29 年经典游戏被攻克：谷歌 Gemini 2.5 Pro 成功通关《宝可梦蓝》

IT之家 5 月 4 日消息，谷歌最先进的人工智能模型取得了重大突破：成功通关了一款 29 年前的电子游戏。

谷歌首席执行官桑达尔・皮查伊（Sundar Pichai）在 X 网站上兴奋地宣布：“太精彩了！Gemini 2.5 Pro 刚刚完成了《宝可梦蓝》！”

据IT之家了解，此次直播活动名为“Gemini Plays Pokemon”，由一位名叫 Joel Z 的 30 岁软件工程师发起，他并非谷歌员工。尽管如此，谷歌高管们对这一尝试表示了支持。谷歌 AI Studio 的产品负责人洛根・基尔帕特里克（Logan Kilpatrick）上个月曾表示，Gemini 在完成《宝可梦》方面取得了显著进展，并且已经获得了第五个徽章（目前表现第二好的模型只获得了三个徽章，不过使用的是不同的代理框架）。皮查伊还开玩笑说：“我们正在开发 API，即人工宝可梦智能。”

为何选择《宝可梦》？早在今年 2 月，Anthropic 公司就曾强调其 Claude AI 模型在《宝可梦红》中的表现，称 Claude 的“深度思考和代理训练”使其在应对“更出人意料”的任务时更具优势，例如玩经典游戏。但 Claude 似乎尚未通关《宝可梦红》，这是否意味着 Gemini 在游戏方面表现更胜一筹？Joel Z 在他的 Twitch 页面上提醒观众：“请不要将此视为衡量大型语言模型（LLM）玩宝可梦能力的基准。两者之间无法进行直接比较，因为 Gemini 和 Claude 使用不同的工具，并且接收到的信息也不同。”

此外，两款 AI 模型都需要借助代理框架才能玩游戏。这些框架为模型提供带有额外信息的游戏截图，使模型能够据此做出决策（可能涉及调用专业代理），并按下与 AI 指令相对应的按钮。

Joel Z 承认，在帮助 Gemini 完成游戏的过程中，他确实进行了一些“开发干预”，但他强调这并非作弊。“我的干预是为了提升 Gemini 的整体决策和推理能力。我不会给出具体提示词，也不会为特定挑战（如月球山脉）提供攻略或直接指令。唯一接近这种情况的是，我告诉 Gemini 需要与火箭队小兵对话两次才能获得升空钥匙，这其实是一个在《宝可梦黄》中被修复的漏洞。”

他还表示：“Gemini Plays Pokémon 仍在积极开发中，其框架也在不断演变。”

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签