Gemini 2.5 Pro通关宝可梦蓝谷歌创造首个AI冠军

快科技资讯 05月03日 23:04

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

谷歌的Gemini 2.5 Pro在直播中成功通关了《宝可梦蓝》，成为首个进入宝可梦联盟名人堂的AI大模型。这次实验由软件工程师Joel Z运行，旨在测试Gemini 2.5 Pro实验版的游戏能力，该项目受“ClaudePlaysPokemon”启发。尽管《宝可梦蓝》在今天看来可能简单，但对于AI模型来说，通关并非易事。此前，Claude模型在游戏中表现不佳，主要原因是模型“视力不佳”，难以解读游戏中的低分辨率像素世界和二维地图。Gemini 2.5 Pro通过构建自主决策系统和自动导航工具，实现了突破，未来可能成为测试大模型的新基准。

🎮Gemini 2.5 Pro 在直播中成功通关经典游戏《宝可梦蓝》，谷歌CEO皮查伊第一时间官宣，标志着AI模型在游戏领域的重大突破。

🧠软件工程师 Joel Z 的实验旨在测试 Gemini 2.5 Pro 实验版的游戏性能，该实验版受“ClaudePlaysPokemon”项目的启发，但 Gemini 2.5 Pro 在自主决策和导航方面有所创新。

🗺️大模型玩宝可梦游戏的难点在于“视力不佳”，难以解读低分辨率、像素化的游戏画面以及二维地图，导致模型经常迷路，无法顺利通过建筑物。

🚀Gemini 2.5 Pro 的成功得益于其构建的自主决策系统和自动导航工具，使其能够自主决定目的地并规划路线，从而克服了视觉上的挑战。

快科技5月3日消息，就在刚刚，Gemini 2.5 Pro 在直播中通关了《宝可梦蓝》。

谷歌CEO皮查伊第一时间兴奋官宣，放出通关时刻珍贵影像：

后续，Gemini的介绍里可能会多一条：“首个成为宝可梦联盟冠军、登入《宝可梦蓝》名人堂的AI大模型”。

此次直播是由一位名为Joel Z的软件工程师运行，他做这个实验，是因为Gemini 2.5Pro出了个实验版，大家好奇它玩游戏怎么样。

而Gemini 2.5Pro实验版则是受“ClaudePlaysPokemon”项目的启发，两个项目类似，区别是Claude的项目玩的是宝可梦红，而Gemini 2.5Pro的项目玩的是宝可梦蓝。

两款都是比较经典的宝可梦游戏，虽然放到现在游戏有那么点无聊，甚至大家会觉得这游戏太简单，但让大模型去玩这个游戏甚至自己通关可不是个容易的事情。

Claude这边，一年前旧模Claude3.5 只能勉强走出新手村到达常磐森林；2个月前，Claude 3.7 倒是终于能击败道馆主了，但也并未通关宝可梦。

目前，大模型的表现明显不如人类，参照“Claude Plays Pokémon”项目研究人员的说法，这主要是因为大模型“视力不佳”。

以Claude为例，模型很难像人类一样去解读屏幕里展现出的低分辨率、像素化的世界；同时，游戏中的二维地图看上去对未经专门训练的大模型而言也充满挑战性。

通俗点讲就是人物经常会迷路，穿不过建筑物。

Joel Z表示，这个项目不是简单地让AI瞎点，而是构建了一套自主决策系统，对比Claude还有个自动导航工具，而Gemini 2.5Pro则让他自主决定目的地，然后自己规划路线。

现在，谷歌的Gemini 2.5Pro率先实现了新的突破，并表示还将在这个有趣的挑战中进行更多探索。

或许真的像网友所说：以后测试大模型的基准要变成谁能更快通关宝可梦了。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签