IT之家 05月03日 15:33
首个 AI 冠军:Gemini 2.5 Pro 大模型直播通关《宝可梦蓝》,谷歌 CEO 第一时间官宣
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

谷歌的Gemini 2.5 Pro在直播中成功通关了《宝可梦蓝》,成为了首个登入宝可梦名人堂的大型语言模型。这一突破引发了广泛关注,网友们纷纷表示赞叹。文章详细介绍了Gemini通关的过程,包括其思考方式、行动步骤,以及面临的挑战。尽管在游戏过程中,Gemini的表现不如人类,但它在理解游戏规则和策略方面展现出了一定的能力。同时,文章也探讨了大模型在游戏中的局限性,例如视觉解读和上下文理解的困难。这次成功通关标志着大模型在游戏AI领域迈出了一大步。

🕹️ Gemini 2.5 Pro成功通关了《宝可梦蓝》,成为首个达成此成就的大型语言模型,谷歌CEO劈柴哥第一时间发布了这一喜讯。

🤔 Gemini玩宝可梦的基本步骤包括:截取屏幕截图并检索游戏状态数据、用网格覆盖处理图像以辅助空间推理、将屏幕截图和游戏信息发送给模型、AI决定行动、执行按钮按下操作并等待游戏更新,最后重复该过程。

💡 尽管Gemini在游戏中的表现不如人类,例如在导航和空间推理方面,但它能够理解游戏规则,并在对战中运用策略。例如,当游戏提示电属性攻击对岩石属性宝可梦“效果不佳”时,Gemini能够理解并调整策略。

🧐 大模型在游戏中的挑战主要在于视觉理解和上下文限制。例如,模型难以解读Game Boy屏幕的低分辨率像素化画面,二维地图也对其构成挑战。

就在刚刚,Gemini 2.5 Pro 在直播中通关了《宝可梦蓝》。谷歌 CEO 劈柴哥第一时间兴奋官宣,放出通关时刻珍贵影像。

大模型这一小步,把网友们也整嗨了。

满屏画风皆是:泰!酷!辣!

这回,Gemini 的自我介绍里可以多一条了:首个成为宝可梦联盟冠军、登入《宝可梦蓝》名人堂的大模型。(doge)

要知道,一年前的旧模 Claude 3.5 还只能勉强走出新手村到达常磐森林,2 个月前,Claude 3.7 倒是终于能击败道馆主了,但也并未通关宝可梦。

Gemini 2.5 Pro 通关宝可梦

游戏已通关,但直播仍继续。画面是酱婶的:

有一说一,过程看上去是有那么点无聊,因为每动一步 Gemini 都要深思熟虑……

左边的文本框里显示了 Gemini 每个行动背后的详细思考过程。

在上面这个片段中,Gemini 的主要目标是探索华蓝洞穴,寻找和捕获超梦。

直播中可以看到,在完成了一长串行动,走到了目标位置之后,Gemini 2.5 Pro 足足思考了 40 多秒,消耗 76011 个 token,才开启下一步的行动规划。

(因为有点迷路,Gemini 后面还想了很久很久……)

不过从这些思考过程中,可以清晰地看到大模型是怎么理解宝可梦游戏的。总结起来,Gemini 玩宝可梦的基本步骤如下:

另外,模型上下文的限制也影响了它们在游戏中的表现。不过,在游戏中偏文本的部分,此前 Claude 就已经有惊艳表现。比如,在宝可梦对战中,当游戏提示电属性宝可梦的攻击对岩石属性对手“效果不佳”时,Claude 能马上 get 到其中的意思,并在此后将这些知识整合到自己的战斗策略里。

现在,谷歌率先实现了新的突破,并表示还将在这个有趣的挑战中进行更多探索(直播将至少持续数天)。或许真的像网友所说:

参考链接:

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Gemini 宝可梦 大模型 AI游戏
相关文章