谷歌发布了一个非常牛皮的世界模型 Genie 3!
这次生成时长和分辨率都很给力,而且还支持通过文本动态改变世界事件,这搭配一个 LLM 不就妥妥的 AI 游戏吗
能以 24 帧每秒的速度生成,分辨率高达 720P,支持超过几分钟保持环境一致性
模型能模拟自然现象,并展现真实世界的物理特性。
支持跨越地理和时间界限,生成如阿尔卑斯山、威尼斯、古希腊等多样场景
通过自回归方式逐帧生成,Genie 3 能在几分钟内保持环境物体和细节的一致性,视觉记忆最长可达一分钟。
不仅支持导航,还能通过文本 prompt 动态改变世界事件
可为 AI 智能体(如 SIMA agent)生成丰富环境,支持复杂目标的达成和长期任务训练
详细信息:https://deepmind.google/discover/blog/genie-3-a-new-frontier-for-world-models/