刚刚,OpenAI深夜直播,GPT-4o的原生图像生成大升级!奥特曼亲自上阵组队,演示了自拍变梗图、相对论漫画等功能,不过相对隔壁谷歌发布的新模型,OpenAI的这波动作着实有点不够看。 就在谷歌刚刚扔出地表最强模型Gemini 2.5 Pro不久,OpenAI也有动作了。 奥特曼亲自带队,展示了GPT-4o图像生成技术的各种大升级,比如制作梗图、文本渲染、多轮交互生成和指令遵循等。 整个直播中最亮的演示,莫过于这张官方玩梗的表情包了。 目前,这项功能已经在ChatGPT和Sora中,向所有Plus、Pro、Team和免费用户推出。 当然,新版Sora生图的时间,也比以往更长了。但OpenAI看来,生图的质量和其具备的世界知识,让用户值得等待那多出的几秒。 GPT-4o原生图像生成来了! 在直播中,奥特曼介绍道,从今天起,ChatGPT中的原生图像生成功能正式推出! GPT-4o的全模态能力,从此也融合进了Sora中。 OpenAI多模态研究的负责人Gabe介绍说,两年前刚开始这个项目时,他对于GPT-4这个强大的模型会怎样原生支持图像模型非常好奇。 一年后,当模型完成训练时,他看到了令人兴奋的迹象。从GPT-2以来,他已经很久没有这种感觉——这是一个疯狂时刻。 给出以下prompt,GPT-4o就生成了符合要求的图像,完全还原了要求。 接下来,三个人用手机来了张自拍,GPT-4o立刻把三人自拍转换成了动漫风格的版本。 甚至他们开始官方玩梗,让模型添加一段「Feel The AGI」在图片上,一张表情包就此诞生。 这个过程,就体现了4o作为全能模型的强大能力。 因为它不仅仅是一个语言模型,还包括图像、音频,所有输入和输出的模态。它可以理解、生成这些模态,并且无缝地在它们之间工作。 用OpenAI的话说,「我们终于迈向了这种真正集成的多模态模型」。OpenAI直播狙击谷歌,奥特曼AGI梗图现场直出!GPT-4o超强原生生图来袭