OpenAI GPT-4o 推出原生图像生成功能，这次升级有哪些看点？

刚刚，OpenAI深夜直播，GPT-4o的原生图像生成大升级！奥特曼亲自上阵组队，演示了自拍变梗图、相对论漫画等功能，不过相对隔壁谷歌发布的新模型，OpenAI的这波动作着实有点不够看。就在谷歌刚刚扔出地表最强模型Gemini 2.5 Pro不久，OpenAI也有动作了。奥特曼亲自带队，展示了GPT-4o图像生成技术的各种大升级，比如制作梗图、文本渲染、多轮交互生成和指令遵循等。整个直播中最亮的演示，莫过于这张官方玩梗的表情包了。目前，这项功能已经在ChatGPT和Sora中，向所有Plus、Pro、Team和免费用户推出。当然，新版Sora生图的时间，也比以往更长了。但OpenAI看来，生图的质量和其具备的世界知识，让用户值得等待那多出的几秒。 GPT-4o原生图像生成来了！在直播中，奥特曼介绍道，从今天起，ChatGPT中的原生图像生成功能正式推出！ GPT-4o的全模态能力，从此也融合进了Sora中。 OpenAI多模态研究的负责人Gabe介绍说，两年前刚开始这个项目时，他对于GPT-4这个强大的模型会怎样原生支持图像模型非常好奇。一年后，当模型完成训练时，他看到了令人兴奋的迹象。从GPT-2以来，他已经很久没有这种感觉——这是一个疯狂时刻。给出以下prompt，GPT-4o就生成了符合要求的图像，完全还原了要求。接下来，三个人用手机来了张自拍，GPT-4o立刻把三人自拍转换成了动漫风格的版本。甚至他们开始官方玩梗，让模型添加一段「Feel The AGI」在图片上，一张表情包就此诞生。这个过程，就体现了4o作为全能模型的强大能力。因为它不仅仅是一个语言模型，还包括图像、音频，所有输入和输出的模态。它可以理解、生成这些模态，并且无缝地在它们之间工作。用OpenAI的话说，「我们终于迈向了这种真正集成的多模态模型」。OpenAI直播狙击谷歌，奥特曼AGI梗图现场直出！GPT-4o超强原生生图来袭

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签