虎嗅 13小时前
GPT-5发布了,到底有没有那么神?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

OpenAI发布了备受期待的GPT-5模型,号称是迄今为止最智能、最快速、最实用的模型,内置的思考能力旨在提供专家级智能。GPT-5拥有标准版、mini、nano和Chat四个版本,并提供免费、Plus和Pro三种用户模式。新模型在AIME数学竞赛中取得满分,编程能力大幅提升,并在多模态评测中表现出色,能更好地处理图像、视频和科学推理。然而,发布会上的图表数据展示方式引发了“按需缩放”坐标系的争议,尽管OpenAI表示技术博客已更正,但这一失误仍受到广泛批评。同时,用户对免费开放的承诺与实际使用体验之间存在疑问。GPT-5的实际表现和市场接受度仍需时间检验。

🔬 **性能大幅提升与多模态能力增强**:GPT-5在多项基准测试中表现突出,特别是在AIME数学竞赛中获得满分,编程能力也显著增强。其多模态能力得到大幅提升,能够更智能地处理图像、视频等非文本信息,如理解图表、总结图片内容等,为用户带来更丰富的交互体验。

🚀 **多版本与灵活定价策略**:GPT-5推出了标准版、mini、nano和Chat四个版本,以满足不同用户和应用场景的需求。同时,提供免费、Plus和Pro三种用户模式,并通过API平台提供多种模型选择,兼顾了不同用户的支付能力和使用需求。

⚠️ **发布会数据展示争议**:在发布会上,GPT-5的Benchmark数据图表展示方式引发了关于“按需缩放”坐标系的争议,被批评为误导性展示。尽管OpenAI声称技术博客已进行更正,但这一失误在用户和业内引起了广泛讨论和质疑,影响了模型的公信力。

💬 **用户反馈与市场期待**:尽管GPT-5在技术上有所突破,但用户对免费开放的承诺与实际使用体验存在疑问,例如ChatGPT何时能获得更新。此外,微软CEO等业界人士的积极评价也表明了对GPT-5的看好,但市场最终的买单程度仍需通过实际应用来检验。

💡 **AI模型发展的趋势与挑战**:GPT-5的发布标志着AI大模型在智能、速度和实用性方面迈出了重要一步,尤其是在多模态理解和复杂任务执行方面。然而,如何确保数据展示的透明度、维护用户信任以及兑现承诺,是AI模型开发者面临的重要挑战。

GPT-5,终于在深夜出炉。

以为很震惊,以为很惊艳?确实有。

但先来看一张图:

OpenAI到底是如何做到在全球直播的场合展示Benchmark,竟然能把52.8显示得比69.1都高,甚至这个69.1能跟30.8平齐的???

其它的不谈,单就这一点,开场直接号称“博士水平”AI,就这么水灵灵地“按需缩放”坐标系,也是引得网友怒喷不已。

甚至Altman都赶忙出来转移话题,称技术博客上是正确的……

确实,技术博客确实是有所更正。

但如此失误,着实不应该,毕竟大家都等了2年啊!

博士水平的AI,来了

不过有一说一,除了这个被大众诟病的致命失误之外,GPT-5在现场的表现还算是可圈可点。

在技术博客中,OpenAI开场直接一句:“迄今为止,这是我们最智能、最快速、最实用的模型,内置的思考能力让每个人都能拥有专家级智能。”

这次发布的GPT-5拥有四个版本:

    GPT-5:在不同领域中进行Coding和执行任务的标准模式;

    GPT-5 mini:轻量版版本,适用于对明确界定的任务和场景;

    GPT-5 nano:强调运行速度和性价比;

    GPT-5 Chat:ChatGPT中使用的版本。

GPT-5目前已面向普通用户提供免费、plus和Pro三种模式。

同时在API平台上,推出了GPT-5、GPT-5 nano、GPT-5 mini三种模型选择。

不仅如此,承接昨天时隔6年的开源,OpenAI表示这次GPT-5面向所有人,免费!并且是博士水平的那种。

我们先来看下Benchmark。

最让人吸睛的,还是GPT-5在AIME 2025的表现,直接拿下满分的成绩。

其次就是编程能力,相较于o3和4o,GPT-5在思考模式加持之下,达到了74.9%的水平。

除此之外,这个模型在多种多模态评测中表现出色,覆盖了图像、视频、空间理解和科学推理等方面。

更强的多模态能力,意味着ChatGPT在处理图片和其他非文字信息时更聪明了——比如看懂图表、总结一张演示照片的内容,或者回答关于图示的问题。

而且比较罕见的是,第三方的大模型竞技场也是及时跟进,直接发表声明:“全方面第一”

具体而言,竞技场涉及的内容包括:文本、Web开发、视觉、编程、数学、创造力、长查询等。

由此可见,GPT-5从目前评测标准来看,确实是AI大模型的卫冕之王。

再看效果

成绩是一方面,但实际效果才是硬道理。

深谙此理的Sam Altman在自己的X账号上也是立马跟进,发布了由GPT-5生成的效果:

并且Altman还表示,有GPT-5权限的用户,只需发送“use beatbot to make a sick beat to celebrate gpt-5”即可体验。

不多不说,营销这块,Altman还是非常手拿把掐的。

不过在直播的现场演示过程中,GPT-5还是有不少惊艳的表现在身上的。

例如让GPT-5生成一个学语法的APP,效果是这样的:

不要以为是简单的网站,除了可以完成市面上AI的交互之外,它在里面还可以内嵌一个小游戏:

并且若是想改变APP里面的内容,只要一句话,瞬间就可以改变布局:

对于更加庞大且复杂的项目,例如现场OpenAI展示了用GPT-5先编程出来的代码:

在运行之后,便得到了一个3D效果的“世界”:

总而言之,从现场效果来看,GPT-5也是担得起“最聪明、最强编程”的大模型。

“观众”们买单吗?

从目前X上“观众”的反馈来看,讨论最激烈的就是前面我们提到的图表bug。

甚至有网友做了一张简单粗暴的Excel表格来讽刺这次的失误:

不过另一方面,老东家微软CEO火速出面站台,并配有一个“爱心”图片以表支持:

再如开发者们常用的VS Code,官方也是Day 0无缝衔接GPT-5:

不过对于普罗大众来说,反馈声音最大的莫过于:“说好的免费,我的ChatGPT咋没有呢?”

总而言之,用户到底买不买单,实测效果到底有没有那么神,需要让子弹再飞一会了。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

GPT-5 OpenAI 人工智能 大模型 AI发布
相关文章