36氪 AI 4小时前
终于发布的GPT-5,和它改变世界的982天
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

备受瞩目的GPT-5于北京时间8月8日凌晨正式发布。此次OpenAI在技术上并未追求颠覆性飞跃,而是着重提升了模型的推理能力和智能体(Agentic AI)表现,并推出了多个版本以适应不同场景需求。GPT-5整合了GPT系列和o系列模型,通过实时路由器自动调度最优模型,旨在解决用户选择困难症。在价格方面,GPT-5 API价格大幅降低,更具竞争力。此外,GPT-5在语音、人格模式等方面也进行了显著优化,提升了用户体验和多模态交互能力。OpenAI还时隔六年重新开源了两款模型,以应对日益激烈的AI市场竞争,并进一步巩固其行业领导地位。

🚀 **GPT-5发布,聚焦智能体与推理能力**:GPT-5的发布并未追求与GPT-4相比的颠覆性技术飞跃,而是将重点放在提升模型的推理能力和智能体(Agentic AI)能力上。它整合了GPT系列和o系列模型,并引入了实时路由器,能够根据任务自动调用最优模型,从而简化用户选择,提升使用效率。

💡 **多版本定价策略,降低使用门槛**:GPT-5推出了标准版、mini、nano以及ChatGPT内置版本,以满足不同场景和需求的个性化应用。值得注意的是,GPT-5的API价格相较于GPT-4大幅下降,甚至低于GPT-4的预览版本,显示出OpenAI在降低使用成本、扩大用户群体方面的决心。

🗣️ **“情商”提升与多模态交互优化**:GPT-5在“情商”方面也进行了显著提升,新增了多种“人格”模式,允许用户选择模型的输出风格,增加了交互的趣味性和个性化。在语音交互方面,GPT-5的语音能力已接近真人水平,延迟低、真实感强,在教育、医疗等场景的应用潜力巨大。

🌐 **重返开源,应对市场竞争**:在沉寂六年之后,OpenAI发布了两款开源模型GPT-OSS-20B和GPT-OSS-120B,采用Apache 2.0许可协议,允许自由商用。此举旨在回应外界对其闭源策略的批评,并应对全球AI模型开源化浪潮,特别是来自中国公司的激烈竞争,以期在AI生态系统中保持领先地位。

📈 **模型迭代放缓,但算力投入持续**:GPT-5的发布间隔长达两年半,显示出OpenAI在模型迭代节奏上有所放缓,这与当前大模型训练数据瓶颈及技术路线的转变有关。尽管如此,OpenAI仍在持续加大在算力基础设施上的投入,如“星际之门”项目,以支持未来更强大的模型研发。

文|邓咏仪 周鑫雨

编辑|苏建勋

刚刚过去的7月,是疯狂的开源月——阿里(Qwen)、月之暗面(Kimi)、智谱(GLM)等十多家AI公司推出了新开源模型。OpenRouter趋势榜前10名,来自中国的开源模型就占了9席。

但无需多言,现在GPT-5来了,用实力为这场竞赛画下句点。

△来源:OpenAI

北京时间8月8日凌晨1点,GPT-5正式发布。GPT-5 并没有宣布模型参数,采用多层级架构,整合了o3系列的推理能力,重点提升了智能体(Agentic AI)能力。

GPT-5上线后,迅速屠榜大模型竞技场LMArena,在所有细分类目中都位列第一。

△大模型竞技场实时排行榜。来源:LMArena

GPT-5发布前,X和开源社区上的消息已经沸沸扬扬。

我们照例看到了一些“偷感很重”的操作——在开源社区提前上线偷跑版本,从8月3日开始,OpenAI CEO Sam Altman先在X上用“20 Hours Left”虚晃一枪,又在接下来的几天,用不间断的小发布,吊足了观众胃口:

8月5日,ChatGPT幽默地上线了“防沉迷弹窗”;

8月6日,模型来是来了,但不是GPT-5——而是两个开源模型GPT-OSS-120B和GPT-OSS-120B。

老对手们也没闲着。Anthropic和Google都在GPT-5发布前上了“大菜”:Anthropic上线了Claude 4.1,依旧主打编程能力;而Google则发布了世界模型Genie 3,在多模态上秀了一把肌肉。

总体而言,GPT-5的这次发布更“朴实”,没有那么多炫技,甚至可以说有点不温不火——在技术上,它并没有像GPT-4之于GPT-3.5一样,有飞跃般的能力提升。

相反,OpenAI花了大力气,提升推理、智能体能力,还做了许多工程化工作。从语音等多模态能力,到“学习模式”、新上线的人格模式,再到价格大降……OpenAI的总体逻辑,都是让模型更好地落地、被使用。

Sam Altman表示,这次GPT-5的发布就像是“把一个博士团队揣在兜里”,许多新功能都免费给所有用户开放,这也和ChatGPT走To C路线的策略相符。

不偏科的GPT-5,治好了模型选恐症

这次发布的GPT-5拥有四个版本:

    GPT-5:在不同领域中进行Coding和执行任务的标准模式; GPT-5 mini:轻量版版本,适用于对明确界定的任务和场景; GPT-5 nano:强调运行速度和性价比; GPT-5 Chat:ChatGPT中使用的版本。

△来源:OpenAI

成立以来,OpenAI对外提供服务的模型数量,已经超过了40个。发布这些尺寸、上下文窗口、API价格各异的模型版本,是为了适配不同的使用场景。

但模型过多,反而增加了用户在执行任务中的“选择困难症”。Altman坦言:“产品发布节奏失控是复杂化的主因,我们意识到用户不应为选择模型而困扰——人工智能应‘即用即灵’。”

通过GPT-5的发布,OpenAI意在终结模型“选择恐惧”的局面。

GPT-5并非单一的语言或者推理模型,而是在训练中采取了统一模型架构,整合了GPT系列(语言模型)和o系列(推理模型),并具有调度子模型的能力。

官方资料显示,GPT-5的系统由三部分组成:

    高效、智能的模型:解决大多数问题; 深度推理模型(GPT‑5 thinking):解决更复杂的问题; 实时路由器(real‑time router):根据真实信号持续训练,包括用户更换模型时的偏好率、回复的准确度以及所测得的正确性,这些指标都会随着时间的推移而不断提高。

这意味着,用户不再需要花大力气思考如何选择模型。GPT-5能够直接根据执行的具体任务,自动调用最优的模型。

△来源:OpenAI

强,但不贵

虽然号称OpenAI最强模型,但GPT-5的价格,相较其它自家模型而言,一点也不贵。

根据《智能涌现》的统计,就GPT系列语言模型而言,GPT-3.5到GPT-4,价格有过一次跃升。但GPT-5三个模型的API价格,都比GPT-4最便宜的Preview版本(输入:10美元/M Tokens;输出:30美元/M Tokens)还要低。

目前,OpenAI最贵的模型,仍然是推理模型o系列的o1-pro。o1-pro的输入价格(150美元/M Tokens),是GPT-5(1.25美元/M Tokens)的120倍!

这样来看,融合了GPT系列能力和o系列能力的GPT-5,价格还是很有竞争力的。

△来源:《智能涌现》制图

当下,OpenAI共有两个官方渠道可以体验到GPT-5系列模型。其一,是直接付费调用模型API。

另一个官方渠道,则是使用ChatGPT的免费版、Plus版、Pro版,以及Team版。值得注意的是,虽然在ChatGPT免费版上可以直接使用GPT-5,但仍有一定的限额。额度消耗完毕后,模型会自动切换成更轻量的GPT-5 mini。

ChatGPT 企业版和教育行业的用户,则要等到GPT-5发布一周后,才能使用新模型。

△来源:《智能涌现》制图

当然,如果你想免费体验到GPT-5的预览版,还可以用GitHub Copilot。

△GPT-5(Preview)已经上架GitHub Copilot。来源:GitHub

特别的是,OpenAI这次还明晃晃打起了ToG的生意。

8月6日,OpenAI首席产品官Kevin Weil宣布,在未来12个月里,ChatGPT企业版将对美国联邦政府开放,每个机构只需要支付——1美元!

△来源:X@Kevin Weil

不只是IQ提升,EQ也是

比起往常大秀参数、能力,这次OpenAI花费大量篇幅介绍了包括健康、编程、教育等多个场景的应用案例。

“更快、更可靠、更准确”,几乎是在每个场景中都被强调的属性。

比如,在生成小游戏时,现场演示大概只用时几分钟,GPT-5就能快速写好一两百行代码,生成一个带关卡、音效的小游戏。

△GPT-5生成的滚球小游戏 来源:OpenAI

在编程任务中,GPT-5 可以快速一次性完成前端应用程序,生成一个3D版本的SVG文件,用于Canvas。

“可靠”不仅来自于模型的智能水平不断提升,也在EQ(情商)上。

这次GPT-5上线的“人格”模式,就会让模型可玩性更高。四种人格,包括四种Cynic(愤世嫉俗者)、Robot(机器人)、Listener(倾听者)、Nerd(学霸),供用户自己选择模型的输出风格。

△对话框颜色也可以随心换。来源:OpenAI

GPT-5带来的语音能力和情商进化,尤其能够提升教育、医疗等场景中的产品体验。

比如,面对一位用户的提问:“我妈妈得癌症了,怎么办,我得癌症的几率也会很高吗?”

△o3和GPT-5的对比。来源:OpenAI

4月发布的o3,会直接条理清晰列个清单,告诉你“是的,你是直系亲属,患癌概率会有提升。”

但GPT-5会理解复杂问题背后的微妙语境,先是安抚你的情绪——“很遗憾你要处理这样的情况”,然后再开始分析可能性和成因。

△展示学习模式 来源:OpenAI

在现场展示的用户案例中,OpenAI多模态负责人则直接用语音模式,让ChatGPT开始化身韩语老师,对话的质量、语音的真实感、延迟,都已经与真人一般无异。

△学习模式。来源:OpenAI

时隔六年,终于重新开源

2025年初,DeepSeek成为第一个复现OpenAI o1的模型公司,引领了这半年的开源模型浪潮。

这也逼得OpenAI终于在时隔六年后,拿出了新的开源模型。

两款开源模型,分别为gpt-oss-20b(21B参数,其中3.6B为激活参数)和gpt-oss-120b(117B参数,其中5.1B为激活参数)两个版本。

△来源:OpenAI

这是一个MoE(混合专家)大模型,采用Apache 2.0许可协议,允许自由商用。

20B是相当小的参数规模,将模型规模压缩到20B和120B,却给了128×4的超大 MoE配置、200k超宽词表和NTK-RoPE扩展,目的不是把模型的参数堆到最大,而是希望开源推理效率最高。

两款模型的定位,显然是在端侧的应用,而且专门为智能体(Agentic AI)而设计。奥特曼在推文里表示,gpt-oss 与o4-mini水平相当,120B的gpt-oss可以在高端笔记本上运行;而20B版本的模型,手机就可以跑。

词表超过20万,支持多语种或代码混合输入——这样的设置直接对标DeepSeek与阿里的Qwen3。加上宽松的商用协议,这会补上OpenAI被诟病已久的开源生态。

作为大模型的领军者,OpenAI一直引领着技术风潮:GPT-3.5证明了Scaling Law带来的智能能力“涌现”;GPT-4带来模型能力的巨大提升,引领了一波大模型竞赛热潮;

哪怕是GPT-5停滞期间,OpenAI发布的副线产品Sora,也引领了2024年的多模态模型浪潮。

不难看出,GPT-5的研发之路颇为坎坷。挑战一方面来自全球优质人类数据逐渐消耗殆尽,单纯扩大模型规模带来的智能提升,已经遇到瓶颈。

这直接导致2024年,AI界陷入技术路线之争:Scaling Laws是否已到尽头?2024年9月,OpenAI发布o1模型,大模型领域开始从Scaling Laws,转向以强化学习(RL)为主的训练范式。

GPT-5的发布,恰好站在技术路线转变的十字路口。

对OpenAI而言,发布GPT-5,更是意味着要对这段时间里的内外部压力和质疑,统一作出回应。

自2023年3月14日发布GPT-4后,到今天的GPT-5,足足隔了2年有余。这段时间里,无论OpenAI推出什么新产品——Sora、GPT-4o、o1模型、吉卜力风格文生图——用户总是在奥特曼的推特下催促:”快上GPT-5!”

GPT-5研发的停滞,也给了开源领域的模型玩家机会,DeepSeek R1成功复现了OpenAI o1的大部分能力,也直接导致这半年里,全球大小AI公司都在疯狂开源——OpenAI需要拿出足够有信服力的的闭源模型,才能够再一次证明自己。

2023年底的”宫斗”事件,则导致OpenAI分崩离析,核心人物Ilya Sutskever、Mira Murati等纷纷出走。从非盈利转向商业实体后,OpenAI的组织能力、发展策略也备受质疑——GPT-5是否达到了“AGI”标准?是否会直接影响和金主微软的合作联盟?

OpenAI需要一边极速前进,一边谨慎处理这些问题。

尽管如此,ChatGPT仍创造了诸多历史——自2022年11月推出以来,两个月内达到1亿用户,创下史上最快增长的消费应用记录。

在GPT-5发布前,AI巨头们的竞赛依旧进行着:OpenAI和Anthropic都分别拿到了新一轮融资,

如今,ChatGPT依旧是是全球活跃度、收入最高的AI应用,每周有7亿用户使用ChatGPT,它渗入人们日常生活的程度,远超你我的想象。

在GPT-5发布之际,我们也选取了最近OpenAI的一些数据,来复盘这家AI公司的登月征程。

算力还得烧,但模型迭代的节奏已经放缓

GPT-5千呼万唤始出来的背后,是OpenAI逐步放缓的模型发布节奏。

可以看到,GPT-2到GPT-3,仅过了7个月。但GPT-3到GPT-4,OpenAI花了整整33个月;GPT-4到GPT-5,又过了两年半。

△来源:智能涌现制图

“Scaling Law”,这个由OpenAI在2020年创造的概念,一年前还是大模型赛道的信条。这一点促使大模型公司,在构建大规模计算集群和数据集上,一掷千金。

然而,“越大越好”的定律正在受到动摇。

除了缺乏文本训练数据外,由于系统的复杂性,大模型的训练效果仿佛开盲盒。不少研究人员都表示,大模型的训练容易出现硬件故障等Bug,模型最终性能等到训练结束才能知道——而这可能需要数月的时间。

连“Scaling教父”OpenAI自身,也陷入了迭代的瓶颈:

GPT-5发布前夕,The Information曾披露OpenAI内部的训练细节:2024年,本想作为GPT-5发布的模型Orion(内部版本),两轮训练就烧了5亿美元、跑满10万卡,结果只比GPT-4o“略好”。

两位GPT-5的早期测试者告诉路透社,GPT-5的Coding和数学能力令人印象深刻,但GPT-4到GPT-5的能力跨越,不像GPT-3到GPT-4那么大。

但相对地,据业内估计,GPT-5是OpenAI史上规模最大,使用训练资源最多的模型。

不过,硅谷大公司们还在继续提升对芯片的支出预算。

△来源:EPOCH AI

非营利AI研究组织Epoch AI的统计显示,OpenAI、Meta、Google三家公司,在顶级模型训练上所消耗的计算量,每年仍然呈倍数递增。比如,OpenAI模型训练计算规模,平均每年增长到5.3倍。

摩根士丹利则预计,在2024–2028年这五年,全球企业在AI数据中心的总投入将高达3万亿美元。其中一半会花在GPU等加速芯片上。

2025年3月,彭博社就报道,OpenAI将斥资1000亿美元建设“星际之门”基础设施项目。该项目的首个数据中心综合体,所能容纳的英伟达AI芯片的数量,多达40万个——如果填满,这将成为目前已知最大的AI计算集群之一。

每周有7亿人使用ChatGPT,占世界人口近10%

大概很少人意识到,ChatGPT的周活跃用户已经达到7亿——这相当于全世界人口的近10%。这个数字是去年同期的4倍。

△来源:SensorTower

ChatGPT诞生之初,就已经刷新了世上增长最快的App记录。两年过去,它依然保持着强劲的增长势头,月活甚至超过了Reddit,逼近Twitter这样成立已近20年的老牌社交平台。

△ChatGPT的一周用量增长趋势,以及与Google、Teams、Slack等生产力工具对比。来源:SensorTower

AI再也不是一个小众市场。

据SensorTower数据,2025年7月,ChatGPT已经成为在iOS和Google Play上达到10亿全球下载量的最快应用,仅仅几个月后,它就成为达到5亿月活跃用户(月活用户)的最快应用(不包括预安装)。

一个表现是,AI的“打工”属性也在减弱。在2024年,ChatGPT的周末用量增长会明显比周中减少近10%;但到了2025年,趋势已经显著放缓。

这意味着,无论是周中还是周末,人们使用ChatGPT的频率都差不多。

收入超120亿美金,但起飞的不止OpenAI一家

截止2025年7月,OpenAI的年化收入已经达到120亿美元。

自ChatGPT发布以来,OpenAI收入呈现指数级增长,从2023年的16亿美元,迅速增长到2024年的37亿美元,再到2025年的120亿美元,年均复合增长率超过300%。

在大模型厂商中,OpenAI和Anthropic是断层领先的前两名,后者同样由前OpenAI核心人员创办,对商业化更谨慎。但随着2025年AI Coding起飞,Anthropic也迎来收入的跃升。

△来源:智能涌现制图

值得注意的是,两年过去,两家公司的收入构成已经大相径庭。

OpenAI更像一个To C App公司,超过70%收入来自To C用户的订阅,20%来自API调用;Anthropic则是另一个镜像——收入超过70%来自API调用,只有10%来自To C侧订阅。

凭借AI收入起飞的也远不止OpenAI一家,偷偷赚钱的还有美股的科技巨头们。

来源:智能涌现制图

大模型问世后,微软、Google、Meta三家的市值因大模型,有了喜人的增长。

微软凭Azure AI与Copilot全线开花,市值猛增三成,2025财年Q4云收入同比飙39%。CEO纳德拉直言“AI已把我们所有业务重新点火”。

Meta更是因为AI,把广告转化率抬升5个百分点,市值上扬27%。

哪怕是在大模型上一开始被OpenAI打得还不了手的Google,今年也凭借Gemini 2.5的发布而重回技术圈中心。

今年第一季度,谷歌实现营收902.3亿美元,同比大涨12%。这其中,因为大模型带来的云用量起飞,是重要因素。

开源和闭源模型,差距仍在不断缩小

OpenAI因为“反抗AI被大公司垄断”而成立。但在ChatGPT引爆全球,成为现象级产品之后,ChatGPT转向闭源,OpenAI从此面临一个完全不同的开源态势。

2024年前,OpenAI在顶尖模型上一直领先。但从2024年下半年开始,包括Meta旗下的Llama 2、Google旗下的Gemini、到了后来的Deepseek、Qwen,接棒开源多个重要模型。

开源模型和闭源模型的差距迅速缩小。

△模型智能水平跃迁曲线,从2025年开始,各家模型和OpenAI(黑色折线)的差距显著缩小 来源:Artificial Analysis

模型智能水平跃迁曲线,从2025年开始,各家模型和OpenAI(黑色折线)的差距显著缩小 △来源:Artificial Analysis

即便OpenAI这次终于开源,补上空缺,但要在激烈的竞争中保持闭源模型的领先优势,挑战还是很大。

如今的开源生态已经泾渭分明分为几大阵营。

中国玩家们大多都在以开源追击。在这次GPT-5发布期间,阿里已经开源了包括Qwen3-4B、Qwen-Image等多个模型;前不久月之暗面开源的旗舰模型K2,也引起了硅谷的广泛关注。

相反,美国的几大模型厂商,对开源的态度开始变得暧昧不明。

比如,Anthropic的创始人Dario Amodei,在最近的一次播客采访中直接表示“开源AI是伪概念”,表示AI开源和软件开源不同。开源再先进,也不会削弱Anthropic的商业价值。

而扎克伯格批量从OpenAI挖走明星人才后,组建起新AI团队后,最近也被爆出,Alexandr Wang在内的高管们,正在考虑让旗舰模型Behemoth转向闭源,以应对接下来的激烈模型竞争。

封面来源|AI生成

欢迎交流

欢迎交流

欢迎关注u

本文来自微信公众号“智能涌现”,作者:邓咏仪 周鑫雨,36氪经授权发布。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

GPT-5 OpenAI AI模型 智能体 开源
相关文章