掘金 人工智能 6小时前
GPT-5 王者降临,免费博士级 AI 全面屠榜!百万程序员不眠之夜,7 亿人沸腾
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

OpenAI于近日发布了备受期待的GPT-5,标志着其在人工智能领域迈出了重要一步。此次发布的GPT-5是对GPT-4的重大升级,据称在编码、数学、写作、健康和视觉感知等方面均表现卓越,智能远超以往所有模型。GPT-5将提供多个版本,包括一个核心的“智能高效模型”和一个更深层次的推理模型“GPT-5 Thinking”,并辅以“实时路由器”,旨在构建一个以GPT-5为核心的通用智能操作系统。GPT-5将成为ChatGPT的默认模型,并向所有Plus、Pro、Team及Free用户开放,其中免费用户在达到使用限制后将切换至GPT-5 mini。此次发布也再次彰显了华人团队在AI研发中的重要贡献,多位核心成员为华人。

⭐ GPT-5作为OpenAI的最新旗舰模型,是对GPT-4的重大升级,在智能和性能上实现了显著飞跃,被OpenAI视为迈向通用人工智能(AGI)的重要里程碑。其在文本、Web开发、视觉、硬提示、编程、数学、创造力及长查询等多个领域均刷新了历史最佳表现。

💡 GPT-5采用了分层设计,包含“智能高效模型”、“GPT-5 Thinking”(深层推理模型)和“实时路由器”,旨在构建一个以GPT-5为核心的通用智能操作系统。这一架构的引入,预示着AI系统将能更全面地应对复杂问题。

✅ OpenAI特别强调了GPT-5在真实世界应用中的可靠性和准确性,通过专门的评估机制显著减少了“幻觉”现象。在健康咨询场景的临床评估中,GPT-5表现出色,被认为是“健康顾问级”模型,其准确性甚至接近或超越了部分人类选手在专业竞赛中的表现。

💻 GPT-5在编程能力上表现突出,不仅在SWEBench上刷新了历史最高分,证明了其在真实工程场景中的强大实力,还在多种编程语言上展现了卓越能力。其强大的代码生成和理解能力,为开发者带来了极大的便利。

👨‍💻 在GPT-5的研发团队中,华人科学家和工程师扮演了关键角色,包括首席研究官Mark Chen以及Rennie Song、Elaine Ya Le、Max Schwarzer、王若宸和Tianfu Fu等核心成员,他们的贡献为GPT-5的成功发布奠定了坚实基础,再次印证了“AI圈处处有华人”的说法。

「【新智元导读】GPT-5,震撼登场!距离 22 年 11 月的 ChatGPT,再到 23 年 3 月的 GPT-4,GPT-5 竟隔了两年半之久。这次的深夜直播,国内有数万吃瓜群众在线观看。至少按 OpenAI 的说法,他们离 AGI 又近了一步。」

全球用户瞩目中,GPT-5 终于震撼登场了!

OpenAI 用一个多小时的超长发布会,全方位展示了 GPT-5 的炸裂性能。

奥特曼领衔,出场人数众多,华人依旧耀眼

正值每周 7 亿人使用 ChatGPT 之际,GPT-5 重磅发布了。它是对 GPT-4 的一次重大升级,更是标志着 OpenAI 在实现 AGI 道路上的一个重要里程碑。

OpenAI 介绍说,这是我们迄今为止最优秀的 AI 系统,智能远超之前的所有模型,在编码、数学、写作、健康、视觉感知上都性能卓越。

这个统一的系统,包含一个能够解答大多数问题的**「智能高效模型、一个能够解决更复杂问题的更深层次的推理模型」(GPT-5 Thinking),以及一个「实时路由器。」**

而 GPT-5、GPT-5-mini、GPT-5-nano 等多版本的分层推出,意味着 OpenAI 正在主动构建一个以 GPT-5 为底层核心的通用智能操作系统。

从现在开始,GPT-5 将成为 ChatGPT 中的默认模型,GPT-4o、o3、o4-mini、GPT-4.1 和 GPT-4.5 都将被它取代。

与此同时,****「所有 Plus、Pro、Team 和 Free 用户,都可以使用 GPT-5 了。」

如果你花钱订阅,就可以无限制访问 GPT-5 和 GPT-5 Pro,而免费用户在达到使用限制后,会转换到 GPT-5 mini。

直播后,LMArena 不装了,摊牌了:GPT-5 再创历史纪录,OpenAI 重回 AI 王座!

在文本、Web 开发和视觉领域排名第一

在硬提示、编程、数学、创造力、长查询等方面排名第一

在代号「summit」的测试下,GPT-5 目前持有最高的竞技场分数

「首测 GPT-5 编程写作,太顶了」

在多个跨学科的学术评估中,GPT-5 都超越了其他主流模型。

首先,GPT-5 是最好的编码模型,在 SWEBench 上直接刷新了历史最高分,这表明它在现实工程场景中性能超强。

在 Aider Polyglot 上,它也表现强大,证明了自己的多种编程语言能力。

在 MMMU 上,它也刷新了纪录;甚至在 AIME 2025(美国高中数学竞赛)中,它不仅远超以往模型,还接近甚至超过许多人类选手的表现。

而 OpenAI 这次着重强调的,就是 GPT-5 在真实世界中的表现——克服幻觉!把准确性和可靠性,都放在了最高优先级。

因此,他们专门构建了一套评估机制,结果显示:GPT-5 是目前最可靠、最真实、最可信的模型,显著减少了错误与幻觉。

比如在健康咨询中,GPT-5 的表现就尤其出色。在 250 名医生参与设计的临床场景评估中,它成为最值得信赖的「健康顾问级」模型。

而且,这个口袋博士团队级的模型,将免费向专业用户推出,可以连接所有工具。

GPT-5 一上线,我们立即开启了一波全面的实测,不得不说,其在编程、写作领域强到离谱。

首先是,小哥想要学习法语的网站,GPT-5 能够完美复刻。

一波演示下来,GPT-5 带来了亲眼所见的震撼,足以称得上是全球最好的编码模型。

「核心华人团队」

毫无意外,这次又是华人团队撑起了大半边天。

紧随奥特曼的,就是 OpenAI 首席研究官(Chief Research Officer)Mark Chen。

在 GPT-5 演示中,下列场景再次验证了「AI 圈处处有华人」:

4 人同台,有 3 位是华人。

从左至右以此为:Mark Chen、Rennie Song、Elaine Ya Le、Max Schwarzer

除了后训练负责人 Max Schwarzer,其他三人 Mark Chen、Rennie Song、Elaine Ya Le 都是华人。

此外,王若宸演示了 GPT-5 的语音 / 语音学习功能。他是 OpenAI 多模态研究科学家,训练了 ChatGPT 的语音模型。

奥特曼还点赞了另一位 GPT-5 核心成员 Tianfu Fu 的工作。他是 GPT-5 的核心贡献者。

总的来说,这次 GPT-5 发布,还是有不少可圈可点的地方,虽然基准测试图也被挑出了一些错处。

GPT-5 的直播结束,许多人还沉浸在兴奋和激动之中。

今夜无眠。

参考资料:YZJX

openai.com/gpt-5/

openai.com/index/gpt-5…

openai.com/index/intro…

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

GPT-5 OpenAI AGI 人工智能 AI模型
相关文章