GPT-5来了马斯克：我不服

Cnbeta 23分钟前

GPT-5来了马斯克：我不服

OpenAI发布了备受期待的GPT-5，其能力已从“高中生”跃升至“博士级专家”。GPT-5最大的亮点在于从“聊天机器人”进化为“全能助理”，具备强大的多模态理解能力，能够“听说读写看”并能直接连接其他软件进行操作，如Office和开发工具。它还引入了“人格”切换功能，并优化了“思考模式”，使其分析更深入。在各项评测中，GPT-5大幅减少了事实性幻觉，并在数学、编程、知识测试和多模态能力上刷新了多项新高，甚至能复现Word和Excel等应用。然而，市场反应和用户反馈褒贬不一，有人认为其“情商”下降，文本输出生硬，且升级幅度未达预期，但其在严谨逻辑和复杂工程领域的表现仍属顶尖。

🚀 **全能助理的诞生**：GPT-5已从单纯的聊天机器人进化为能够理解并执行复杂任务的“全能助理”，其多模态能力显著提升，能够处理文本、图像等多种信息，并能直接连接和操作各类软件，如Office套件和开发工具，极大地拓展了其应用场景。

🧠 **深度思考与智能交互**：GPT-5优化了“思考模式”，用户只需通过简单指令即可激活其深度分析能力，使其在解决复杂问题时表现更出色。同时，预设的多种“人格”模式让交互更加灵活和个性化，满足不同用户的需求。

📊 **性能飞跃与幻觉大幅减少**：GPT-5在多项基准测试中取得了突破性进展，包括在事实性幻觉上比GPT-4o减少44%，比GPT-3.5减少78%。其在数学、编程、知识测试和多模态能力等领域均达到了新的高度，展现出强大的综合实力。

💡 **严谨逻辑与工程能力的突出**：GPT-5在需要严密逻辑推理和复杂工程技能的领域表现尤为突出，能够完成如自动生成、打乱和复原20阶魔方程序，以及在网页中复现可用的Word和Excel等高难度任务，充分体现了其“博士生”级别的专业能力。

📉 **市场与用户反馈的争议**：尽管GPT-5在技术上取得了显著进步，但市场和用户的反应却不尽相同。部分用户反映其“情商”下降，文本输出生硬，且升级幅度未达预期。资本市场也出现概念股回调，显示出对此次升级的谨慎态度，认为其更像是一次常规迭代而非颠覆性革命。

人工智能巨头 OpenAI 最近终于推出了万众期待的新一代旗舰模型 GPT-5。在发布会上，CEO 山姆·奥特曼用一个颇具戏剧性的比喻来形容它的跃升：“GPT-3 像高中生，偶尔有灵光却缺乏稳定；GPT-4 像大学生，兼具智能与实用；而 GPT-5，则像是与一位博士级专家对话。”

他还自嘲“在 GPT-5 面前一无是处”，吊足了全球用户的胃口。这场等待了两年半的升级，“千呼万唤始出来”。

说起来，GPT-5 的诞生并不容易。背后经历了长达一年的艰难研发，核心团队还被高薪挖角，算力开销大得惊人。

OpenAI 这一路真是走得既焦虑又艰辛。现在，终于把这个“统一系统”搬上了台面，大家都在等它能带来什么新花样。

概括来说，GPT5 最大的变化就是从一个“聊天机器人”进化成了一个真正能干活的“全能助理”。

首先，多模态开挂让这个新助理的“脑子”变好使了。过去你跟它说话、发图都得分开来，现在是“听说读写看”一把抓，你丢给它什么它都能立刻理解。

更关键的是，它学会了“动手”。以前的 GPT 只能给你出主意，现在的 GPT-5 能直接连接你的其他软件，帮你操作Office、在开发工具里写代码，甚至处理工作流程。

为了让这个助理不那么呆板，OpenAI 还给它预设了不同的“人格”，你可以随时把它切换成毒舌的、严谨的或者善解人意的模式。

自从 DeepSeek 开创了“Think 模式”之后，让大模型在回答前先“想一想”似乎成了行业标配，各家都推出了类似的功能。

但 GPT-5 有点不一样，它把这个过程变得更直接了。

你不需要去特意寻找或点击某个按钮，只要在提问时加上一句“认真思考”，系统就会自动为你切换到那个更擅长深度分析的 gpt-5-thinking 模式，用更强的“脑力”来解决你的问题。

接着就是 GPT 传统保留节目：屠榜。OpenAI 甩出了 25 个榜单，密密麻麻的图表告诉你 GPT-5 在各个维度有多牛。

事实性幻觉大幅减少，比 GPT-4o 少了 44%，比 o3 少了 78%，基本上是不胡说八道了。

数学竞赛直接干到了满分，现实世界编程能力新高，人类知识测试新高，多模态能力新高……反正就是新高，新高，全是新高。

发布会一结束，全球的网红和博主们就第一时间冲了进去，开始对 GPT-5 进行五花八门的“极限施压”测试。

其中，50 万粉丝的油管主 Matthew Berman 搞了个大的，他用一个 25 分钟的视频，密集展示了 GPT-5 近 30 个堪称变态的任务。

比如，让 GPT-5 写了个程序，能瞬间生成、打乱甚至复原一个复杂的 20 阶魔方。

更狠的是，它直接在网页里复刻出了 Word 和 Excel 的完整应用。注意，是能用的那个软件，而不是给你画个表格那么简单。

从经典的“生命游戏”3D版，到可以随便调节重力、空气阻力的流体动力学模拟器，GPT-5还真如奥特曼之前比喻的“博士生水平”。

然而，就在开发者们为之狂欢时，另一边的画风却完全不同。

资本市场最先用脚投票，发布当天概念股普遍回调，显然没被这个“博士生”彻底打动。

毕竟，大家等了两年半，期待的是一场石破天惊的革命，结果只等到了一次意料之中的常规升级，失望在所难免。

更何况，如今的 AI 竞赛早已进入了残酷的“春秋战国”时代，各路诸侯的技术差距正在飞速缩小，OpenAI 再想靠常规操作就甩开对手几个身位，已经难上加难。

在这片喧嚣中，OpenAI 的老冤家马斯克更是第一个站出来唱反调，直接甩出成绩单，表示 GPT-5 还不如他家的 Grok 4。

不仅资本和对手不买账，普通网友的吐槽声也越来越大。

大家最直观的感受是，GPT-5 的“智商”好像是高了，但“情商”却下降了。

很多人反映，现在用它写文案、写话术，感觉文字变得生硬、机械，没了以前那种灵动和自然。

有网友一针见血地调侃：“情绪和逻辑就像跷跷板，你把逻辑这头死死按住，情感那头可不就弹飞了吗？”

难怪不少网友担心自己最顺手的 GPT-4.5 会就此消失，不过很快就有热心网友发现，设置里其实有个开关，过去的模型还是可以切换回来的。

这种感觉，让很多人觉得 AI 似乎真的进入了瓶颈期。

而争议最大的，还是官方每次都吹得最响的编程能力。

很多人第一反应还是：“感觉不如 Claude 好用啊？” 这种“奥特曼式营销”宣传时天花乱坠，实际用起来却有落差，让不少人对榜单上的“新高”打了好几个问号。

不过也有网友反馈开发一个粤语学习应用，让几家大模型都试了试，结果 Claude 和 Gemini 在生成 UI 和精准修改代码时都或多或少出了问题，只有 GPT-5 稳稳地完成了任务，效果还出奇地好。

说到底，GPT-5 给人的感觉，就像一个严重偏科的天才：它的文科一塌糊涂，写不出有温度的文字；但它的理科，尤其是在需要严密逻辑和复杂工程能力的领域，还是十分抗打。

老狐觉得网友的这句话就概括得恰如其分：只是没有预期那么好……但仍旧是当前最能打的大模型。

Fish AI Reader

AI辅助创作，多种专业模板，深度分析，高质量内容生成。从观点提取到深度思考，FishAI为您提供全方位的创作支持。新版本引入自定义参数，让您的创作更加个性化和精准。

FishAI

鱼阅，AI 时代的下一个智能信息助手，助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

GPT-5 OpenAI 人工智能大模型 AI助理

相关文章

人工智能正在摧毁互联网内容生态系统

阿里云：通义千问API日调用量破亿企业用户破9万

【iThome 2024 CIO大調查系列1】AI、資安和永續變革三箭齊發

鈺登跨入AI，推出搭配英特爾四代Xeon SP與Gaudi2的伺服器

OpenAI加入C2PA指導委員會，測試Deepfake圖像偵測工具

蘋果發表M4晶片，更新iPad產品線

Red Hat推出AI平臺，內建IBM開源Granite模型