DeepSeek乱杀一通后，OpenAI们终于坐不住了。

差评 02月07日

DeepSeek乱杀一通后，OpenAI们终于坐不住了。

DeepSeek的崛起引发了新一轮AI军备竞赛，各科技巨头纷纷亮剑。OpenAI发布O3推理模型并免费开放搜索功能，谷歌全量开放Gemini 2.0，阿里云也推出了Qwen2.5-Max。DeepSeek凭借其对中文互联网的深刻理解，赢得了广泛关注，但也面临着来自四面八方的挑战。这场竞赛中，各家公司都拿出了看家本领，预示着今年将有一场精彩的模型大战。

🚀DeepSeek的出现，打破了原有AI市场的格局，凭借其对中文互联网的深刻理解，迅速拉高了国内对AI的认知程度，甚至在一定程度上超越了Claude和ChatGPT等海外模型。

💻OpenAI迅速做出回应，发布了O3-mini模型，该模型在科学、数学和编码方面表现出色，尤其在编程能力上甚至超越了DeepSeek R1，并免费开放ChatGPT搜索功能，以应对DeepSeek的挑战。

🌐阿里云也加入了战局，推出了Qwen2.5-Max，声称在多个基准测试中超越了DeepSeek V3和OpenAI的O1-mini等模型，并在Chatbot Arena的大模型盲测排行榜上名列前茅，显示出强大的实力。

🔬谷歌的Gemini 2.0虽然发布较早，但直到DeepSeek崭露头角后才全量开放，尽管在基准测试中性能优于前代模型，但受到的关注相对较少，显得有些无人在意。

原创世超 2025-02-07 00:01 浙江

让我们谢谢DeepSeek

今年过年，年味浓不浓俺不好说，但 AI 味肯定是够够的了。

小到年夜饭桌，大到热搜新闻，哪哪都是 DeepSeek ，就连世超家族群里平时不咋关注科技的亲戚，也在说中国的人工智能这次胜了老美一筹。

这么说吧， DeepSeek 凭一己之力，拉高了全国对 AI 的认知程度。

至于 DeepSeek 到底有多厉害，想必这段时间哥几个也已经上手体验过了，说它是目前最懂中文互联网的 AI 模型，应该没人有意见吧？

反正从身边人统计学来看，这段时间什么 Claude 、 ChatGPT 通通都不香了。

不过大伙儿也先别急着开香槟，这次 DeepSeek 一冒头，对手们就从四面八方吻了上来。

OpenAI 大年初四发 o3 推理模型，今天又免费开放了搜索功能，谷歌的 Gemini2.0 全量开放，还有阿里的 Qwen2.5-Max 也发力打榜 DeepSeek 。。。

要我说，这些科技公司还是得逼一把，不然你都不知道他们的实力到底有多少。

先说 OpenAI 的 o3 ，去年底的发布会就传出了消息，说今年 1 月份要上线。

但奥特曼估计也没想到，被 DeepSeek 狙了一手，现在这个发布的时间节点，多少就有点耐人寻味了。包括世超也觉着， o3-mini 的发布是为了反击 DeepSeek 。

当然回到正题啊，这次的 o3-mini ，号称是他们的推理系列中最具成本效益的模型，还尤其擅长科学、数学和编码，响应的速度也更快。

一句话总结， o3-mini 就像一个家庭条件一般，但智商很高的理科学霸。

就拿编程来说，除了 o3-mini （ low ）打不过 o1 以外， o3-mini 三个档位的模型，基本乱杀前辈 o1 系列。

竞赛数学也不在话下， o3-mini （ high ）的表现都要好过 o1 系列。

就连博士级别的题目， o3-mini 也能跟 o1 系列打得有来有回。

x 上有老哥用同一组 prompt 测试了 o3-mini 和 DeepSeek R1 ，得出的结论是 “ o3-mini （编程能力）碾压 DeepSeek R1 ” 。

说实话，光看视频的话，确实是 o3-mini 的效果更逼真。

另外一位老哥也测试了一把 o3-mini 的物理理解能力（ prompt ：编写一个球在超立方体内弹跳的 Python 脚本），直接夸 o3-mini 可能是物理学得最好的模型。

反正看了一波大伙儿的测试，世超觉着 o3-mini 似乎更接近咱们一直在说的，能够理解物理世界、模拟物理规律的世界模型。

重点是， o3-mini 现在免费就能用上，可比之前的 o1 要大方的多了。

而且， o3-mini 只是 o3 系列的第一个版本，后面还会有满血版的 o3 出来。我的建议是让 DeepSeek 再整个大活，给奥特曼上点强度，到时候指不定还会有大升级。

这不，除了发布 o3-mini 外， OpenAI 又趁着咱们开工的这两天，免费开放了 ChatGPT 搜索。

现在你甚至都不需要注册，就能直接用。

过年那阵，微软也让所有的 Copilot 用户免费用上了 o1 推理模型，要不说还得谢谢 DeepSeek 呢。

另外一边，谷歌也有点坐不住了。

同样是去年 12 月发布 Gemini 2.0 ，但那会儿只有开发者和一部分测试者能用，一直咕咕咕也不见有动静。

结果被 DeepSeek 这么一激，一口气发了三个版本的 Gemini2.0 模型。

基准测试中，各方面性能也都优于前代模型。

但相比 DeepSeek 和 OpenAI 的热度，谷歌这边多少就显得有些无人在意了。

再来看国内的情况，阿里云算是第一个对 DeepSeek 发起 “ 进攻 ” 的公司。

根据阿里云官方的说法， Qwen2.5-Max 在多个基准测试中，超越 DeepSeek V3 、 o1-mini 等多个模型。

并且在 Chatbot Arena 的大模型盲测排行榜上， Qwen2.5-Max 冲到了第七的位置。

具体看模型的数学和编程能力，甚至还能拿第一。

所以 Qwen2.5-Max 在发布后，国内有不少媒体都出来捧了一波。

反正世超看下来，这次由 DeepSeek 掀起的新一轮 AI 军备竞赛，领头的这一批公司已经掏出了不少真家伙。

不过说实在的， DeepSeek 这出后来者居上的戏码，的确给咱上了一课。

指不定后边儿还会有更加出色的模型出现，毕竟有 DeepSeek R1 的珠玉在前，如果再不拿出点实力相当，或者足够炸场的东西来，那就没啥意思了。

咱们坐着等就成，今年的模型大战肯定有的看了。

撰文：西西

编辑：江江&面线

美编：萱萱

图片、资料来源：

X、OpenAI官网

部分图源网络

跳转微信打开

Fish AI Reader

AI辅助创作，多种专业模板，深度分析，高质量内容生成。从观点提取到深度思考，FishAI为您提供全方位的创作支持。新版本引入自定义参数，让您的创作更加个性化和精准。

FishAI

鱼阅，AI 时代的下一个智能信息助手，助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepSeek AI军备竞赛 OpenAI Gemini Qwen

相关文章

OpenAI加入C2PA指導委員會，測試Deepfake圖像偵測工具

How popular is ChatGPT? Part 1: more popular than Taylor Swift

OpenAI set to unveil AI-driven challenger to Google Search

OpenAI faces complaint over fictional outputs

OpenAI计划下周宣布ChatGPT和GPT-4更新，但不会推出GPT-5和搜索引擎

苹果据悉接近与OpenAI达成协议，将ChatGPT应用于iPhone

OpenAI据悉正开发AI语音助手

Comment on What should the UK’s £100 million Foundation Model Taskforce do? by Government-issued digital money gets closer - The World News Papers

Comment on What should the UK’s £100 million Foundation Model Taskforce do? by Il denaro digitale emesso dal governo si sta avvicinando - Darios Cafe Blogs

Codex, OpenAI’s Automated Code Generation API with Greg Brockman - #509