1、零一万物与 Minimax

虽然现在大家已经忘却，但零一万物官宣退出（大参数量的）模型层竞争，是在今年1月的事情。

当时整个AI圈一片哗然，虽然六小虎的那些已经放弃大投入炼丹早就被人各种猜测，但零一万物公开来谈这个事情的影响是完全不同的。

但放到现在，在旁观者来看这似乎更像是一种笑话。模型层正展现出一幅欣欣向荣之势，之前怀疑开源LLM快死的担忧也被R1这条鲇鱼成功续命一波。当然模型层的烧钱需求并没有减少，一些团队不得不退出是商业上的不得已，Mistral、Reka等差不多都选择了同样的路线。毕竟以DeepSeek持有的算力，以市场价租赁的话，可能要至少1亿RMB每月的租金，这庞大的成本即使是六小龙也是吃不消的。DeepSeek能够胜出从投入上来看似乎并不让人惊讶。

Minimax紧接着发声，提出了完全不同的战略方向：重视模型，弱化模型之外的方向。这与不少AI产品的战略方向有着明显的不同。而后续DeepSeek R1的爆火又印证了这点。它们在一起成功撼动了过去互联网时代的应用做事方式。

现在还能在X上看到一些流量视角很好的人在说“先卖出去，然后再开发”，到底哪边在这轮AI时代才是正确方向，还有待未来进行验证。

参考阅读：

聊李开复最近发言，兼谈上一代scaling law撞墙

聊MiniMax闫俊杰最近发言，兼谈如何进一步提升LLM的能力

2、DeepSeek R1

R1的影响是如此之大，需要单独一节讨论。这方面的讨论已经很多，本节更多聚焦在一些非共识的视角。

首先在技术上，R1向所有人展示如何去复刻o1模型，并且这个思路可以延续到RFT阶段，整个LLM生态的所有层面都可以由此收益。

第二，在开源模型方面也有重大影响。虽然业内人士一直对于R1的模型能力评价一般，低于公众的评价。但即使到目前为止，我仍然能够持续地听到R1在某些类型场景已经颠覆掉了之前方案的消息。R1虽然有着各种问题，但它确实很能打，到目前为止我们还并没有第二个开源模型能够在综合角度与之竞争。

很多人觉得现在很多组织私有化部署R1就是智商税，或者说满足上面要求，但从我目前收到的信息来看，可能R1私有化部署的价值并没有这么低。在不少场景用户可以感到R1模型相对于他们之前能用到的方案的明显提升，对用户来讲，就是实实在在的提升，而且用上这个模型只需要支付硬件成本，不需要支付定制开发的成本。R1已经在颠覆To B定制开发中的不少方案，现阶段的定制开发市场已经显著萎缩，有待于用户在习惯R1之后，重新找出那些他们仍然不满意的点。

这一轮很多在采购R1私有化部署的组织并不是之前的定制化开发的客户，从预算和内部决策方式的角度来说，他们未来一段时间主要买的AI产品也都是标品。甚至说R1的出现导致已有的介于定制化和标品之间的客户更偏向标品一些。市场被强化了一个认知：要购买前沿的AI标品。

第三，R1的出现大幅拉高了开源LLM模型的baseline，让海内外的很多模型厂都有点挂不住，有些的闭源模型仍然能保持领先，但领先幅度被削弱了。整个模型层由去年逐步转为封闭迟钝的状态重新进入到开源和追求智能的阶段，模型层之上的应用层和用户都显著受益于这点。未来半年，开源和闭源模型的进展都会显著加速了。不过模型层研发团队的压力一下被加大了很多，我祝愿他们的身体能撑得住。

第四，DeepSeek R1在国内的巨大流量导致的破圈和对很多圈外用户的成功影响，让很多人认识到这里的很多机会，也凝聚了很多共识。

参考阅读：

对这轮DeepSeek高渗透率的归因

RFTaaS有望成为第一种通用Agent构建平台