原创 信息平权 2025-03-26 22:03 上海
由于投资这边情绪低落,导致普遍低估了过去2天模型的发布,已经眼花缭乱了,且还没结束。
Gemini 2.5 pro其实很强,反超了 4.5 和 grok3,但今天竟然没什么声量。还记得之前一直传说谷歌训崩了一个超大模型吗?最大的Gemini-3是个几万亿参数的超大模型,仍在继续推进。相对而言2.5 pro算小的。因此预训练到底结束了吗?ROI角度的确放缓了,但实际上各家还在一码一码往前探索极限。
而谷歌扔出2.5pro,就是为了狙击凌晨OpenAI 4o的更新。这次的图像合成惊艳全行业了。用橘子话说:这是OAI自从Deep Research以来最有意义的更新。设计领域取代传统工作流感觉是板上钉钉了。不过,多模态这方面 OAI 的领先优势或许并不大了,可以期待下后面国产某家的对标发布。 或者就想象一下,刚刚4o更新的图片合成效果,搬上抖音,会解锁什么样的玩法和爆款?
DeepSeek V3突然更新的0324版本,最亮眼的是:代码能力已接近 Claude 3.7 Sonnet,但成本仅为后者的3%...继续追着闭源打。
此外大家关心的Deepseek R2,马上发布,是不是真的 ARC-AGI 得分超过 90% 不知道,但参考 o1 到 o3 也是花了 3 个月,r2 比 o3 又晚了 3-4 月,略超o3是可以期待的。且o3也分为低计算和高计算模式,R2 成本估计比 o3 低计算模式还要低。之前我们还说过引入了NSA的 V4 更值得期待,不会太久
字节没声音了吗?反而更聚焦了。一方面,内部各种应用向开发其实储备了非常多东西,之前大家看到的所谓字节manus,只是内部员工的小实验,但能看出Agent能力集成到豆包指日可待。而另一边,更有意义的是,字节AI策略大调整,重心再次切回seed和纯粹的research,应用和AGI探索双线并行,是之前策略的即时纠偏和补足。
说实话,现在的国内团队看起来比OAI更像早期 OAI。
总之底层模型仍在以周、甚至以日为单位推进,竞争更加白热化。资产市场消沉不代表业界消沉,耐心等开花结果。
(完)
R2的具体时间、小米YU7的具体定价(有惊喜),以及Questmobile国内AI应用最新数据,欢迎来围观和讨论