原创 orangesai 2025-01-17 21:31 北京
一个非共识,挑战了过去十几年积累下来的移动互联网经验?
今天晚点发布了对 MiniMax CEO IO 的访谈。
全文充满了反共识的点,可以说是「暴论频出」。
中国人工智能产业过去一两年一直有个巨大的误区:就是认为用户越多,模型能力提升越快。这个逻辑非常错。
千万不要用上一代做移动互联网产品的方法论来思考新产品。
如果一个产品特别依赖推广,大概率就不太对
是 Scaling Law 撞墙了,我就放弃了,而是我要做什么事能让它延续。
一年前最喜欢说信仰的那些人,信仰都兑现了吗?
实践出真知,这篇访谈的内容非常值得参考。
全文链接:https://mp.weixin.qq.com/s/VBnm3KCsYd4fuXcBpDgiaA
但是这句话「千万别套用移动互联网的逻辑来做 AI——因为技术特性导致 AI 不是用户越多,模型能力提升越快。」
剥离原有语境之后,就变成了一种巨大的非共识,似乎挑战了过去十几年积累下来的移动互联网经验,引起了一些争议。
问题来了
上面的争议,严格来说是个概念的混淆,可以归结为一个小误会。
抛开争议不谈,真重要的问题是:
大模型进步到底需要不需要用户?
本文将通过以下产品的案例,为大家讨论这个问题提供一些背景信息
ChatGPT
GPT4
国产模型
Character AI
Kimi
海螺视频
DeepSeek
Claude
请带着问题一起思考:
移动互联网的经验有多少可以复用?
大模型产品,是否需要推流?
字节会是国内的大赢家吗?
语言大模型的大进步不需要用户
先从 ChatGPT 聊起。
ChatGPT 于2022年11月30日上线,虽然很快就拿到了100万用户,但是这些用户数据回流到模型至少也要一个月,所以我们可以理解为用户是0。
虽然 ChatGPT 在线上是持续进步的,但 ChatGPT 刚上线的表现已经非常惊艳了。
能达到这个惊艳的水平,并不依赖用户的输入。
实际上看过 GPT4 论文的朋友都知道,GPT4 的表现是远比 ChatGPT 3.5 惊艳的。
而 GPT4 的训练完成时间其实是 2022年8月,比 ChatGPT 的发布早三个月。
所以 GPT4 这么巨大的进步也不需要用户输入。
国产模型在 2023 年上半年,一直在做的事情就是追平 ChatGPT。
最后他们一个一个都追平了,包括有用户的,没用户的。
可以这么说,2023年上半年,国产模型的进步,最重要的功劳在蒸馏和开源,跟用户没什么关系。
Kimi 在2023年底上线了长文本功能,长文本相关的任务完成的很好,惊艳四座。
但它的惊艳主要靠产品经理和算法对长文本任务的优化以及对老师模型的蒸馏。
也跟用户没什么关系。
DeepSeek 在 2024 年的海内外口碑特别好,开源代码能力第一名,2024年都没怎么做产品推用户,直到最近才上了 APP。
所以这么看下来,大模型的进步似乎确实不太需要用户。
不光是语言模型
大模型进步不需要用户这件事不光发生在语言模型上,也发生在视频模型上。
2024年中,可灵视频模型一出,大家惊呼,还是有用户有数据的短视频公司厉害。
可是字节的数据和用户总比快手要多的,但是字节的模型那时候可没出来。
到年底的时候,第一梯队的视频模型就两个:可灵,海螺。
海螺视频那时候用户也是0。
后来一家公司的算法大佬透露,短视频数据质量太低,不是什么好的训练数据。
类似的事情还发生在图像领域。
Midjourney,出道即巅峰,到现在虽然不是用户数最多的,但依然是审美天花板。
所以这么看下来,视频和图像模型的进步似乎确实不太需要用户。
大模型的小进步还是需要精英用户的
话说回来,虽然大模型的大进步不太需要用户,但是迭代和优化,还是需要用户的输入作为参考的。
只是 99% 的用户输入都没太大意义,只有 1% 的精英用户输入是有意义的。
很多人说更多用户可以解锁更多场景,其实本质是更多精英用户的输入才能解锁更多场景。
而精英用户在用什么大模型,大家都也是很清楚的。
精英用户选择模型靠的也不是广告,而是自己体验并参考其他精英用户的口碑。
不过由于蒸馏这一特殊知识传递系统的存在,精英用户所用的大模型是老师。
老师最终会教会学生。
所以,该要用户还是需要一点的,只是没必要疯狂推流。
大模型和产品的矛盾
大模型本身是反网络效应的。
以前用户要获取信息,只能通过内容,这就需要有创作者来生产内容。
现在用户要获取信息,大模型可以直接生产很多内容,并不需要创作者来构建双边网络。
技术可能没那么刚需用户了,但是产品还是需要用户的。
没有用户,收入从哪里来?
所以当主题回到 AI 产品,移动互联网的那套经验,又是非常重要的。
这里就出现了最矛盾的现象。
大语言模型产品疯狂推流是为了什么?
为了赚钱?但国内显然没什么人付费。
为了长远?如果网络效应,那自然也可以理解,但上面分析了可能没有。
为了技术进步?上面也说了,技术的大进步并不需要
想来想去,也只有一个理由:融资。
产品用户越多,公司估值越高,投资人就越愿意投资。
就算大模型进步不需要太多用户,总需要卡吧,总需要钱吧?
所以大模型公司就左边拿着投资人的钱,右边把钱扔给小红书和B站。
为什么投资人愿意投资用户最多的公司?
其实是因为一个神奇的梅特卡夫定律。
梅特卡夫定律
梅特卡夫定律由以太网发明者、3COM公司创始人罗伯特•梅特卡夫于1973年提出,这一定律在计算机领域的地位堪比摩尔定律。其核心观点是:网络的价值与联网设备数量的平方成正比。
从技术角度看,如果网络中有N个节点,则潜在的连接数约为N*(N-1),即N²数量级。这说明网络的价值会随着节点数量的增加呈平方级增长。这一理论在2014年得到了实证——研究发现Facebook的收入与用户数的平方成正比,中国学者也验证了腾讯存在类似规律。
梅特卡夫同时还认为网络的成本至多是以线性的水平在增长,这样就必然有一个网络的价值等于成本的临界点存在:在网络的节点数目很小的时候,网络的价值还不能超过成本。但一旦网络节点数增加,超越了临界点,则网络将会取得爆发性的增长。
梅特卡夫定律是对互联网企业为什么如此追求增长的一个非常重要的解释。
但从第一性原理去思考,这是互联网时代的规律,在大模型时代并不成立。
ChatGPT 的爆发性增长是在刚发布的时候而不是在具备网络效应之后。
Claude 发布的时候,ChatGPT 已经有很大的用户优势了,但是今年靠着超强的编程能力,依然吃掉了 OpenAI 10% 的 2B 市场份额。
Google 入场很晚,但现在 Gemini 2.0 已经成了很多任务的首选模型,而且2025年会变得更强。
重新思考一切
类比虽然不是一个严谨的逻辑思维。
但确实人类最喜欢最容易理解的思维模式。
面对未来,我们感到迷茫,就总想去从历史找一些参考答案。
我们去找四小龙时代和移动互联网时代的经验。
拿来实践才发现,有些有用,有些没用。
也许大部分,都没什么用。
但是没关系,这就是人类最值得赞扬的地方:
通过不断实践,获得新的认知。