晚点播客丨MiniMax 闫俊杰聊大模型 2024：一个非共识判断引起的回声

原创晚点团队 2025-01-22 21:58 北京

“更好的模型可以导向更好的应用，但更好的应用和更多用户并不会导向更好的模型。”

文丨程曼祺

* 头图：Dota 2019 国际邀请赛决赛（TI9）中，OG 战队的 Ana 使用 IO（小精灵，图中球形发光体）的经典作战，OG 在 TI9 中夺冠。为什么用这个图？播客里有答案。

▲扫描上图中的二维码，可收听播客。《晚点聊 LateTalk》#99 期节目。欢迎在小宇宙、喜马拉雅、苹果 Podcast 等渠道关注、收听我们。

《晚点聊 LateTalk》是《晚点 LatePost》推出的播客节目。“最一手的商业、科技访谈，最真实的从业者思考。”

上周四，我们发布图文访谈：《晚点对话 MiniMax 闫俊杰：千万别套用移动互联网的逻辑来做 AI》，这是这次访谈的音频版。

闫俊杰的一些 “非共识” 判断，引起不少讨论。

他认为，模型能力和用户规模并不是直接的飞轮关系：“更好的模型可以导向更好的应用，但更好的应用和更多用户并不会导向更好的模型。”

而今天（1 月 22 日）字节跳动发布 Doubao-1.5-pro 模型的技术报告里则提到：“依托字节在推荐、搜索和广告领域的 AB Test 经验，研发了基于用户反馈的高效 PostTraining 全流程……通过用户数据飞轮持续提升模型的实际使用体验。”

「乱翻书」主理人潘乱 1 月 21 日时也预告，他将录一期播客，“就聊能不能套用移动互联网逻辑来看 AI？”

有听友在既看了图文访谈、又听了播客后说：“看文字和听声音感觉还是很不一样。”

其实从用户规模上来说，MiniMax 在大模型创业公司中是相对领先的：它的 AI 社区产品 Talkie 的最新月活用户数已超 Character.ai，成为同类产品全球第一；其在中国的 AI 社区产品 “星野”，用户数、使用时长和留存率也都是第一，高于字节旗下的同类产品。它在去年 8 月底推出的视频生成平台海螺 AI，目前也是全球访问量最高的视频生成网站。

闫俊杰为什么要自己推翻自己的优势？听听他自己怎么说吧。

内容要点

聊 MiniMax-01 新模型系列：为什么开源？

02:12 为什么开源——加速技术迭代 & 加强技术品牌

08:22 行业误区：认为更好的智能水平要依赖更多的用户；其实不然

13:01 想清楚这个逻辑后：模型要追求不断提高上限，而产品就是产品

15:11 明确 MiniMax 是一家技术驱动的公司

聊对技术的态度：“一年前最喜欢说信仰的人，信仰都兑现了吗？”

18:01 “随热点而动？” 这是对我们的误解

20:13 现在没人能定义什么是 AGI，只能定义智能水平会不断进步

22:00 作为创业者，不是说 Scaling Law 撞墙了我就放弃了，而是努力找方法延续它

23:59 一年前最喜欢说信仰的人，信仰都兑现了吗？

聊 Agent：long-context 很重要，探索 coding 之外的 Agent 场景

25:31 Agent 能处理复杂任务，复杂任务指在专业领域达到专业人士水平

27:51 Agent 需要模型架构和能力的提升；MiniMax-01 做到了第一点

29:08 01 改传统 Transformer 里的非线性注意机制为线性注意力机制，提升了处理 long-context 的能力，这对单 Agent 交互质量，和多 Agent 通讯都很重要

35:07 为什么没发 o1 方向模型？

39:40 多模态能力在 OpenAI L1-L5 的 AGI 路线图里很重要

41:04 AI 编程助手 Cursor 的成功并不基于 o 方向的模型

41:51 蒸馏 o1 数据复现 o1，没那么难

44:09 编程之外另一 Agent 落地场景：信息的获取

51:09 中美模型的一个区别，前者缺少内部 benchmark

55:19 MiniMax 的技术团队特点：模型、Infra 和工程的综合能力强；客观、扁平、灵活

聊模应一体：市场不是有 A，就不能有 B

01:01:38 模型、应用一起做，还有必要吗？

01:03:59 即使更晚创业，也不会做只做应用的公司，因为想做基于未来技术的产品

01:04:44 海螺文本的失利——没有坚持技术驱动

01:06:48 Talkie、星野的暂时领先——因为更懂用户

01:07:34 做技术的人大部分觉得自己很牛，但我不是这么认知世界的

聊竞争：不要区分大厂和创业公司

01:07:56 不用把创业公司单独当一类公司

01:09:22 DeepSeek 也很纯粹；智谱第一个有 AI 路线图

01:09:59 MiniMax 的路线图？——逃出生天，下一步最重要

01:11:19 一年来大模型竞争最大的变化：更多人意识到这和移动互联网是两件事

01:12:29 没和字节谈过被收购，从来没想过把公司卖一个什么价钱

01:15:02 24 年没完成年初目标，定目标的逻辑就不太对

01:16:28 大厂投入和竞争激烈程度都在预料之内

01:18:46 AI 产品该看什么指标？

01:20:25 大公司之外，更大的 “危险” 还是来自自己的认知

聊团队和自己：放下 ego，深度思考

01:22:49 不要假定团队没有流失，流失才是正常的

01:23:24 MiniMax 需要的两种人

01:25:48 确定研发优先级需要做取舍，不见得每个取舍都对，纠错很重要

01:26:56 CEO 决策什么不决策什么不重要，重要的是组织有共同决策标准

01:29:48 让所有人都觉得公司被管得很好，这不是一个目标

01:30:28 打造 AI 组织的难点：持续吸引更好的人

01:31:17 半年多前焦虑，现在不了，因为已做出取舍，以技术迭代为最大目标

01:32:08 去年反思最多的问题——认知能力为何不能提升得更快？

01:32:16 放下自我，思考得更深入

01:34:29 为什么一直被叫 IO？

01:36:38 25 年对自己的期待：不断提高技术水平

· FIN ·

阅读原文

跳转微信打开

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签