原创 晚点团队 2025-01-22 21:58 北京
“更好的模型可以导向更好的应用,但更好的应用和更多用户并不会导向更好的模型。”
“更好的模型可以导向更好的应用,但更好的应用和更多用户并不会导向更好的模型。”
文丨程曼祺
* 头图:Dota 2019 国际邀请赛决赛(TI9)中,OG 战队的 Ana 使用 IO(小精灵,图中球形发光体)的经典作战,OG 在 TI9 中夺冠。为什么用这个图?播客里有答案。
▲扫描上图中的二维码,可收听播客。《晚点聊 LateTalk》#99 期节目。欢迎在小宇宙、喜马拉雅、苹果 Podcast 等渠道关注、收听我们。
《晚点聊 LateTalk》是《晚点 LatePost》 推出的播客节目。“最一手的商业、科技访谈,最真实的从业者思考。”
上周四,我们发布图文访谈:《晚点对话 MiniMax 闫俊杰:千万别套用移动互联网的逻辑来做 AI》,这是这次访谈的音频版。
闫俊杰的一些 “非共识” 判断,引起不少讨论。
他认为,模型能力和用户规模并不是直接的飞轮关系:“更好的模型可以导向更好的应用,但更好的应用和更多用户并不会导向更好的模型。”
而今天(1 月 22 日)字节跳动发布 Doubao-1.5-pro 模型的技术报告里则提到:“依托字节在推荐、搜索和广告领域的 AB Test 经验,研发了基于用户反馈的高效 PostTraining 全流程……通过用户数据飞轮持续提升模型的实际使用体验。”
「乱翻书」主理人潘乱 1 月 21 日时也预告,他将录一期播客,“就聊能不能套用移动互联网逻辑来看 AI?”
有听友在既看了图文访谈、又听了播客后说:“看文字和听声音感觉还是很不一样。”
其实从用户规模上来说,MiniMax 在大模型创业公司中是相对领先的:它的 AI 社区产品 Talkie 的最新月活用户数已超 Character.ai,成为同类产品全球第一;其在中国的 AI 社区产品 “星野”,用户数、使用时长和留存率也都是第一,高于字节旗下的同类产品。它在去年 8 月底推出的视频生成平台海螺 AI,目前也是全球访问量最高的视频生成网站。
闫俊杰为什么要自己推翻自己的优势?听听他自己怎么说吧。
内容要点
聊 MiniMax-01 新模型系列:为什么开源?
02:12 为什么开源——加速技术迭代 & 加强技术品牌
08:22 行业误区:认为更好的智能水平要依赖更多的用户;其实不然
13:01 想清楚这个逻辑后:模型要追求不断提高上限,而产品就是产品
15:11 明确 MiniMax 是一家技术驱动的公司
聊对技术的态度:“一年前最喜欢说信仰的人,信仰都兑现了吗?”
18:01 “随热点而动?” 这是对我们的误解
20:13 现在没人能定义什么是 AGI,只能定义智能水平会不断进步
22:00 作为创业者,不是说 Scaling Law 撞墙了我就放弃了,而是努力找方法延续它
23:59 一年前最喜欢说信仰的人,信仰都兑现了吗?
聊 Agent:long-context 很重要,探索 coding 之外的 Agent 场景
25:31 Agent 能处理复杂任务,复杂任务指在专业领域达到专业人士水平
27:51 Agent 需要模型架构和能力的提升;MiniMax-01 做到了第一点
29:08 01 改传统 Transformer 里的非线性注意机制为线性注意力机制,提升了处理 long-context 的能力,这对单 Agent 交互质量,和多 Agent 通讯都很重要
35:07 为什么没发 o1 方向模型?
39:40 多模态能力在 OpenAI L1-L5 的 AGI 路线图里很重要
41:04 AI 编程助手 Cursor 的成功并不基于 o 方向的模型
41:51 蒸馏 o1 数据复现 o1,没那么难
44:09 编程之外另一 Agent 落地场景:信息的获取
51:09 中美模型的一个区别,前者缺少内部 benchmark
55:19 MiniMax 的技术团队特点:模型、Infra 和工程的综合能力强;客观、扁平、灵活
聊模应一体:市场不是有 A,就不能有 B
01:01:38 模型、应用一起做,还有必要吗?
01:03:59 即使更晚创业,也不会做只做应用的公司,因为想做基于未来技术的产品
01:04:44 海螺文本的失利——没有坚持技术驱动
01:06:48 Talkie、星野的暂时领先——因为更懂用户
01:07:34 做技术的人大部分觉得自己很牛,但我不是这么认知世界的
聊竞争:不要区分大厂和创业公司
01:07:56 不用把创业公司单独当一类公司
01:09:22 DeepSeek 也很纯粹;智谱第一个有 AI 路线图
01:09:59 MiniMax 的路线图?——逃出生天,下一步最重要
01:11:19 一年来大模型竞争最大的变化:更多人意识到这和移动互联网是两件事
01:12:29 没和字节谈过被收购,从来没想过把公司卖一个什么价钱
01:15:02 24 年没完成年初目标,定目标的逻辑就不太对
01:16:28 大厂投入和竞争激烈程度都在预料之内
01:18:46 AI 产品该看什么指标?
01:20:25 大公司之外,更大的 “危险” 还是来自自己的认知
聊团队和自己:放下 ego,深度思考
01:22:49 不要假定团队没有流失,流失才是正常的
01:23:24 MiniMax 需要的两种人
01:25:48 确定研发优先级需要做取舍,不见得每个取舍都对,纠错很重要
01:26:56 CEO 决策什么不决策什么不重要,重要的是组织有共同决策标准
01:29:48 让所有人都觉得公司被管得很好,这不是一个目标
01:30:28 打造 AI 组织的难点:持续吸引更好的人
01:31:17 半年多前焦虑,现在不了,因为已做出取舍,以技术迭代为最大目标
01:32:08 去年反思最多的问题——认知能力为何不能提升得更快?
01:32:16 放下自我,思考得更深入
01:34:29 为什么一直被叫 IO?
01:36:38 25 年对自己的期待:不断提高技术水平
· FIN ·