晚点LatePost 01月25日
晚点播客丨MiniMax 闫俊杰聊大模型 2024:一个非共识判断引起的回声
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文深入探讨了MiniMax创始人闫俊杰对当前AI发展趋势的独特见解,他认为模型能力提升并不完全依赖用户规模增长。文章剖析了MiniMax在技术驱动下的发展策略,强调了模型技术迭代的重要性,而非盲目追求用户增长。同时,文章还探讨了Agent技术在复杂任务中的应用前景,以及MiniMax在长文本处理和多Agent交互方面的技术突破。此外,文章还涉及了AI领域竞争格局、团队建设以及创业公司如何保持技术领先等多个方面,为读者提供了对AI产业发展的新视角。

💡 模型与应用并非简单的飞轮关系:闫俊杰提出“更好的模型可以导向更好的应用,但更好的应用和更多用户并不会导向更好的模型”的观点,挑战了业界普遍认为的用户规模驱动模型进步的认知。

🚀 技术驱动是核心:MiniMax 坚持技术驱动,致力于不断提高模型上限,而非将重心放在短期用户增长。他们通过开源模型加速技术迭代,并加强技术品牌影响力。

🤖 Agent 技术潜力巨大:MiniMax 强调 Agent 在处理复杂任务中的重要性,尤其是在专业领域达到专业人士水平的能力。他们通过改进传统 Transformer 结构,提升了模型在 long-context 处理和多 Agent 通讯方面的能力。

🎯 市场竞争与认知:MiniMax 认为不应区分大厂和创业公司,应专注于自身技术迭代。他们强调大模型竞争与移动互联网不同,需要更深入的思考和认知。

🌟 自我认知与团队建设:MiniMax 强调放下 ego,深度思考,持续吸引优秀人才。他们认为团队流失是常态,重要的是建立共同的决策标准,持续提升技术水平。

原创 晚点团队 2025-01-22 21:58 北京

“更好的模型可以导向更好的应用,但更好的应用和更多用户并不会导向更好的模型。”

“更好的模型可以导向更好的应用,但更好的应用和更多用户并不会导向更好的模型。”

文丨程曼祺

* 头图:Dota 2019 国际邀请赛决赛(TI9)中,OG 战队的 Ana 使用 IO(小精灵,图中球形发光体)的经典作战,OG 在 TI9 中夺冠。为什么用这个图?播客里有答案。

▲扫描上图中的二维码,可收听播客。《晚点聊 LateTalk》#99 期节目。欢迎在小宇宙、喜马拉雅、苹果 Podcast 等渠道关注、收听我们。


《晚点聊 LateTalk》是《晚点 LatePost》 推出的播客节目。“最一手的商业、科技访谈,最真实的从业者思考。”


上周四,我们发布图文访谈:《晚点对话 MiniMax 闫俊杰:千万别套用移动互联网的逻辑来做 AI》,这是这次访谈的音频版。


闫俊杰的一些 “非共识” 判断,引起不少讨论。


他认为,模型能力和用户规模并不是直接的飞轮关系:“更好的模型可以导向更好的应用,但更好的应用和更多用户并不会导向更好的模型。”


而今天(1 月 22 日)字节跳动发布 Doubao-1.5-pro 模型的技术报告里则提到:“依托字节在推荐、搜索和广告领域的 AB Test 经验,研发了基于用户反馈的高效 PostTraining 全流程……通过用户数据飞轮持续提升模型的实际使用体验。”


「乱翻书」主理人潘乱 1 月 21 日时也预告,他将录一期播客,“就聊能不能套用移动互联网逻辑来看 AI?”


有听友在既看了图文访谈、又听了播客后说:“看文字和听声音感觉还是很不一样。”



其实从用户规模上来说,MiniMax 在大模型创业公司中是相对领先的:它的 AI 社区产品 Talkie 的最新月活用户数已超 Character.ai,成为同类产品全球第一;其在中国的 AI 社区产品 “星野”,用户数、使用时长和留存率也都是第一,高于字节旗下的同类产品。它在去年 8 月底推出的视频生成平台海螺 AI,目前也是全球访问量最高的视频生成网站。


闫俊杰为什么要自己推翻自己的优势?听听他自己怎么说吧。


内容要点

聊 MiniMax-01 新模型系列:为什么开源?

02:12 为什么开源——加速技术迭代 & 加强技术品牌

08:22 行业误区:认为更好的智能水平要依赖更多的用户;其实不然

13:01 想清楚这个逻辑后:模型要追求不断提高上限,而产品就是产品

15:11 明确 MiniMax 是一家技术驱动的公司


聊对技术的态度:“一年前最喜欢说信仰的人,信仰都兑现了吗?”

18:01 “随热点而动?” 这是对我们的误解

20:13 现在没人能定义什么是 AGI,只能定义智能水平会不断进步

22:00 作为创业者,不是说 Scaling Law 撞墙了我就放弃了,而是努力找方法延续它

23:59 一年前最喜欢说信仰的人,信仰都兑现了吗?


聊 Agent:long-context 很重要,探索 coding 之外的 Agent 场景

25:31 Agent 能处理复杂任务,复杂任务指在专业领域达到专业人士水平

27:51 Agent 需要模型架构和能力的提升;MiniMax-01 做到了第一点

29:08 01 改传统 Transformer 里的非线性注意机制为线性注意力机制,提升了处理 long-context 的能力,这对单 Agent 交互质量,和多 Agent 通讯都很重要

35:07 为什么没发 o1 方向模型?

39:40 多模态能力在 OpenAI L1-L5 的 AGI 路线图里很重要

41:04 AI 编程助手 Cursor 的成功并不基于 o 方向的模型

41:51 蒸馏 o1 数据复现 o1,没那么难

44:09 编程之外另一 Agent 落地场景:信息的获取

51:09 中美模型的一个区别,前者缺少内部 benchmark

55:19 MiniMax 的技术团队特点:模型、Infra 和工程的综合能力强;客观、扁平、灵活


聊模应一体:市场不是有 A,就不能有 B

01:01:38 模型、应用一起做,还有必要吗?

01:03:59 即使更晚创业,也不会做只做应用的公司,因为想做基于未来技术的产品

01:04:44 海螺文本的失利——没有坚持技术驱动

01:06:48 Talkie、星野的暂时领先——因为更懂用户

01:07:34 做技术的人大部分觉得自己很牛,但我不是这么认知世界的


聊竞争:不要区分大厂和创业公司

01:07:56 不用把创业公司单独当一类公司

01:09:22 DeepSeek 也很纯粹;智谱第一个有 AI 路线图

01:09:59 MiniMax 的路线图?——逃出生天,下一步最重要

01:11:19 一年来大模型竞争最大的变化:更多人意识到这和移动互联网是两件事

01:12:29 没和字节谈过被收购,从来没想过把公司卖一个什么价钱

01:15:02 24 年没完成年初目标,定目标的逻辑就不太对

01:16:28 大厂投入和竞争激烈程度都在预料之内

01:18:46 AI 产品该看什么指标?

01:20:25 大公司之外,更大的 “危险” 还是来自自己的认知


聊团队和自己:放下 ego,深度思考

01:22:49 不要假定团队没有流失,流失才是正常的

01:23:24 MiniMax 需要的两种人

01:25:48 确定研发优先级需要做取舍,不见得每个取舍都对,纠错很重要

01:26:56 CEO 决策什么不决策什么不重要,重要的是组织有共同决策标准

01:29:48 让所有人都觉得公司被管得很好,这不是一个目标

01:30:28 打造 AI 组织的难点:持续吸引更好的人

01:31:17 半年多前焦虑,现在不了,因为已做出取舍,以技术迭代为最大目标

01:32:08 去年反思最多的问题——认知能力为何不能提升得更快?

01:32:16 放下自我,思考得更深入

01:34:29 为什么一直被叫 IO?

01:36:38 25 年对自己的期待:不断提高技术水平

·  FIN  ·

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

MiniMax AI模型 Agent技术 技术驱动 行业认知
相关文章