即刻AI圈子 2024年11月14日
Sam Altman发了条言简意赅的推文:there is no wall。 终于还是被推出来回应大模型预训练陷入瓶颈的行业恐慌了。 清理了一下时间线,大致上是这样的: - The Inf...
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

近期,关于大模型预训练陷入瓶颈的讨论甚嚣尘上。The Information率先报道OpenAI GPT-5项目难产,随后Bloomberg报道OpenAI、Google和Anthropic等公司新模型发布延迟,收益递减现象明显。AI社区起初质疑报道缺乏实证,但OpenAI前首席科学家Ilya Sutskever、Meta首席科学家Yann LeCun等业内人士相继发声,认为大模型扩展法则或已触及极限。Anthropic创始人Dario Amodei则认为扩展法则来自经验而非客观规律,但仍有潜力。最终,OpenAI CEO Sam Altman发推回应,表示“墙不存在”,意在否认大模型预训练已触及瓶颈。

🤔 The Information报道OpenAI GPT-5项目难产,随后Bloomberg报道OpenAI、Google和Anthropic等公司新模型发布延迟,收益递减现象明显,引发行业对大模型预训练瓶颈的担忧。

👨‍🔬OpenAI前首席科学家Ilya Sutskever以及Meta首席科学家Yann LeCun等业内人士认为,大模型扩展法则可能已经到达极限,需要改变训练模式。

🗣️Anthropic创始人Dario Amodei认为大模型扩展法则来自经验而非客观规律,但仍然存在继续发展的可能性。

📢OpenAI CEO Sam Altman发推回应,表示“墙不存在”,否认大模型预训练已触及瓶颈,并暗示未来仍有突破可能。

Sam Altman发了条言简意赅的推文:there is no wall。

终于还是被推出来回应大模型预训练陷入瓶颈的行业恐慌了。

清理了一下时间线,大致上是这样的:

- The Information率先报道,OpenAI因为GPT系列模型的进化速度放缓,调整了公司战略,GPT-5难产已成定局;

- Bloomberg随后助攻,把采写范围扩大到了OpenAI、Googe和Anthropic三家公司,发现新版模型全在推迟发布,可以看到收益递减曲线;

- AI社区此时普遍还认为媒体报道有失公允,觉得没有核心从业者出来证言,只是搜集了边角料想搞个大新闻而已,大家不要慌,「且听龙吟」;

- 然后从OpenAI出局的前首席科学家Ilya Sutskever刚好跳出来补刀,对路透社判断大模型扩展法则确实已经到达了极限,必须改变训练模式;

- Meta的首席科学家、图灵奖得主Ynn LeCun也没放过攻击闭源竞争对手的机会,在Threads上表示「我不想说我早就告诉过你,但我确实早就告诉过你」;

- Anthropic的创始人Dario Amodei在播客里安抚市场,认为预训练的扩展法则(Scaling Laws)来自经验而非客观规律,但自己会押它仍然会继续存在;

- 再就是两个小时前,Sam Altman现身喊话,说物理学不存,不对,是墙不存在。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

大模型 预训练 扩展法则 GPT-5 瓶颈
相关文章