华尔街见闻 02月26日
如何预期DeepSeek R2
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

DeepSeek预计在五月前发布r2,该版本将在r1的基础上大幅提升,主要通过增加RL训练数据来增强模型的复杂推理能力。r1论文中提到,随着RL数据的增加,模型将涌现出“反思”、“探索不同方法”等复杂行为能力。DeepSeek的目标是在其他公司闭源的情况下,继续开源,r2对标OpenAI的o3完整版,V4至少对标GPT-4.5。V4可能会加入多模态能力,而r系列依然是推理模型。DeepSeek甚至可能比英伟达更懂如何使用GPU,其创新受益于全球“开源”研究。因此,相比于r2,V4更值得期待,因为它将打开推理模型的新天花板。

🚀 DeepSeek预计在5月前发布r2,该版本将在r1的基础上大幅提升,主要通过增加RL训练数据来增强模型的复杂推理能力。r1论文中提到,随着RL数据的增加,模型将涌现出“反思”、“探索不同方法”等复杂行为能力。

💡 DeepSeek的目标是在其他公司闭源的情况下,继续开源。r2应该对标的是OpenAI的o3完整版,而V4至少应该对标GPT-4.5,基于V4+RL的模型,应该对标是未来的所谓“GPT-5”。

🖼️ 合理预期V4可能会加入多模态能力,但r系列依然是推理模型。且这个过程中,所有的“原料”全部开源,不仅原料开源,连制造原材料的“配方”都直接开源。

🧠 DeepSeek甚至可能比英伟达更懂如何使用GPU,其Research上的创新,OpenAI o系列的灵感也来自于早已发表的“开源”paper,叠加自己的算力优势和工程探索实现。说到底没人全靠自己闭门造车,都受益于全世界“开源”研究或实践的喂养。

路透今晚报道了DeepSeek可能在5月前发布r2。之前DeepSeek研究员Daya在2月初已经说过:RL还在早期,今年会看“显著进步”(significant progress)

其实在r1论文中也提到过:由于目前RL训练数据还很少,R1的下个版本会大幅提升。

也就是r1论文中的下图,以及论文所述:随着RL数据的增加,模型不仅解决复杂推理任务的能力持续稳定提升,且会自然涌现出一些复杂行为能力,比如“反思”、“探索不同方法”。这些能力不是人类设计,而是随着模型在RL环境中训练,自然涌现的。

粗浅的理解,现在不需要算法上的巨大创新,按照目前路线+更多算力+DS如此强的infra能力,基于目前的V3基座模型,依然可以取得r2/r3。当看到RL提升边际放缓,再基于新的基座V4,继续做RL,进一步推进推理模型提升。也就是下面这张图:(左脚踩右脚示意图)

而参考OpenAI的路线图,o3已经决定不发布完整模型,GPT-4.5也成了最后一个独立发布的基座模型,意味着GPT-5(混合模型)开始,越来越黑盒。说白了,以后无论是基座模型还是推理模型本身,都是“原料”而不是“最终产品”,CloseAI和Anthropic一定会雪藏。

但DeepSeek要做的,就是在别人继续闭源的时候,继续开源。r2应该对标的是o3完整版,而V4至少应该对标GPT-4.5,基于V4+RL的模型,应该对标是未来的所谓“GPT-5”。因此合理预期应该是V4可能会加入多模态能力,但r系列依然是推理模型。且这个过程中,所有的“原料”全部开源,不仅原料开源,按照这次代码的基调,连制造原材料的“配方”都直接开源。

这里面其实没有什么DeepSeek不知道的秘密,甚至在infra层面远超北美很多模型大厂。今天我们在星球讨论的:DeepSeek甚至可能比英伟达更懂如何使用GPU。而所谓Research上的创新,OpenAI o系列的灵感也来自于早已发表的“开源”paper,叠加自己的算力优势和工程探索实现。说到底没人全靠自己闭门造车,都受益于全世界“开源”研究或实践的喂养。

因此说回来,相比于r2,大家反而应该更期待V4,因为这打开了推理模型另一个level天花板,开辟的是另一条全新跑道。r2是时间表上确定的事情,而V4会是一个惊喜。这都会在今年发生。

 

来源:信息平权,原文标题:《如何预期DeepSeek R2》

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepSeek R2 V4 开源 多模态
相关文章