华尔街见闻 - 最热文章 03月06日
昨夜3件事,加强中国AI科技叙事?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

昨晚到今天,AI圈传来三大重磅消息,持续加强中国科技叙事。阿里通义开源了RL新模型,32B性能比肩DeepSeek R1,且本地化部署门槛进一步降低,4090或Mac mini即可运行。苹果发布Mac studio,7万多的价格即可本地满血运行DS-R1。Monica团队打造的Agent Manus AI刷屏,市场对Agent能力有了更多认识和期待。这三件事预示着RL的大规模强化学习scaling law已经出现,以阿里为代表的中国科技公司将会迎来持续的重估。

🚀 阿里通义开源RL新模型,32B性能比肩DeepSeek R1,在数学和代码能力评测中表现出色,且可在通义APP和网页端体验。该模型通过校验生成答案的正确性来为数学问题提供反馈,训练方式有所创新。

💻 苹果发布Mac studio,仅需7万多即可本地满血运行DeepSeek-R1,预计速度可达20token/s,大幅降低了R1本地化的门槛,从70多万降至7万多。

🤖 Manus AI的刷屏,虽然疑似软文推广,但提高了市场对Agent能力的认知和期待,进一步激发了应用端的需求。算力成为关键要素。

昨晚到今天,AI圈有3个重磅消息,中国科技的叙事持续加强。

1)阿里通义开源RL新模型

阿里通义没有食言,说这周再开源一个RL新模型,昨晚放出来了。最厉害的是32B性能比肩满血DeepSeek R1,在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1蒸馏模型,现在已经可以在通义APP和网页端体验了。

而且看起来,这个RL训练并没有花费太长时间,阿里的朋友反馈,与以往奖传统励模型不同的是,说这次是通过校验生成答案的正确性来为数学问题提供反馈。

高性能大模型本地化部署门槛进一步降低,现在一个4090就可以了,极限一点大于24G内存(苹果的架构内存GPU可以共享)的Mac mini就可以部署,国补下,4位数内搞定。

影响就是RL的潜力又被放大了,智能硬件的能力的提升可能很快会到来?应用的需求又会爆发,又利好了Agent的发展。

2)Mac studio可以本地满血DS-R1

苹果发布Mac studio 7w多的价格可以本地满血DS-R1,预计20token/s;(R1满血本地化门槛大幅降低,从70多万到7w多)

3) Manus AI刷屏

Manus AI这个Monica团队打造的Agent刷屏(虽然很明显是软文广子),但市场对Agent能力有了更多认识和期待,应用端期待更高了。(算力、算力、算力);



这三条,又要改变一些市场对AI的叙事,但可以预见,RL的大规模强化学习的scaling law已经出现,以阿里为代表的中国科技公司将会迎来持续的重估。

 

来源:硬AI,原文标题:《昨夜3件事,加强中国AI科技叙事?》

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI RL模型 DeepSeek Agent 算力
相关文章