05月29日 23:02
新版DeepSeek-R1深夜整大活!编程能力暴涨,实测直逼Claude 4,网友玩疯直呼太强了
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

DeepSeek于今日凌晨在Hugging Face上开源了DeepSeek-R1-0528模型。开发者体验后认为,该模型在编程、逻辑推理和交互能力等方面均有显著提升。基准测试显示,其性能接近OpenAI的o4 mini和o3模型高版本,在32k以内文本召回测试中表现优异。开发者通过案例体验称,DeepSeek-R1-0528效果基本追平Claude 4,有些情况下表现更好。新模型能够一次性生成超千行无Bug代码,且在HTML/CSS/JS动态交互实现中更加精准,整体风格更接近OpenAI o3,是目前开源大模型中性能顶尖的版本之一。

🚀 DeepSeek-R1-0528模型在Hugging Face上开源,标志着开源领域的一大进步,该模型在编程、逻辑推理和交互能力上均有显著提升,引发开发者热烈反响。

💻 代码测试平台Live CodeBench的数据显示,DeepSeek-R1-0528的性能已接近OpenAI的o4 mini和o3模型高版本,证明其在代码生成和理解方面具有强大的能力。

📝 文本召回测试表明,DeepSeek-R1-0528在处理32k以内文本时,比之前的R1版本表现更佳,但在60k文本处理上有所下降,这意味着其在短文本理解和生成方面更具优势。

🎮 开发者通过实际案例体验发现,DeepSeek-R1-0528的效果已基本追平Claude 4,甚至在某些情况下表现更好,例如在飞机大战游戏生成对比中,新版R1新增了许多道具,画面效果更佳。

李水青 2025-05-29 10:29 浙江

这可能是DeepSeek原计划发布的R2。

这可能是DeepSeek原计划发布的R2。

作者 |  李水青

编辑 |  云鹏

智东西5月29日报道,今天凌晨,DeepSeek-R1-0528在Hugging Face上开源。

地址:

https://huggingface.co/deepseek-ai/DeepSeek-R1-0528/tree/main

此前昨日晚间,DeepSeek官方推送通知,R1模型已经完成小版本试升级,可在官方网站、APP、小程序测试(打开深度思考)体验。

针对DeepSeek-R1-0528,DeepSeek尚未放出模型卡介绍更多功能。但开发者已为之沸腾,多方用户体验后提到,DeepSeek-R1-0528在编程、逻辑推理、交互能力等方面均有显著提升。

已有开发者对DeepSeek-R1-0528进行了基准测试,称这是开源领域的重大胜利。代码测试平台Live CodeBench显示,其性能接近OpenAI在4月中旬发布的o4 mini和o3模型高版本

▲DeepSeek-R1-0528性能接近o3模型高版本

测试地址:

https://livecodebench.github.io/leaderboard.html

同时有文本召回测试结果显示,32k以内文本DeepSeek-R1-0528比之前的R1要好不少,但是60k下降了不少。这意味着在32k以内针对给定的材料使用新R1提问让它回答的话,准确度会好不少。

▲DeepSeek-R1-0528基于材料回复更准确

测试地址:

https://fiction.live/stories/Fiction-liveBench-May-22-2025/oQdzQvKHw8JyXbN87

多位开发者通过案例体验称,DeepSeek-R1-0528效果基本追平Claude 4,有些情况下表现更好。

“直接看效果, 我就提两点, 注意平面的橙色漫反射, 以及控制面板的美观程度。这俩是用同一个提示词一次性生成的,Claude 4 sonnet生成了542行, DeepSeek-R1-0528生成了728行。帧率和运动角度细节也值得关注。”一位开发者在X平台上称。

▲DeepSeek-R1-0528与Claude 4 sonnet进行效果比较

有开发者让DeepSeek-R1-0528、Claude 4和DeepSeek-V3-0324在飞机大战游戏生成对比效果。新版R1在之前的基础上,自己新增了很多道具,画面也比之前更好了。

▲DeepSeek-R1-0528、Claude 4和DeepSeek-V3-0324在飞机大战游戏程序的表现

此外,根据测试者反馈,DeepSeek-R1-0528能够一次性生成超千行无Bug代码,且在HTML/CSS/JS动态交互实现(如天气卡片动画、数据可视化)中更加精准。

DeepSeek-R1-0528在风格上更接近OpenAI o3,是目前开源大模型中性能顶尖的版本之一。有测试者认为,该版本的性能可能原本计划作为R2发布,但因竞争压力而以R1升级版形式推出。

来源:Hugging Face、X平台

(本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。)

 科普视频

2025超级智能体爆发元年,企业如何真正用上专属AI生产力?跟随首个企业部署超级智能体实操指南,联想集团F24/25财年硬核知识科普视频收官之作《超级智能体:企业如何获得AI自由》,亲历当下智能黄金时代的关键转折——以混合式AI为阶梯,企业专属智能加速落地,新一轮企业生产力,即将引爆。


阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepSeek-R1-0528 开源模型 AI性能 代码生成
相关文章