你以为这是DeepSeek的一次小更新，实际上它又超神了。。。

差评 05月30日 01:32

你以为这是DeepSeek的一次小更新，实际上它又超神了。。。

DeepSeek-R1悄然更新至0528版本，推理性能大幅提升，前端开发和工具使用能力更智能。尤其在中文长文本生成方面表现卓越，能快速生成高质量科幻小说，甚至超越部分网文水平。代码能力也得到显著提升，在LiveCodeBench榜单上名列前茅，解决了之前的编程问题，生成代码一次启动成功，物理效果更符合规律。前端审美也得到优化，界面美观度提升。此次更新展示了DeepSeek在本土化优势和性能上的实力，让人对国产大模型充满期待。

🚀DeepSeek-R1-0528版本在推理性能、前端开发和工具使用能力上均有显著提升，尤其是在物理世界的推理能力上，比Claude-4-Sonnet表现更优秀，例如小球撞击砖块后的倒塌效果更符合物理规律。

✍️DeepSeek-R1-0528在长文本生成能力方面表现惊艳，能够快速生成高质量的科幻小说，情节和逻辑都无可挑剔，甚至超越了部分网文的水平，展现了其在中文领域的强大能力。

💻DeepSeek-R1-0528的代码能力也得到提升，在LiveCodeBench榜单上跃升至第四名，解决了之前版本中五边形小球弹跳代码启动失败的问题，新版本生成的代码不仅一次启动成功，而且小球弹跳效果更符合物理规律，细节到位。

🎨DeepSeek-R1-0528的前端审美也得到优化，与Claude Sonnet 4相比，界面美观度和功能完整度不相上下，并且R1-0528还增加了使用说明，但在取色功能上仍存在bug。

世超 2025-05-30 00:03 浙江

这就去开起点账号。

还没等来 DeepSeek-R2，DeepSeek-R1 昨天晚上先悄悄更新了一波。

和上次 V3-0324 版本一样，这回 DeepSeek 又又又往 Hugging Face 上默默扔了一个 DeepSeek-R1-0528，Model Card 和官方的更新公告都没出。

而在大伙儿还没反应过来的时候，R1 新版本已经是大模型热搜榜的第一了。

大家热烈讨论 R1 新版本的同时，也不忘 cue 一下 R2 和 V4 的大版本更新。

由于每次 DeepSeek 都喜欢赶在中国传统节日前后出点新东西，国外网友已经开始从国庆和端午的放假时间，来推测发布日期了。。。

难道这也是计划的一部分吗？（手动狗头）

值得一提的是，今天也是 NVIDIA Q1 财报发布的日子。遥想上次 R1 技术报告给大模型训练算力带来的拷打，还好这次只是 DeepSeek 小更，并没有公布算力信息，不然真的有点难绷。

话说回 R1 这次更新，DeepSeek 官方表示，R1-0528 的推理性能大幅提升、前端开发能力更强、工具使用能力更智能。

从官方案例来看，R1-0528 在物理世界的推理能力确实比 Claude-4-Sonnet 要优秀。小球在破坏砖块墙后，砖块的不规则倒塌更符合物理规律。

而等世超亲手测完了这次更新，只想说：虽然 R1-0528 编程推理能力有提升，但达不到惊艳。至于它的长文本生成能力，我愿称 DeepSeek 为大模型里掌管中文的神。

精彩的东西咱放在前面看，我们本来以为这只是一次普通的测试，没想到事情没那么简单。。。

世超给 R1 的提示词只有简单的：“请给我写一篇 10000 字的科幻小说。” 其余从文章的大纲到内容全是它自己完成。

话不多说，大家直接看文吧：

“霓虹像永不凝固的液态宝石”，“整座城市浸泡在一种迷幻而冰冷的蓝紫色调里”。。。

此刻，世超只恨不能把全篇小说截给大家，感兴趣的差友可以去文末链接阅读全文。

作为一篇悬疑科幻小说，DeepSeek 行文流畅，科幻氛围浓厚，人物描写细致入微，从情节到逻辑都无可挑剔。

写出这样的故事，DeepSeek 只思考了 40 秒。

而一直以来被大家认为文字功底很强的 Gemini 2.5 pro 表现一般，写出来的小说像是辞藻堆砌，有些晦涩难懂。

有一说一，看完 DeepSeek 写的小说，世超的心情非常复杂。这篇小说甚至可以说比大部分网文都优秀，又有速度又有质量，大模型恐怖如斯。

难道失业的风也要吹到。。。世超表示瑟瑟发抖。

咱再说说代码生成上的更新。其实 R1-0528 的代码能力也有显著的提升，只不过比起它的长文本生成，就有点不够看了。

在大模型代码能力测试基准 LiveCodeBench 上，DeepSeek-R1-0528 已经跃升到了榜单第四，略逊于 o4-Mini（Medium），但和 o3-Mini 打得有来有回，直接被闭源的 OpenAI 包围了。

既然编程能力这么强，世超就先拿经典问题 —— 五边形小球弹跳测一测。

各位差友可能还有印象，之前咱评测 V3-0324 版本的时候也把老 R1 拿出来溜了溜，结果那时候 R1 的表现非常拉垮。

不过，这次 R1-0528 的表现确实出乎意料，比起老 R1 好了不是一点半点。

左边旧 R1，右边 R1-0528

不仅代码一次启动成功，不像老版的飞檐走壁，新版本小球弹跳的效果明显更符合物理规律，在五边形拐角处的丝滑回弹更是细节到位。

除了物理效果提升，R1-0528 生成的界面也很美观，甚至可以自定义重力强度、旋转速度、弹性系数、摩擦系数的参数，还能实时看到小球运动的各种物理参数。

不过可能因为咱在提示词里并没有让它干这些事，虽然物理参数是实时显示变化的，但动画参数控制滑块仅供观赏，没啥实际用途。。。

世超还看到有网友说 R1-0528 能和 Claude Sonnet 4 碰一碰。记得上次测 V3-0324 的时候，Claude Sonnet 3.7 赢得很彻底。不知道这回 DeepSeek 的前端审美有啥优化？

测试完世超觉得，R1 真的没输。

我们给两个模型分别只一次机会，相同的提示词，生成的结果该是啥样就是啥样，不能重来。

首先从画面美观度和功能完整度来说，两者算打个平手。R1-0528 的界面明显不像 V3 时期那么简陋了。功能方面，Sonnet 4 有的，R1-0528 通通都有，R1 还贴心地加上了使用说明。

左 DeepSeek-R1-0528，右 Claude Sonnet 4

但是，实测 Claude Sonnet 4 的清空画板和保存键并不好用。而且两者的取色功能都存在 bug，取色器会穿到色卡的下面去，只能说还有一定进步空间。

左 DeepSeek-R1-0528，右 Claude Sonnet 4

除此之外，也有网友表示这回更新之后，DeepSeek 的深度思考直接停不下来了。。。

为了提升模型深度思考的能力，R1-0528 似乎有意拉长了大模型的思考时长。但这个改动带来的具体效果还是看个人需求，毕竟要是一个问题想上 25 分钟，即使答案更完美，作为用户也确实有点捉急。

总的来说，这次更新 DeepSeek 依然延续了他们过往的风格：轻描淡写小更一下，但是整个大活儿。

DeepSeek-R1-0528 不管是纵向和自己比，还是横向和其它大模型比，表现都丝毫不输，甚至在中文长文本生成方面一骑绝尘。

世超觉得，这次 DeepSeek 带来的惊喜，让我们对国产大模型又有了新的期待。DeepSeek-R1-0528 向我们展示了，它们不仅可以和闭源模型卷性能，还有不可替代的本土化优势。

最后，想体验的差友，现在上官网就能用到 R1 最新的 0528 版本啦。

撰文：莫莫莫甜甜

编辑：江江 & 方糖

美编：焕妍

图片、资料来源：

莫莫实测

X、Reddit、知乎

https://huggingface.co/deepseek-ai

https://openrouter.ai/deepseek/deepseek-r1-0528

DeepSeek 写的小说在这里：

https://github.com/MomoIsNotCoding/DeepSeek-R1-0528-Novel

Gemini 写的小说在这里：

https://github.com/MomoIsNotCoding/Gemini-2.5-pro-Novel

跳转微信打开

Fish AI Reader

AI辅助创作，多种专业模板，深度分析，高质量内容生成。从观点提取到深度思考，FishAI为您提供全方位的创作支持。新版本引入自定义参数，让您的创作更加个性化和精准。

FishAI

鱼阅，AI 时代的下一个智能信息助手，助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepSeek-R1 长文本生成代码能力国产大模型

相关文章

OpenAI在国内的两条应用之路走不通了？

OpenAI在国内的两条应用之路走不通了？

“泼天富贵”砸向国产大模型

AI新竞争：最好的应对是开放

大模型 API 文档一览：有的简洁易用，有的乱七八糟

OpenAI断供中国，微软云却留了后手

OpenAI停用，砸了谁的饭碗？

OpenAI这个盘，阿里云们能接得住吗？

太平洋证券：暑期档游戏及电影上线，持续关注后续储备新游戏上线节奏和上线表现

太平洋证券：暑期档游戏及电影陆续上线，持续关注后续储备新游戏上线节奏和上线表现