初探 Deepseek R1-0528 开源模型：AI 编程能力跃升，媲美 OpenAI o3 和 o4-mini

IT之家 05月29日 09:23

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

Deepseek最新发布的R1-0528模型小版本在编程能力、审美设计和代码补全等方面表现出色。尤其是在复杂指令处理和前端页面生成上展现了高精度和高效能。其编程能力可媲美OpenAI最新的o3模型。在Extended NYT Connections跑分中，R1-0528模型跑分显著高于初代R1模型。此外，R1-0528模型在审美设计和代码补全方面同样表现卓越，能准确理解复杂指令，生成复杂前端页面和动态动画，且推理时长大幅缩短。

💻编程能力提升：DeepSeek-R1-0528模型可根据用户输入的简单提示词，快速生成高质量代码，在Live CodeBench中的性能可以媲美OpenAI最新的o3模型（High）。

🧩基准测试优化：在Extended NYT Connections跑分中，DeepSeek-R1-0528模型跑分为49.8分，显著高于初代Deepseek R1模型的38.6分，表明其语言理解和推理能力得到提升。

🎨审美设计与代码补全：R1-0528模型在审美设计和代码补全（code completion）方面同样表现卓越，轻松应对多样化任务，输出结果精准且实用。

⏱️推理时长缩短：相较于OpenAI的o3和o4-mini模型，R1-0528大幅缩短了推理时长，提供了更加流畅和高效的使用体验。

IT之家 5 月 29 日消息，深度求索（Deepseek）昨日通过官方交流群，邀请用户测试 DeepSeek-R1-0528 模型小版本，初步测试结果表明，R1-0528 在编程能力、审美设计和代码补全等方面表现出色，尤其在复杂指令处理和前端页面生成上展现了高精度和高效能。

DeepSeek-R1-0528 模型在多个方面实现了性能提升，其中最为亮眼的就是编程能力，能根据用户输入的简单提示词，快速生成高质量代码。

代码测试平台 Live CodeBench 中显示，其性能可以媲美 OpenAI 最新的 o3 模型（High）。

在 Extended NYT Connections 跑分中，DeepSeek-R1-0528 模型跑分为 49.8 分，而初代 Deepseek R1 模型为 38.6 分。

IT之家注：Extended NYT Connections 是一个用于评估大型语言模型（LLM）性能的基准测试，基于《纽约时报》的 Connections 谜题游戏。

这个基准测试包含了 651 个 NYT Connections 谜题，并且增加了额外的词汇以提高难度，旨在更全面地测试模型的语言理解和推理能力。

R1-05-28 具有 o3-2.5 专业风格的响应。箭头 / 星号的使用与 o3 风格非常一致，结尾处“why it works”的表述更具说服力。

此外，在审美设计和代码补全（code completion）方面，R1-0528 同样表现卓越。测试中，该模型轻松应对多样化任务，输出结果精准且实用。

在生成复杂前端页面和动态动画方面，R1-0528 也展现了强大的能力，能准确理解复杂指令。更重要的是，相比较 OpenAI 的 o3 和 o4-mini 模型，R1-0528 大幅缩短了推理时长，提供了更加流畅和高效的使用体验。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签