DeepSeek-R1 模型发布，性能对标 OpenAI o1 正式版

IT之家 01月20日

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

幻方量化旗下AI公司深度求索发布了DeepSeek-R1模型，并同步开源模型权重。该模型在后训练阶段大规模使用强化学习技术，在极少标注数据下，显著提升了推理能力，在数学、代码和自然语言推理等任务上表现出色，性能可与OpenAI o1正式版媲美。DeepSeek还通过R1模型蒸馏出多个小模型并开源，其中32B和70B模型在多项能力上超越了OpenAI o1-mini。DeepSeek-R1 API服务已上线，定价为每百万输入tokens 1元/4元，每百万输出tokens 16元。此外，DeepSeek还将其训练技术完全公开，并统一使用MIT License，支持模型蒸馏，促进技术开源共享。

🚀 DeepSeek-R1模型发布：深度求索公司发布了DeepSeek-R1模型，并同步开源模型权重，该模型在后训练阶段大规模使用了强化学习技术，在极少标注数据的情况下，极大提升了模型推理能力。

🧠 性能比肩OpenAI：DeepSeek-R1在数学、代码、自然语言推理等任务上，性能比肩OpenAI o1正式版，同时蒸馏出的小模型也超越了OpenAI o1-mini。

💰 API服务及定价：DeepSeek-R1 API服务已上线，定价为每百万输入tokens 1元（缓存命中）/ 4元（缓存未命中），每百万输出tokens 16元。

🔓 开源协议调整：DeepSeek已将DeepSeek-R1训练技术全部公开，并统一使用MIT License，完全开源，不限制商用，无需申请。

🔬 支持模型蒸馏：DeepSeek产品协议明确支持“模型蒸馏”，允许用户利用模型输出、通过模型蒸馏等方式训练其他模型，促进技术的开源和共享。

IT之家 1 月 20 日消息，幻方量化旗下 AI 公司深度求索（DeepSeek）今日正式发布 DeepSeek-R1 模型，并同步开源模型权重。

据官方介绍，DeepSeek-R1 在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1 正式版。

DeepSeek 称，DeepSeek-R1 蒸馏小模型超越 OpenAI o1-mini。DeepSeek 在开源 DeepSeek-R1-Zero 和 DeepSeek-R1 两个 660B 模型的同时，通过 DeepSeek-R1 的输出，蒸馏了 6 个小模型开源给社区，其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini 的效果。

DeepSeek-R1 API 服务定价为每百万输入 tokens 1 元（缓存命中）/ 4 元（缓存未命中），每百万输出 tokens 16 元。

IT之家注意到，DeepSeek 已将 DeepSeek-R1 训练技术全部公开，在发布并开源 R1 的同时，同步在协议授权层面也进行了如下调整：

模型开源 License 统一使用 MIT。我们曾针对大模型开源的特点，参考当前行业的通行实践，特别引入 DeepSeek License 为开源社区提供授权，但实践表明非标准的开源 License 可能反而增加了开发者的理解成本。为此，此次我们的开源仓库（包括模型权重）统一采用标准化、宽松的 MIT License，完全开源，不限制商用，无需申请。

产品协议明确可“模型蒸馏”。为了进一步促进技术的开源和共享，我们决定支持用户进行“模型蒸馏”。我们已更新线上产品的用户协议，明确允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签