DeepSeek 05月14日 00:51
DeepSeek-R1 发布,性能对标 OpenAI o1 正式版
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

DeepSeek发布并开源DeepSeek-R1模型,遵循MIT License,允许用户通过蒸馏技术训练其他模型。R1上线API,开放思维链输出,性能对齐OpenAI-o1正式版。同时,DeepSeek公开R1训练技术,并蒸馏了多个小模型开源给社区,部分模型效果对标OpenAI o1-mini。为推动开源,模型开源License统一使用MIT,产品协议明确支持“模型蒸馏”。用户可通过官网或App调用R1完成推理任务,API服务定价为每百万输入tokens 1元/4元,每百万输出tokens 16元。

🚀DeepSeek-R1模型正式发布并开源,模型权重同步开放,遵循MIT License,允许用户通过蒸馏技术训练其他模型,促进技术社区的交流与创新协作。

💡DeepSeek-R1性能对齐OpenAI-o1正式版,后训练阶段大规模使用强化学习技术,在数学、代码、自然语言推理等任务上表现出色,同时DeepSeek将R1训练技术全部公开。

📚通过DeepSeek-R1的输出,DeepSeek蒸馏了多个小模型开源给社区,其中32B和70B模型在多项能力上实现了对标OpenAI o1-mini的效果。

✅模型开源License统一使用MIT,完全开源,不限制商用,无需申请。产品协议明确可“模型蒸馏”,进一步促进技术的开源和共享。

深度求索 2025-01-20 20:10 北京

更新遵循 MIT License 开放API,训练技术同步公开

今天,我们正式发布 DeepSeek-R1,并同步开源模型权重。

性能对齐OpenAI-o1正式版
DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。

在此,我们将 DeepSeek-R1 训练技术全部公开,以期促进技术社区的充分交流与创新协作。

论文链接

https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

蒸馏小模型超越 OpenAI o1-mini

我们在开源 DeepSeek-R1-Zero 和 DeepSeek-R1 两个 660B 模型的同时,通过 DeepSeek-R1 的输出,蒸馏了 6 个小模型开源给社区,其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini 的效果。

HuggingFace链接

https://huggingface.co/deepseek-ai

开放的许可证和用户协议

为了推动和鼓励开源社区以及行业生态的发展,在发布并开源 R1 的同时,我们同步在协议授权层面也进行了如下调整:

App与网页端

登录DeepSeek官网或官方App,打开“深度思考”模式,即可调用最新版 DeepSeek-R1 完成各类推理任务。

API 及定价

DeepSeek-R1 API 服务定价为每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中),每百万输出 tokens 16 元

详细的 API 调用指南请参考官方文档 

https://api-docs.deepseek.com/zh-cn/guides/reasoning_model

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepSeek-R1 开源模型 模型蒸馏 MIT License
相关文章