DeepSeek 01月21日
DeepSeek-R1 发布,性能对标 OpenAI o1 正式版
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

DeepSeek正式发布并开源DeepSeek-R1模型,该模型性能比肩OpenAI o1正式版,尤其在数学、代码和自然语言推理方面表现突出。同时,DeepSeek还开源了通过R1蒸馏出的6个小模型,部分模型能力已超越OpenAI o1-mini。为促进技术共享,DeepSeek统一采用MIT License,允许用户进行模型蒸馏,并调整了用户协议。用户可通过官网或App调用最新版R1,API定价为每百万输入tokens 1元/4元,每百万输出tokens 16元。

🚀 DeepSeek-R1模型正式开源,性能对标OpenAI-o1正式版,尤其在数学、代码、自然语言推理等任务上表现出色。

💡 DeepSeek开源R1的同时,还开源了通过R1蒸馏的6个小模型,其中32B和70B模型在多项能力上超越了OpenAI o1-mini。

⚖️ 模型开源许可证统一采用MIT License,允许用户进行“模型蒸馏”,并更新了线上产品的用户协议,进一步促进了技术的开源和共享。

💰 DeepSeek-R1 API定价为:每百万输入tokens 1元(缓存命中)/ 4元(缓存未命中),每百万输出tokens 16元。

深度求索 2025-01-20 20:10 北京

更新遵循 MIT License 开放API,训练技术同步公开

今天,我们正式发布 DeepSeek-R1,并同步开源模型权重。

性能对齐OpenAI-o1正式版

DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。

在此,我们将 DeepSeek-R1 训练技术全部公开,以期促进技术社区的充分交流与创新协作。

论文链接

https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

蒸馏小模型超越 OpenAI o1-mini

我们在开源 DeepSeek-R1-Zero 和 DeepSeek-R1 两个 660B 模型的同时,通过 DeepSeek-R1 的输出,蒸馏了 6 个小模型开源给社区,其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini 的效果。

HuggingFace链接

https://huggingface.co/deepseek-ai

开放的许可证和用户协议

为了推动和鼓励开源社区以及行业生态的发展,在发布并开源 R1 的同时,我们同步在协议授权层面也进行了如下调整:

App与网页端

登录DeepSeek官网或官方App,打开“深度思考”模式,即可调用最新版 DeepSeek-R1 完成各类推理任务。

API 及定价

DeepSeek-R1 API 服务定价为每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中),每百万输出 tokens 16 元

详细的 API 调用指南请参考官方文档 

https://api-docs.deepseek.com/zh-cn/guides/reasoning_model

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepSeek-R1 开源模型 模型蒸馏 MIT License API
相关文章