IT之家 01月20日
DeepSeek-R1 模型发布,性能对标 OpenAI o1 正式版
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

幻方量化旗下AI公司深度求索发布了DeepSeek-R1模型,并同步开源模型权重。该模型在后训练阶段大规模使用强化学习技术,在极少标注数据下,显著提升了推理能力,在数学、代码和自然语言推理等任务上表现出色,性能可与OpenAI o1正式版媲美。DeepSeek还通过R1模型蒸馏出多个小模型并开源,其中32B和70B模型在多项能力上超越了OpenAI o1-mini。DeepSeek-R1 API服务已上线,定价为每百万输入tokens 1元/4元,每百万输出tokens 16元。此外,DeepSeek还将其训练技术完全公开,并统一使用MIT License,支持模型蒸馏,促进技术开源共享。

🚀 DeepSeek-R1模型发布:深度求索公司发布了DeepSeek-R1模型,并同步开源模型权重,该模型在后训练阶段大规模使用了强化学习技术,在极少标注数据的情况下,极大提升了模型推理能力。

🧠 性能比肩OpenAI:DeepSeek-R1在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版,同时蒸馏出的小模型也超越了OpenAI o1-mini。

💰 API服务及定价:DeepSeek-R1 API服务已上线,定价为每百万输入tokens 1元(缓存命中)/ 4元(缓存未命中),每百万输出tokens 16元。

🔓 开源协议调整:DeepSeek已将DeepSeek-R1训练技术全部公开,并统一使用MIT License,完全开源,不限制商用,无需申请。

🔬 支持模型蒸馏:DeepSeek产品协议明确支持“模型蒸馏”,允许用户利用模型输出、通过模型蒸馏等方式训练其他模型,促进技术的开源和共享。

IT之家 1 月 20 日消息,幻方量化旗下 AI 公司深度求索(DeepSeek)今日正式发布 DeepSeek-R1 模型,并同步开源模型权重。

据官方介绍,DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。

DeepSeek 称,DeepSeek-R1 蒸馏小模型超越 OpenAI o1-mini。DeepSeek 在开源 DeepSeek-R1-Zero 和 DeepSeek-R1 两个 660B 模型的同时,通过 DeepSeek-R1 的输出,蒸馏了 6 个小模型开源给社区,其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini 的效果。

登录 DeepSeek 官网或官方 App,打开“深度思考”模式,即可调用最新版 DeepSeek-R1 完成各类推理任务。

DeepSeek-R1 API 服务定价为每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中),每百万输出 tokens 16 元。

IT之家注意到,DeepSeek 已将 DeepSeek-R1 训练技术全部公开,在发布并开源 R1 的同时,同步在协议授权层面也进行了如下调整:

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepSeek-R1 强化学习 模型开源 模型蒸馏 MIT License
相关文章