DeepSeek 推理模型预览版上线，解密 o1 推理过程

原创深度求索 2024-11-20 19:59 北京

推理性能媲美 o1-preview，公开完整思维链

今天，DeepSeek 全新研发的推理模型 DeepSeek-R1-Lite 预览版正式上线。

所有用户均可登录官方网页（chat.deepseek.com），一键开启与 R1-Lite 预览版模型的超强推理对话体验。

DeepSeek R1 系列模型使用强化学习训练，推理过程包含大量反思和验证，思维链长度可达数万字。

该系列模型在数学、代码以及各种复杂逻辑推理任务上，取得了媲美 o1-preview 的推理效果，并为用户展现了 o1 没有公开的完整思考过程。

全面提升的推理性能

DeepSeek-R1-Lite 预览版模型在美国数学竞赛（AMC）中难度等级最高的 AIME 以及全球顶级编程竞赛（codeforces）等权威评测中，均取得了卓越的成绩，大幅超越了 GPT-4o 等知名模型。

下表为 DeepSeek-R1-Lite 在各项相关评测中的得分结果：

DeepSeek-R1-Lite 的推理过程长，并且包含了大量的反思和验证。下图展示了模型在数学竞赛上的得分与测试所允许思考的长度紧密相关。

红色实线展示了模型所能达到的准确率与所给定的推理长度呈正相关；

相比传统的多次采样+投票（Majority Voting），模型思维链长度增加展现出了更高的效率。

“深度思考” 模式专门针对数学、代码等各类复杂逻辑推理问题而设计，相比于普通的简单问题，能够提供更加全面、清晰、思路严谨的优质解答，充分展现出较长思维链的更多优势。

对话开启示例：

适用场景与效果示例：

上下滑动，查看更多

DeepSeek-R1-Lite 目前仍处于迭代开发阶段，仅支持网页使用，暂不支持 API 调用。DeepSeek-R1-Lite 所使用的也是一个较小的基座模型，无法完全释放长思维链的潜力。

当前，我们正在持续迭代推理系列模型。之后，正式版 DeepSeek-R1 模型将完全开源，我们将公开技术报告，并部署 API 服务。

——End——