IT之家 03月25日 21:58
DeepSeek 官方详解 V3 模型小版本升级:各项能力全面进阶
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

DeepSeek-V3 模型发布小版本更新 DeepSeek-V3-0324,该版本在推理、代码生成、中文写作和搜索能力上均有显著提升。新模型借鉴 DeepSeek-R1 的强化学习技术,在数学、代码等任务上超越了 GPT-4.5。前端开发能力增强,生成的 HTML 代码更具可用性和美观性。中文写作方面,模型在 R1 的基础上进一步优化,提升中长篇文本的创作质量。此外,新模型在工具调用、角色扮演和问答闲聊等方面也有所改进。DeepSeek-V3-0324 沿用相同的 base 模型,仅改进了后训练方法,并开源了模型权重,供用户自由使用。

🚀 **推理任务表现提升**:新版 V3 模型借鉴 DeepSeek-R1 模型的强化学习技术,大幅提高了在推理类任务上的表现,在数学、代码类相关评测集上取得了超过 GPT-4.5 的得分成绩。

💻 **前端开发能力增强**:新版 V3 模型在 HTML 等代码前端任务上,生成的代码可用性更高,视觉效果也更加美观、富有设计感。例如,模型可以生成演示多个小球运动的 p5.js 程序,并包含可调整参数的滑动按钮,以赛博朋克风格的 HTML 呈现。

✍️ **中文写作能力升级**:新版 V3 模型基于 R1 的写作水平进行了进一步优化,特别提升了中长篇文本创作的内容质量,提供更优质的中文写作体验。

🔍 **中文搜索能力优化**:新版 V3 模型可以在联网搜索场景下,对于报告生成类指令输出内容更为详实准确、排版更加清晰美观的结果,提升用户的使用体验。

💡 **模型开源与技术细节**:DeepSeek-V3-0324 与之前的 DeepSeek-V3 使用同样的 base 模型,仅改进了后训练方法。私有化部署时只需要更新 checkpoint 和 tokenizer_config.json。模型参数约 660B,开源版本上下文长度为 128K。

IT之家 3 月 25 日消息,DeepSeek-V3 模型昨日进行了小版本更新,今晚官方发布了该更新的详情。

IT之家附全文内容如下:

DeepSeek V3 模型已完成小版本升级,目前版本号 DeepSeek-V3-0324,用户登录官方网页、App、小程序进入对话界面后,关闭深度思考即可体验。API 接口和使用方式保持不变。如非复杂推理任务,建议使用新版本 V3 模型,即刻享受速度更加流畅、效果全面提升的对话体验。

模型能力提升一览

推理任务表现提高

新版 V3 模型借鉴 DeepSeek-R1 模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过 GPT-4.5 的得分成绩。

新版 V3 模型的百科知识(MMLU-Pro, GPQA)、数学(MATH-500, AIME 2024)和代码任务(LiveCodeBench)表现均有提升

前端开发能力增强

在 HTML 等代码前端任务上,新版 V3 模型生成的代码可用性更高,视觉效果也更加美观、富有设计感。

动图展示了一个由模型生成的演示多个小球在指定空间范围内运动的 p5.js 程序,包含若干可以调整重力、摩擦力等参数的滑动按钮,并以赛博朋克风格的 HTML 呈现

中文写作升级

在中文写作任务方面,新版 V3 模型基于 R1 的写作水平进行了进一步优化,同时特别提升了中长篇文本创作的内容质量。

中文搜索能力优化

新版 V3 模型可以在联网搜索场景下,对于报告生成类指令输出内容更为详实准确、排版更加清晰美观的结果。

此外,新版 V3 模型在工具调用、角色扮演、问答闲聊等方面也得到了一定幅度的能力提升。

模型开源

DeepSeek-V3-0324 与之前的 DeepSeek-V3 使用同样的 base 模型,仅改进了后训练方法。私有化部署时只需要更新 checkpoint 和 tokenizer_config.json(tool calls 相关变动)。模型参数约 660B,开源版本上下文长度为 128K(网页端、App 和 API 提供 64K 上下文)。V3-0324 模型权重下载请参考:

Model Scope: 

https://modelscope.cn/models/deepseek-ai/DeepSeek-V3-0324

Huggingface: 

https://huggingface.co/deepseek-ai/DeepSeek-V3-0324

与 DeepSeek-R1 保持一致,此次我们的开源仓库(包括模型权重)统一采用 MIT License,并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepSeek-V3 模型更新 人工智能 代码生成 中文写作
相关文章