原创 SiliconCloud 2025-03-27 14:50 美国
小版本,大升级。
近日,深度求索发布了最新版 DeepSeek-V3-0324(671B)新版本主模型参数量不变。尽管官方称是“小版本升级”,但不少测试过的网友并不同意官方的谦虚说辞。这一版本在编码、写作、数学能力上显然有不小提升,属于“小版本,大升级”。
现在,硅基流动 SiliconCloud 平台的 Pro 版与普通版 DeepSeek-V3 都已完成升级,且同样基于华为云昇腾云部署推理服务。新版本 DeepSeek-V3 的价格与 API 接口保持不变,max_tokens 提升至 8K,支持 Function Calling、JSON Mode、Prefix、FIM。另外,为确保企业用户平稳过渡至新版本,初始版本 V3-1226 服务将持续支持一段时间。
在线体验
https://cloud.siliconflow.cn/models
API 文档
https://docs.siliconflow.cn/cn/api-reference/
模型性能及特点
新版 V3 模型借鉴了 DeepSeek-R1 模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现。根据 DeepSeek 官方提供的基准测试数据,相比 DeepSeek-V3 初始版本,DeepSeek-V3-0324 的推理能力显著提升:在 MMLU-Pro 上提升了 5.3%,在 GPQA 上提升 9.3%,在 AIME 上提升了 19.8%,在 LiveCodeBench 上提升了 10.0%。
同时,DeepSeek-V3-0324 在以下能力上有所改进:
AI 社区评价
“新版的 Deepseek-V3 绝非小版本更新!”有用户称,在前端设计初次尝试这一版本,效果超过 R1。
还有用户使用 DeepSeek V3-0324 创建了一个网站,其中模型编写了 800 多行代码,一次都没有中断,而且它开源、免费、速度超快。
看来这次“小更新”比预期更好,数学方面也有提升。这让用户对 DeepSeek-R2 抱有极大期望。“中国不仅在追赶,且在超越我们。而且这一切都是开源的。”
现在,你也可以通过调用硅基流动 SiliconCloud 平台的 API 尝试这次超越预期的新版本了。
Token 工厂 SiliconCloud
DeepSeek-R1 蒸馏版等免费用
作为一站式大模型云服务平台,SiliconCloud 致力于为开发者提供极速响应、价格亲民、品类齐全、稳定丝滑的大模型 API。
除了最新版 DeepSeek-V3,SiliconCloud 已上架包括 Wan2.1-I2V、Qwen2.5VL-72B、Wan2.1-T2、QwQ-32B、DeepSeek-R1、DeepSeek-R1-Distill、CosyVoice2、DeepSeek-VL2、HunyuanVideo、Qwen2.5-7B/14B/32B/72B、BCE、BGE、SenseVoice-Small在内的上百款模型。其中,DeepSeek-R1 蒸馏版(8B、7B、1.5B)、BGE 等多款大模型 API 免费使用,让开发者实现“Token 自由”。
开发者可在 SiliconCloud 平台自由对比、组合各类大模型,只需在开发应用时轻松调用更易用、高效的 API,为你的生成式 AI 应用选择最佳实践。
•SiliconCloud上线加速版阿里QWQ-32B
•SiliconCloud上线加速版阿里Qwen2.5-VL
•硅基流动上线DeepSeek-R1 & V3企业级服务
•DeepSeek API支持批量推理,R1价格直降75%
让超级产品开发者实现“Token自由”
邀好友用SiliconCloud,狂送2000万Token/人
即刻体验DeepSeek-R1&V3
cloud.siliconflow.cn
扫码加入用户交流群