DeepSeek-R1 & V3 API 再升级，支持批量推理，R1 价格直降 75%

硅基流动 03月12日 19:59

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

硅基流动 SiliconCloud 平台推出 DeepSeek-R1 & V3 API 的批量推理服务，旨在帮助用户更高效、低成本地处理大规模数据任务。批量推理不受实时推理速率限制，预计24小时内完成任务，DeepSeek-V3 批量推理价格直降 50%，3月11日至18日期间，DeepSeek-R1 批量推理更有高达 75% 的优惠，输入价格为 1 元/百万 Tokens，输出价格为 4 元/百万 Tokens。适用于数据分析、模型评估等非实时响应场景，同时，DeepSeek-R1 & V3 API 已支持 Function Calling、JSON Mode 等功能，Pro版 TPM上限已提升至100万。

🚀 硅基流动 SiliconCloud 平台现在支持 DeepSeek-R1 & V3 API 的批量推理功能，用户可以发送批量请求，无需受到实时推理速率的限制，从而更高效地处理大型数据任务。

💰 DeepSeek-V3 的批量推理服务价格大幅降低 50%，而在 3 月 11 日至 3 月 18 日期间，DeepSeek-R1 的批量推理服务更是提供高达 75% 的折扣，输入价格降至 1 元/百万 Tokens，输出价格为 4 元/百万 Tokens。

📊 批量推理特别适用于需要处理大量数据，但对实时性要求不高的应用场景，例如生成报告、数据清洗、数据分析和模型性能评估等任务。

✨ DeepSeek-R1 & V3 API 已经支持多种功能，包括 Function Calling、JSON Mode 和 Prefix、FIM 功能，并且 Pro 版本的 DeepSeek-R1 & V3 API 的 TPM（每分钟处理的 Token）上限已从 1 万提升至 100 万。

原创 SiliconCloud 2025-03-11 19:34 北京

批量推理不受实时推理速率限制的影响。

即刻起，硅基流动 SiliconCloud 平台的 DeepSeek-R1 & V3 API 支持批量推理（Batch Inference）。

用户通过批量 API 发送请求到 SiliconCloud，不受实时推理速率限制的影响，预期可在 24 小时内完成任务。相比实时推理，DeepSeek-V3 批量推理价格直降 50%，其中，3 月 11 日至 3 月 18日，DeepSeek-R1 批量推理优惠价格直降 75%，输入价格为 1 元 / 百万 Tokens、输出价格为 4 元 / 百万 Tokens。

批量推理可帮助用户更高效处理生成报告、数据清洗等大批量数据处理任务，享受更低成本的 DeepSeek-R1 & V3 API 服务，适用于无需实时响应的数据分析、模型性能评估等场景。

API 文档

https://docs.siliconflow.cn/cn/userguide/guides/batch

此前，DeepSeek-R1 & V3 API 已支持 Function Calling、JSON Mode、Prefix、FIM 功能，并且 Pro 版 DeepSeek-R1 & V3 API 的 TPM（每分钟处理的 Token）上限已从 1 万提升至 100 万。

近期更新

• SiliconCloud上线加速版阿里QWQ-32B
• 硅基流动助力华为小艺接入DeepSeek-R1
• Pro版 DeepSeek-R1 & V3 TPM升至100万
 • DeepSeek-R1 & V3支持Function Calling

• 硅基流动支持DeepSeek-R1 & V3私有化部署
• 硅基流动上线DeepSeek-R1 & V3企业级服务

让超级产品开发者实现“Token自由”

邀好友用SiliconCloud，狂送2000万Token/人

即刻体验DeepSeek-R1&V3
cloud.siliconflow.cn

扫码加入用户交流群

阅读原文

跳转微信打开

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签