原创 SiliconFlow 2025-02-14 19:05 北京
为企业客户提供安全、高效的智能化转型方案。
此前,硅基流动大模型云服务平台 SiliconCloud 首发上线基于昇腾算力的满血版 DeepSeek-R1 & V3,率先走通了在国产芯片部署 DeepSeek 模型的路径。今天,硅基流动联合北京昇腾人工智能计算中心,支持基于昇腾算力的 DeepSeek-R1 & V3 系列模型、Qwen、FLUX.1等上百种主流模型的私有化集群部署,助力企业客户实现智能化升级。
具体而言:
基于 16 卡昇腾 Atlas 800I A2,硅基流动提供满血版 DeepSeek-R1 & V3 单一专属实例,支持 100 以上并发数;
基于昇腾 Atlas 800I A2,硅基流动支持 DeepSeek-R1 的 70B、32B、14B 蒸馏版本适配;
基于昇腾 Atlas 300I Duo,硅基流动支持 DeepSeek-R1 的 14B、8B、7B 蒸馏版本适配;
基于昇腾 Atlas 300V,硅基流动支持 DeepSeek R1 的 1.5B 适配。
基于昇腾算力,硅基流动私有化 MaaS 平台实现对智算资源的高效管理和优化,为多租户、高并发的训练和推理场景提供持续稳定的资源供给。
平台支持DeepSeek-R1 & V3 系列模型、Qwen、FLUX.1等上百种模型的一键式私有化部署与训练调优,并对模型进行统一纳管,提供高效的模型推理服务。特别是,硅基流动的大模型推理加速引擎 SiliconLLM 适配了昇腾硬件,通过模型、机制、框架、算子等层面的联合优化,实现对 DeepSeek-R1 & V3 等模型的高效推理,可获得持平全球高端 GPU 部署模型的效果,并显著降低模型推理时间与成本,让开发者及企业客户基于自己的需求快速开发业务。
同时,平台面向一线业务场景,支持多场景智能体的开发与应用,加速大模型在公司内部的落地与普及,赋能业务创新与智能化升级。
根据企业客户业务需求,结合硅基流动与昇腾 AI 的软硬件能力,目前我们提供基于昇腾算力的专属实例、算力纳管、私有版 MaaS、基于昇腾 910 系列 NPU 的一体机四种企业级服务模型。
未来,硅基流动将与昇腾 AI 继续推进各类 AI 大模型部署合作,为企业客户提供更安全、高效的智能化转型方案,将大模型能力更高效地应用于企业业务产品中,加速推动产业智能化发展。
近期更新
• 硅基流动助力华为小艺接入DeepSeek-R1
• 大量应用接入硅基流动DeepSeek-R1 & V3
• 硅基流动上线DeepSeek-R1 & V3企业级服务
• 硅基流动上线加速版 DeepSeek-R1 蒸馏模型
• 硅基流动x华为云推出DeepSeek R1&V3服务
让超级产品开发者实现“Token自由”
邀好友用SiliconCloud,狂送2000万Token/人
即刻体验DeepSeek-R1&V3
cloud.siliconflow.cn
扫码加入用户交流群