原创 SiliconCloud 2025-07-13 17:16 北京
特别擅长编码以及通用 Agent 任务。
硅基流动 SiliconCloud 平台已上线月之暗面开源的 MoE 模型 Kimi K2。该模型总参数为 1T,激活参数 32B,在各项基准性能测试中展现出比肩顶尖商业模型的实力,特别擅长编码以及通用 Agent 任务。
SiliconCloud 上的 Kimi K2 支持 128K 最大上下文长度,价格为输入 4 元 / M Tokens,输出为 16 元 / M Tokens。此前,SiliconCloud 还上线了月之暗面的编程大模型 Kimi-Dev-72B。
欢迎通过以下方式使用 Kimi K2,国内站与国际站新用户可分别自动获取 14 元/ 1 美元赠金体验。
国内站在线体验
https://cloud.siliconflow.cn/models
国际站在线体验(即将上线)
https://cloud.siliconflow.com/models
第三方应用接入教程
https://docs.siliconflow.cn/cn/usercases/
开发者 API 文档
https://docs.siliconflow.cn/cn/api-reference/chat-completions/
模型特点及性能
Kimi K2 的技术特性主要包括以下三点:
- 大规模训练:在 15.5T Tokens 数据上训练了 1T 参数的 MoE 模型,且全程保持训练稳定性;MuonClip 优化器:将 Muon 优化器应用于前所未有的规模扩展,并开发了新的优化技术以解决扩展过程中的不稳定问题;智能体驱动型智能:专为工具调用、逻辑推理和自主解决问题而设计。
根据公开的基准测试数据,Kimi K2 在自主编程、工具调用和数学推理三大能力维度的基准性能测试中取得了优秀表现。
月之暗面提到,Kimi K2 是构建通用 Agent 能力的坚实基础,未来还会加入思考和视觉理解等能力。
用户评价
Perplexity 创始人 Aravind Srinivas 高度评价了 Kimi K2。在他们内部评估中,Kimi K2 表现出色,并且很快会基于该模型做后训练。
也有用户表示,Kimi K2 竟然一次性就搞定了网页版 Minecraft,而用 Gemini 2.5 Pro 试了 4 天共 6 次都没搞定。
除了出色的编码以及 Agent 能力,也有用户指出 Kimi K2 具有出色的语言能力。“我对 Kimi K2 的印象是,它使用的词汇比常见模型更优质多样,于是快速在 SpeechMap 数据上做了语言多样性分析——果然,Kimi K2 得分最高。”
现在,你也可以通过调用硅基流动的 API 尝试 Kimi K2 了。
Token 工厂 SiliconCloud
DeepSeek 蒸馏版等免费用
作为一站式大模型云服务平台,SiliconCloud 致力于为开发者提供品类齐全、极速响应、稳定丝滑、价格亲民的大模型 API。
除了 Kimi-K2-Instruct,SiliconCloud 已上架包括 Kimi-Dev-72B、GLM-4.1V-9B-Thinking、ERNIE-4.5-300B-A47B、Hunyuan-A13B、Qwen3-Embedding & Reranker、MiniMax-M1-80k、DeepSeek-R1-0528、Qwen3、Wan2.1、Qwen2.5VL-72B、CosyVoice2 在内的上百款模型。其中,DeepSeek-R1 蒸馏版(8B、7B、1.5B)等多款大模型 API 免费使用,让开发者实现“Token 自由”。
开发者可在 SiliconCloud 平台自由对比、组合各类大模型,只需在开发应用时轻松调用更易用、高效的 API,为你的生成式 AI 应用选择最佳实践。
近期更新
600天与一个新生品牌的蜕变
比肩H100!基于昇腾云超节点的R1上线
硅基流动国际站上线FLUX.1 Kontext [dev]
硅基流动 x 昆仑技术推出DeepSeek一体机
硅基流动上线DeepSeek-R1 & V3企业服务
爆改Gemini-CLI,用DeepSeek跑同款命令行
提效300%,大模型一体机加速药企报告撰写
邀好友用SiliconCloud,狂送2000万Token/人即刻体验Kimi-K2cloud.siliconflow.cn扫码加入用户交流群