2023年才成立的中國AI新創Moonshot AI(月之暗面)上周開源Kimi K2模型,包括基礎模型Kimi-K2-Base及代理式模型Kimi-K2-Instruct,並在許多關鍵基準測試上勝過或相當於OpenAI、Anthropic與DeepSeek。
Kimi K2為一混合專家語言模型,具備1兆個參數與320億個啟動參數,利用Muon優化器進行訓練,Moonshot AI說,它在尖端知識、推理及程式碼任務上皆達到卓越性能,也針對代理功能最佳化。
Moonshot AI使用15.5兆個Token,預訓練了擁有1兆參數的混合專家模型;把Muon優化器應用到前所未有的規模並研發新的優化技巧,以解決隨著模型變大而出現的不穩定現象;且其代理式智慧是專為工具使用、推理能力及自主解決問題而設計。
Kimi K2具備Kimi-K2-Base基礎模型與Kimi-K2-Instruct指令模型兩個版本,前者可供研究人員及開發者使用,適合需要自行微調或客製化解決方案的情境,後者則是經過後訓練的指令模型,適用於聊天,或是具備代理能力的應用場景。
Moonshot AI比較了Kimi K2、DeepSeek、阿里通義千問、OpenAI、Anthropic及Google在代理/程式碼、工具使用及數學/STEM等領域等基準測試,發現Kimi K2在各個領域都有傑出的表現。
圖片來源/Moonshot AI
Kimi K2每百萬個輸入Token的價格為0.15美元,輸出為2.5美元,比OpenAI或Anthropic都還要便宜。
VentureBeat分析,既開源又提供具競爭力價格的API,代表Moonshot AI深刻理解了市場動態,企業客戶可藉由API立即部署,再遷移到自行託管的版本以滿足優化或合規性的要求,同時建立了市場佔有率及生態系的採用率。
而且,每個下載或試用Kimi K2的開發人員都會成為潛在的企業客戶,且社群的貢獻也會降低Moonshot AI的開發成本。
Moonshot AI的創辦團隊來自中國清華大學,2023年10月推出AI聊天機器人Kimi,2024年即獲得由阿里巴巴領投的10億美元資金,同年8月再得到來自騰訊與其它組織的3億美元資金,其它投資者還包括紅杉中國、美團及小紅書等。