法國AI新創公司Mistral本周宣布協助程式設計的代理人大語言模型(LLM)Devstral,可單機部署,且號稱軟工能力比GPT-4.1mini、Deepseek-V3還強。
Devstral是Mistral和開源 AI程式設計師專案OpenHands(原名OpenDevin)開發商All Hands AI合作開發。在OpenHands等程式撰寫平臺上,Devstral可和本地codebase互動,協助加速程式開發。而且由於Devstral僅24億參數,使其適合執行在單一GPU 如Nvidia GeForce RTX 4090或32MB RAM的Mac電腦上,很適合在本地機器上的部署。
Devstral是從Mistral-Small 3.1微調成24億參數的模型,具備最高128k字詞的長context window。它具有工具使用能力,能用工具來探索codebase、編輯多個檔案,支援軟工(SWE)代理人。由於它在以Mistral-Small 3.1微調前,視覺編碼器已經移除,因此支援編輯代理人時,Devstral只支援文字輸出輸入。
根據Mistral提供的資料,在SWE-Bench Verified的標竿測試中,Devstral跑分(46.8%)優於其他模型,包括Claude 3.5 Haiku、SWE-smith-LM 32B,並大幅超越GPT-4.1-mini(23.6%)。而在以同樣的測試支架(scaffold,即OpenHands)上,Devstral在SWE-Bench Verified跑分,還超過更大模型如Deepseek-V3-0324 和 Qwen3 232B-A22B。
圖片來源/Mistral
Devstral目前為實驗預覽版,將以Apache 2.0授權開源,意謂著可作商業或非商業用途。文件公開供開發人員試用、開發或客製化。
Mistral也透過其API提供devstral-small-2025給開發人員,費用等同Mistral Small 3.1,為輸入每100萬字詞0.1美元,輸出費用為每100萬字詞0.3美元。
欲自行部署者,即日起可以在Hugging Face、Ollama、Kaggle、Unsloth、LM Studio等網站下載。