AI & Big Data 02月03日
Mistral開源Mistral Small 3 24B,稱效能超越3倍大的Llama 3.3
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

法國AI新創Mistral AI推出開源模型Mistral Small 3,其240億參數的設計在效能上超越了參數更大的Llama 3.3 70B。該模型專為快速反應的生成式AI任務而設計,具有低延遲和高效率的特點,適用於本地部署。Mistral Small 3在多項基準測試中表現出色,尤其在MMLU測試中精準度高達81%,且延遲性僅為150 token/s。此外,它還支援多種應用場景,包括口語協助、函式呼叫及本地推論,並已在金融、醫療等領域進行評估。Mistral AI以Apache 2.0授權開源該模型,鼓勵開發者進行改進和利用。

🚀 Mistral Small 3模型以240億參數實現了超越Llama 3.3 70B的效能,顯示其在參數效率上的顯著優勢,這意味著它能在資源受限的環境下提供強大的計算能力。

⏱️ Mistral Small 3在MMLU測試中精準度達81%,且延遲性為150 token/s,這表明該模型不僅準確,而且反應速度快,非常適合需要即時回應的應用場景。

💻 該模型適用於多種應用場景,包括快速口語協助、低延遲函式呼叫、微調後自建特定領域專家,並可在PC或Mac平臺上執行本地推論,這增加了其應用的靈活性和便利性。

🤝 Mistral AI以Apache 2.0授權開源Mistral Small 3,並與Hugging Face、Ollama等多個AI平臺合作上架,這促進了模型的廣泛使用和社群協作。

💰 Mistral Small 3在金融、醫療、機器人等領域已有客戶評估,並可應用於客服和情感分析等水平場景,顯示其在商業應用上的巨大潛力。

法國AI新創公司Mistral AI上周公布開源高速、低延遲的模型Mistral Small 3 24B,效能超越參數量3倍大的Llama 3.3 70B。Mistral Small 3是為了能完成80%生成式AI任務而以指令預訓練的模型,參數量240億,以便在本地部署且仍能提供強大效能。Mistral表示,Mistral Small 3比競爭模型少很多層,大幅縮短每次前向傳遞(forward pass)的時間。它在MMLU測試精準度達81%,延遲性為150 token/s。Mistral Small也是目前同類別中最有效率的模型。以標竿測試表現而言,Mistral Small 3在MMLU、Math、GPQA Main都超越Llama 3.1 70B和Google Gemma 2 27B,而在不同語言的MMLU測試中,Mistral Small也都超越Llama 3.1 70B及Gemma 2 27B(但落後於Qwen 2.5-32B)。這家新創公司指出,Mistral Small 3 24B模型適用場景包括反應快速的口語協助、低延遲的函式呼叫、微調後自建特定領域專家、以及在PC或Mac平臺上執行本地推論。經過量化(quantized)壓縮的Mistral Small 3可執行在單一顆RTX 4090或一臺具32GB RAM的MacBook上。該公司稱Mistral Small 3已有金融、醫療、機器人/自動化/製造業客戶評估中。水平使用場景則包含客服和情感與回饋分析。Mistral以Apache 2.0授權開源預訓練和指令微調的check point版本。這些checkpoint版本可作為其他開發人員改進的基礎。業者相信,和最近爆紅的開源推理模型像是DeepSeek類似,Small 3也可促進AI推理能力的演進。但Mistral提醒,Mistral Small 3不是以強化學習和合成資料訓練,因此在AI模型產製上屬於較前期結果,不像新興的DeepSeek R1那麼成熟。Small 3 24B模型已以Apache 2.0授權在la Platforma開源,顯示名稱為mistral-small-latest或mistral-small-2501。Mistral AI同時也公告,該公司逐漸捨棄非傳統開源MRL授權,因而其通用模型也將改用Apache 2.0授權。因此連同Mistral Small 3,其模型權重也可開放下載於本地供自由修改和使用,或在la Platforme開放Mistral AI本地部署及VPC環境、客製化和協同平臺、以及其推論與雲端合作夥伴平臺上以serverless API存取。需要特殊能力(像是加快速度和加大context、特定領域知識、特殊任務能力如完成程式撰寫等)的企業和開發人員,也可以在Mistral Small 3之外再使用額外的商用模型補強。Mistral AI也和AI平臺包括Hugging Face、Ollama、Kaggle、Together AI、IBM watsonx和Fireworks AI等合作上架Small 3模型。不久之後也會在Nvidia NIM、Amazon SageMaker、Groq、Databricks和Snowflake上架。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Mistral AI 開源模型 Mistral Small 3 生成式AI 低延遲
相关文章