Google推出Gemma 3n預覽版,進一步推進語言模型在行動裝置本地端的應用。Gemma 3n為一套主打輕量與高效能的開放模型,專為手機、平板與筆記型電腦等裝置設計。與Gemma 3 4B模型於行動裝置端相比,Gemma 3n回應速度約快1.5倍,同時提升理解品質,展現本地人工智慧運算的即時性與實用價值。
Gemma 3n的主要特色在於全新架構,並與高通、聯發科、三星系統LSI等多家行動晶片廠商合作。Google團隊根據現代行動處理器的特性進行架構最佳化,使模型可在2GB至3GB記憶體空間下運作。
Gemma 3n公開版本提供5B及8B兩種參數規格,並透過PLE(Per-Layer Embeddings)等技術,降低記憶體需求並提升運算效率,官方也以E4B、E2B說明有效記憶體占用,讓開發者可在一般硬體條件下,在主流行動裝置或筆電部署具多模態潛力的生成式人工智慧。
Gemma 3n在Chatbot Arena Elo評分達1283分,僅略低於專有模型Claude 3.7 Sonnet,並超越多數同級與開放模型。在多任務語言理解基準MMLU測試中,Gemma 3n支援mix’n’match動態組態,開發者可根據裝置與應用需求,靈活切換2B、4B等多種子模型組合,在記憶體與效能間取得平衡。
Gemma 3n也強調多模態處理潛力,目前預覽版已支援文字與圖像功能,官方後續將釋出音訊理解、語音辨識與語音翻譯等功能。之後開發者便可利用該模型在裝置端,開發即時語音助理、影音互動應用及隱私敏感場景的人工智慧服務,減少對雲端依賴,實現即時且個人化的人工智慧功能。
Google指出,Gemma 3n採用與Gemini Nano相同的次世代基礎架構,將帶動人工智慧功能進一步普及至Android、Chrome等終端應用,並陸續釋出更多模組與功能。官方目前提供Google AI Studio文字互動測試,以及Google AI Edge套件本地開發兩種體驗Gemma 3n的管道。