Google宣布推出新預覽語言模型Gemini 2.5 Flash,主打具備可切換推理功能與思考預算(Thinking Budget)控制機制,協助開發者在速度、成本與結果品質之間取得更細緻的平衡。相較先前版本2.0 Flash,本次更新在保留高運算效率的前提,進一步強化對複雜任務的理解與處理能力,特別是可明顯提升需要多步驟推理指令的回答準確度。
Gemini 2.5 Flash為Google第一個混合式推理模型,允許開發者透過API或Google AI Studio介面,依據使用場景決定是否啟用模型的思考能力,並可設定Token上限作為推理預算。系統將依據提示字串的難度,自動判斷是否進入推理程序以及推理的長度,避免資源浪費。開發者也可將預算設為0,跳過推理階段,以最低延遲回應簡單問題。
在推理能力評估方面,Gemini 2.5 Flash在開源測試平臺LMArena的Hard Prompts測試表現接近旗艦級2.5 Pro模型,表示其已具備處理跨領域計算、邏輯推論與結構分析的能力,同時保有相對輕量的參數規模與運算成本。Google指出,Gemini 2.5 Flash透過可設定的推理預算機制,提供開發者在成本、延遲與品質之間更靈活的控制方式,適用於處理語言理解、資料分析與決策輔助等具備不同複雜度的任務。
Gemini 2.5 Flash已於Google AI Studio與Vertex AI平臺開放預覽,開發者可透過新參數thinking_budget控制模型的推理深度,範圍從0至24,576 Tokens,不僅支援API呼叫,也提供圖形化控制介面調整,並可參考官方提供的Gemini Cookbook範例進行試驗。Google表示,未來將持續改進Flash系列模型並擴展適用範圍,預計在進入正式發布階段前,還會釋出更多版本更新與功能細節。