Google預覽新模型Gemini 2.5 Flash，導入思考預算機制提升推理控制彈性

AI & Big Data 前天 14:52

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

Google 推出了新预览语言模型 Gemini 2.5 Flash，该模型主打可切换推理功能和思考预算控制机制。与之前的 2.0 Flash 相比，新版本在保持高运算效率的同时，增强了对复杂任务的理解和处理能力，尤其是在多步骤推理指令的回答准确度方面。Gemini 2.5 Flash 允许开发者根据应用场景决定是否启用模型的思考能力，并设定 Token 上限作为推理预算，从而在速度、成本和结果质量之间取得平衡。该模型已在 Google AI Studio 和 Vertex AI 平台开放预览。

🧠 Gemini 2.5 Flash 是 Google 首个混合式推理模型，开发者可以通过 API 或 Google AI Studio 界面，根据使用场景决定是否启用模型的思考能力。

💡 模型引入思考预算（Thinking Budget）控制机制，开发者可以设置 Token 上限作为推理预算。系统会根据提示字串的难度，自动判断是否进入推理程序以及推理的长度，避免资源浪费。

🚀 在开开源测试平台 LMArena 的 Hard Prompts 测试中，Gemini 2.5 Flash 的表现接近旗舰级 2.5 Pro 模型，表明其具备处理跨领域计算、逻辑推论与结构分析的能力，同时保持相对轻量的参数规模与运算成本。

⚙️ 开发者可以通过新参数 thinking_budget 控制模型的推理深度，范围从 0 至 24,576 Tokens。Google 表示，未来将持续改进 Flash 系列模型并扩展适用范围。

Google宣布推出新預覽語言模型Gemini 2.5 Flash，主打具備可切換推理功能與思考預算（Thinking Budget）控制機制，協助開發者在速度、成本與結果品質之間取得更細緻的平衡。相較先前版本2.0 Flash，本次更新在保留高運算效率的前提，進一步強化對複雜任務的理解與處理能力，特別是可明顯提升需要多步驟推理指令的回答準確度。

Gemini 2.5 Flash為Google第一個混合式推理模型，允許開發者透過API或Google AI Studio介面，依據使用場景決定是否啟用模型的思考能力，並可設定Token上限作為推理預算。系統將依據提示字串的難度，自動判斷是否進入推理程序以及推理的長度，避免資源浪費。開發者也可將預算設為0，跳過推理階段，以最低延遲回應簡單問題。

在推理能力評估方面，Gemini 2.5 Flash在開源測試平臺LMArena的Hard Prompts測試表現接近旗艦級2.5 Pro模型，表示其已具備處理跨領域計算、邏輯推論與結構分析的能力，同時保有相對輕量的參數規模與運算成本。Google指出，Gemini 2.5 Flash透過可設定的推理預算機制，提供開發者在成本、延遲與品質之間更靈活的控制方式，適用於處理語言理解、資料分析與決策輔助等具備不同複雜度的任務。

Gemini 2.5 Flash已於Google AI Studio與Vertex AI平臺開放預覽，開發者可透過新參數thinking_budget控制模型的推理深度，範圍從0至24,576 Tokens，不僅支援API呼叫，也提供圖形化控制介面調整，並可參考官方提供的Gemini Cookbook範例進行試驗。Google表示，未來將持續改進Flash系列模型並擴展適用範圍，預計在進入正式發布階段前，還會釋出更多版本更新與功能細節。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签