AI & Big Data 前天 14:52
Google預覽新模型Gemini 2.5 Flash,導入思考預算機制提升推理控制彈性
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Google 推出了新预览语言模型 Gemini 2.5 Flash,该模型主打可切换推理功能和思考预算控制机制。与之前的 2.0 Flash 相比,新版本在保持高运算效率的同时,增强了对复杂任务的理解和处理能力,尤其是在多步骤推理指令的回答准确度方面。Gemini 2.5 Flash 允许开发者根据应用场景决定是否启用模型的思考能力,并设定 Token 上限作为推理预算,从而在速度、成本和结果质量之间取得平衡。该模型已在 Google AI Studio 和 Vertex AI 平台开放预览。

🧠 Gemini 2.5 Flash 是 Google 首个混合式推理模型,开发者可以通过 API 或 Google AI Studio 界面,根据使用场景决定是否启用模型的思考能力。

💡 模型引入思考预算(Thinking Budget)控制机制,开发者可以设置 Token 上限作为推理预算。系统会根据提示字串的难度,自动判断是否进入推理程序以及推理的长度,避免资源浪费。

🚀 在开开源测试平台 LMArena 的 Hard Prompts 测试中,Gemini 2.5 Flash 的表现接近旗舰级 2.5 Pro 模型,表明其具备处理跨领域计算、逻辑推论与结构分析的能力,同时保持相对轻量的参数规模与运算成本。

⚙️ 开发者可以通过新参数 thinking_budget 控制模型的推理深度,范围从 0 至 24,576 Tokens。Google 表示,未来将持续改进 Flash 系列模型并扩展适用范围。

Google宣布推出新預覽語言模型Gemini 2.5 Flash,主打具備可切換推理功能與思考預算(Thinking Budget)控制機制,協助開發者在速度、成本與結果品質之間取得更細緻的平衡。相較先前版本2.0 Flash,本次更新在保留高運算效率的前提,進一步強化對複雜任務的理解與處理能力,特別是可明顯提升需要多步驟推理指令的回答準確度。

Gemini 2.5 Flash為Google第一個混合式推理模型,允許開發者透過API或Google AI Studio介面,依據使用場景決定是否啟用模型的思考能力,並可設定Token上限作為推理預算。系統將依據提示字串的難度,自動判斷是否進入推理程序以及推理的長度,避免資源浪費。開發者也可將預算設為0,跳過推理階段,以最低延遲回應簡單問題。

在推理能力評估方面,Gemini 2.5 Flash在開源測試平臺LMArena的Hard Prompts測試表現接近旗艦級2.5 Pro模型,表示其已具備處理跨領域計算、邏輯推論與結構分析的能力,同時保有相對輕量的參數規模與運算成本。Google指出,Gemini 2.5 Flash透過可設定的推理預算機制,提供開發者在成本、延遲與品質之間更靈活的控制方式,適用於處理語言理解、資料分析與決策輔助等具備不同複雜度的任務。

Gemini 2.5 Flash已於Google AI Studio與Vertex AI平臺開放預覽,開發者可透過新參數thinking_budget控制模型的推理深度,範圍從0至24,576 Tokens,不僅支援API呼叫,也提供圖形化控制介面調整,並可參考官方提供的Gemini Cookbook範例進行試驗。Google表示,未來將持續改進Flash系列模型並擴展適用範圍,預計在進入正式發布階段前,還會釋出更多版本更新與功能細節。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Gemini 2.5 Flash Google 语言模型 推理能力
相关文章