IT之家 前天 15:13
谷歌 Gemini 2.5 Flash 混合推理 AI 模型上线:性能成本双优
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

谷歌推出了Gemini 2.5 Flash预览版AI模型,该模型整合于Google AI Studio、Vertex AI以及Gemini应用中。Gemini 2.5 Flash是一款混合推理模型,其核心优势在于“动态且可控”的计算能力,允许开发者根据查询的复杂程度调整处理时间,特别适用于高容量和实时应用场景,如客户服务和文档解析。该模型在低延迟和成本控制上进行了优化,定价方面,输入每百万tokens为0.15美元,输出(不含推理)每百万tokens为0.6美元,输出(含推理)每百万tokens为3.5美元。与Anthropic和Grok等竞品相比,Gemini 2.5 Flash在成本上更具优势。

💡谷歌发布的Gemini 2.5 Flash是一款混合推理模型,它最大的特点在于其“动态且可控”的计算能力。开发者可以根据查询的复杂程度灵活调整处理时间,从而优化性能。

🚀 Gemini 2.5 Flash 尤其适用于“高容量”和“实时”的应用场景,例如客户服务和文档解析,这使得它成为响应式虚拟助手和实时总结工具的理想选择。

💰在定价方面,Gemini 2.5 Flash模型展现出竞争力。输入每百万tokens为0.15美元,输出(不含推理)每百万tokens为0.6美元,输出(含推理)每百万tokens为3.5美元,这使得它在成本上具有优势。

🛠️开发者可以通过Gemini API在Google AI Studio和Vertex AI中使用Gemini 2.5 Flash,同时也可以通过Gemini应用内的模型选择器直接使用,并结合Canvas工具优化文档和代码编辑。

IT之家 4 月 18 日消息,谷歌公司昨日(4 月 17 日)发布公告,宣布在 Google AI Studio 和 Vertex AI 中,以 Gemini API 的方式推出 Gemini 2.5 Flash Preview 预览 AI 模型。

用户还可通过 Gemini 应用内的模型选择器直接使用,并结合 Canvas 工具优化文档和代码编辑。

IT之家此前报道,Gemini 2.5 Flash 是一个混合推理模型,具备“动态且可控”的计算能力,开发者能够根据查询请求的复杂程度灵活调整处理时间。

谷歌指出,Gemini 2.5 Flash 非常适合用于“高容量”和“实时”的应用场景,例如客户服务和文档解析。谷歌在其博客文章中提到:“这款工作型模型专门针对低延迟和降低成本进行了优化,是响应式虚拟助手和实时总结工具的理想引擎”。

根据谷歌官方公布的定价,Gemini 2.5 Flash 模型每 100 万 tokens 输入为 0.15 美元,每 100 万 tokens 输出(不含推理)为 0.6 美元、每 100 万 tokens 输出(含推理)为 3.5 美元.

作为首款全混合推理模型,开发者可根据需求开关推理功能,灵活调整响应质量、成本和延迟,与 Anthropic 和 Grok 的前沿模型相比,Gemini 2.5 Flash 成本更低但表现不俗。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Gemini 2.5 Flash 谷歌 AI模型 混合推理 低延迟
相关文章