快科技资讯 21小时前
谷歌首推Gemini 2.5 Flash:成本爆降600%
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

谷歌推出了新型混合推理模型Gemini 2.5 Flash,该模型通过可调节的“思考预算”功能,在保持高性能的同时显著降低了使用成本。在闭源思考模式下,其成本仅为0.6美元/百万tokens,相比全功能模式大幅降低600%。性能方面,Gemini 2.5 Flash在多项基准测试中表现出色,尤其是在GPQA知识问答和LiveCodeBench代码基准测试中展现了显著优势,其综合性能与OpenAI的o4-mini模型相当。该模型的推出为AI应用开发提供了更灵活、更经济的选择。

💡 Gemini 2.5 Flash 引入了可调节的“思考预算”功能,允许用户根据需求调整模型的计算资源,从而在性能和成本之间实现平衡。 这使得模型能够在保持高性能的同时,显著降低使用成本。

💰 在成本方面,Gemini 2.5 Flash 提供了极具竞争力的价格。在闭源思考模式下,其成本仅为0.6美元/百万tokens,远低于全功能思考模式的3.5美元/百万tokens,实现了成本的大幅降低。

🏆 在性能表现上,Gemini 2.5 Flash 在多个基准测试中表现出色。 在大模型排行榜中,其ELO评分达到1392分,仅次于GPT-4.5-preview,与Grok-3表现相当。 在GPQA知识问答和LiveCodeBench代码基准测试中,该模型均展现出显著优势。

🆚 经过对比测试,Gemini 2.5 Flash 在多模态推理和数学任务上明显优于Claude 3.7 Sonnet,综合性能与OpenAI最新o4-mini模型不相上下。 在“人类最后一次考试”基准测试中,该模型以12.1%的高分位列第二,进一步证明了其强大实力。

快科技4月18日消息,据报道,谷歌发布了突破性混合推理模型Gemini 2.5 Flash,该模型创新性地引入可调节"思考预算"功能,在保持高性能的同时显著降低使用成本。

在闭源思考模式下,其成本仅为0.6美元/百万tokens,相比全功能思考模式(3.5美元/百万tokens)大幅降低600%。值得注意的是,即便在基础模式下运行,其性能依然超越前代Gemini 2.0 Flash。

性能表现方面,Gemini 2.5 Flash在大模型排行榜中以1392分ELO评分高居第二,仅次于GPT-4.5-preview,与Grok-3表现相当。

具体任务测试中,该模型展现出显著优势:在GPQA知识问答中,24K思考预算可带来6%的性能提升;在LiveCodeBench代码基准测试中,16K思考预算时达到最佳表现。

对比测试结果显示,Gemini 2.5 Flash在多模态推理和数学任务上明显优于Claude 3.7 Sonnet,综合性能与OpenAI最新o4-mini模型不相上下。在模拟人类综合能力的"人类最后一次考试"基准测试中,该模型以12.1%的高分位列第二,再次印证其强大实力。

此次发布的Gemini 2.5 Flash通过创新的"思考预算"机制,在性能与成本之间实现了突破性平衡,为AI应用开发提供了更灵活、更经济的选择。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Gemini 2.5 Flash 混合推理 成本优化 人工智能 谷歌
相关文章