AI & Big Data 03月26日 10:52
Google發表具推理能力的Gemini 2.5,效能擊敗o3-mini、DeepSeek R1
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Google发布新一代Gemini 2.5模型,该模型在多项测试中超越了OpenAI o3-mini、DeepSeek R1等竞争对手。Gemini 2.5整合了强化式学习和思维链等技术,具备100万字词的context window,并很快升级到200万字词。新模型能够处理更复杂的问题,支持具情境感知能力的AI代理人。Gemini 2.5 Pro Experimental是其中一个版本,在科学、数学、编程等测试中表现出色,并能根据提示撰写游戏执行档程序。开发者和企业可通过Google AI Studio、Gemini Advanced和Vertex AI平台使用。

🧠 Gemini 2.5是Google Gemini新一代模型家族的最新成员,结合了强化式学习和思维链技术,并在基础模型上进行了更有效的后训练,以提升性能。

📚 Gemini 2.5 拥有100万字词的context window,未来将扩展到200万字词,使其能够理解庞大的数据集,并处理来自不同数据源(包括文本、图像、音频甚至整个代码库)的数据。

🏆 Gemini 2.5 Pro Experimental是该模型的一个版本,在LMArena的基准测试中,在科学、数学、编程、视觉推理和长上下文等测试中,均超越了OpenAI o3-mini、GPT-4.5、Claude 3.7 Sonnet或DeepSeek R1等竞争模型。

🎮 Google展示了Gemini 2.5 Pro能够在输入一行提示后,撰写出电玩游戏的执行档程式,体现了其强大的代码生成能力。

💻 Gemini 2.5 Pro Experimental现已通过Google AI Studio、Gemini Advanced和Vertex AI平台向开发者和企业开放,方便用户使用和体验。

去年公布首個具推理能力的Gemini 2.0 Flash Thinking模型後,Google昨(25)日發表Gemini 2.5模型,作為Gemini新一代模型家族的最新成員,Google宣稱在多項測試中擊敗OpenAI o3-mini、DeepSeek R1等模型。

Gemini 2.0 Flash Thinking和Gemini 2.5是結合強化式學習及思維鏈等技術,但在更好的基礎模型上輔以更有效的後訓練,使效能更為提升。一如OpenAI未來不再區分獨立的推理模型,Google未來也將把這些思維能力整合到所有模型,使其得以處理更複雜問題,支援具情境感知能力的AI代理人。

Gemini 2.5具備100萬字詞(token)的context window,很快會再升級到200萬字詞。這新模型能理解龐大的資料集,處理不同資料源,包括文字、影、音甚至整個程式庫的資料,以解決複雜的問題。

Gemini 2.5將提供多個版本。首先推出的是Gemini 2.5 Pro Experimental,號稱為Google處理複雜任務的最進階模型。根據LMArena的標竿測試結果,Gemini 2.5 Pro Experimental在科學、數學、程式編輯、視覺推理及長脈絡(long context)等測試中,都超越競爭模型如OpenAI o3-mini、GPT-4.5、Claude 3.7 Sonnet或DeepSeek R1,像是科學測試GPQA Diamond得分為84%,數學測試AIME則為86.7%。在推理與知識測試中,Gemini 2.5 Pro拿下18.8%的最佳成績,而在代理人程式撰寫的SWE-Bench Verified測試中,Gemini 2.5 Pro得分63.8%,僅次於Claude 3.7 Sonnet。

Google也示範了Gemini 2.5 Pro可以在輸入一行提示後,撰寫出電玩遊戲的執行檔程式。

Gemini 2.5 Pro Experimental現在透過Google AI Studio提供給開發商及企業,以及付費的Gemini Advanced方案,後者用戶可以在桌機或手機上,在模型下拉選單中選取使用。幾個星期內Gemini 2.5 Pro Experimental也會在Vertex AI平臺上線。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Google Gemini 2.5 人工智能 AI模型
相关文章