All In AI的Google I/O 2025还开源了一系列模型，冲~

PaperAgent 05月21日 19:43

All In AI的Google I/O 2025还开源了一系列模型，冲~

谷歌在IO 2025大会上展示了其在人工智能领域的最新进展，预示着Gemini时代的到来。亮点包括Gemini 2.5 Flash在推理、多模态、代码和长上下文方面的全面提升，以及Veo 3视频生成模型原生音频生成功能。谷歌还对搜索进行了彻底重塑，并推出了Agent模式以提高用户效率。此外，谷歌还开源了一系列模型，包括MedGemma和Gemma 3，以促进AI技术的更广泛应用和创新。AI技术正在被世界更快地采用，谷歌产品和API每月处理的token数量一年内增长了50倍。

🚀 Gemini 2.5 Flash性能卓越：在推理、多模态、代码和长上下文等多个维度上都实现了显著提升，同时Gemini 2.5 Pro也在不断改进，为用户提供更强大的AI能力。

🎥 Veo 3视频生成模型：作为谷歌最先进的视频生成模型，Veo 3具备原生音频生成功能，能够创造出令人惊叹的视听体验。

🤖 Agent模式提升效率：Geminiapp中的Agent模式可以帮助用户在互联网上更高效地完成任务，Gmail中的个性化智能回复功能则能从谷歌应用中提取信息，并以用户口吻进行书写。

💡 开源模型促进创新：谷歌开源了MedGemma和Gemma 3等一系列模型，旨在促进AI技术的更广泛应用和创新，特别是在医学文本和图像理解以及低资源设备上的高效执行方面。

2025-05-21 11:45 广东

谷歌 CEO：在Google IO 2025上，我们分享了数十年的人工智能研究如今已成现实。从对搜索的彻底重塑到Agent模式、Veo 3以及更多，Gemini时代将是迄今为止最令人兴奋的AI时代。大会的亮点也都是AI、AI还是AI...

最新的Gemini 2.5 Flash在几乎所有维度上都更胜一筹：推理、多模态、代码、长上下文。

借助深度思考模式，Gemini 2.5 Pro也在不断改进。

AI模式正在向美国所有用户推出。它对搜索进行了彻底的重塑，具备更高级的推理能力，因此您可以提出更长、更复杂的查询。

Veo 3是我们最先进的视频生成模型，具备原生音频生成功能，令人惊叹不已。

谷歌会议中的实时语音翻译功能可匹配您的语调和语速，能够跨语言进行流畅的对话。

在Geminiapp中的Agent模式可以帮助您在互联网上更高效地完成更多任务

借助Gmail中的个性化智能回复功能，可以授权Gemini从的谷歌应用中提取详细信息，并以用户的口吻进行书写。

Google Beam利用一种新的视频模型将二维视频流转化为逼真的三维体验——几乎完美的头部追踪，精度可达毫米级，每秒60帧，全部实时完成。

世界比以往任何时候都更快地采用人AI。去年，我们在产品和API中每月处理的token数量为9.7万亿。如今，这一数字已达到480万亿。这是一年内的50倍增长。

除了上述的一些亮点，还开源了一系列模型：medgemma、gemma-3n

Gemma 3n模型专为在低资源设备上高效执行而设计。它们能够处理多模态输入，包括文本、图像、视频和音频输入，并生成文本输出，指令调整型变体的权重是公开的。这些模型是使用超过140种口语的数据进行训练的。

MedGemma ，这是一个用于医学文本和图像理解的开放式多模态模型。该模型基于 Gemma 3 构建，具有可微调、轻量级等特点，专为在云端或本地运行的放射学分析或病历摘要等应用而设计。

https://blog.google/technology/developers/google-io-2025-collection/

https://x.com/sundarpichai/status/1924909370497995010

https://huggingface.co/google

推荐阅读

• 动手设计AI Agents：（编排、记忆、插件、workflow、协作）

• DeepSeek R1 + Agent 的下半场

• 单智能体（Agent）：企业员工AI助理

• Agent到多模态Agent再到多模态Multi-Agents系统的发展与案例讲解（1.2万字，20+文献，27张图）

欢迎关注我的公众号“PaperAgent”，每天一篇大模型（LLM）文章来锻炼我们的思维，简单的例子，不简单的方法，提升自己。

跳转微信打开

Fish AI Reader

AI辅助创作，多种专业模板，深度分析，高质量内容生成。从观点提取到深度思考，FishAI为您提供全方位的创作支持。新版本引入自定义参数，让您的创作更加个性化和精准。

FishAI

鱼阅，AI 时代的下一个智能信息助手，助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Google IO 2025 Gemini 人工智能 AI模型 Agent模式

相关文章

人工智能正在摧毁互联网内容生态系统

阿里云：通义千问API日调用量破亿企业用户破9万

【iThome 2024 CIO大調查系列1】AI、資安和永續變革三箭齊發

鈺登跨入AI，推出搭配英特爾四代Xeon SP與Gaudi2的伺服器

蘋果發表M4晶片，更新iPad產品線

Red Hat推出AI平臺，內建IBM開源Granite模型

【iThome 2024 CIO大調查系列 1｜IT投資趨勢】IT投資布局更多角化，雲端比重明顯增加