掘金 人工智能 05月21日 11:33
Google I/O 2025:AI全家桶震撼发布,搜索与多模态模型全面升级
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

谷歌在2025年I/O大会上发布了一系列AI技术更新,涵盖搜索、多模态模型和创作工具。搜索引入AI模式,提供更智能的交互体验;Gemini 2.5 Pro Deep Think模式在数学和编程领域表现出色;Imagen 4图像模型在细节和创意上取得突破;Veo 3视频模型新增音效和语音生成,并支持唇形同步;FLOW AI剪辑工具整合视频、图像和音频生成。此外,Chrome内置Gemini,推出Google AI Ultra订阅服务,Stitch能生成UI设计稿,NotebookLM支持视频摘要,Labs新增虚拟试衣功能,这些更新都展示了谷歌在AI领域的持续创新。

🔍 **AI搜索模式革新**: 谷歌搜索引入AI模式,允许用户进行更复杂、更长的查询,并提供更精准、智能的回答,实现从关键词匹配到智能化交互的转变。

🧠 **Gemini 2.5 Pro Deep Think**: 推出Deep Think模式,增强推理能力,尤其擅长处理复杂的数学和编程问题,在相关竞赛中取得领先成绩。

🖼️ **Imagen 4图像模型**: 新一代图像生成模型,在细节表现力上有所突破,支持多种风格和分辨率,并提升了拼写和排版能力,适用于多种创作场景。

🎬 **Veo 3视频模型**: 提升视频质量,新增音效和语音生成功能,并支持唇形同步,用户只需输入故事提示即可生成视频片段,为内容创作提供强大工具。

✂️ **FLOW AI剪辑工具**: 整合Veo 3、Imagen 4和Gemini模型,提供从创意构思到成品输出的完整流程支持,降低专业内容创作门槛。

💻 **Chrome与Gemini集成**: Chrome浏览器内置Gemini,利用当前页面上下文提供智能服务,提升用户体验。

💎 **Google AI Ultra订阅**: 一站式订阅所有谷歌AI服务,提供最高使用限额和优先体验,包括Gemini、Veo 3、Flow等。

juejin.cn/aicoding AI编程板块了解更多AI编程干货

在2025年5月的Google I/O大会上,谷歌发布了一系列令人瞩目的AI技术更新,涵盖了搜索功能的重构、多模态模型的突破以及全新的创作工具。这些更新不仅展示了谷歌在AI领域的深厚实力,也为用户和开发者带来了更多可能性。以下是对本次发布内容的详细整理,基于X用户@op7418的帖子(x.com/op7418/thre…

1. 谷歌搜索AI模式:重塑搜索体验

谷歌搜索引入了全新的“AI模式”,计划面向美国所有用户推出。这一模式对搜索功能进行了彻底的重构,允许用户提出更长、更复杂的查询,并通过更先进的推理能力提供精准的回答。AI模式不仅能回答问题,还能像智能助手一样处理复杂任务,例如自动化购票或虚拟试衣等。这标志着谷歌搜索从传统的关键词匹配向智能化、交互式体验的重大转变。

2. Gemini 2.5 Pro Deep Think模式:推理能力再突破

Gemini 2.5 Pro推出了全新的“Deep Think”模式,这是一种增强型推理模式,专为处理复杂的数学和编程问题设计。在生成回答前,Deep Think会探索多种假设,从而提供更准确、深入的解决方案。在2025年美国数学奥林匹克竞赛(USAMO)和LiveCodeBench(一项竞赛级编程高难度基准测试)中,Gemini 2.5 Pro Deep Think模式均取得了领先成绩,展现了其在学术和专业领域的强大潜力。

目前,该模式仅对一小部分安全专家开放测试,未来几周将通过Gemini API向更多受信任的测试者提供。这表明谷歌在稳步推进技术落地的同时,仍在确保其安全性和稳定性。

3. Imagen 4图像模型:细节与创意兼得

Imagen 4是谷歌最新一代图像生成模型,以其卓越的细节表现力而备受关注。无论是复杂织物的纹理、水滴的真实感,还是动物毛发的细腻质感,Imagen 4都能呈现出惊艳的效果。同时,它在写实与抽象风格之间切换自如,支持多种宽高比和高达2K分辨率的图像生成,特别适合用于印刷、海报、贺卡甚至漫画创作。

此外,Imagen 4在拼写和排版能力上也有显著提升,用户可以更轻松地创作文本内容丰富的图像。目前,Imagen 4已集成到Gemini应用和Google Labs的Whisk实验中,供用户试用。

4. Veo 3视频模型:视听一体,唇形同步

Veo 3是谷歌视频生成技术的又一里程碑,不仅在视频质量上大幅提升,还新增了音效和语音生成功能。更令人惊叹的是,Veo 3默认支持唇形同步,用户只需输入一个简短的故事提示,模型就能生成一段生动呈现故事的视频片段,其理解能力令人印象深刻。

目前,Veo 3已面向美国地区的Ultra订阅用户开放。这一功能的推出无疑为内容创作者提供了强大的工具,尤其是在短视频和影视制作领域。

5. FLOW AI剪辑工具:创作新利器

FLOW AI是谷歌基于Veo 3、Imagen 4和Gemini模型打造的视频剪辑工具,集视频、图像和音频生成于一体。它为用户提供了从创意构思到成品输出的完整流程支持,尤其适合有志于电影制作或短视频创作的用户。FLOW AI的推出进一步降低了专业内容创作的门槛,展现了AI在多模态内容生成中的无限可能。

6.Chrome 现在内置了 Gemini

7.Gemini diffusion

Gemini diffusion 使用扩散模型的LLM,Gemini diffusion 在编码方面表现尤为出色。模型能以每秒 2000 个 token 的速度生成代码

8.Gemini APP 更新

iOS 和 Android 用户都可以使用 Gemini Live 读取相机和屏幕的功能 Canvas 和 Deep Research都进行了很多能力迭代 Agent 模式即将推出

9.Google Meet 现在支持近乎实时的语音翻译功能

推出 Google AI Ultra 一站式订阅所有谷歌 AI 服务

这不比Open AI 的 Pro 值多了! 每月 249.99 美元(新用户可享前三个月五折优惠) Gemni:提供 Deep Research 领域的最高使用限额,优先获得突破性的 Veo 3 模型使用权。 Flow:Google AI Ultra 订阅方案将 Flow 的性能上限提升至 1080p 视频生成、高级摄像机控制及优先体验 Veo 3。 Whisk: Google AI Ultra可获得 Whisk Animate 的最高使用权限,该功能通过 Veo 2 将图像转化为八秒视频 NotebookLM:能获得最高使用限制和增强的模型功能。 Chrome 中的 Gemini:从明天开始,直接在 Chrome 浏览器中抢先体验 Gemini。该功能利用当前页面的上下文。 Project Mariner:这款智能研究原型可通过单一仪表板同时管理多达 10 项任务——从研究到预订和采购。 YouTube Premium:个人版 YouTube Premium 套餐可无广告观看 YouTube 视频、离线收听 YouTube Music 30 TB 存储空间:在 Google Photos、Drive 和 Gmail 中提供海量存储容量

11.Stitch 这个新产品能通过AI生成UI设计稿!

Stitch 这个新产品能通过AI生成UI设计稿! 而且支持导出到Figma

12.NotebookLM 发布视频概览,从包括 PDF、照片等来源创建简短的视频摘要

13.Labs 换衣功能

Google 现在支持在 Labs 体验虚拟试衣

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

谷歌 AI Gemini Imagen Veo
相关文章