歸藏的AI工具箱 2024年12月12日
谷歌大招来了!!Gemini 2.0 原生多模态输入输出
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

谷歌发布了Gemini 2.0 Flash,这是一款原生多模态输入输出模型,速度是1.5 Pro的两倍,性能更强。它具备多模态输出、多语种音频输出、原生图像输出和原生工具使用等新功能。Gemini 2.0 Flash还引入了Jules代码助理,这是一个实验性的AI驱动代码代理,可以与GitHub工作流程集成,处理bug修复等任务。开发人员现在可以在Google AI Studio和Vertex AI中测试Gemini 2.0 Flash。

🚀Gemini 2.0 Flash是谷歌推出的新一代多模态模型,速度是1.5 Pro的两倍,同时在多模态、文本、代码、视频、空间理解和推理性能方面有显著提升,特别是在杂乱图像中小对象识别上表现更佳。

🔊Gemini 2.0 Flash支持原生多模态输出,包括文本、音频和图像的集成响应,通过单个API调用实现。它还具备多语种本地音频输出功能,提供8种高质量声音和多种语言及口音选择。

🖼️Gemini 2.0 Flash现在可以原生生成图像,并支持会话式、多轮编辑,用户可以在之前的输出基础上进行构建和完善。它可以输出交错的文本和图像,非常适用于多模态内容。

🛠️Gemini 2.0 Flash经过训练可以使用工具,这是构建代理体验的基本能力。它可以本地调用工具,如Google搜索和代码执行,以及通过函数调用调用自定义第三方函数。将Google搜索作为工具使用可产生更准确和全面的答案。

🤖Jules是基于Gemini 2.0的实验性AI代码助理,能在SWE-bench Verified上达到51.8%的成绩。它可以异步工作,与GitHub工作流程集成,处理bug修复等耗时任务,并创建多步骤计划,高效修改多个文件,甚至准备好拉取请求。

原创 歸藏的 AI 工具箱 2024-12-11 23:54 北京

谷歌的大招终于来了,发布了 Gemini 2.0 Flash 应该是第一家实现原生多模态输入输出的模型

谷歌的大招终于来了,发布了 Gemini 2.0 Flash 应该是第一家实现原生多模态输入输出的模型,而且还有新的编码代理,这些代理将通过替代开发人员采取行动来增强工作流程。

Gemini 2.0 Flash

Flash 2.0 的速度是 1.5 Pro 的两倍,同时实现了更强的性能,包括新的多模式输出,并附带原生的工具使用。 

    更好的性能:Gemini 2.0 Flash 比 1.5 Pro 更强大,同时仍然提供开发人员期望的 Flash 速度和效率。它还在关键基准测试中改进了多模式、文本、代码、视频、空间理解和推理性能。改进的空间理解可以在杂乱图像中的小对象上生成更准确的边界框,以及更好的对象识别和描述。

    原生多模态输出:Gemini 2.0 Flash 生成包含文本、音频和图像的集成响应 - 所有这些都通过单个 API 调用实现。这些新的输出模式可供早期测试人员使用,预计明年将更广泛地推出。

原生工具使用:Gemini 2.0 已经接受过训练使用工具-这是构建代理体验的基本能力。它可以本地调用工具,如 Google 搜索和代码执行,以及通过函数调用调用自定义第三方函数。将 Google 搜索本地用作工具可产生更准确和全面的答案,同时增加发布者的流量。可以同时运行多个搜索,从多个来源同时查找更多相关事实并将它们组合以提高信息检索准确性。

多模态实时API:开发人员现在可以使用来自摄像头或屏幕的音频和视频流输入构建实时的多模态应用程序。支持自然对话模式,如中断和语音活动检测。该 API 支持将多个工具集成在一起,以通过单个 API 调用完成复杂的用例。


Jules代码助理

Jules:可以执行任务的编码代理,2.0 Flash,在 SWE-bench Verified 上实现了 51.8%,该测试对代理在真实软件工程任务上的性能进行测试,Claude 3.5是49%。 

Jules,一个实验性的 AI 驱动代码代理,它将使用 Gemini 2.0。朱尔斯能够异步工作,并与你的 GitHub 工作流程集成,处理 bug 修复和其他耗时的任务,而你可以专注于你真正想要构建的内容。Jules会创建全面的、多步骤的计划来解决问题,高效修改多个文件,甚至准备好拉取请求,将修复直接回传到 GitHub。 

如何使用

从今天开始,开发人员可以在 Google AI Studio 和 Vertex AI 中通过 Gemini API 测试和探索 Gemini 2.0 Flash,在其实验阶段,普遍可用性将在明年初推出。 


跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

谷歌 Gemini 2.0 Flash 多模态 人工智能 Jules代码助理
相关文章