谷歌发布 Gemini 2.5 Pro I/O 特别版：编程双榜第一

掘金人工智能 05月07日 11:12

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

近期，谷歌发布了Gemini 2.5 Pro I/O特别版，其编程能力在LMArena和WebDev Arena排行榜上均取得领先。LTXStudio也推出了130亿参数的LTX-Video开源视频生成模型，该模型在细节呈现和运动轨迹方面有所提升，并可在本地GPU上高效运行。此外，ACE-Step开源音乐AI模型支持19种语言，并具备多种控制能力，其生成效果接近Suno。同时，ComfyUI新增了多个付费模型API节点支持，并更新了Logo设计。

🚀 谷歌发布Gemini 2.5 Pro I/O特别版，该版本在编程能力上取得了重大突破，不仅在LMArena编码排行榜上登顶，还在WebDev Arena排行榜上稳居第一，标志着其在技术上的显著进步。

🎬 LTXStudio推出了130亿参数的LTX-Video开源视频生成模型。该模型采用了多尺度渲染技术，提升了视频细节的呈现，同时增强了运动轨迹和场景理解能力。值得一提的是，该模型可在本地GPU上运行，速度比同类产品快30倍，并支持关键帧、镜头/角色运动控制等功能。

🎵 ACE-Step是一个由ACE Studio和StepFun联合开发的开源音乐生成模型，它基于扩散模型，支持生成多种风格的歌曲，并支持包括中文在内的19种语言。该模型提供了声音克隆、歌词修改、混音及音轨生成等多种控制功能，其生成效果接近Suno。

💻 ComfyUI增加了多个付费模型的API节点支持，用户可以直接在ComfyUI中使用这些付费模型，并且价格与官方API一致。ComfyUI团队还计划在未来版本中支持用户使用自己的API key，以便更好地控制和管理使用成本。

谷歌发布 Gemini 2.5 Pro I/O 特别版：编程双榜第一

谷歌正式发布 Gemini 2.5 Pro "I/O 特别版"技术预览。作为 2.5 Pro 的重大升级版本，其编程能力获得突破性提升 —— 不仅在 LMArena 编码排行榜登顶，更在 WebDev Arena 排行榜稳居第一。

完整更新内容可查阅谷歌官方技术博客[1]。

同样可以在 ai.dev 中直接用，选 Gemini 2.5 Pro Preview 05-06

LTXStudio 发布 130 亿参数 LTX-Video 开源模型

LTXStudio 最新发布了 LTX-Video 13B 开源视频生成模型：

130亿参数规模采用多尺度渲染技术，呈现更精细的细节显著提升运动轨迹与场景理解能力可在本地GPU运行，比同类产品快 30 倍支持关键帧、镜头/角色运动控制及多镜头序列生成

完整更新介绍可以看官方推文[2]

ACE-Step 开源音乐 AI：19 种语言支持

ACE-Step[3] 是由 ACE Studio 和 StepFun 联合开发的开源音乐生成模型，基于扩散模型，支持生成多种风格歌曲，支持包括中文在内的 19 种语言。

支持各种控制能力，包括声音克隆、歌词修改、人声性别调整、混音及音轨生成。

生成的效果水平接近 Suno，旋律连贯，歌词对齐。

官方还提供了在线演示[4]，感兴趣的佬可以立即体验。

ComfyUI 新增多款付费模型 API 节点支持

继上周推出 GPT-Image-1 API 节点后，ComfyUI 现已新增多个付费模型的 API 节点[5]支持。

这些节点的定价与直接调用各模型官方 API 的价格一致。付费模型完整价格表：点击查看[6]。

ComfyUI 团队还表示，未来版本将支持用户使用自己的 API key。

此外，居然还换了 Logo，采用了更现代的扁平化设计风格，似乎是第二次换了吧

谷歌发布 Gemini 2.5 Pro I/O 特别版：编程双榜第一

LTXStudio 发布 130 亿参数 LTX-Video 开源模型

ACE-Step 开源音乐 AI：19 种语言支持

ComfyUI 新增多款付费模型 API 节点支持

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签