谷歌发布 Gemini 2.5 Pro I/O 特别版:编程双榜第一
谷歌正式发布 Gemini 2.5 Pro "I/O 特别版"技术预览。作为 2.5 Pro 的重大升级版本,其编程能力获得突破性提升 —— 不仅在 LMArena 编码排行榜登顶,更在 WebDev Arena 排行榜稳居第一。
完整更新内容可查阅谷歌官方技术博客[1]。
同样可以在 ai.dev 中直接用,选 Gemini 2.5 Pro Preview 05-06
LTXStudio 发布 130 亿参数 LTX-Video 开源模型
LTXStudio 最新发布了 LTX-Video 13B 开源视频生成模型:
- 130亿参数规模采用多尺度渲染技术,呈现更精细的细节显著提升运动轨迹与场景理解能力可在本地GPU运行,比同类产品快 30 倍支持关键帧、镜头/角色运动控制及多镜头序列生成
完整更新介绍可以看官方推文[2]
ACE-Step 开源音乐 AI:19 种语言支持
ACE-Step[3] 是由 ACE Studio 和 StepFun 联合开发的开源音乐生成模型,基于扩散模型,支持生成多种风格歌曲,支持包括中文在内的 19 种语言。
支持各种控制能力,包括声音克隆、歌词修改、人声性别调整、混音及音轨生成。
生成的效果水平接近 Suno,旋律连贯,歌词对齐。
官方还提供了在线演示[4],感兴趣的佬可以立即体验。
ComfyUI 新增多款付费模型 API 节点支持
继上周推出 GPT-Image-1 API 节点后,ComfyUI 现已新增多个付费模型的 API 节点[5]支持。
这些节点的定价与直接调用各模型官方 API 的价格一致。付费模型完整价格表:点击查看[6]。
ComfyUI 团队还表示,未来版本将支持用户使用自己的 API key。
此外,居然还换了 Logo,采用了更现代的扁平化设计风格,似乎是第二次换了吧