掘金 人工智能 05月07日 11:12
谷歌发布 Gemini 2.5 Pro I/O 特别版:编程双榜第一
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

近期,谷歌发布了Gemini 2.5 Pro I/O特别版,其编程能力在LMArena和WebDev Arena排行榜上均取得领先。LTXStudio也推出了130亿参数的LTX-Video开源视频生成模型,该模型在细节呈现和运动轨迹方面有所提升,并可在本地GPU上高效运行。此外,ACE-Step开源音乐AI模型支持19种语言,并具备多种控制能力,其生成效果接近Suno。同时,ComfyUI新增了多个付费模型API节点支持,并更新了Logo设计。

🚀 谷歌发布Gemini 2.5 Pro I/O特别版,该版本在编程能力上取得了重大突破,不仅在LMArena编码排行榜上登顶,还在WebDev Arena排行榜上稳居第一,标志着其在技术上的显著进步。

🎬 LTXStudio推出了130亿参数的LTX-Video开源视频生成模型。该模型采用了多尺度渲染技术,提升了视频细节的呈现,同时增强了运动轨迹和场景理解能力。值得一提的是,该模型可在本地GPU上运行,速度比同类产品快30倍,并支持关键帧、镜头/角色运动控制等功能。

🎵 ACE-Step是一个由ACE Studio和StepFun联合开发的开源音乐生成模型,它基于扩散模型,支持生成多种风格的歌曲,并支持包括中文在内的19种语言。该模型提供了声音克隆、歌词修改、混音及音轨生成等多种控制功能,其生成效果接近Suno。

💻 ComfyUI增加了多个付费模型的API节点支持,用户可以直接在ComfyUI中使用这些付费模型,并且价格与官方API一致。ComfyUI团队还计划在未来版本中支持用户使用自己的API key,以便更好地控制和管理使用成本。

谷歌发布 Gemini 2.5 Pro I/O 特别版:编程双榜第一

谷歌正式发布 Gemini 2.5 Pro "I/O 特别版"技术预览。作为 2.5 Pro 的重大升级版本,其编程能力获得突破性提升 —— 不仅在 LMArena 编码排行榜登顶,更在 WebDev Arena 排行榜稳居第一。

完整更新内容可查阅谷歌官方技术博客[1]。

同样可以在 ai.dev 中直接用,选 Gemini 2.5 Pro Preview 05-06

LTXStudio 发布 130 亿参数 LTX-Video 开源模型

LTXStudio 最新发布了 LTX-Video 13B 开源视频生成模型:

完整更新介绍可以看官方推文[2]

ACE-Step 开源音乐 AI:19 种语言支持

ACE-Step[3] 是由 ACE Studio 和 StepFun 联合开发的开源音乐生成模型,基于扩散模型,支持生成多种风格歌曲,支持包括中文在内的 19 种语言。

支持各种控制能力,包括声音克隆、歌词修改、人声性别调整、混音及音轨生成。

生成的效果水平接近 Suno,旋律连贯,歌词对齐。

官方还提供了在线演示[4],感兴趣的佬可以立即体验。

ComfyUI 新增多款付费模型 API 节点支持

继上周推出 GPT-Image-1 API 节点后,ComfyUI 现已新增多个付费模型的 API 节点[5]支持。

这些节点的定价与直接调用各模型官方 API 的价格一致。付费模型完整价格表:点击查看[6]。

ComfyUI 团队还表示,未来版本将支持用户使用自己的 API key。

此外,居然还换了 Logo,采用了更现代的扁平化设计风格,似乎是第二次换了吧

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Gemini LTX-Video ACE-Step ComfyUI AI模型
相关文章