原创 小茸茸 2025-03-20 09:54 重庆
Orpheus TTS:基于 Llama-3b 架构的开源语音合成系统;腾讯开源 FlashVDM:加速 Hunyuan3D 2.0 模型生成速度 30 倍;Halfmoon 模型在生图竞技场登顶
阶跃星辰推出 Step-Video-TI2V:30B 参数图生视频模型
Step-Video-TI2V[1] 是由 StepFun(阶跃星辰)开发的图生视频模型,拥有 30B 参数,是目前开源社区中规模最大的 TI2V 模型之一。
该模型能够根据提示词和初始图生成 540p/24fps 共 5 秒的视频。采用 MIT 许可证完全开源,可以商用。
该模型对 GPU 要求较高,单 GPU 运行需要超大显存支持,推理时间较长(约 14 分钟),即使使用 4GPU 也需要大约 5 分钟。
Step-Video-TI2V 模型页面: https://huggingface.co/stepfun-ai/stepvideo-ti2v
Orpheus TTS:基于 Llama-3b 架构的开源语音合成系统
Orpheus TTS[2] 是一个开源的基于 Llama-3b 的 TTS 系统,旨在提供接近人类水平的语音合成质量。具有自然语调、情感表达和高清晰度的特点。
项目基于 Apache 2.0 许可证开源,可以商用。官方的在线演示是英文的,效果非常不错,我试了下中文,能生成,不过大佐味满满的。
Orpheus TTS 开源项目主页: https://github.com/canopyai/Orpheus-TTS
腾讯开源 FlashVDM:加速 Hunyuan3D 2.0 模型生成速度 30 倍
FlashVDM[3] 是一种专门用于加速形状生成的通用框架,现已开源。
腾讯表示,Hunyuan3D 2.0 整个系列的模型生成速度提升了 30 倍,处理时间从 30 秒缩短至 1 秒。完全得益于 FlashVDM,它不仅支持混元系列模型,还支持加速其他模型。
FlashVDM 开源项目: https://github.com/Tencent/FlashVDM
Windsurf 重磅更新:支持类 Cursor 的 tab 补全
Windsurf 宣布支持类 Cursor 的 tab 补全、导入、跳转和多行补全!最关键的是这些能力都是免费使用,Pro 用户只是响应更快,体验丝滑。
完整更新细节可以看官方博客[4]
Windsurf Wave 5 官方博客: https://codeium.com/blog/windsurf-wave-5
Halfmoon 模型在生图竞技场登顶
Artificial Analysis的生图模型竞技场[5]上出现了一款名为 Halfmoon 的模型,其 ELO 得分超越了此前的 Recraft v3 模型,以 16 分的优势登顶榜首。
佬们可以猜猜这会是谁家的模型呢?
Artificial Analysis 图片生成竞技场: https://artificialanalysis.ai/text-to-image/arena?tab=Arena
❝如果你喜欢《一觉醒来 AI 界发生了什么》系列的话,请 关注、点赞、在看、收藏、分享 五连警告,这对我真的很重要!