我爱计算机视觉 2024年10月17日
开源了!阿里轨迹控制版视频生成 Tora 开源发布
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

阿里团队在GitHub上开源轨迹控制版视频生成工具Tora,基于DiT框架,专注轨迹控制视频生成。提供完整代码与模型权重,目前为文生视频版本,未来计划提供更多功能。Tora文生视频功能通过Gradio可视化界面,操作简单,生成的视频效果自然,提升用户体验。

🎬 Tora是阿里团队开源的视频生成工具,基于先进的DiT框架,专注于轨迹控制的视频生成,为学术界和开源社区提供了强大工具。

💻 阿里团队提供了完整的代码与模型权重,当前开放的文生视频版本供研究人员和开发者在学术环境中使用,未来还将提供更多功能。

🎨 Tora的文生视频功能通过Gradio可视化界面展现,用户可绘制轨迹并输入文本提示生成6秒的轨迹控制视频,还可选择预设或自定义轨迹以实现个性化效果。

🌟 Tora在处理直线轨迹和螺旋曲线方面表现出色,当文本提示中的物体与预设轨迹不精确匹配时,仍能保持物体自然运动规律,使生成的视频更具观看价值。

52CV 2024-10-17 13:14 江苏




关注公众号,发现CV技术之美




阿里团队近期在 GitHub 上正式开源了轨迹控制版的视频生成工具—— Tora。这一开源项目为学术界和开源社区提供了强大的工具,允许用户探索视频生成领域的无限可能。

Tora 基于先进的 DiT 框架,专注于轨迹控制的视频生成。在此次发布中,阿里团队提供了完整的代码与模型权重,供研究人员和开发者在学术环境中使用。

根据 GitHub 仓库中的 README 文件,由于阿里团队目前的商用计划,当前开放的版本仅为文生视频版本。

未来,团队还计划提供 ModelScope 的试用 demo、训练代码及完整版 Tora,让更多用户受益于其强大的功能。

Tora 的文生视频功能通过 Gradio 可视化界面展现,用户的操作过程极为简单。只需绘制任意数量的轨迹,并输入一段文本提示(prompt),便可生成为期 6 秒的轨迹控制视频。

用户可以选择使用提供的预设轨迹,或者自定义绘制轨迹,以实现更具个性化的效果。

demo展示:

从此次 github 仓库的 demo 中看,Tora 无论在处理直线轨迹还是螺旋曲线方面都表现出色。尤其令人印象深刻的是,当输入的文本提示中的物体未能与预设轨迹精确匹配时,Tora 仍能尽力保持物体的自然运动规律,确保其运动尽可能符合预设轨迹。这种趋于自然的效果使得生成的视频更具观看价值,极大地提升了用户体验。

如果您对这项技术感兴趣,欢迎访问其(https://github.com/alibaba/Tora)进行探索与尝试。

✑推荐阅读

最新 AI 进展报道
请联系:amos@52cv.net

END




欢迎加入「视频生成交流群?备注:生成




跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

阿里 轨迹控制 Tora 视频生成
相关文章