IT之家 02月18日
昆仑万维开源国内首个面向 AI 短剧创作的视频生成模型 SkyReels-V1
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

昆仑万维开源了国内首个面向AI短剧创作的视频生成模型SkyReels-V1和表情动作可控算法SkyReels-A1。SkyReels-V1针对表演细节进行打标,利用好莱坞级别数据训练微调,可实现影视级人物微表情表演生成,支持33种表情与400多种动作组合,还原真人情感表达。同时支持文生视频和图生视频,在同等分辨率下各项指标达到开源SOTA水平。SkyReels-A1对标Runway的Act-One,支持视频驱动的电影级表情捕捉,能够基于任意人体比例生成人物动态视频,将驱动视频中的表情和表演细节移植到给定参考图片的人物身上。

🎬SkyReels-V1是国内首个面向AI短剧创作的视频生成模型,针对表演细节进行优化,通过千万级别的好莱坞级别数据进行训练微调,提升生成视频的质量。

🎭SkyReels-V1支持影视级人物微表情表演生成,拥有33种人物表情与400多种自然动作组合,能够更真实地还原人物的情感表达,包括大笑、怒吼、惊讶、哭泣等。

🎞️SkyReels-V1不仅支持文生视频,还支持图生视频,并且在开源视频生成模型中参数规模最大,在同等分辨率下各项指标均达到开源SOTA水平,生成画面具备电影级的质感,包括构图、演员站位和相机角度。

🤖SkyReels-A1作为表情动作可控算法,对标Runway的Act-One,支持视频驱动的电影级表情捕捉,可以将驱动视频中的面部表情和表演细节“移植”到参考人物图片上,生成新的视频。

IT之家 2 月 18 日消息,昆仑万维今日宣布开源国内首个面向 AI 短剧创作的视频生成模型 SkyReels-V1、国内首个 SOTA 级别基于视频基座模型的表情动作可控算法 SkyReels-A1

昆仑万维官方介绍称,SkyReels-V1 针对表演细节做了打标,还对情绪、场景、表演诉求等进行处理,利用“千万级别、高质量”的好莱坞级别数据进行训练微调

此外,SkyReels-V1 可实现“影视级人物微表情表演生成”,支持 33 种人物表情与 400 + 种自然动作组合,还原真人情感表达,支持生成大笑、怒吼、惊讶、哭泣等微表情。

基于好莱坞级的影视数据训练,当前 SkyReels 生成的每一帧画面,在构图、演员站位、相机角度等号称都具备“电影级的质感”。

SkyReels-V1 不仅支持文生视频,还支持图生视频,号称是“开源视频生成模型中参数最大的支持图生视频的模型”,在同等分辨率下各项指标实现开源 SOTA。

总结来看,SkyReels-V1 可以实现:

性能方面,在自研推理优化框架「SkyReels-Infer」的加持下,该模型可实现 544p 分辨率,推理基于单台 4090 用时 80s,还支持分布式多卡并行,支持 Context Parallel,CFG Parallel,和 VAE Parallel。

此外,模型采取 fp8 quantization 以及 parameter-level offload,满足低显存用户级显卡运行需求;支持 flash attention、SageAttention,模型编译优化等,进一步优化延迟;基于开源 diffuser 库,提升易用性。

为了实现更加精准可控的人物视频生成,昆仑万维还开源了 SOTA 级别的基于视频基座模型的表情动作可控算法 SkyReels-A1,对标 Runway 的 Act-One,SkyReels-A1 支持视频驱动的电影级表情捕捉。

SkyReels-A1 能够基于任意人体比例(包括肖像、半身及全身构图)生成人物动态视频

如下图所示,将参考人物图片(上图)和驱动视频(左下)同时作为输入,在 SkyReels-A1 的能力加持下,生成了新的视频 —— 将驱动视频中的面部表情和表演细节“移植”到给定参考图片的人物身上。

IT之家附开源地址如下:

技术报告:

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

昆仑万维 SkyReels-V1 SkyReels-A1 AI短剧 视频生成
相关文章