全民熊猫计划 04月09日 17:51
CLS 大会分享|AI 动画 · 潜空间旅行计划
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文分享了作者在ComfyUI Leadership Summit上关于AI动画创作的经验,探讨了视频转绘和图生视频两种主流路径,重点介绍了AnimateDiff社区的IPIV's Morph工作流。作者通过实践总结了Diffusion模型在AI动画创作中的特点,并分享了创作心得。文章还展望了未来的创作方向,包括希腊神话故事、马蒂斯风格MV等,并提出探索不同概念在高维潜空间关联性的有趣想法。

🎬AI动画主要分为两种路径:视频转绘(Video to Video)和图生视频(Img to Video)。视频转绘是在原有视频基础上进行风格转移,图生视频则是通过AI生成图片素材,再转化为视频。

💡作者分享了使用AnimateDiff社区的IPIV's Morph工作流的经验,该工作流能根据关键帧生成补帧动画。作者认为关键帧间的视觉联系和意象主题的相关性,可以生成更流畅丝滑的动画。

🌼作者通过实际案例,如雏菊变人脸、扑克牌变人,展示了AI动画创作的可能性,并强调了探索AI潜力的重要性。

🔮作者总结了Diffusion模型的特点,认为其在高维潜空间中蕴含了大量符号和意象之间的关联,这种特性使得AI动画创作如同诗歌一般。

✨作者展望了未来的创作计划,包括希腊神话故事、马蒂斯风格MV等,并提出探索不同概念在高维潜空间关联性的想法,例如将“圣经”和“香蕉”结合进行创作。

原创 海辛 2024-06-05 21:10 上海

这次去 ComfyUI Leadership Summit 艺术分论坛分享了自己的 AI 动画经验,是我很长一


这次去 ComfyUI Leadership Summit 艺术分论坛分享了自己的 AI 动画经验,是我很长一段时间关于 AI 艺术创作的思考了,决定也发在公众号上。



目前 AI 动画主要有两种路径,一种是视频转绘(Video to Video):在原有视频的基础上进行风格转移,生产新的视频,比如下面这个奶牛猫跳舞的转绘视频,Morph Studio 正在测试的风格转绘功能。

这个工作流其实很像传统电影/动画制作的思路:我们先有草稿,再完善为成稿;先有了分镜动画,再逐步完善为成片。迪士尼的《美女与野兽》和今 敏的《千年女优》都是先请真人演员拍摄了大量参考素材,再由动画师来进行绘制。

另一种是图生视频(Img to Video):用 AI 生成一系列图片素材后,通过图生视频的方式,生成大量的视频素材,再将视频进行剪辑,比如下面这个食品广告就是我通过 Morph Studio 生成视频素材后剪辑的。

这两种模式基本是目前由 AI 制作动画的主流,在 4 月的时候,AnimateDiff 社区出了一个新的工作流:IPIV's Morph. 这个工作流的特点是根据提供的几张关键帧,形成关键帧之间的补帧动画。

阿文在这个工作流的基础上进行了优化,从而做了一些动态肖像画。这里是他的分享:

https://civitai.com/articles/5145/animatelcm

我觉得只是做动态肖像化有些没意思(X)从一张脸变成另一张脸,好像还不够发挥 AI 本身的想象力。比如,我可不可以从一朵蒲公英,逐渐变成一张人脸呢?

或者从扑克牌的梅花变出一个人呢?

我做了一系列尝试,逐渐可以稳定地做出非常丝滑的 AI 动画。在这个过程中,我总结出 Diffusion 模型的一些特点:

一、当关键帧之间有视觉联系的时候,会形成更丝滑的动画。

上面的这个例子里,我用了如下 4 个关键帧,这 4 个关键帧是这样思考的:图 1 是一朵雏菊;图 2 的风车和雏菊都是放射的形状,所以可以做形似,由于风车是动态的,所以会给画面带来转起来的动画;图 3 是雏菊移开后的人物肖像;图 4 最后定格在角色面部。

二、当关键帧之间有意象、主题的相关性时,会形成更丝滑的动画。

上面的这个例子中,我用了如下 4 个关键帧,这 4 个关键帧是这样思考的:黑桃、罗盘、月相图、黑猫是一组神秘学意象。我的猜测是:他们在过去的艺术作品中经常一起出现,所以在潜空间中有较近的距离,故在给定的关键帧内,能形成丝滑的动画。

那么又有视觉相关性、又有意象相关性,自然可以生成非常丝滑的动画效果,比如石头、蛇、美杜莎这个动画:

这让我感觉到 Diffusion 模型本身像是艺术家的集体潜意识一样,在高纬的 Latent Space 中蕴含了大量不同符号和意象之间的关联,这种跳转动画本身像是 AI 动画中的诗歌。

基于以上的创作,我决定接下来也在这个方向上进行探索,我大致定了三个作品计划:

1. 希腊神话故事

希腊神话具有强烈的符号性,感觉配上讲故事的音频的话会特别合适。可能也会在制作过程中更加理解希腊故事。

2. 马蒂斯风格 MV

这是我和阿文的共同项目,用马蒂斯的美术风格,做一个 MV 动画,目前其实视觉已经设计好了,也有了初版动画,应该在 7 月内会和大家见面。

以上两个方向都还是我比较舒适区以内的计划,接下来是我认为可能带了一些学术研究性质的方向,我称这个方向为:

两个截然不同的概念,在高纬潜空间有多远呢?如果我将两个完全不想干的概念“圣经”和“香蕉”放在一起会怎么样?

我试了试将初始帧设置为圣经,终止帧设置为香蕉,只给 AI 60 帧的时间发生形变,这是其生成的动画:

可以看出这个动画很扭曲牵强。

那如果我给 AI 更长的时间在潜空间里 travel,是否能生成更合理的视觉呢?这是我给 AI 80 帧的时间,其生成的动画:

由此,我们可以初步得出结论:圣经到香蕉间的距离是 80 帧。

这个实验让我形成了一个假说:

在我前面的作品案例中,从雏菊、风车、花群到女孩,一共花了 100 帧,形成了很丝滑的动画效果;但如果拿掉风车和花群中间两个关键帧,直接让一头一尾生成补帧动画,在 100 帧内无法产生任何丝滑的符合视觉逻辑的动画效果。

所以在高纬空间里,两个点之间符合视觉逻辑的最短路径,并不是直线,或者是两个向量相减。中间需要借由其他的概念/关键帧来进行跳转。我想要去寻找这些概念间的传送门之间是什么关系。

Diffusion 模型还潜藏着非常大的宝藏尚未被挖掘,无论是从创作的角度还是学术的角度。这也让我感觉到了,我好像找到了自己非常想要去挖掘和探索的艺术创作方向。

关注我,一起在潜空间旅游!(X)

感谢你的阅读,祝你端午节快乐!



跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI动画 ComfyUI AnimateDiff IPIV's Morph Diffusion模型
相关文章