歸藏的AI工具箱 2024年12月13日
可灵创造出了真正的梦想机器!完美的 ID 保持视频生成,还有跟 Sora 的对比
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文作者体验了可灵的AI视频模型定制功能,发现其在视频生成ID保持技术上表现卓越,解决了传统AI视频生成中人脸ID不一致的问题。通过对比测试,Sora在图生视频方面几乎不可用,文生视频也存在诸多问题,而可灵的定制模型能高度还原个人面部特征,并在不同场景下自然变化,生成效果惊艳。虽然模型训练过程稍显繁琐,但最终效果显著,尤其在ID一致性方面,可灵的方案解决了闪烁、死板等问题,提升了AI生成视频的真实感和实用性。

🛠️ 可灵的AI视频模型定制功能强大,尤其在ID保持技术上,能高度还原个人面部特征,包括痘痘、发际线、肌肉线条等细节,且在不同场景下能自然变化,实现高度逼真的效果。

🆚 通过与Sora的对比测试发现,Sora在图生视频方面几乎不可用,文生视频也存在画面不动、生成劣质3D视频等问题,而可灵在两方面都表现突出,尤其在ID一致性上,解决了传统AI视频生成中人脸ID不一致的问题。

💎 可灵的定制模型训练需要钻石会员,并消耗一定积分,但只需提供15条10秒以上的个人视频素材即可进行训练,并有详细的页面指引。尽管过程稍显繁琐,但最终生成效果惊艳,尤其在ID一致性方面,解决了闪烁、死板等问题。

🎬 可灵的AI视频模型不仅能高度还原面部特征,还能学习面部表情和神态动作,以及物理效果,使得生成的视频更具真实感和自然度,例如,作者跳伞的画面,效果逼真到令人恍惚。

原创 歸藏的 AI 工具箱 2024-12-13 07:01 北京

顺便去可灵做了一个对比测试,做测试的时候才发现居然可以定制 AI 视频模型了,这个太强大了,试了一下给我惊艳到了

前几天 Sora 发布之后满心欢喜的去尝试,结果太令人失望了,图生视频基本不可用,同时还有频繁的生成失败和各种限制条件,基本等于诈骗。 

很多博主也开始翻出可灵等其他模型去测试,发现不知不觉他们都已经这么强大了,我也顺便去可灵做了一个对比测试,做测试的时候才发现居然可以定制 AI 视频模型了,这个太强大了,试了一下给我惊艳到了,后面有介绍。 

先来看看和 Sora 的对比,这次分了两个部分,文生视频和图生视频。 



图生视频这里就别说了,Sora 的完全不可用,感觉成功率连 1% 都不到,大部分都不动,好不容易动了没按提示词动,或者在画面中加入了完全跟图片风格不同的内容非常出戏。 

文生视频这里的话成功率上来了一些,但是画面完全不动的情况也时有发生,而且一旦涉及到一些非现实或者不常见的概念它就摆烂,开始生成 20 年前游戏画面那种劣质 3D 的视频。 

 

然后我开始测试他们这个 AI 视频模型的功能,老实说创建过程确实有点繁琐。 

但是,当我用我自己的模型生成第一个视频的时候,我觉得这些都是值得的,这是目前市面上独一份的视频生成 ID 保持技术,可以看藏师傅的梦想生活短片。 

 

当然一些图片方案也可以达到在视频生成后 ID 保持的效果,但是要么有闪烁,要么保持的非常死板,图片什么样视频里就什么样,跟环境不融合,要么是在视频后半部分或者运动幅度大的时候无法保持 ID 的一致性。 

但是可灵这个方案根本不存在这些问题,我在给朋友们看了以后他们的表情真的很精彩,有的对 AI 不了解的朋友真的以为我去做这些事情了。 

首先是相似度真的爆表,比如我脸上的一些痘痘,还有感人的发际线,以及面部肌肉线条,都还原了,甚至我后脑勺的头发长度都是一样的,当然还有我的眼镜款式。 

另外模型也不会一直死板的还原你现在的状态和样貌,当你生成不同的环境的时候他会根据场景对你的样貌生成一些变化,比如下面这个我在沙漠探险很长时间后,可灵就给我的胡子变得很长。 

最后就是真实感了,因为是模型的原因,你的面部表情和神态动作都会学到,比如一些常见的表情,以及物理效果,这里面最好的部分是我跳伞的画面,真的我自己看到的时候都恍惚了一下。 

 

那么说了这么多如何使用呢,你需要在可灵网页版左侧导航的 AI 模型进入,模型训练成本确实很高,所以需要钻石会员才可以创建,而且现在创建还会打折,只需要一半的积分。 

整体大约需要 15 条 10 秒以上的视频,建议提前拍摄好,不要有其他人脸,人脸不要完全丢失,可以拍一大段然后自己剪成合适的长度,页面有非常详细的指引。 

相信我,相较于结果来说这些成本是值得的。 

 

AI 内容生成技术 70 分和 90 分的效果带来的影响和对内容消费者的触动完全是不同的,可能这就是可灵做这种成本很高的模型的功能的原因吧。 

我在看第一条结果的时候真的都傻了,正因为我看 AI 内容很多,所以我知道这个质量意味着什么。 

AI 内容生成的三座大山、ID 一致性、风格一致性、场景一致性,可以说 ID 一致性通过这种方式已经被完全解决了,期待可灵在另外两个一致性上给我们更多的惊喜。

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

可灵 AI视频模型 ID一致性 视频生成 Sora
相关文章