理想 TOP2 02月17日
MoEE:理想汽车的混合专家模型
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

理想汽车联合浙大等高校发布MoEE,一种新型音频驱动肖像动画框架。MoEE通过解耦六种基本情感并结合复合情感,实现了对单一和复杂情感状态的精确合成。研究引入了包含150小时视频内容的高质量数据集DH-FaceEmoVid-150,为情感驱动模型训练提供了丰富素材。MoEE框架的情感到潜空间模块,可将文本、音频和标签等多模态输入映射到统一情感潜空间,实现灵活情感控制。通过两阶段训练和掩码噪声情感采样,MoEE在情感控制准确性和视频自然性方面表现出色,为音频驱动肖像动画领域树立新标杆。

🎭 MoEE框架的核心创新在于情感解耦,它将六种基本情感(愤怒、厌恶、恐惧、快乐、悲伤、惊讶)分离,并结合复合情感,从而能够精确合成单一情感和复杂情感状态,实现更细腻的情感表达。

💾 DH-FaceEmoVid-150数据集的贡献在于其高质量和丰富性,它包含150小时的视频内容,涵盖六种基本情感和四种复合情感,为情感驱动模型的训练提供了宝贵的素材,提升了模型的泛化能力。

🧠 情感到潜空间模块(Emotion-to-Latents Module)的设计亮点在于其多模态融合能力,它能够将文本、音频和标签等多种模态输入映射到统一的情感潜空间,从而实现灵活的情感控制,甚至可以通过音频单独实现情感控制,增强了模型的交互性和可控性。

🛠️ MoEE框架采用了两阶段训练过程和掩码噪声情感采样策略,这两种方法共同作用,提高了情感控制的准确性和生成视频的自然性。通过引入噪声数据和掩码处理,模型对情感条件的学习能力得到了显著增强。

2025-02-14 20:32 四川

2025年1月3日理想联合浙大等高校发布MoEE: Mixture of Emotion Experts for Audio-Driven Portrait Animation。

其中理想为第二单位

论文链接:https://arxiv.org/abs/2501.01808v2

MoEE(Mixture of Emotion Experts)是一种新型音频驱动肖像动画框架,由理想汽车联合来自浙大等高校的研究人员共同开发,旨在通过精确的情感控制生成逼真的动态头像视频。

MoEE 的核心创新在于通过解耦六种基本情感(愤怒、厌恶、恐惧、快乐、悲伤、惊讶)并结合复合情感,实现了对单一情感和复杂情感状态的精确合成。此外,研究还引入了一个高质量的数据集——DH-FaceEmoVid-150,该数据集包含150小时的视频内容,涵盖六种基本情感和四种复合情感,为情感驱动模型的训练提供了丰富的素材。

MoEE 框架还设计了一个情感到潜空间模块(Emotion-to-Latents Module),能够将文本、音频和标签等多种模态输入映射到统一的情感潜空间,从而实现灵活的情感控制,甚至可以通过音频单独实现情感控制。通过两阶段训练过程和掩码噪声情感采样策略,MoEE在情感控制的准确性和生成视频的自然性方面表现出色。

该研究的特点在于其对情感控制的精确性和多样性的关注,尤其是在生成复杂情感状态时的能力。MoEE框架不仅在单一情感生成上表现出色,还能通过混合情感专家模块生成自然的复合情感,这在以往的研究中较为少见。

此外,研究通过引入高质量的数据集和多模态情感控制模块,显著提升了模型的灵活性和生成质量,为音频驱动肖像动画领域树立了新的标杆。

技术解读

本研究的核心思路是通过解耦基本情感并结合复合情感,利用混合情感专家(MoEE)模型和高质量的数据集DH-FaceEmoVid-150,实现音频驱动肖像动画中精确的情感控制和自然的动态头像生成。MoEE 框架通过引入情感到潜空间模块(Emotion-to-Latents Module),将多模态输入(如音频、文本、标签)映射到统一的情感潜空间,从而支持灵活的情感控制,甚至可以通过音频单独实现情感驱动。此外,该技术采用两阶段训练过程和掩码噪声情感采样策略,进一步提升情感控制的准确性和生成视频的自然性。

MoEE 模型的处理过程大致如下:


加微信,进群深度交流理想长期基本面。不是车友群。


阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

MoEE 音频驱动 肖像动画 情感控制 人工智能
相关文章