报告主题:MatAnyone:利用记忆传播实现指定目标的视频抠像

报告日期:04月24日(本周四)10:30-11:30

报告要点:
视频人物抠像技术在电影、短视频制作和实时视频通讯中具有广泛的应用价值,但面对复杂背景和多目标干扰时,现有方法仍然难以实现令人满意的追踪稳定性和细节捕捉效果。与传统无辅助方法不同,MatAnyone 提出一种基于记忆传播的「目标指定型」视频抠像方法:只需在第一帧通过人物遮罩指定抠像目标,即可在整个视频中实现稳定、高质量的目标提取。受视频目标分割的记忆力机制启发,MatAnyone对需要更高精度的抠像任务提出了「区域自适应记忆融合」,智能调节记忆信息在不同区域(即核心和边缘)的传播程度,从而既确保人物主体在复杂环境中的语义稳定性,又细致捕捉到毛发等精细边界细节。此外,我们构建了更大规模、更高质量的训练数据集 VM800,以及更加贴近真实分布的评测基准 YouTubeMatte。同时,为克服现有视频抠像数据不足的问题,我们创新性地提出了利用真实分割数据进行核心区域监督的训练策略,显著提升了模型在真实场景中的泛化能力。
报告嘉宾:
杨沛青是南洋理工大学MMLab的二年级博士生,师从吕健勤教授。她的研究兴趣涵盖计算机视觉与深度学习,聚焦于视觉内容增强、编辑及生成。她在 CVPR、NeurIPS、IJCV等国际顶级会议与期刊上发表多篇研究成果。
更多信息请访问她的个人主页:https://pq-yang.github.io/。

扫码报名

更多热门报告

内容中包含的图片若涉及版权问题,请及时与我们联系删除