index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html
![]()
Mat Anyone提出基于记忆传播的视频抠像方法,可指定目标实现稳定高质量提取。该方法受视频目标分割记忆力机制启发,提出区域自适应记忆融合,还构建训练数据集和评测基准,提出训练策略提升泛化能力。报告嘉宾为杨沛青。
🎬Mat Anyone提出基于记忆传播的「目标指定型」视频抠像方法,在第一帧指定抠像目标。
🧠受视频目标分割记忆力机制启发,提出「区域自适应记忆融合」,确保语义稳定性和细节捕捉。
📚构建大规模高质量训练数据集VM800和评测基准YouTubeMatte,提出训练策略提升泛化能力。

报告主题:MatAnyone:利用记忆传播实现指定目标的视频抠像
报告日期:04月17日(周四)10:30-11:30
视频人物抠像技术在电影、短视频制作和实时视频通讯中具有广泛的应用价值,但面对复杂背景和多目标干扰时,现有方法仍然难以实现令人满意的追踪稳定性和细节捕捉效果。与传统无辅助方法不同,MatAnyone 提出一种基于记忆传播的「目标指定型」视频抠像方法:只需在第一帧通过人物遮罩指定抠像目标,即可在整个视频中实现稳定、高质量的目标提取。受视频目标分割的记忆力机制启发,MatAnyone对需要更高精度的抠像任务提出了「区域自适应记忆融合」,智能调节记忆信息在不同区域(即核心和边缘)的传播程度,从而既确保人物主体在复杂环境中的语义稳定性,又细致捕捉到毛发等精细边界细节。此外,我们构建了更大规模、更高质量的训练数据集 VM800,以及更加贴近真实分布的评测基准 YouTubeMatte。同时,为克服现有视频抠像数据不足的问题,我们创新性地提出了利用真实分割数据进行核心区域监督的训练策略,显著提升了模型在真实场景中的泛化能力。杨沛青是南洋理工大学MMLab的二年级博士生,师从吕健勤教授。她的研究兴趣涵盖计算机视觉与深度学习,聚焦于视觉内容增强、编辑及生成。她在 CVPR、NeurIPS、IJCV等国际顶级会议与期刊上发表多篇研究成果。更多信息请访问她的个人主页:https://pq-yang.github.io/。
扫码报名
热门报告

内容中包含的图片若涉及版权问题,请及时与我们联系删除