组委会 2025-06-02 16:26 江苏
聚焦解耦表征学习(DRL)及可控生成(Controllable AIGC)
关注公众号,发现CV技术之美
国际计算机视觉大会(ICCV 2025)将举办首届“DRL4Real解耦表征学习与可控生成研讨会”——The 1st International Workshop and Challenge on Disentangled Representation Learning for Controllable Generation,现正式推出两大核心竞赛赛道。本次挑战赛聚焦解耦表征学习(DRL)及可控生成(Controllable AIGC)两大领域的前沿问题,为全球研究者提供创新展示与学术交流的高端平台。
DRL4Real Workshop主页:
https://drl-for-real.github.io/DRL-for-Real/
01 概述
解耦表征学习(Disentangled Representation Learning)有望增强AI对世界的基本理解,潜在地解决生成模型(Generative Model)中的幻觉问题并提高生成系统的可控性(Controllability)。尽管学术界兴趣浓厚,但由于缺乏现实基准和统一评估指标,DRL研究仍局限于简单合成数据场景(Synthetic Toy Data),难以大规模推广到实用阶段。
ICCV 2025 DRL4Real研讨会旨在通过引入新颖、真实的数据集和全面的基准来弥合这一差距,用于评估实际应用中的DRL方法。我们将重点关注自然图像可控生成和自动驾驶场景生成等关键领域,探索DRL如何提高模型的鲁棒性、可解释性和泛化能力。
02 数据集
DRL4Real数据集专为解耦表征学习和可控生成而设计,涵盖多种现实场景和多样化的解耦因素。它包含两个主要类别,与我们的竞赛赛道一致:
通用图像子集
包含约14,000张图像,涵盖13个不同类别:汽车、猫、牛、狗、鹰、人脸、花卉、水果、马、鸽子、树木、蔬菜,以及延时摄影。该子集中的图像部分使用文本到图像生成模型合成,其他则来自可控生成视频源或从真实视频中捕获。
单因子变化:我们的数据集提供文本描述和相应图像,展示因子变化。数据样例如下。
Car Color Manipulation
Hair Color Manipulation
Rose Color Manipulation
多因子变化:我们主要提供相应的文本描述,并附有少量图像作为示例。数据样例如下。
Flowers in Vase
Flowers in Hand
Vase in Hand
自动驾驶场景子集
以车辆为中心的数据集,具有5个摄像头视角:
4个朝外的摄像头位于车辆周围
1个俯视摄像头
每个样本由这5个摄像头拍摄的视频中分别提取的100帧组成,同时在8个关键因素上有变化:车辆速度(加速、匀速、减速)、天气条件(晴朗、雾、小雨)、光照和其他环境因素。数据集包括3种不同的车辆类型和5个以上的背景场景,使用CARLA模拟器系统生成,总计20,000余张高质量图像。
数据样例如下。
03 挑战赛
我们的竞赛旨在通过现实基准和全面评估指标推进解耦表征学习领域。挑战赛分为两个主要赛道:
竞赛赛道
1. 单因子赛道
该赛道提供超过13,000张图像,涵盖数据集中提到的场景和相应的文本描述。参赛者必须使用解耦模型参与此赛道,如β-VAE、GEM、StyleGAN、EncDiff、CL-Dis、STA等。 评估指标
图像质量(50%):使用Fréchet Inception Distance(FID)测量
潜变量解耦(50%):使用双向DCI评估,该指标扩展了传统DCI指标,还测量真实图像中的扰动如何影响编码器中相应的潜变量
2. 多因子赛道
该赛道分为两个子类别,每个子类别有两个独立的排行榜:
2.1 通用图像数据集
总体排行榜:向所有方法开放。评估使用LLM来评估:
图像的强度评分
变化与非预期变化的比率(越接近1越好)
解耦排行榜:仅适用于解耦模型,使用与单因子赛道相同的指标
2.2 自动驾驶数据集
总体排行榜:向所有方法开放。评估使用结构相似性指数(SSIM)比较重建帧与真实帧
解耦排行榜:仅适用于解耦模型,使用与单因子赛道相同的指标
奖项设置
优胜团队将获得:
冠军:800美元(或等值奖品)
亚军:400美元(或等值奖品)
季军:200美元(或等值奖品)
并受邀向DRL4Real 2025研讨会提交挑战论文,录用论文将收录至ICCV 2025 Workshops会议论文集。
重要日期
5月31日,23:59:59 AOE:研讨会公告和训练与验证数据集发布
6月23日,23:59:59 AOE:最终测试数据集发布
6月28日,23:59:59 AOE:研讨会论文截止日期
6月30日,23:59:59 AOE:竞赛提交截止日期
7月3日,23:59:59 AOE:竞赛结果通知
7月7日,23:59:59 AOE:挑战赛论文截止日期
7月11日,23:59:59 AOE:论文接受通知
8月15日,23:59:59 AOE:终稿提交截止日期
10月19日:ICCV 2025 研讨会和竞赛结果展示
04 征稿
DRL4Real研讨会旨在汇集学术界和工业界的研究人员和从业者,讨论和探索解耦表征学习和可控生成领域的最新趋势、挑战和创新。我们欢迎解决以下主题(但不限于)的原创研究贡献:
解耦表征学习
可控图像和视频生成
自动驾驶中的场景理解和生成
多模态解耦(图像、视频、文本)
生成模型中的解耦(GANs、VAEs、扩散模型)
解耦表征在实际场景中的应用
使用解耦表征的少样本和零样本学习
集成大型语言模型进行可控生成
提交详情
论文将经过同行评审,并遵循ICCV 2025会议论文的风格、格式和长度。已接受的论文必须注册并展示,以确保其被收录在IEEE Xplore中。详情请参阅ICCV 2025作者指南,Openreview投稿链接稍后会公开。