ICCV 2025 DRL4Real 解耦表征学习与可控生成研讨会，竞赛与征稿已开启

我爱计算机视觉 06月02日 22:07

ICCV 2025 DRL4Real 解耦表征学习与可控生成研讨会，竞赛与征稿已开启

国际计算机视觉大会（ICCV 2025）将举办首届“DRL4Real解耦表征学习与可控生成研讨会”，聚焦解耦表征学习(DRL)及可控生成(Controllable AIGC)两大前沿领域。研讨会推出两大核心竞赛赛道，提供真实数据集和全面基准，旨在弥合学术研究与实际应用之间的差距，重点关注自然图像可控生成和自动驾驶场景生成。通过竞赛和征稿，汇集全球研究者，共同探讨DRL和可控生成的最新趋势、挑战与创新，推动该领域的发展。

🏆ICCV 2025将举办首届DRL4Real研讨会，推出两大竞赛赛道，聚焦解耦表征学习(DRL)与可控生成(AIGC)，旨在为研究者提供创新交流平台。

🖼️研讨会提供DRL4Real数据集，包含通用图像和自动驾驶场景两部分，覆盖多种现实场景和解耦因素，部分图像为文本到图像模型合成或来自真实视频。

🏅挑战赛设单因子和多因子两个赛道，提供超过13000张图像和自动驾驶数据集，采用FID、双向DCI、LLM评估以及SSIM等指标，优胜者将获得奖金并受邀提交论文。

✍️研讨会面向学术界和工业界征集原创研究，主题包括解耦表征学习、可控图像/视频生成、自动驾驶场景理解与生成等，接收论文将遵循ICCV 2025标准并收录至会议论文集。

📅重要日期包括：数据集发布（5月31日），竞赛提交截止（6月30日），研讨会论文截止（6月28日），以及研讨会和竞赛结果展示（10月19日）。

组委会 2025-06-02 16:26 江苏

聚焦解耦表征学习(DRL)及可控生成(Controllable AIGC)

关注公众号，发现CV技术之美

国际计算机视觉大会（ICCV 2025）将举办首届“DRL4Real解耦表征学习与可控生成研讨会”——The 1st International Workshop and Challenge on Disentangled Representation Learning for Controllable Generation，现正式推出两大核心竞赛赛道。本次挑战赛聚焦解耦表征学习(DRL)及可控生成(Controllable AIGC)两大领域的前沿问题，为全球研究者提供创新展示与学术交流的高端平台。

DRL4Real Workshop主页：

https://drl-for-real.github.io/DRL-for-Real/

01 概述

解耦表征学习（Disentangled Representation Learning）有望增强AI对世界的基本理解，潜在地解决生成模型（Generative Model）中的幻觉问题并提高生成系统的可控性（Controllability）。尽管学术界兴趣浓厚，但由于缺乏现实基准和统一评估指标，DRL研究仍局限于简单合成数据场景（Synthetic Toy Data），难以大规模推广到实用阶段。

ICCV 2025 DRL4Real研讨会旨在通过引入新颖、真实的数据集和全面的基准来弥合这一差距，用于评估实际应用中的DRL方法。我们将重点关注自然图像可控生成和自动驾驶场景生成等关键领域，探索DRL如何提高模型的鲁棒性、可解释性和泛化能力。

02 数据集

DRL4Real数据集专为解耦表征学习和可控生成而设计，涵盖多种现实场景和多样化的解耦因素。它包含两个主要类别，与我们的竞赛赛道一致：

通用图像子集

包含约14,000张图像，涵盖13个不同类别：汽车、猫、牛、狗、鹰、人脸、花卉、水果、马、鸽子、树木、蔬菜，以及延时摄影。该子集中的图像部分使用文本到图像生成模型合成，其他则来自可控生成视频源或从真实视频中捕获。

单因子变化：我们的数据集提供文本描述和相应图像，展示因子变化。数据样例如下。

Car Color Manipulation

Hair Color Manipulation

Rose Color Manipulation

多因子变化：我们主要提供相应的文本描述，并附有少量图像作为示例。数据样例如下。

Flowers in Vase

Flowers in Hand

Vase in Hand

自动驾驶场景子集

以车辆为中心的数据集，具有5个摄像头视角：

4个朝外的摄像头位于车辆周围

1个俯视摄像头

每个样本由这5个摄像头拍摄的视频中分别提取的100帧组成，同时在8个关键因素上有变化：车辆速度（加速、匀速、减速）、天气条件（晴朗、雾、小雨）、光照和其他环境因素。数据集包括3种不同的车辆类型和5个以上的背景场景，使用CARLA模拟器系统生成，总计20,000余张高质量图像。

数据样例如下。

03 挑战赛

我们的竞赛旨在通过现实基准和全面评估指标推进解耦表征学习领域。挑战赛分为两个主要赛道：

竞赛赛道

1. 单因子赛道

该赛道提供超过13,000张图像，涵盖数据集中提到的场景和相应的文本描述。参赛者必须使用解耦模型参与此赛道，如β-VAE、GEM、StyleGAN、EncDiff、CL-Dis、STA等。评估指标

图像质量（50%）：使用Fréchet Inception Distance（FID）测量

潜变量解耦（50%）：使用双向DCI评估，该指标扩展了传统DCI指标，还测量真实图像中的扰动如何影响编码器中相应的潜变量

2. 多因子赛道

该赛道分为两个子类别，每个子类别有两个独立的排行榜：

2.1 通用图像数据集

总体排行榜：向所有方法开放。评估使用LLM来评估：

图像的强度评分

变化与非预期变化的比率（越接近1越好）

解耦排行榜：仅适用于解耦模型，使用与单因子赛道相同的指标

2.2 自动驾驶数据集

总体排行榜：向所有方法开放。评估使用结构相似性指数（SSIM）比较重建帧与真实帧

解耦排行榜：仅适用于解耦模型，使用与单因子赛道相同的指标

奖项设置

优胜团队将获得：

冠军：800美元（或等值奖品）

亚军：400美元（或等值奖品）

季军：200美元（或等值奖品）

并受邀向DRL4Real 2025研讨会提交挑战论文，录用论文将收录至ICCV 2025 Workshops会议论文集。

重要日期

5月31日，23:59:59 AOE：研讨会公告和训练与验证数据集发布

6月23日，23:59:59 AOE：最终测试数据集发布

6月28日，23:59:59 AOE：研讨会论文截止日期

6月30日，23:59:59 AOE：竞赛提交截止日期

7月3日，23:59:59 AOE：竞赛结果通知

7月7日，23:59:59 AOE：挑战赛论文截止日期

7月11日，23:59:59 AOE：论文接受通知

8月15日，23:59:59 AOE：终稿提交截止日期

10月19日：ICCV 2025 研讨会和竞赛结果展示

04 征稿

DRL4Real研讨会旨在汇集学术界和工业界的研究人员和从业者，讨论和探索解耦表征学习和可控生成领域的最新趋势、挑战和创新。我们欢迎解决以下主题（但不限于）的原创研究贡献：

解耦表征学习

可控图像和视频生成

自动驾驶中的场景理解和生成

多模态解耦（图像、视频、文本）

生成模型中的解耦（GANs、VAEs、扩散模型）

解耦表征在实际场景中的应用

使用解耦表征的少样本和零样本学习

集成大型语言模型进行可控生成

提交详情

论文将经过同行评审，并遵循ICCV 2025会议论文的风格、格式和长度。已接受的论文必须注册并展示，以确保其被收录在IEEE Xplore中。详情请参阅ICCV 2025作者指南，Openreview投稿链接稍后会公开。

05 人员

跳转微信打开

Fish AI Reader

AI辅助创作，多种专业模板，深度分析，高质量内容生成。从观点提取到深度思考，FishAI为您提供全方位的创作支持。新版本引入自定义参数，让您的创作更加个性化和精准。

FishAI

鱼阅，AI 时代的下一个智能信息助手，助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

ICCV 2025 解耦表征学习可控生成 DRL4Real 计算机视觉

相关文章

Exploring EfficientAD: Accurate Visual Anomaly Detection at Millisecond-Level Latencies: A Brief Overview

Top Important Computer Vision Papers for the Week from 29/04 to 05/05

V-JEPA, AI Reasoning from a Non-Generative Architecture with Mido Assran - #677

AI Trends 2024: Computer Vision with Naila Murray - #665

Privacy vs Fairness in Computer Vision with Alice Xiang - #637

Data Augmentation and Optimized Architectures for Computer Vision with Fatih Porikli - #635

Optical Flow Estimation, Panoptic Segmentation, and Vision Transformers with Fatih Porikli - #579

Trends in Computer Vision with Georgia Gkioxari - #549

Deep Unsupervised Learning for Climate Informatics with Claire Monteleoni - #497

Robust Visual Reasoning with Adriana Kovashka - #463