2024-11-25 11:11 浙江
来源:极市平台
真实雨景/图像去雨相关
真实雨景数据集
一个由~29.5K的雨/无雨影像对组成的大型数据集,涵盖了广泛的自然雨景。
合成降雨数据集
合成降雨数据集由从多个数据集(Rain14000、Rain1800、Rain800、Rain12)收集的 13,712 个清洁雨图像对组成。使用单个经过训练的模型,可以在各种测试集上执行评估,包括 Rain100H、Rain100L、Test100、Test2800 和 Test1200。
RainNet
RainNet是一个真实的(非模拟的)大规模空间降水降尺度数据集,包含62,424对低分辨率和高分辨率降水图,历时17年。与模拟数据相反,该真实数据集涵盖了各种类型的真实气象现象(例如飓风、狂风等),并显示了挑战降尺度算法的物理特征——时间错位、时间稀疏和流体属性。
RainDS
其中包括各种照明条件和不同场景中的无数图像对。每对包含四张图像:雨纹图像、雨滴图像和包含两种类型的雨以及无雨对应物的图像。
SemanticSpray 数据集
该数据集为 RoadSpray [1] 数据集的一个子集提供语义标签,该数据集包含车辆在潮湿表面上以不同速度行驶的场景,从而产生拖曳喷雾效果。我们为 200 多个动态场景提供语义标签,将 LiDAR 点云中的每个点标记为背景(道路、植被、建筑物等)、前景(移动的车辆)和噪声(喷雾、LiDAR 伪影)。
自动驾驶方向
ExDark图像数据集
Exclusively Dark (ExDARK) 数据集是 7,363 张从极低光环境到黄昏(即 10 种不同条件)的低光图像的集合,具有 12 个对象类(类似于 PASCAL VOC),在图像类级别和局部对象边界上进行了注释盒子。
Nexet车辆检测数据集
50000张带标注的训练图片41190张测试图片图片来自77个国家
Udacity 自动驾驶汽车数据集
该数据集包含 11 个类别的 97,942 个标签和 15,000 张图像。有 1,720 个空样本(没有标签的图像)。
所有图像均为 1920x1200(下载大小约为 3.1 GB)。我们还提供了一个降采样到 512x512(下载大小约 580 MB)的版本,适用于大多数常见的机器学习模型(包括 YOLO v3、Mask R-CNN、SSD 和 mobilenet)。
WoodScape
WoodScape 包含四个环视摄像头和九项任务,包括分割、深度估计、3D 边界框检测和新型污染检测。为超过 10,000 张图像提供实例级别的 40 个类的语义注释。
BDD100K
UCB的全天候全光照大型数据集,包含1,100小时的HD录像、GPS/IMU、时间戳信息,100,000张图片的2D bounding box标注,10,000张图片的语义分割和实例分割标注、驾驶决策标注和路况标注。官方推荐使用此数据集的十个自动驾驶任务:图像标注、道路检测、可行驶区域分割、交通参与物检测、语义分割、实例分割、多物体检测追踪、多物体分割追踪、域适应和模仿学习。
Linkopings交通标志数据集
超过 20,000 张图像 ,其中 20% 已标记。包含 3488个 交通标志。从超过 350 公里的瑞典道路上 记录的公路和城市序列。
非洲地区交通标志数据集
该数据集已特别针对非洲地区进行了改进。两个开源数据集仅用于提取非洲地区使用的交通标志。该数据集包含来自所有类别的 76 个类,例如 监管、警告、指南和信息标志。该数据集总共包含 19,346 张图像和每个类别至少 200 个实例。
图像检索相关
CUB-200-2011
CUB-200 是一个包含 200 种鸟类的具有挑战性的数据集。扩展版本将每个类别的图像数量大约增加了一倍,并添加了新的零件本地化注释。所有图像都使用边界框、零件位置和属性标签进行注释。
iNaturalist
iNaturalist 2017 数据集 (iNat) 包含来自 5,089 个自然细粒度类别的 675,170 张训练和验证图像。这些类别属于 13 个超类别,包括 Plantae(植物)、Insecta(昆虫)、Aves(鸟类)、Mammalia(哺乳动物)等。iNat 数据集高度不平衡,每个类别的图像数量差异很大。例如,最大的超类别“Plantae(植物)”有来自 2,101 个类别的 196,613 张图像;而最小的超类别“原生动物”只有来自 4 个类别的 381 张图像。
Stanford Online Products
斯坦福在线产品(SOP) 数据集有 22,634 个类别,包含 120,053 张产品图像。前 11,318 个类别(59,551 张图像)用于训练,其余 11,316 个类别(60,502 张图像)用于测试
Google Landmarks Dataset v2
这是 Google Landmarks 数据集 (GLDv2) 的第二个版本,其中包含带有代表人造和自然地标的标签的图像。该数据集可用于地标识别和检索实验。此版本的数据集包含大约 500 万张图像,分为 3 组图像:训练、索引和测试
Flickr Image dataset
Flickr30k 数据集已成为基于句子的图像描述的标准基准。本文介绍了 Flickr30k 实体,它用 244k 共指链扩充了 Flickr30k 的 158k 标题,将同一图像的不同标题中对相同实体的提及链接起来,并将它们与 276k 手动注释的边界框相关联。
GPR1200 Dataset
这是一个易于使用且易于访问但具有挑战性的基准数据集,包含 1200 个类别和 10 个类别示例。从不同图像区域的六个公开数据集中手动选择类和图像,确保了高类多样性和清晰的类边界。
多目标跟踪相关
DanceTrack
一个大规模的多目标跟踪数据集,用于在遮挡、频繁交叉、统一外观和多样化肢体姿态中进行人体跟踪。建议强调运动分析在多目标跟踪中的重要性,而不是主要基于外观匹配的图表。
Wildtrack
Wildtrack 是一个大规模和高分辨率的数据集。它被七个静态摄像机拍摄到一个公共开放区域,以及无脚本的密集行人站立和行走。与相机框架一起,提供精确的关节(外在和内在)校准,以及 7 个系列的 400 个注释 以每秒 2 帧的速率进行检测的帧。这导致超过40 000个边界框划定了感兴趣区域内的每个人,总数超过 300人。
TAO
TAO 是用于跟踪任何对象的联合数据集,包含 2,907 个在不同环境中捕获的高分辨率视频,平均时长为半分钟。采用自下而上的方法发现了 833 个类别的大量词汇表,比以前的跟踪基准高出一个数量级。
BEE23
收集了 32 个视频,记录了几个阳光明媚的日子里不同时期的蜂群活动。数据集的总大小为 3,562 帧和 43,169 个注释。
PathTrack 数据集
通过众包方法收集了一个名为 PathTrack 数据集的大型数据集,用于多目标跟踪 (MOT)。PathTrack 数据集包含 720 个视频序列中的 15,000 多个人的轨迹。
BDD100K驾驶视频数据集
UCB的全天候全光照大型数据集,包含1,100小时的HD录像、GPS/IMU、时间戳信息,100,000张图片的2D bounding box标注,10,000张图片的语义分割和实例分割标注、驾驶决策标注和路况标注。官方推荐使用此数据集的十个自动驾驶任务:图像标注、道路检测、可行驶区域分割、交通参与物检测、语义分割、实例分割、多物体检测追踪、多物体分割追踪、域适应和模仿学习。
往期精彩回顾
适合初学者入门人工智能的路线及资料下载
机器学习及深度学习笔记等资料打印
《统计学习方法》的代码复现专辑
交流群
请备注:”昵称-学校/公司-研究方向“,例如:”张小明-浙大-CV“加群。
(也可以加入机器学习交流qq群772479961)