提供百度云盘地址下载
基于公开的大规模航空图像数据集构建了AI-TOD,这些数据集包括:DOTA-v1.5的训练验证集[1]、xView的训练集[19]、VisDrone2018-Det的训练验证集[20]、Airbus Ship的训练验证集1以及DIOR的训练验证+测试集[3]。这些数据集的详细信息如下:
DOTA-v1.5 训练验证集:这是原始 DOTA-v1.0 数据集 [1] 的升级版本,并已用于航空图像目标检测(DOAI2019)的性能评估。DOTA-v1.5 训练验证集包含 1,869 张图像,尺寸从 800 × 800 到 4000 × 4000 像素不等,以及 280,196 个目标实例,这些实例被标注为 16 个类别(例如,船只、小型车辆、储罐)。
xView训练集:这是一个大规模的目标检测数据集,包含1,415平方公里的WorldView-3图像,分辨率为30厘米。该标注数据集用于目标检测,涵盖了60个类别中的超过100万个目标实例,包括各种类型的车辆、飞机和船只[19]。
VisDrone2018-Det 训练验证集。该数据集包含 7,019 张图像,这些图像由无人机平台在不同地点、不同高度拍摄。图像经过人工标注,包含边界框和 10 个预定义类别(例如行人、人、汽车)。
Airbus-Ship训练验证集。这是一个用于Kaggle挑战赛中的船舶检测数据集。Airbus-Ship训练验证集包含42,559张图像和81,724艘船舶,所有对象均以多边形标注。
DIOR 训练验证+测试集。该数据集包含 23,463 张图像和 192,472 个目标实例,涵盖 20 个类别(例如,飞机、船舶、风车)。
为了构建AI-TOD数据集,我们从上述数据集中提取图像和对象实例,具体步骤如下:
图像尺寸。原始图像被划分为800×800像素的块,重叠部分为200像素。如果原始图像小于800×800像素,则通过填充零像素将其扩展到800×800像素。
对象类型。我们在AI-TOD数据集中选择了八种类别,包括飞机(AI)、桥梁(BR)、储罐(ST)、船舶(SH)、游泳池(SP)、车辆(VE)、人(PE)和风车(WM)。这些类别的选择基于某类对象在低分辨率航空图像中是否常见及其尺寸。airplane (AI), bridge (BR), storage-tank (ST), ship (SH), swimming-pool (SP), vehicle (VE)
类别转换。在选定类别后,我们将相应数据集中的旧类别转换为新类别。在此过程中,一些类别不在AI-TOD中的对象将被剔除。
图片预览:

编辑

编辑

编辑
标注例子:

编辑
数据集官方大小22GB大小且默认不是YOLO格式,这里将官方图片无损压缩成jpg格式并转成YOLO格式,压缩包体积变成1.08GB大小,大大节约下载时间且不影响训练效果。