数据集格式:Pascal VOC格式+YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)
图片数量(jpg文件个数):2871
标注数量(xml文件个数):2871
标注数量(txt文件个数):2871
标注类别数:6
标注类别名称(注意yolo格式类别顺序不和这个对应,而以labels文件夹classes.txt为准):["1","2","3","4","5","6"]
每个类别标注的框数:
1 框数 = 279
2 框数 = 1146
3 框数 = 1185
4 框数 = 538
5 框数 = 4705
6 框数 = 187
总框数:8040
使用标注工具:labelImg
标注规则:对类别进行画矩形框
重要说明:暂无
特别声明:本数据集不对训练的模型或者权重文件精度作任何保证,数据集只提供准确且合理标注
图片预览:

标注例子:
数据举例
常见瑕疵实拍图示例如下:
针对某些缺陷在特定视角下的才能拍摄到,每块砖拍摄了三张图,包括低角度光照黑白图、高角度光照黑白图、彩色图,示例如下:
数据内容
- train_imgs:训练图片数据,jpg格式
- train_annos.json:训练标注数据,json格式
- Readme.md:说明文件
标注说明
训练标注是train_annos.json
,内容如下:
[
{
"name": "226_46_t20201125133518273_CAM1.jpg",
"image_height": 6000,
"image_width": 8192,
"category": 4,
"bbox": [
1587,
4900,
1594,
4909
]
},
'''
'''
]
具体说明如下:
name
是图片名,"226_46"代表砖的唯一id,"CAM1"代表相机1拍照所得,一般来说每块砖会有三张样本,分别是CAM1,CAM2,CAM3。image_height
和image_width
是图片高宽category"
是类别id,bbox
是目标框信息xyrb格式,分别指[左上角x坐标,左上角y坐标,右下角x坐标,右下角y坐标]
类别说明
id和瑕疵名的对应关系如下:
{
"0": "背景",
"1": "边异常",
"2": "角异常",
"3": "白色点瑕疵",
"4": "浅色块瑕疵",
"5": "深色点块瑕疵",
"6": "光圈瑕疵"
}