数据集格式:Pascal VOC格式+YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)
图片数量(jpg文件个数):4832
标注数量(xml文件个数):4832
标注数量(txt文件个数):4832
标注类别数:7
所在github仓库:firc-dataset
标注类别名称(注意yolo格式类别顺序不和这个对应,而以labels文件夹classes.txt为准):["Broken","Chalky","Clean","Damaged","Discolored","Immature","Organic Foreign Matters"]
每个类别标注的框数:
Broken(破碎) 框数 = 73488
Chalky(粉质/垩白) 框数 = 19038
Clean(洁净) 框数 = 115888
Damaged(受损) 框数 = 25314
Discolored(变色) 框数 = 43198
Immature(未成熟) 框数 = 10304
Organic Foreign Matters(有机异物) 框数 = 18746
总框数:305976
每个类别占有图片数:
Broken(破碎) 占有图片数 = 2148
Chalky(粉质/垩白) 占有图片数 = 606
Clean(洁净) 占有图片数 = 2947
Damaged(受损) 占有图片数 = 1303
Discolored(变色) 占有图片数 = 2024
Immature(未成熟) 占有图片数 = 896
Organic Foreign Matters(有机异物) 占有图片数 = 801
图片分辨率:416x416
使用标注工具:labelImg
标注规则:对类别进行画矩形框
重要说明:数据集没有划分训练验证测试集需自行划分
特别声明:本数据集不对训练的模型或者权重文件精度作任何保证
图片预览:
标注例子: