注意数据集是由3个人模拟拍摄,通过不同手势录制视频然后对视频进行抽帧形成的图片
数据集格式:Pascal VOC格式+YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)
图片数量(jpg文件个数):3364
标注数量(xml文件个数):3364
标注数量(txt文件个数):3364
标注类别数:11
所在github仓库:firc-dataset
标注类别名称(注意yolo格式类别顺序不和这个对应,而以labels文件夹classes.txt为准):["dog_everything","extend_boom","hoist","lower","lower_boom","move_slowly","raise_boom","retract_boom","stop","swing_left","swing_right"]
每个类别标注的框数:
dog_everything(全能动作) 框数 = 286
extend_boom(伸展臂架) 框数 = 287
hoist(起升) 框数 = 298
lower(下降) 框数 = 320
lower_boom(下降臂架) 框数 = 300
move_slowly(慢速移动) 框数 = 300
raise_boom(举升臂架) 框数 = 349
retract_boom(收回臂架) 框数 = 296
stop(停止) 框数 = 320
swing_left(左回转) 框数 = 299
swing_right(右回转) 框数 = 310
总框数:3365
每个类别占有图片数:
dog_everything(全能动作) 占有图片数 = 286
extend_boom(伸展臂架) 占有图片数 = 286
hoist(起升) 占有图片数 = 298
lower(下降) 占有图片数 = 320
lower_boom(下降臂架) 占有图片数 = 300
move_slowly(慢速移动) 占有图片数 = 300
raise_boom(举升臂架) 占有图片数 = 349
retract_boom(收回臂架) 占有图片数 = 296
stop(停止) 占有图片数 = 320
swing_left(左回转) 占有图片数 = 299
swing_right(右回转) 占有图片数 = 310
图片分辨率:1280x720
使用标注工具:labelImg
标注规则:对类别进行画矩形框
重要说明:数据集没有划分训练验证测试集需自行划分
特别声明:本数据集不对训练的模型或者权重文件精度作任何保证
图片预览:
标注例子: