解析共30页,每问代码都有,代码语言为python。
一、题目简析
是一道大数据题,重点考察多分类问题,题目不多,都是围绕着对数据的分类展开。难点在于分的类别很多,数据量很大很大。而且是txt类型的,并不是封装好的csv或者excel文件,很考验数据处理和算法设计能力。
二、逐问分析
1.请设计一套特征和一个有效的算法,以便从这些磨损传感器的数据中分类19种类型的人体行为。
首先我们需要做的就是读取数据,我们看到官方给出的数据集中,原数据按照给定的19种类型分成了19个文件,每个文件对应一种动作类型。
Appendix: File structure
• 19 activities (a)
• 8 subjects (p)
• 60 segments (s)
• 5 units on torso (T), right arm (RA), left arm (LA), right leg (RL), left leg (LL)
• 9 sensors on each unit (x, y, z accelerometers, x, y, z gyroscopes, x, y, z magnetometers)