其实这个案例主要目的是为了展示这些异常值的无监督算法怎么使用的,本文是一个无监督算法的总结大全。只是恰巧有同学需要做这个内幕交易的数据,因此才使用这个数据作为展示异常时监测算法的使用罢了。
内部交易不可能是凭借几个数据就能检测出来的,因此本文的这个实际背景经济含义可以看看就行了,没啥真正的作用,主要还是展示怎么使用这些异常值检测算法。
由于异常检测是无监督的,其实其检测方式还是和模型算法自身的特性有很强的关系。这个肯定得需要根据特定的数据找特定的异常的时候去设计特定的算法罢了,本文只是对通用的,简便的,能快速使用的,一些异常值检测的方法的一个总结演示。
主要就是 使用无监督聚类的一些异常检测算法,进行内幕交易监测,计算一些评价指标——准确率,精准率,召回率,F1值,特异度,灵敏度,ROC,AUC。
这个案例我还用有监督学习的方法进行了尝试,效果会比无监督的模型好很多。没有在博客里面放出来,但是放在这个附件里面,也是可以一样直接运行的。
(本人专注Python数据分析,更多种类数据和代码详见主页)