Python电能质量扰动信号分类(六)基于扰动信号特征提取的超强机器学习识别模型

作品简介

此代码已经继续加入电能质量扰动信号—高创新分类模型全家桶 (mbd.pub)：

https://mbd.pub/o/bread/mbd-ZpWXmpty

全家桶包括以下内容：

1.FFT+CNN-BiGRU-Attention 电能质量扰信号分类：一维信号分类 (mbd.pub)

2.基于FFT + CNN -Transformer时域、频域特征融合的电能质量扰动识别模型 (mbd.pub)

3.交叉注意力融合时域、频域特征的FFT + CNN -BiLSTM-CrossAttention电能质量扰动识别模型 (mbd.pub)

4.交叉注意力融合时域、频域特征的FFT + CNN -Transformer-CrossAttention电能质量扰动识别 (mbd.pub)

5.Python电能质量扰动信号分类(六)基于扰动信号特征提取的超强机器学习识别模型 (mbd.pub)

包括完整的电能质量扰信号数据集，以及已经生成制作好的十分类扰动信号数据集、分类数据和标签集，对应代码均可以运行

包括数据预处理的代码，和数据特征提取、制作分类的，XGBoost分类代码

环境：python 3.9

任何环境安装或者代码问题，请联系作者沟通交流，对于购买者，作者免费解决后续问题，关注微信公众号[建模先锋]，联系作者；

导读.png

创新度高！！！需要发论文的同学即买即用

前言

本文基于Python仿真的电能质量扰动信号，先经过数据预处理进行数据集的制作和加载，然后通过特征提取和机器学习方法进行扰动信号识别，特征提取是通过从原始PQD信号中提取有意义的特征来减少数据维度，并捕捉到信号的关键信息，机器学习方法能够基于这些特征建立模型，并通过训练和学习来识别不同的扰动信号。

Python仿真电能质量扰动信号的详细介绍可以参考下文（文末附10分类数据集）：

Python-电能质量扰动信号数据介绍与分类

部分扰动信号类型波形图如下所示：

复合扰动信号.png

1 数据集和特征提取

1.1 数据集导入

在参考IEEE Std1159-2019电能质量检测标准与相关文献的基础上构建了扰动信号的模型，生成包括正常信号在内的10中单一信号和多种复合扰动信号。参考之前的文章，进行扰动信号10分类的预处理：

第一步，按照公式模型生成单一信号

10分类公式.png

单一扰动信号可视化：

二维信号.png

根据信号时间步长为 1024 制作数据集

数据集制作.png

形成5000个样本，单个样本长度 1024，加上一个标签类别。

1.2 扰动信号特征提取

(1) 峭度（Kurtosis） ：衡量信号的尖锐程度，用于检测信号中的高频成分

(2) 熵值（Entropy） ：衡量信号的复杂程度和随机性，用于检测信号的频谱特性

(3) 分形值（Fractal Dimension） ：衡量信号的自相似性和复杂度，用于分析信号的分形特征

(4) 波形指标（Waveform Indicators） ：包括峰值因子、脉冲因子、裕度因子等，用于分析信号的时域特征

(5) 频谱指标（Spectral Indicators） ：包括峰值频率、能量比值、谱线形指标等，用于分析信号的频域特征

(6) 频域指标（Time-Frequency Indicators） ：包括瞬时频率、瞬时能量等，用于分析信号的时频特征

(7) 统计特征（Statistical Features） ：包括均值、方差、偏度等，用于描述信号的统计特性

(8) 小波包特征（Wavelet Packet Features） ：通过小波变换提取的特征，用于分析信号的时频局部特性

(9) 振动特征（Vibration Features） ：包括峰值振动、有效值振动等，用于描述信号的振动特性

特征提取1.png

特征提取2.png

选择了多种特征提取方法来捕捉信号的不同特征，共提取9类13个特征指标，来作为机器学习模型的训练与识别。

2超强模型XGBoost——原理介绍

2.1 原理介绍

论文链接：

XGBoost | Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining

GBoost模型（eXtreme Gradient Boosting）是一种梯度提升框架，由Tianqi Chen在2014年开发，并在机器学习领域广泛应用。 XGBoost的核心思想是通过迭代地训练多个弱学习器，并将它们组合起来，实现强大的预测能力。它在梯度提升算法的基础上进行了改进和优化，具有高效、灵活和可扩展的特点。

下面是XGBoost的一些关键特性和原理：

1. 梯度提升：XGBoost使用了梯度提升算法，也称为增强学习（Boosting）算法。它通过迭代地训练多个弱学习器，并通过梯度下降的方式来优化模型的预测能力。每个弱学习器都是在前一个弱学习器的残差上进行训练，从而逐步减小预测误差。

2. 基于树的模型：XGBoost采用了基于树的模型，即决策树。决策树是一种非常灵活和可解释的模型，能够学习到复杂的非线性关系。XGBoost使用了CART（Classification and Regression Trees）作为默认的基学习器，每个决策树都是通过不断划分特征空间来实现分类或回归任务。

3. 正则化策略：为了防止过拟合，XGBoost引入了正则化策略。它通过控制决策树的复杂度来限制模型的学习能力。常用的正则化策略包括限制决策树的最大深度、叶子节点的最小样本数和叶子节点的权重衰减等。

4. 特征选择和分裂：XGBoost在构建决策树时，通过特征选择和分裂来最大化模型的增益。特征选择基于某种评估准则（如信息增益或基尼系数），选择对当前节点的划分最有利的特征。特征分裂则是确定特征划分点的过程，使得划分后的子节点能够最大程度地减小预测误差。

5. 并行计算：为了提高模型的训练速度，XGBoost使用了并行计算的策略。它通过多线程和分布式计算等技术，将训练任务分解为多个子任务，并在不同的处理器上同时进行计算。这样可以加快模型的训练速度，特别是在处理大规模数据集时表现优异。

6. 自定义损失函数：XGBoost允许用户自定义损失函数，以适应不同的任务和需求。用户可以根据具体问题的特点，定义适合的损失函数，并在模型训练过程中使用它。

XGBoost模型通过梯度提升算法和基于树的模型，在许多机器学习任务中都取得了很好的效果，包括分类、回归、排序和推荐等。我们利用其高效、灵活和可扩展的特性，使用XGBoost来构建一个梯度提升模型，通过迭代地训练多个决策树来实现轴承故障识别。

2.2 特征数据集制作

特征数据集.png

3 模型评估和对比

3.1 随机森林分类模型

模型分数、准确率、精确率、召回率、F1 Score

随机森林评估.png

扰动信号十分类混淆矩阵

混淆矩阵1.png

3.2 支持向量机SVM分类模型

模型分数、准确率、精确率、召回率、F1 Score

SVM评估.png

扰动信号十分类混淆矩阵：

混淆矩阵2.png

3.3 XGBoost分类模型

模型分数、准确率、精确率、召回率、F1 Score

XGBoost评估.png

扰动信号十分类混淆矩阵：

混淆矩阵3.png

实验结果表明，所提取的各种特征都对电能质量扰动信号识别有一定的贡献。峭度、熵值和分形值能够帮助捕捉信号的尖锐程度、复杂程度和自相似性，从而有效地区分不同类型的扰动信号。波形指标、频谱指标和频域指标能够提供信号的时域和频域特征，有助于识别扰动信号的时频特性。统计特征、小波包特征和振动特征则能够描述信号的统计特性和振动特性，从而更好地区分扰动信号。

对比可以看出来， XGBoost分类模型性能最好，在训练集、测试集上的表现最优，模型分数也是最高，在扰动信号识别中取得了良好的效果。通过准确地捕捉到信号的特征和模式，能够对不同类型和程度的信号类型进行准确的识别和分类，准确率达到98%，速度快，性能好，创新度高。

面包多.png

创作时间：

此代码已经继续加入 电能质量扰动信号—高创新分类模型全家桶 (mbd.pub)：

此代码已经继续加入电能质量扰动信号—高创新分类模型全家桶 (mbd.pub)：