基于幅值分布统计和非线性熵特征的机械故障诊断方法(Python)

作品简介

算法针对CWRU轴承振动数据,提出了一套融合传统统计特征、现代非线性动力学指标和频域解调技术的综合诊断方法。首先通过去直流预处理和时域波形可视化获取信号基础形态;进而利用核密度估计和高阶统计量(偏度、峭度)刻画幅值概率分布特性,其中峭度能有效识别冲击性故障,尤其是滚动体故障呈现极高的峭度值。为深入挖掘故障调制信息,引入包络谱分析,通过希尔伯特解调突出故障特征频率,为故障类型识别提供频域证据。同时,采用排列熵及其多尺度扩展量化信号的复杂度,结果表明外圈故障因周期性冲击主导而熵值最低,内圈故障因调制与噪声混合而熵值较高,正常状态熵值居中但受采样率影响需谨慎解释。多尺度排列熵曲线进一步揭示了不同尺度下的复杂度演化规律,增强了故障模式的可分性。最后,将多种状态的分析结果进行对比可视化,并输出关键数值指标,实现了从时域、频域到熵域的多维度诊断,为轴承故障的定性识别与定量分析提供了全面、鲁棒的技术手段。

算法步骤

数据采集与预处理

从CWRU轴承数据集中读取不同故障类型(内圈、滚动体、外圈)及正常状态的MAT格式振动加速度信号,将多维数组展平为一维时间序列,并减去均值以去除直流分量,消除趋势项对后续分析的影响。

时域波形可视化

绘制原始振动信号的时域波形图,直观展示信号的幅值波动特征,初步观察是否存在周期性冲击成分,为后续分析提供定性参考。

幅值概率密度分析

确定信号幅值的绝对值最大值,将幅值区间[−max,max][−max,max]等分为指定数量(如100个)的小区间,统计每个区间内的数据点个数,绘制归一化直方图,得到离散幅值概率密度分布。

采用高斯核密度估计方法,生成连续的概率密度曲线,克服直方图对区间划分的敏感性,更精确地反映幅值分布细节。

基于信号均值和标准差,构造理论正态分布曲线并与核密度曲线叠加,通过对比判断分布偏离高斯分布的程度。

计算并输出信号的均值、标准差、偏度(Skewness)和峭度(Kurtosis)等统计特征,其中偏度描述分布对称性,峭度反映冲击成分的强度(正常状态峭度接近0,故障状态峭度大于0)。

包络谱分析

对预处理后的信号进行希尔伯特变换,提取解析信号的幅值包络,再对包络序列进行快速傅里叶变换,得到包络谱。包络谱能够有效解调故障冲击产生的调制边带,在故障特征频率处呈现峰值,便于识别不同故障类型。

排列熵计算

将信号嵌入到mm维相空间(嵌入维度m=4m=4,时间延迟τ=1τ=1),提取所有嵌入向量的排列模式,统计各模式出现概率,计算香农熵并归一化到[0,1][0,1]区间,得到排列熵值。排列熵衡量时间序列的复杂性,正常轴承振动随机性较强,熵值较高;故障状态因周期性冲击导致规律性增强,熵值降低。

多尺度排列熵分析

在多个时间尺度上重复排列熵计算:首先对原始信号进行粗粒化(如尺度因子从1到20),将粗粒化后的序列作为新序列计算排列熵,得到熵值随尺度变化的曲线。多尺度排列熵能够揭示信号在不同时间尺度下的复杂度演化,故障信号往往在特定尺度上呈现熵值下降,形成特征指纹。

多状态对比与结果输出

将正常状态与三种故障状态的核密度估计曲线绘制在同一张图中,通过对比曲线形态、峰值位置和尾部延伸,直观展示不同状态的幅值分布差异。

保存所有生成的图形(时域图、概率密度图、包络谱图、多尺度排列熵曲线、多状态对比图)为PNG文件,并在控制台输出各状态的统计特征值和排列熵值,为故障诊断提供定量依据。

创作时间: