融合黎曼流形几何特征和时频域统计特征的机械故障诊断（Python）

作品简介

知乎学术咨询

https://www.zhihu.com/consult/people/792359672131756032

担任《Mechanical System and Signal Processing》《中国电机工程学报》《宇航学报》《控制与决策》等期刊审稿专家，擅长领域：信号滤波/降噪，机器学习/深度学习，时间序列预分析/预测，设备故障诊断/缺陷检测/异常检测

首先对原始轴承振动信号进行预处理，包括去直流分量和标准化，然后通过固定长度的窗口分割构建样本集。

核心流程分为两个并行分支：传统特征提取分支和黎曼流形特征提取分支。在传统分支中，系统从每个振动信号样本中提取丰富的时域统计特征（如均值、标准差、RMS、峰值、偏度、峰度等）、频域特征（如频谱质心、总功率、频谱方差等）以及小波变换特征，这些多域特征共同构成对轴承状态的全面描述，然后通过主成分分析进行降维压缩，保留最具信息量的特征。

在黎曼流形分支中，系统采用相空间重构技术将一维时间序列转换为对称正定矩阵，这些矩阵在数学上构成黎曼流形上的点，通过黎曼图嵌入方法对这些流形点进行降维，同时保持流形上的局部几何结构，然后计算所有矩阵的黎曼均值作为流形的中心，将每个矩阵通过对数映射投影到黎曼均值的切空间中，从而将非线性流形上的计算转换为欧氏空间中的线性运算。

最后，系统将两个分支提取的特征进行融合，形成一个综合的特征向量，输入到随机森林分类器中进行训练和预测。整个系统不仅能够精确识别轴承的正常状态和三种典型故障（滚珠故障、内圈故障、外圈故障），而且具有坚实的数学理论基础和良好的工程实用性，为工业设备的智能运维提供了强有力的技术支撑。

详细算法步骤

第一步：数据准备与预处理

系统首先从指定的数据文件夹中加载四类轴承振动信号数据，包括正常状态数据、滚珠故障数据、内圈故障数据和外圈故障数据。对每段原始信号进行预处理，去除直流分量并进行标准化处理，确保不同样本间具有可比性。然后将长信号按照固定长度和重叠率分割成多个样本段，并为每个样本分配相应的类别标签，构建完整的训练数据集。

第二步：数据集划分

采用分层随机抽样的方法将总数据集划分为训练集和测试集，确保每个类别在训练集和测试集中的比例保持一致，避免因数据分布不均导致的模型偏差，同时保证后续模型评估的公平性和可靠性。

第三步：基准模型构建

作为性能对比基准，系统首先构建一个基于传统特征提取的基准模型。从每个振动信号样本中提取多域特征，包括时域统计特征、频域特征和小波变换特征，这些特征共同描述了信号的幅值特性、频率分布特性以及时频局部特性。使用主成分分析对高维特征进行降维处理，保留主要的信息成分，然后训练一个随机森林分类器作为基准诊断模型。

第四步：黎曼流形特征提取

这是系统的核心创新部分。首先通过相空间重构技术将一维时间序列转换为对称正定矩阵，这些矩阵在数学上构成了黎曼流形上的点。使用黎曼图嵌入方法对这些流形点进行降维处理，在保持流形局部几何结构的同时降低数据维度。然后计算所有流形点的黎曼均值作为参考中心点，通过黎曼几何中的对数映射将每个流形点投影到黎曼均值的切空间中，从而将复杂的非线性流形计算转换为欧氏空间中的线性运算，得到表征原始信号几何结构的切向量特征。

第五步：多特征融合

将传统方法提取的统计特征与黎曼流形方法提取的几何特征进行融合，形成一个综合的特征表示。这种融合策略充分利用了传统方法在信号统计特性描述方面的优势，以及黎曼流形方法在数据几何结构刻画方面的优势，实现了特征信息的互补和增强。

第六步：分类器训练

使用融合后的综合特征训练一个随机森林分类器。随机森林作为一种集成学习算法，通过构建多个决策树并综合它们的预测结果，能够有效避免过拟合问题，提高模型的泛化能力和鲁棒性，特别适合于工业故障诊断这种对可靠性要求较高的应用场景。

第七步：模型评估与对比

在独立的测试集上评估训练好的模型性能，计算准确率、精确率、召回率、F1分数等多个评价指标。同时与基准模型进行对比分析，验证黎曼流形方法的有效性和优越性。通过混淆矩阵可视化模型的分类效果，分析各类别的识别准确率。

创作时间：