获取完整数据和代码,请直接加
kang20224
不要在面包多直接拍
基于物理信息机器学习的多模态特征融合滚动轴承故障诊断(Pytorch)
滚动轴承作为旋转机械的关键部件,健康状态直接影响设备运行安全。传统故障诊断方法依赖人工特征提取与浅层分类器,难以有效捕捉振动信号中蕴含的多尺度、多模态故障信息。近年来,物理信息机器学习(Physics-Informed Machine Learning, PiML)将系统动力学机理与数据驱动方法相结合,通过嵌入故障频率、能量衰减等先验知识,显著提升了特征的可解释性与诊断精度。
提出一种基于时域统计、动态模态分解及物理启发特征的轴承故障诊断框架,首先对原始振动信号进行重叠滑动窗口切分,并基于训练集进行标准化;随后提取时域统计量(均方根、峭度、偏度等)、利用总最小二乘动态模态分解获得前4阶复特征值作为动态特征,并计算故障特征频率(BPFI、BPFO、BSF)附近的包络谱能量及包络指数衰减常数作为物理启发特征,共同构建17维特征向量;最后采用随机森林作为分类器,并基于GroupKFold交叉验证与标签噪声注入评估模型泛化能力。在凯斯西储大学轴承数据集上的实验结果表明,该方法在测试集上达到100%的准确率,5折交叉验证平均准确率为98.80%,充分验证了物理信息特征与多模态融合的有效性。
算法步骤
数据预处理 对原始振动信号进行重叠滑动窗口切分,窗口长度2048点,步长512点(75%重叠),以扩充样本数量;基于训练集统计量(均值和标准差)对训练集、验证集及测试集分别进行Z-score标准化,避免数据泄露。
时域统计特征提取 对每个样本计算均方根值、峭度、偏度、峰峰值及波形因子,作为基础的统计特征,反映信号的能量、非高斯性及冲击强度。
动态模态分解特征提取 构造Hankel矩阵(嵌入维度50)并进行总最小二乘动态模态分解,截断阶数取8;提取前四阶模态对应的复特征值(实部与虚部共8维),表征系统的内在动态演化特性。
物理启发特征提取 计算Hilbert包络谱,在滚动体、内圈、外圈故障特征频率(基于转频1797 Hz计算)±5 Hz频带内积分得到能量特征;对包络信号进行峰值检测,利用指数衰减模型拟合冲击衰减过程,获得衰减常数作为物理约束特征,共4维。
特征融合与分类器训练 将上述17维特征拼接后,采用随机森林(200棵树,最大深度9,最小叶子样本4等)作为分类器,在训练集上训练,并在验证集上调优超参数。
模型评估与鲁棒性验证 在测试集上计算准确率、精确率、召回率及F1分数;采用GroupKFold(5折)交叉验证评估泛化能力;人为注入1.5%的标签噪声以模拟真实工业环境中的标注误差。
特征可视化与解释性分析 利用t-SNE与PCA对特征进行降维可视化,绘制特征重要性、混淆矩阵、ROC曲线及学习曲线,从多角度验证物理信息特征的可分性与模型稳定性。