独家原创 | CEEMDAN-CNN-GRU-GlobalAttention + XGBoost组合预测

作品简介

包括电力变压器数据集，风速数据集，以及已经生成制作好的经过CEEMDAN分解的数据集、标签集，对应代码均可以运行，还有CEEMDAN解示例

CNN-Transfromer + XGBoost模型, 有着更小的MSE, MAE，效果特别明显

包括数据CEEMDAN预处理的代码，和完整CNN-Transfromer模型预测代码、XGBoost预测模型代码、可视化代码

环境：python 3.9 pytorch1.8 及其以上

任何环境安装或者代码问题，请联系作者沟通交流，对于购买者，作者免费解决后续问题，关注微信公众号[建模先锋]，联系作者；

组合预测模型思路：使用复杂模型去预测数据的分量特征，因为复杂模型参数量大，适合预测高频复杂分量特征，但是低频分量特征比较简单，要是还用复杂模型的话，就容易过拟合，反而效果不好，所以对于低频分量特征我们采用简单模型（或者机器学习模型）去预测，然后进行预测分量的重构以实现高精度预测。

创新1：通过CNN卷积池化层降低序列长度，增加数据维度，然后再送入GRU-GlobalAttention进行全局时域特征学习，提高了模型捕捉序列中的全局上下文信息的感知能力；

创新2：基于GlobalAttention优化的GRU网络,GlobalAttention是一种用于加强模型对输入序列不同部分的关注程度的机制。在 GRU 模型中，全局注意力机制可以帮助模型更好地聚焦于输入序列中最相关的部分，从而提高模型的性能和泛化能力。在每个时间步，全局注意力机制计算一个权重向量，表示模型对输入序列各个部分的关注程度，然后将这些权重应用于 GRU 输出的特征表示，通过对所有位置的特征进行加权，使模型能够更有针对性地关注重要的时域特征；

全局.png

创新3：把 CEEMDAN 算法对时间序列分解后的分量通过样本熵的计算进行划分，再分别通过CNN-GRU-GlobalAttention 模型和 XGBoost 模型进行组合预测，来实现精准预测。

注意：此次产品，我们还有配套的模型讲解和参数调节讲解！

文件解说.png

导读.png

前言

本文基于前期介绍的电力变压器（ 文末附数据集 ），介绍一种综合应用完备集合经验模态分解CEEMDAN与组合预测模型（CNN-GRU-GlobalAttention + XGBoost）的方法，以提高时间序列数据的预测性能。该方法的核心是使用CEEMDAN算法对时间序列进行分解，接着利用CNN-GRU-GlobalAttention模型和XGBoost模型对分解后的数据进行建模，最终通过集成方法结合两者的预测结果。

电力变压器数据集的详细介绍可以参考下文：

电力变压器数据集介绍和预处理

1 电力变压器数据CEEMDAN分解与可视化

1.1 导入数据

油温数据.png

1.2 CEEMDAN分解

分解可视化.png

根据分解结果看，CEEMDAN一共分解出11个分量，然后通过计算每个分量的样本熵值进行分析。样本熵是一种用于衡量序列复杂度的方法，可以通过计算序列中的不确定性来评估其复杂性。样本熵越高，表示序列的复杂度越大。

样本熵.png

我们大致把前6个高样本熵值复杂分量作为CNN-GRU-GlobalAttention模型的输入进行预测，后5个低样本熵值简单分量作为XGBoost模型的输入进行预测.

2 数据集制作与预处理

2.1 划分数据集

按照9：1划分训练集和测试集，然后再按照前6后5划分分量数据。

在处理LSTF问题时，选择合适的窗口大小（window size）是非常关键的。选择合适的窗口大小可以帮助模型更好地捕捉时间序列中的模式和特征，为了提取序列中更长的依赖建模，本文把窗口大小提升到24，运用CCEMDAN-CNN-GRU-GlobalAttention模型来充分提取前6个分量序列中的特征信息。

数据集制作.png

分批保存数据，用于不同模型的预测

3 基于CEEMADN的组合预测模型

3.1 定义CNN-GRU-GlobalAttention网络模型

模型定义.png

3.2 设置参数，训练模型

模型训练.png

50个epoch，MSE 为0.001372，CNN-GRU-GlobalAttention预测效果显著，模型能够充分提取时间序列的时序特征和空间特征，收敛速度快，性能优越，预测精度高，适当调整模型参数，还可以进一步提高模型预测表现。

注意调整参数：