独家原创 | 基于 Informer + TCN-SENet的并行预测模型

作品简介

导读.png

本期基于某风电功率数据集，提出一种Informer+TCN-SENet并行预测模型，在单步预测任务中预测效果提升明显！

● 数据集：某风电场风电功率数据集、电力数据集、风速数据集等

● 环境框架：python 3.9 pytorch 1.8 及其以上版本均可运行

● 单步预测模型分数：测试集 0.98

● 使用对象：论文需求、毕业设计需求者

● 代码保证：代码注释详细、即拿即可跑通。

我们同时提供基于多个数据集，在多个预测任务中，进行实验和对比，并提供详细的资料和解说文档，包括如何替换自己的数据集、参数调整教程，预测任务的替换等，代码逐行注释，参数介绍详细：

面包多.png

效果对比：

TCN 预测模型:

模型评估：

TCN模型评估.png

预测可视化：

TCN预测值.png

Informer + TCN-SENet 并行预测模型：

模型评估：

Informer + TCN-SENet.png

预测可视化：

预测拟合.png

1 模型创新点介绍

1.1 结合Informer和TCN-SENet的优势

Informer：擅长处理长时间序列，能够并行计算，提高了计算效率和预测性能。Informer在Transformer的基础上进行了改进，使其更适合时序数据，特别是具有长时间依赖的序列数据。
TCN-SENet：利用时间卷积网络（TCN）的一系列时间卷积层，这些卷积层可以有效地捕获不同时间尺度上的序列模式，在TCN的输出上应用SENet模块，用于学习和增强重要特征的表示，提高模型对关键信息的感知能力。

通过将这两种模型并行使用，可以更好地捕捉不同时间尺度上的模式，提高预测的准确性和鲁棒性。

封面.png

1.2 并行模型架构

并行使用Informer和TCN-SENet，通过两个分支并行学习，可以使模型在不同的时间尺度上进行信息提取和处理：

（1）Informer部分：

主要用于捕捉全局时序模式，适合处理长时间序列数据。
通过稀疏自注意力机制提高对远程时序依赖的捕捉能力。
对输入数据进行全局特征提取。

informer架构.png

（2） TCN-SENet：

主要用于捕捉局部空间模式，处理短期依赖性和序列数据的动态变化。
使用 TCN 提供的卷积结构捕捉序列的短期动态。
SENet 模块增强特征通道的表示能力，通过自适应调整不同通道的重要性。

这种架构能够更全面地捕捉时序数据的特征，提升模型的预测性能。

1.3 模型融合

将Informer和TCN-SENet的输出拼接在一起，通过一个全连接层融合不同模型的特征。这种融合方式使得模型能够同时利用Informer的全局信息提取能力和TCN-SENet的局部空间关系建模能力。

1.4 高效计算

Informer的使用大大提高了长时间序列的计算效率，同时TCN利用卷积操作的因果性和可并行性，通常比RNN更快，尤其在长序列的情况下。这种组合在保证高效计算的同时，提升了预测的精度和可靠性。

2 Informer 详解，三大创新点

2.1 概率稀疏注意力机制（ ProbSparse Self-attention）

概率稀疏自注意力是Informer模型中引入的一种稀疏自注意力机制。其核心思想是通过概率方法选择最重要的一部分注意力权重进行计算，而忽略那些对结果影响较小的权重。这种方法能够显著降低计算复杂度，同时保持较高的模型性能。

稀疏自注意力：不同于标准 Transformer 的密集自注意力机制，Informer 引入了 ProbSparse Self-attention，通过概率抽样机制选择重要的 Q-K 对进行计算，减少了计算复杂度。
效率提升：稀疏注意力机制显著降低了计算复杂度，从 O(L2⋅d) 降低到 O(L⋅log(L)⋅d)，其中 L 是序列长度，d 是每个时间步的特征维度。

2.2 多尺度特征提取- 信息蒸馏

Informer的架构图并没有像Transformer一样在Encoder的左边标注来表示N个Encoder的堆叠，而是一大一小两个梯形。横向看完单个Encoder（也就是架构图中左边的大梯形，是整个输入序列的主堆栈）。

梯形结构.png

Encoder的作用是Self-attention Distilling，由于ProbSparse自相关机制有很多都是用V的mean填充的，所以天然就存在冗余的attention sorce ,因此在相邻的Attention Block之间应用卷积与池化来对特征进行下采样，所以作者在设计Encoder时，采用蒸馏的操作不断抽取重点特征，从而得到值得重点关注的特征图。

蒸馏层.png