【调制识别】融合双流嵌入的Transformer模型,实现短信号样本调制分类新突破【附python代码】

作品简介

【EW Frontier】——雷达通信AI科研人的一站式技术平台!

✅ 超1000+实战代码:DOA/调制识别/ISAC/抗干扰/无人机等雷达、通信、电子战全方向(MATLAB+Python)✅ 专属科研辅导:论文专利选题/仿真/写作、项目定制全程答疑✅ 优质社群资源:985/211硕博同行交流,最新技术干货实时同步🔥 资源获取通道👉知识星球(全部资源无限看):https://wx.zsxq.com/group/15554455154582👉面包多(单个代码精准购):https://mbd.pub/o/EWFrontier/work📞 辅导/答疑:🧑‍🎓客服微信: EWFrontier👥 学术交流QQ群:1074124098

融合双流嵌入的Transformer模型,实现短信号样本调制分类新突破

文章题目

融合双流嵌入的Transformer模型用于短信号样本的调制分类

摘要

自动调制分类(AMC)是现代通信系统中的关键任务,在多样信号条件和有限数据场景下尤为重要。现有基于Transformer的AMC模型多采用单流架构和统一输入格式,限制了其捕捉丰富信号特征的能力。为解决该问题,本文提出一种新型基于Transformer的双流网络DTNet,以实现高效、准确的调制分类。DTNet包含两项核心创新:一是尺度特征扩展(SFE)模块,通过缩放函数将信号转换为结构化输出映射,再经扩展模块将信号重构为方阵,并结合自适应滤波器整合响应映射;二是卷积流,从多尺度信号表示中提取判别特征。此外,本文还设计了改进的特征嵌入方式以适配Transformer架构,捕捉输入信号的全局依赖和上下文信息,提升调制分类精度。实验结果表明,DTNet在基准数据集上表现优异,在RML2016.10A和RML2016.10B数据集上的分类准确率分别达93.4%和94.4%,优于当前最先进的深度学习方法,同时保持更低的计算复杂度。相关源代码已开源。

引言

在无线通信系统中,动态信道采用自适应调制技术优化传输速率,发射机与接收机需交换调制方式相关数据,这会产生协议开销,而接收机若能自主识别调制类型,该开销可被省去,自动调制分类(AMC)便在此背景下成为连接信号检测与解调的中间环节,能识别目标信号的调制格式,即便信号受噪声或干扰影响。

传统AMC研究主要分为基于似然理论(LB-AMC)和基于特征(FB-AMC)两类方法:LB-AMC借助贝叶斯估计和概率模型,分类精度高但计算复杂度大;FB-AMC从接收信号中提取特征进行分类,计算效率高,更适用于实时或资源受限场景。近年来,深度学习技术为AMC带来范式转变,研究者提出多种深度神经网络实现信号特征的自动提取,也诞生了RML2016.10A、RML2016.10B、RML2018.01A等主流基准数据集。

目前,CNN、LSTM、GNN等网络及融合架构已被广泛应用于AMC,研究人员还通过改进网络架构、引入注意力机制、优化训练方法等提升模型性能。Transformer架构因能捕捉信号全局依赖和上下文信息成为研究热点,但现有基于Transformer的AMC模型在短信号样本数据集(如仅含128个复信号样本的RML2016.10A和RML2016.10B)上性能显著下降。

短信号样本的调制分类在实时处理、带宽效率和低延迟通信系统中具有重要实际意义,能加快动态通信环境的决策速度、优化资源受限信道的带宽利用,但该领域的研究仍存在不足:现有针对短信号的模型要么精度偏低(如短时ResNet最高准确率仅61.9%),要么为提升精度引入了过高的计算复杂度。为此,本文提出DTNet模型,专门针对短信号样本设计特征提取架构,在保证低计算复杂度的同时实现高分类精度。

方法简介

本文提出的DTNet模型以CNN为基础,结合Transformer架构设计,整体包含尺度特征提取(SFE模块)、双流嵌入、位置嵌入、Transformer编码器和全连接分类层五大核心部分,专为短信号样本的调制分类优化,核心设计思路为特征富集+双流融合+轻量化Transformer,具体模块设计如下:

  1. 1
  2. SFE模块:分为尺度缩放和特征扩展两个阶段,是DTNet的核心创新之一。先通过1D卷积、批归一化和挤压激励(SE)机制对原始I/Q信号(L×2)进行自适应缩放,抑制噪声并强化关键特征;再采用深度可分离卷积替代传统卷积,在降低计算复杂度的同时将信号特征扩展为L×L的方阵,提升特征的空间丰富度和通道多样性,适配后续Transformer的特征学习。
  3. 2
  4. 双流嵌入:同时处理原始I/Q信号和SFE模块的输出特征,形成互补特征融合。对原始信号采用16×2的卷积补丁嵌入捕捉细粒度时间特征,对SFE输出的方阵特征采用32×32的卷积补丁嵌入提取高层空间特征,将两路输出拼接后形成混合特征表示,兼顾信号的时间保真度和空间抽象性。
  5. 3
  6. 位置嵌入:为Transformer编码器补充位置信息,在双流嵌入的特征序列前添加可学习的类别令牌,再叠加可学习的位置偏置,解决自注意力机制无法感知序列顺序的问题。
  7. 4
  8. Transformer编码器:由多头自注意力(MHSA)和改进的双分支MLP(DB-MLP)交替组成,引入残差连接和层归一化提升训练稳定性。其中DB-MLP将输入令牌分为两个分支并行处理,相比传统单分支MLP,在减少50%参数的同时提升了模型对信号特征的学习能力,实现轻量级设计。
  9. 5
  10. 分类层:通过三层全连接层将Transformer编码器的输出映射到调制类别空间,最后一层的神经元数量与调制类别数匹配,完成分类。

模型训练采用Adam优化器,以交叉熵为损失函数,引入学习率衰减和早停机制防止过拟合,直接以原始I/Q信号为输入,无需额外预处理,在RML2016.10A和RML2016.10B数据集上采用70:15:15的训练/验证/测试数据划分。

结论

本文提出了一种高精度的CNN架构DTNet,专门用于识别各类通信信号的调制模式,该模型在实现超高分类精度的同时,保持了较快的处理速度和较低的计算复杂度。

DTNet的核心优势在于SFE模块的设计,该模块将原始信号信息重新缩放为更大的矩阵表示,生成更丰富的特征映射,并通过增加通道数进一步扩展特征,最终形成方阵特征;同时结合注意力机制捕捉信号的全局依赖,大幅提升了调制分类的准确性。实验结果显示,DTNet在短信号样本基准数据集RML2016.10A和RML2016.10B上的识别准确率分别达到93.4%和94.4%,即便在信号样本数进一步减少至96和64个时,仍能保持93.6%和92.7%的高准确率,性能优于当前所有先进的深度学习模型。

此外,DTNet兼具轻量化特性(仅570万FLOPs),在嵌入式硬件上具备高速推理能力(如Jetson Orin NX可实现9000次/秒推理),完美适配实时、资源受限的通信系统需求,在动态频谱接入、认知无线电等实际场景中具有极高的应用价值,为短信号样本的自动调制分类提供了高效的解决方案。

创作时间:2026-03-15 10:48:53