作品简介

【EW Frontier】——雷达通信AI科研人的一站式技术平台！

✅ 超1000+实战代码：DOA/调制识别/ISAC/抗干扰/无人机等雷达、通信、电子战全方向（MATLAB+Python）✅ 专属科研辅导：论文专利选题/仿真/写作、项目定制全程答疑✅ 优质社群资源：985/211硕博同行交流，最新技术干货实时同步🔥 资源获取通道👉知识星球（全部资源无限看）：https://wx.zsxq.com/group/15554455154582👉面包多（单个代码精准购）：https://mbd.pub/o/EWFrontier/work📞 辅导/答疑：🧑‍🎓客服微信： EWFrontier👥 学术交流QQ群：1074124098

融合双流嵌入的Transformer模型，实现短信号样本调制分类新突破

文章题目

融合双流嵌入的Transformer模型用于短信号样本的调制分类

摘要

自动调制分类（AMC）是现代通信系统中的关键任务，在多样信号条件和有限数据场景下尤为重要。现有基于Transformer的AMC模型多采用单流架构和统一输入格式，限制了其捕捉丰富信号特征的能力。为解决该问题，本文提出一种新型基于Transformer的双流网络DTNet，以实现高效、准确的调制分类。DTNet包含两项核心创新：一是尺度特征扩展（SFE）模块，通过缩放函数将信号转换为结构化输出映射，再经扩展模块将信号重构为方阵，并结合自适应滤波器整合响应映射；二是卷积流，从多尺度信号表示中提取判别特征。此外，本文还设计了改进的特征嵌入方式以适配Transformer架构，捕捉输入信号的全局依赖和上下文信息，提升调制分类精度。实验结果表明，DTNet在基准数据集上表现优异，在RML2016.10A和RML2016.10B数据集上的分类准确率分别达93.4%和94.4%，优于当前最先进的深度学习方法，同时保持更低的计算复杂度。相关源代码已开源。

引言

在无线通信系统中，动态信道采用自适应调制技术优化传输速率，发射机与接收机需交换调制方式相关数据，这会产生协议开销，而接收机若能自主识别调制类型，该开销可被省去，自动调制分类（AMC）便在此背景下成为连接信号检测与解调的中间环节，能识别目标信号的调制格式，即便信号受噪声或干扰影响。

传统AMC研究主要分为基于似然理论（LB-AMC）和基于特征（FB-AMC）两类方法：LB-AMC借助贝叶斯估计和概率模型，分类精度高但计算复杂度大；FB-AMC从接收信号中提取特征进行分类，计算效率高，更适用于实时或资源受限场景。近年来，深度学习技术为AMC带来范式转变，研究者提出多种深度神经网络实现信号特征的自动提取，也诞生了RML2016.10A、RML2016.10B、RML2018.01A等主流基准数据集。

目前，CNN、LSTM、GNN等网络及融合架构已被广泛应用于AMC，研究人员还通过改进网络架构、引入注意力机制、优化训练方法等提升模型性能。Transformer架构因能捕捉信号全局依赖和上下文信息成为研究热点，但现有基于Transformer的AMC模型在短信号样本数据集（如仅含128个复信号样本的RML2016.10A和RML2016.10B）上性能显著下降。

短信号样本的调制分类在实时处理、带宽效率和低延迟通信系统中具有重要实际意义，能加快动态通信环境的决策速度、优化资源受限信道的带宽利用，但该领域的研究仍存在不足：现有针对短信号的模型要么精度偏低（如短时ResNet最高准确率仅61.9%），要么为提升精度引入了过高的计算复杂度。为此，本文提出DTNet模型，专门针对短信号样本设计特征提取架构，在保证低计算复杂度的同时实现高分类精度。

方法简介

本文提出的DTNet模型以CNN为基础，结合Transformer架构设计，整体包含尺度特征提取（SFE模块）、双流嵌入、位置嵌入、Transformer编码器和全连接分类层五大核心部分，专为短信号样本的调制分类优化，核心设计思路为特征富集+双流融合+轻量化Transformer，具体模块设计如下：

1
SFE模块：分为尺度缩放和特征扩展两个阶段，是DTNet的核心创新之一。先通过1D卷积、批归一化和挤压激励（SE）机制对原始I/Q信号（L×2）进行自适应缩放，抑制噪声并强化关键特征；再采用深度可分离卷积替代传统卷积，在降低计算复杂度的同时将信号特征扩展为L×L的方阵，提升特征的空间丰富度和通道多样性，适配后续Transformer的特征学习。
2
双流嵌入：同时处理原始I/Q信号和SFE模块的输出特征，形成互补特征融合。对原始信号采用16×2的卷积补丁嵌入捕捉细粒度时间特征，对SFE输出的方阵特征采用32×32的卷积补丁嵌入提取高层空间特征，将两路输出拼接后形成混合特征表示，兼顾信号的时间保真度和空间抽象性。
3
位置嵌入：为Transformer编码器补充位置信息，在双流嵌入的特征序列前添加可学习的类别令牌，再叠加可学习的位置偏置，解决自注意力机制无法感知序列顺序的问题。
4
Transformer编码器：由多头自注意力（MHSA）和改进的双分支MLP（DB-MLP）交替组成，引入残差连接和层归一化提升训练稳定性。其中DB-MLP将输入令牌分为两个分支并行处理，相比传统单分支MLP，在减少50%参数的同时提升了模型对信号特征的学习能力，实现轻量级设计。
5
分类层：通过三层全连接层将Transformer编码器的输出映射到调制类别空间，最后一层的神经元数量与调制类别数匹配，完成分类。

模型训练采用Adam优化器，以交叉熵为损失函数，引入学习率衰减和早停机制防止过拟合，直接以原始I/Q信号为输入，无需额外预处理，在RML2016.10A和RML2016.10B数据集上采用70:15:15的训练/验证/测试数据划分。

结论

本文提出了一种高精度的CNN架构DTNet，专门用于识别各类通信信号的调制模式，该模型在实现超高分类精度的同时，保持了较快的处理速度和较低的计算复杂度。

DTNet的核心优势在于SFE模块的设计，该模块将原始信号信息重新缩放为更大的矩阵表示，生成更丰富的特征映射，并通过增加通道数进一步扩展特征，最终形成方阵特征；同时结合注意力机制捕捉信号的全局依赖，大幅提升了调制分类的准确性。实验结果显示，DTNet在短信号样本基准数据集RML2016.10A和RML2016.10B上的识别准确率分别达到93.4%和94.4%，即便在信号样本数进一步减少至96和64个时，仍能保持93.6%和92.7%的高准确率，性能优于当前所有先进的深度学习模型。

此外，DTNet兼具轻量化特性（仅570万FLOPs），在嵌入式硬件上具备高速推理能力（如Jetson Orin NX可实现9000次/秒推理），完美适配实时、资源受限的通信系统需求，在动态频谱接入、认知无线电等实际场景中具有极高的应用价值，为短信号样本的自动调制分类提供了高效的解决方案。

创作时间：2026-03-15 10:48:53