提出一种基于物理信息神经网络(Physics‑Informed Neural Network, PINN)的耐药结核病传播动力学参数辨识方法,将敏感型与耐药型结核菌株共存的SIIR微分方程系统嵌入神经网络损失函数,通过自动微分计算方程残差,并联合累积病例数据的拟合误差与初始条件误差构成总损失,利用Adam与L‑BFGS优化器交替训练全连接网络,从而在无需数值求解微分方程的情况下,同时反演出传播率、突变率等关键流行病学参数,实现数据与机理协同驱动的精确建模。
算法步骤
数据预处理与归一化:读取实际累积病例数据(敏感型Cs与耐药型Cr)及新发病例数据,将时间变量归一化至[0,1]区间,并将所有人口数量除以总人口数转化为比例,以增强数值稳定性。
神经网络构建:搭建具有三个隐藏层(每层64个神经元)、Tanh激活函数和Sigmoid输出层的全连接网络,输入为归一化时间,输出为六个状态变量(S, Is, Ir, R, Cs, Cr)的比例。
损失函数设计:
在1000个配置点(collocation points)上计算SIIR微分方程组各方程的残差平方和,作为物理约束损失。
在观测时间点上计算网络预测累积病例与真实累积病例的均方误差,作为数据拟合损失(权重系数10)。
计算初始时刻网络输出与给定初值的均方误差,作为初值条件损失。
总损失为上述三部分之和。
可学习参数定义:将传播率β1、β2,基础突变率α0,饱和系数ρ及半饱和常数ω定义为可训练参数(采用对数变换以保证正值),并与网络权重一同参与梯度更新。
两阶段优化训练:
第一阶段使用Adam优化器(学习率1e-3,迭代15000次)快速降低总损失。
第二阶段采用L‑BFGS优化器(强Wolfe线搜索,最大迭代10000次)对参数进行精细微调。
后处理与输出:训练收敛后,在均匀时间点上生成状态变量轨迹,反归一化为实际人口数;输出最终估计的流行病学参数,绘制参数收敛曲线及拟合效果图,并保存预测结果为CSV文件。