NASA锂电池老化数据集处理与健康因子提取

作品简介

NASA锂电池老化数据集处理与健康因子提取

在数据驱动的电池健康状态(SOH)和剩余使用寿命(RUL)预测领域,高质量的公开数据集是验证算法有效性的基石。其中,NASA Ames 卓越预测中心(PCoE)提供的锂离子电池老化数据集被学术界和工业界广泛采用。


本文将从理论与物理机制出发,基于最经典的 BatteryAgingARC-FY08Q4 数据子集,深度剖析其实验设计逻辑,并详细讨论如何从中科学地提取出 11 个关键的健康因子(Health Factors, HF),以表征电池的衰减过程。




一、 NASA 电池老化实验工况解析

要提取有物理意义的特征,首先必须深刻理解原始数据的采集工况。根据实验设定,本批次(包含编号为 5、6、7、18 的四块电池)的测试环境被严格控制在 24°C 的室温下,其全生命周期的老化轨迹通过反复执行以下标准工况来记录:


  • 充电协议 (CC-CV):以 1.5A 的恒定电流(CC)充电至上限截止电压 4.2V,随后转入恒定电压(CV)模式,直至充电电流自然衰减至 20mA。
  • 放电协议 (CC):以 2A 的恒定电流(CC)进行放电,不同电池的放电截止电压略有差异(分别为 2.7V、2.5V、2.2V 和 2.5V)。
  • 寿命终止条件 (EOL):当电池的实际容量从初始额定值 2Ah 下降 30%(即跌至 1.4Ah)时,判定为达到寿命终点。
  • 附加测试:实验中还穿插了 EIS(电化学阻抗谱)测量,用于观察老化对内部参数的影响。

这种标准的“恒流-恒压充电 + 恒流放电”循环,为我们提取具有时间、容量和电压维度的健康因子提供了完美的温床。




二、 11 个健康因子 (HF) 的理论提取与物理意义

随着循环次数的增加,电池内部会发生锂离子库存损失(LLI)、活性物质损失(LAM)以及内阻增大等不可逆的物理化学退化。我们将这些退化现象具象化为以下 11 个健康因子和 1 个真实目标值。


1. 时间维度特征提取 (HF1 - HF4)

时间特征能够直观反映电池由于内阻增加而导致的极化现象加剧。


  • HF1: 等压升充电时间
  • 理论分析:截取充电过程中,电压从某个固定低值上升到固定高值所经历的时间。随着电池老化,欧姆内阻和极化内阻增大,在相同的 1.5A 充电电流下,电压会以更快的速度攀升,导致该等压升时间缩短。
  • HF2: 恒流充电时间
  • 理论分析:记录 1.5A 恒流阶段(直到电压触及 4.2V)的持续时间。老化越严重,电池越快达到 4.2V 的截止阈值,因此恒流阶段的时间会显著缩短。
  • HF3: 恒压充电时间
  • 理论分析:记录在 4.2V 下电流逐渐衰减至 20mA 的阶段所耗费的时间。由于老化电池在恒流阶段充入的电量变少,系统需要花费更长的恒压时间来“填补”剩余容量,该时间通常呈上升趋势。
  • HF4: 等压降放电时间
  • 理论分析:在 2A 的恒流放电过程中,截取电压下降经过某两个特定电压点的时间差。这直接反映了电池在特定电压区间的放电能力衰减。

2. 容量与面积维度特征 (HF5 - HF7)

容量特征是对电流-时间曲线进行积分(面积计算)的结果,直接代表了电池容纳电荷的能力。


  • HF5: 充电总容量 (面积)
  • 理论分析:整个充电过程(CC+CV)电流对时间的积分。随着循环进行,电池可逆容量不可避免地下降,该特征呈现全局单调递减。
  • HF6: 恒流充电容量
  • 理论分析:仅对 1.5A 恒流阶段的曲线求面积。由于老化导致极化提前触发恒压阶段,恒流阶段能够充入的容量会大幅缩水,这是表征老化的极佳特征。
  • HF7: 恒压充电容量
  • 理论分析:对 4.2V 恒压阶段的电流曲线求面积。虽然总体容量在下降,但恒压阶段充入的电量在总充电量中的比例往往会上升,反映了充电机制的重心偏移。

3. 微分与热力学特征 (HF8 - HF9)

增量容量(Incremental Capacity, IC)曲线分析是电池健康评估中的高阶手段。它通过计算 dQ/dV


dQ/dV(容量对电压的导数),将平缓的电压平台转化为清晰的峰值。


  • HF8: IC曲线峰值
  • 理论分析:IC 峰值代表了电池内部发生主要相变的电压平台。峰值的高度直接关联着参与氧化还原反应的活性锂离子数量。峰值下降,说明电池发生了明显的锂离子或活性物质损失。
  • HF9: IC峰值对应电压
  • 理论分析:随着内阻增加,电池的反应电位会发生极化偏移。IC 峰值不仅会变矮,还会向高电位(充电时)或低电位(放电时)方向移动。捕捉这一电压位置的变化,可以精确量化电池的极化程度。

4. 外部响应特征 (HF10 - HF11)

除了电学参数,温度和多工况比例也是评估老化的重要侧面。


  • HF10: 放电最高温度
  • 理论分析:虽然环境被设定为室温 24°C,但在 2A 的放电过程中,电池内部会产生焦耳热。随着循环老化,内阻的增加会导致产热率急剧上升。因此,提取每个循环的放电最高温度,可以从热力学角度佐证电池的老化。
  • HF11: 恒流时间占比
  • 理论分析:将恒流充电时间(HF2)除以总充电时间(HF2+HF3)。这是一个极好的无量纲化特征。新电池的大部分电量在恒流阶段充入,占比极高;而老化电池该比例会显著下滑。它有效消除了部分量纲差异带来的噪声干扰。

5. 目标变量

  • 真实SOH (State of Health)
  • 理论分析:这是我们通过监督学习需要预测的目标。根据实验设定,它由当前循环的放电总容量除以出厂额定容量(2Ah)得到。其轨迹呈现从 100% 逐渐衰减至 70% (1.4Ah) 的趋势。

代码运行结果

在这里插入图片描述

在这里插入图片描述


结语

在 NASA 的这一经典数据集中,简单的恒流-恒压协议背后蕴含着丰富的退化信息。通过提取这 11 个跨越时间、容量、微分响应与热力学维度的健康因子,我们能够将庞杂的传感器时间序列数据,降维成信息密度极高的特征矩阵。这种将物理化学衰减机制与数据工程紧密结合的思路,正是构建高鲁棒性电池寿命预测模型的核心所在。

创作时间: