婴儿哭声分类识别的主干文件
该文件可以根据需要更换模型、音频文件,同时提供了tensorflow与ONNX转换的源码及两种模型预测方式:
- 不需要安装tensorflow等繁琐安装的ONNX推理方式,该推理代码可以在任何系统简单安装即可运行;(亲测有效!)
- 需要安装tensorflow、keras等包的TF推理方式,该推理代码需要配置tensorflow等包环境,且在Mac OS\Windows系统尤为复杂。
第一种:ONNX推理方式
tensorflow与ONNX转换的源码在run_code.ipynb中
- 运行方式:
python run_pre_ONNX.py --filename ./data/audio/diaper_77.wav --modelPath ./data/onnx/babysound_classification_tf_cnn.onnx
- 项目结构目录

- 环境配置
python==3.9 主要安装以下4个包: pip install onnx pip install onnxruntime pip install librosa pip install resampy 如果出现问题,可指定版本号(一般不会有问题): onnx 1.13.1 onnxruntime 1.14.1 librosa 0.10.1 resampy 0.4.3
第二种:TF推理方式
- 运行方式:
python run_pre.py --filename ./data/audio/diaper_77.wav --modelPath ./data/model/babysound_classification_tf_cnn_improveUrbansound.h5
- 项目结构目录

- linux配置(windows环境也可参考参考安装,建议使用linux环境)
python==3.9 主要安装以下三个包: pip install tensorflow pip install librosa pip install resampy
- 其他环境
.yaml文件为配置文件,项目运行环境,可通过conda加载安装。
Tips: resampy 一定要确保安装,否则会无法使用librosa,而且在过程中不会出现错误提示!