婴儿哭声推理预测【已封装】(免tensorflow安装配置、CPU|GPU均可运行)

作品简介

婴儿哭声分类识别的主干文件

该文件可以根据需要更换模型、音频文件,同时提供了tensorflow与ONNX转换的源码两种模型预测方式

  • 不需要安装tensorflow等繁琐安装ONNX推理方式,该推理代码可以在任何系统简单安装即可运行;(亲测有效!
  • 需要安装tensorflow、keras等包TF推理方式该推理代码需要配置tensorflow等包环境,且在Mac OS\Windows系统尤为复杂。

第一种:ONNX推理方式

tensorflow与ONNX转换的源码在run_code.ipynb中

  • 运行方式:
python run_pre_ONNX.py --filename ./data/audio/diaper_77.wav --modelPath ./data/onnx/babysound_classification_tf_cnn.onnx
  • 项目结构目录
  • 环境配置
python==3.9
主要安装以下4个包:
pip install onnx
pip install onnxruntime
pip install librosa
pip install resampy

如果出现问题,可指定版本号(一般不会有问题):
onnx                         1.13.1
onnxruntime                  1.14.1
librosa                      0.10.1
resampy                      0.4.3

第二种:TF推理方式

  • 运行方式:
python run_pre.py --filename ./data/audio/diaper_77.wav --modelPath ./data/model/babysound_classification_tf_cnn_improveUrbansound.h5
  • 项目结构目录
  • linux配置(windows环境也可参考参考安装,建议使用linux环境)
python==3.9
主要安装以下三个包:
pip install tensorflow
pip install librosa
pip install resampy
  • 其他环境
	.yaml文件为配置文件,项目运行环境,可通过conda加载安装。

Tips: resampy 一定要确保安装,否则会无法使用librosa,而且在过程中不会出现错误提示!

创作时间: