Speech Commands Recognition

内容介绍

Local CV Score	Test Score
0.977 ± 0.001	0.975 ± 0.001

本方案基于pytorch和keras4torch。为方便移植到其他框架测试，下面列出了训练用到的主要设定。

torch>=1.6.0
keras4torch==1.1.3
scikit-learn==0.23.2

librosa==0.8.0

如果使用linux系统，需要先执行如下命令才能安装librosa。

! sudo apt-get install -y libsndfile1

确保原始数据被放在data/ 文件夹中，运行preprocess.ipynb。

这些文件的结构如下：

在上一步完成的基础上，运行train.ipynb。

结束后，对测试集的预测（概率值）将被保存为一个.npy文件。