就是在训练过程中死了文字转WAV音频