进行一系列极为严苛的挑选训练和测试文字转WAV音频