并进行了简单的队列训练文字转WAV音频