但是最终他还是选择了文字转WAV音频