最终还是决定了放弃文字转WAV音频