尽量维持文字转WAV音频