他们也并不需要动听的言语文字转WAV音频