指的是多方面的文字转WAV音频