大多是易容过的文字转WAV音频