主要是经过提炼文字转WAV音频