后者代表量文字转WAV音频