不过现场明显分成了两拨文字转WAV音频