所以从观众到嘉宾文字转WAV音频