在得到明确回应后文字转WAV音频