并没有单纯的问询文字转WAV音频