表面上看起来是在向他们提问文字转WAV音频