从而捕捉到外面的情况文字转WAV音频