我们就可以第一时间捕捉到他们文字转WAV音频