也不一定能够捕获文字转WAV音频