也不知道是不是必须捕捉活的文字转WAV音频