除了必要的抓捕文字转WAV音频