是为了捕捉一物文字转WAV音频