然后将他所看到的一切文字转WAV音频