试图将每一道信息都捕捉住文字转WAV音频