但是确实是在吸收文字转WAV音频