这样便让他们有了一个推测文字转WAV音频