这是要将活生生的人扔到里面文字转WAV音频