通过系统转播回来的全三维立体视频文字转WAV音频