他们全部用的下层位面的语言文字转WAV音频