因为这是次级位面文字转WAV音频