所以他们只是维持自身修为文字转WAV音频