从大部分修士的表情上可以看出文字转WAV音频