它会根据不同修士的情况文字转WAV音频