这里的修士应该把我们当成了普通的修士文字转WAV音频