因为他给出的规则很简单文字转WAV音频