只有他们听不懂的时候才会翻译解释一下文字转WAV音频