他们要采取的战术就是分化文字转WAV音频