他们采取的战术是文字转WAV音频