他认为攻击应该是那样的文字转WAV音频