至少它们攻击单一文字转WAV音频