他们只负责被动反击文字转WAV音频