这说明目标的动作反应都是一流的文字转WAV音频