所以在动的人一定是团长文字转WAV音频