瞄准的是对方的头部文字转WAV音频