重点是她的动作以及看他的神态文字转WAV音频