他用手上的动作代替了回答文字转WAV音频