必须进行眼神上的交流文字转WAV音频