两人显然都记得刚才到底发生了什么文字转WAV音频