而且以他此时的状态文字转WAV音频