然后核对时间文字转WAV音频