而分辨出他们在说什么文字转WAV音频