他们知道分辨正确和错误文字转WAV音频