但一些声音还是能从嘈杂的噪音中区分出来的文字转WAV音频