但有人确实能够做到正确分辨文字转WAV音频