因为你根本不可能分辨出文字转WAV音频