按照常理去推断文字转WAV音频