不仅可以定位文字转WAV音频