但他依然能精准地定位自己的所在文字转WAV音频