他们尤其看重的是舆图文字转WAV音频