却侧重在对环境的洞察文字转WAV音频