粗略辨认着周围的环境与方向文字转WAV音频