从视线里的景物可以得知文字转WAV音频