甚至直接模拟外界的自然环境文字转WAV音频