这第二重的情境和第一重的欲境一样文字转WAV音频