不过从他们的言语描述中文字转WAV音频