最主要的是神识文字转WAV音频