指的显然就是讲台文字转WAV音频