显然是从口鼻里溢出的文字转WAV音频