也就是稍微一表态之后文字转WAV音频