他们为什么要注明文字转WAV音频