所以他们知道位置文字转WAV音频