他们估计也是探知不了多少文字转WAV音频