他们也只能根据自己掌握的信息去摸索文字转WAV音频