然后再一栋一栋的去询问文字转WAV音频