而是将一排排架子分成了三个部分文字转WAV音频