继而凝聚出了类似人形的能量体文字转WAV音频