然后在主人格身上重新组合体现文字转WAV音频