只是通过简单的联姻和继承两个动作文字转WAV音频