继承了三个分支的能力文字转WAV音频