然后根据他们的意图和自身的能力做出分配文字转WAV音频