是根据身份和实力划分的文字转WAV音频