则是角色的动作很少文字转WAV音频