而且排练的时候还要同时兼顾学习文字转WAV音频