都是按照排练时设计好的演的文字转WAV音频