更多的时候是敖在前面指挥文字转WAV音频