目的是为了产生优质的后代文字转WAV音频