在确定所有的位置都已经对齐之后文字转WAV音频