然后一次构建文字转WAV音频