然后将它们再次凝固文字转WAV音频