而现在要经过第二层文字转WAV音频