然后再次传导出来文字转WAV音频