要么就是用基础设施建设来拉动文字转WAV音频