一开始需要我们投入大量计算力去营造和维护文字转WAV音频