这样的学习过程持续了两年多的时间文字转WAV音频