但他们一直在学习文字转WAV音频