尽管荣光只是做了最基本的训练文字转WAV音频