所以他们从小就接受各种各样的训练文字转WAV音频