他虽然没有怎么下过基层去训练文字转WAV音频