但他已经可以想象出文字转WAV音频