但他还是得去做文字转WAV音频