也就是在规定的时间和地点文字转WAV音频