然后根据时间和距离文字转WAV音频