应该是和我们处在同一个时间段文字转WAV音频