持续时间根据人口而定文字转WAV音频