不过他也是先把时间先计算好的文字转WAV音频