他总是在最后的几句中加重了语气文字转WAV音频