第一阶段的24小时是准备阶段文字转WAV音频