他们将这阶段的修习分成三个阶段文字转WAV音频