然后就是连续的小段小段的片段配合解说文字转WAV音频