因为它们会记住我在每一个阶段时的样子文字转WAV音频