其实只是将实验室的人工动作变成了机械动作文字转WAV音频