我仅仅设置了初始数据和一系列基于真实人性的运行法则文字转WAV音频