但实际上仍然按照自己的轨迹在运行文字转WAV音频