所以现在事实上粗剪已经近似完成文字转WAV音频