就否定我们之前定下的方案文字转WAV音频