他们的理由是我们没有充足的证据表明文字转WAV音频