我们要是把他们说的每一句话文字转WAV音频