他们提了两个条件文字转WAV音频