他们认为这是文字转WAV音频