其实就如他们看普通人文字转WAV音频