咱们看到的是幻觉文字转WAV音频