他们只听到一部分文字转WAV音频