尝试使用神识视物文字转WAV音频