在特殊视野中会直接以明暗区分文字转WAV音频