他自然是通过芯片的扫描和追踪才跟上来的文字转WAV音频