全是用余光扫文字转WAV音频