只能凭借肉眼和简单的望眼镜等设备文字转WAV音频