百宝箱
Video Site ID in user profile not reconized. Only "163, youtube, bili,local" accepted.

字符识别OCR把图片上的文字自动识别出来,转换成我们能处理的字符串。这里使用Tesseract这个软件包来做OCRTesseract最初由惠普开发,后来谷歌接受过来继续支持。Tesseract支持100多种书面语言,并且可以被训练继续扩充。Tesseract没有图形化界面,用命令行执行,作为内核被其他有图形化界面的程序调用。我们先来安装Tesseract,然后用命令行运行Tesseract识别图片上的文字。

Mac上可以用homebrew安装Tesseracthomebrew是一个安装工具,帮助我们安装应用到Mac上。homebrew不是Mac自带的,所以自己需要先被安装。搜索引擎上搜install homebrew,找到homebrew的主页brew.sh,主页上赫然挂着安装homebrew的办法,把:/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"贴到terminal终端窗口上,按照提示输入admin的密码后会自动下载安装homebrew

我初次在Mac上安装工具Homebrew时非常顺利,万万没想到在另一台电脑上录制安装Homebrew的视频时上掉链子。安装开始不久就弹出窗口要求安装xcode:

毫无准备的我才知道原来安装homebrew是要用到xcode-select,既然xcode-select有xcode那要求安装xcode想必是合理要求,另外之前那个电脑上好像很久以前有装过xcode……赶紧答应好赶快中断这个意外,所以就点击了'install'。几分钟后被打脸,赫然弹出窗口:

竟然直接安装不了,气愤!安装不了你提供这个选项干什么?

只好termianl+空格调出搜索窗口,敲入app store调出应用商店,然后输入xcode下载(弹出第一个窗口时选择'get xcode'也可以调出应用商店下载xcode),本以为乖乖听话安装xcode后可以继续,却发现安装过程仍然会被这个错误“

xcode-select: note: install requested for command line developer tools

Failed during: /usr/bin/sudo /usr/bin/xcode-select --switch /Library/Developer/CommandLineTools

”拦截终端。

实际上第一个弹出窗口明明白白写着它需要command line developer tools,可惜我当时根本对command line developer tools毫无概念,只是依照惯例用自己的排错三板斧:搜搜搜,把错误信息拷贝到搜索引擎上,找看得顺(kao)眼(pu)的搜索结果看别人如何应对,然后乱打乱撞,逮到一个试一个,我把看到的几个办法列出来,希望要是你也遇到同样问题,能有一款适合你。

首先有人老老实实按照指示安装了xcode,然后就顺利滴解决了这个错误

没有这个运气的往下看:

第一个尝试:

在terminal窗口上敲入命令xcode-select --install,我的机器一运行这条命令就弹出第一张图的窗口,所以我不能理解为什么有人这样弄一下就好了。但确实安装过程是因为xcode-select装不上而终止的。

第二个尝试:

先是安装Xcode,确保Xcode安装在/Applications下,而不是/Users/用户名/Applications下;terminal终端上敲入命令xcode-select -p得到Xcode-select的安装路径,一般是/Applications/Xcode-app/Contents/Developer;最后使得Xcode-app指向这个路径:sudo xcode-select -s /Applications/Xcode-app/Contents/Developer

有人用这种办法解决掉了安装过程中的拦路虎,可惜我没这个运气

第三个尝试:

第一张图上说缺少Command Line Tools来安装Xcode-select,所以直截了当地去苹果官方开发者网站:https://developer.apple.com/download/more/ 下载这个工具。这个网站需要开发者账号和密码,没有的话注册一个就好。打开网页就可以看到几个Command Line Tools (macOS x.x.x) for XCode N文件,点击桌面左上角的苹果标志,弹出的菜单上选择About This Mac,可以查看到应该选择MacOS X.X.X,下载完后双击安装。

Command Line Tools安装完毕后把Homebrew主页上的/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"拷贝到terminal终端窗口上安装Homebrew,在我的机器上没再出现什么幺蛾子成功安装!

不过,成功安装完Homebrew和Tesseract后,这台电脑马上就可以用tesseract识别图片上的文字了,而不像另一台电脑需要特别设置下环境变量TESSDATA_PREFIX。

总之见招拆招且行且珍惜吧

OCR识别图片和PDF上的文字之概述和安装Homebrew视频:

{koala_myvideo 70}

即将推出的Python ABC教程对PythonABC视频内容进行了梳理,修正了发现的错误、对代码做了些许优化、替换掉视频中的英文注释、替换掉国内不能访问的资源、添加windows上的设置和运行……敬请关注,谢谢