在机器学习和计算机视觉领域,光学字符识别(optical character recognition, OCR)长期以来都是人们研究的重要主题之一。OCR 很简单,就是将文档照片或场景照片转换为机器编码的文本。
关于 OCR 的工具,机器之心此前也介绍过不少,如 2020 年频频登上 Github Trending 日榜月榜的开源项目 PaddleOCR,目前该项目已经获得 12.6k star 量。此外还有旷视研究院与华中科大联合研发的基于分割的场景文字识别方法 TextScanner,不仅可以正确读取字符数据,还在一系列相关文字基准数据集上取得了当前最佳性能。
近日,GitHub 上又出现了一个非常火的 OCR 工具 macOCR,短短一天时间,就收获了近800赞。macOCR 是一个开源命令行应用程序,用户可以使用它将屏幕上的任何文本转换为剪贴板上的文本。
项目地址:https://github.com/schappim/macOCR
当你调用 ocr 命令时,一个类似于光标的「屏幕捕获」(screen capture)就会出现。如此一来,边框内的任何文本都将转换为纯文本。
项目作者提供了如下动图展示,将图片文本转换为了文本。
对于 macOCR 命令行应用程序,网友给予了高度评价。网友 @mromanuk 表示:「我很沮丧的是,一直以来没有简单的方法来提取 Mac 图片中的文本。现在 macOCR 弥补了这一空白!这一功能应该在 MacOS 中集成或随时可用。」
安装使用
用户使用的操作系统需要是 macOS Catalina 及以上版本。
用户可以选择编译以下 repo 中的代码,或者下载预先构建的二进制(分为苹果 Silicon 处理器和英特尔处理器)并放在自己的路径中。
苹果 Silicon 处理器安装代码:
- curl -O https://files.littlebird.com.au/ocr.zip;
- unzip ocr.zip;
- sudo cp ocr /usr/local/bin;
英特尔处理器安装代码:
- curl -O https://files.littlebird.com.au/ocr-EPiReQzFJ5Xw9wElWMqbiBayYLVp.zip;
- unzip ocr-EPiReQzFJ5Xw9wElWMqbiBayYLVp.zip;
- sudo cp ocr /usr/local/bin;
当首次运行 macOCR app 时,用户可能需要「允许该 app 访问你的屏幕」,示意图如下:
项目作者
macOCR 的创建者是 Marcus Schappi,现为 Chick Global 的 CEO 和联合创始人。他还曾是 Little Bird Electronics 和 Geek Ammo 等其他其他几家公司的联合创始人。
Schappi 曾在澳大利亚巴克学院、悉尼科技大学以及悉尼大学就读。其中,在攻读悉尼科技大学工程创新、机电一体化及创业学士学位期间,他没有获得该学位。但由于其创建的海啸预警软件吸引了媒体的广泛关注,他最终被悉尼大学研究生项目录取,攻读设计科学硕士(设计计算及计算)。
Schappi 在软件开发、移动应用以及 IOS 开发等方面具有娴熟的技能。
目前,他的 GitHub 主页上有多个项目,比如 macOCR、kod-website、dropcam 等。