现在移动端已经有一些不错的OCR软件,但是几无例外地:
1.需要联网使用;
2.必须付费,甚至不是买断而是订阅。
对于其中的很多,还要加上一条:给文件拍照以后,必须手动裁切图片,限制到有文字的部分。这一步还往往花去我们大量的时间。
但是,现在iOS的原生备忘录APP就支持扫描文档并自动裁切(应该是ARKit的功劳)且成功率还不错,甚至还能索引扫描的图片形式的文档中的内容(应该是Vision Framework的功劳),显然后台有进行文字识别工作。这显然不用花钱订阅,还不需要联网。这不就是一个一气呵成的完美OCR吗?
然而反人类的设定是,目前的原生备忘录没有地方让你复制系统从扫描文档中识别出来的文字。我们知道文本肯定存在于系统某处用作索引,但就是没法复制出来用。
理论上,只要一个开发者调用一下ARKit和Core ML,就可以轻松制作出一款OCR软件。让我失望的是,使用必须联网这个特点就向我证明,绝大多数的主流OCR软件还没有开始利用起系统的原生API。想要用上免费又好用的OCR,惟一的出路似乎是自学iOS开发……
天无绝人之路。在我漫无目的地查VNRecognizeTextRequest的文档的时候,我看到了一个博客——而且里面给出了一个demo——而且这个demo不是一个github项目,而是一个已经上架的APP!