检测到论坛CSS可能没有正确加载，如出现排版混乱请刷新重试。

We detected that the CSS might not be loaded correctly. If the website displays abnormally, Please refresh and try again.

推荐一款小众iOS端OCR软件

BilinSun

现在移动端已经有一些不错的OCR软件，但是几无例外地：
1.需要联网使用；
2.必须付费，甚至不是买断而是订阅。
对于其中的很多，还要加上一条：给文件拍照以后，必须手动裁切图片，限制到有文字的部分。这一步还往往花去我们大量的时间。
但是，现在iOS的原生备忘录APP就支持扫描文档并自动裁切（应该是ARKit的功劳）且成功率还不错，甚至还能索引扫描的图片形式的文档中的内容（应该是Vision Framework的功劳），显然后台有进行文字识别工作。这显然不用花钱订阅，还不需要联网。这不就是一个一气呵成的完美OCR吗？
然而反人类的设定是，目前的原生备忘录没有地方让你复制系统从扫描文档中识别出来的文字。我们知道文本肯定存在于系统某处用作索引，但就是没法复制出来用。
理论上，只要一个开发者调用一下ARKit和Core ML，就可以轻松制作出一款OCR软件。让我失望的是，使用必须联网这个特点就向我证明，绝大多数的主流OCR软件还没有开始利用起系统的原生API。想要用上免费又好用的OCR，惟一的出路似乎是自学iOS开发……
天无绝人之路。在我漫无目的地查VNRecognizeTextRequest的文档的时候，我看到了一个博客——而且里面给出了一个demo——而且这个demo不是一个github项目，而是一个已经上架的APP！

BilinSun

它是免费的。我立刻下载了这个APP并试用了一下。它支持利用系统的AR特性自动识别和裁切拍到的文档。在离线的状态下，它能够以相当不错的准确率识别英文。它没有内购、没有OCR数量限制（毕竟用的是本机资源……），甚至没有广告。惟一的遗憾是它不支持中文。这和我刚看到的iOS 13中VNRecognizeTextRequest API文档是一致的：只支持英文。
等等……iOS 14呢？我查了半天，终于确认iOS 14加入了多个不同语言的识别功能支持。只要开发者为用户提供一个选择界面，并且相应调用API的时候多传一个参数，就可以支持不同语言了。
我注意到这个软件似乎是一个初创的开发者做的。我试着联系了他的邮箱，没想到很快就收到了热情的回复。于是我诉说了我的建议。三个星期之后，软件更新，带来了我提出的一切。

BilinSun

软件的名字是 Scan it - Scan and export PDF 。
由于目前还没有人气，直接搜名字不一定有上榜，所以可以用这个链接查看 https://apps.apple.com/cn/app/scan-it-scan-and-export-pdf/id1509634112
这个项目似乎还没有开始盈利，作者也表示他的作品有人用就是对他最大的鼓励，所以如果好用的话给他打个五星吧233目前这个软件甚至“没有足够的评分”，还是挺惨的……

QJS Studio 王琳芳

不知道楼主有没有发现QQ和微信都是可以文字识别的[tieba=pen]
随便给任意一人(可以是自己小号)发送任意图片，然后就可以转文字。
当然了楼主说的这个软件优势是断网使用。
现在这个互联网发达的年代，这也不算什么优势了。
刻意不联网，图什么？

何沐瑾

QJS Studio 王琳芳这个软件的应用领域可能在工作，毕竟可以导出为PDF
M$ Lens下架了就很惨(不过现在移动端多合一Office也有扫描功能，也免费)

DaleZ

QJS Studio 王琳芳省流量(?)

何沐瑾

QJS Studio 王琳芳日常不用腾讯系，反正上次我用我妈的微信做个笔记要发给老师，结果一直提示文件尚未上传不能转发，然后我就火了，你倒是给我一个上传按钮啊，你在干啥子勒？7456

BilinSun

QJS Studio 王琳芳这个的优势就是你还可以向作者request功能ww
就现在而言比用QQ没什么太大优势，但是如果以后作者支持批量操作的话就会很牛了

BilinSun

何沐瑾啊？！不要吓我，Lens下架了吗

BilinSun

何沐瑾说到这个，我之前都在QQ上把历史课等的课件发在班级群，结果从某时开始QQ显示“安全检查未通过”不予下载，原因我认为就是涉及politique。这个感觉还是挺可怕的，因为我课件里都是截图没有文本文字——表明腾讯不会对于可OCR的内容放松审查。

呵呵韩国观光饭

BilinSun 大陆平台用OCR审查怕也不是啥秘密了，记得当时北凛在贴吧更Windows98史时候图片出现“98”两个数字都动不动吞帖

BilinSun

呵呵韩国观光饭图片是很显然会的，但对于数百页的PPT也会下巨大算力做OCR我属实没想到，何况PPT内部排版本身可以错综复杂，远远不是上传一张图片OCR一张图片这么简单。
唉，说实话能识别PPT内容的技术和算力要能民用多好，就像Adobe Acrobat搞了个Liquid Mode那样。

AlfaEstrella

tg某个bot都能（

不说这个，那能识别波斯文吗？我没见过一个能的（

当然ios，就算能我也打不开）

删封申诉 | 知乎专栏 | 状态监控 | 用户协议(EULA) | 隐私政策

本站文章除其作者特殊声明外，一律采用CC BY-NC-SA 4.0许可协议进行授权，进行转载或二次创作时务必以相同协议进行共享，严禁用于商业用途。

检测到论坛CSS可能没有正确加载，如出现排版混乱请刷新重试。

We detected that the CSS might not be loaded correctly. If the website displays abnormally, Please refresh and try again.

© 2025 wvbCommunity 管理团队