ocr文字识别软件下载文字识别OCR

开源精选是我们在Github、Gitee等开源社区分享优质项目的专栏，包括技术、学习、实用和各种有趣的内容。本期推荐的是一款开源的OCR图像转文本识别软件——UMI OCR。

特性免费：本项目所有代码开源，完全免费。方便：解压即用，离线运行，无需网络。批量：可批量导入处理图片，结果保存到本地 txt、md、jsonl 多种格式文件。也可以即时截屏识别。高效：采用 PaddleOCR-json C++ 识别引擎。只要电脑性能足够，通常比在线 OCR 服务更快。精准：默认使用 PPOCR-v3 模型库。除了能准确辨认常规文字，对手写、方向不正、杂乱背景等情景也有不错的识别率。可设置忽略区域排除水印、设置文块后处理合并排版段落，得到规整的文本。简单上手

屏幕截图识别

点击截图按钮或自定义快捷键，唤起截图识别。

将图片粘贴到软件中。

把图片复制到任何地方(比如文件管理器、网页、微信)，点击软件上的粘贴按钮，自动识别。

本地图片文件的批量识别

将图片或文件夹拖入软件中，批量转换文本。您也可以单击按钮打开浏览窗口进行导入。

识别结果将保存在本地。可以生成不同格式的原始信息，如纯文本txt文件、带链接的Markdown文件、json文件等。它可以配置为在任务完成后执行关机/待机。

文本块后处理（排版优化）

OCR识别的文本是分“块”的，通常一行文本被分成一个块，有时一行被误分成多个块，给阅读带来不便。文本块后处理是对文本块进行重新处理的过程，将同一行或段落中的单词进行组合，并按照正确的顺序进行排序。

下图显示了不同的排版应该选择什么样的处理方案:

忽略区域功能

忽略区域是本软件的一个特殊功能，可以用来消除图片中水印的干扰，在识别结果中只留下需要的文字。