ocr文字识别软件下载 文字识别OCR

开源精选是我们在Github、Gitee等开源社区分享优质项目的专栏,包括技术、学习、实用和各种有趣的内容。本期推荐的是一款开源的OCR图像转文本识别软件——UMI OCR。

ocr文字识别软件下载 文字识别OCR

特性免费:本项目所有代码开源,完全免费。方便:解压即用,离线运行,无需网络。批量:可批量导入处理图片,结果保存到本地 txt、md、jsonl 多种格式文件。也可以即时截屏识别。高效:采用 PaddleOCR-json C++ 识别引擎。只要电脑性能足够,通常比在线 OCR 服务更快。精准:默认使用 PPOCR-v3 模型库。除了能准确辨认常规文字,对手写、方向不正、杂乱背景等情景也有不错的识别率。可设置 忽略区域 排除水印、设置 文块后处理 合并排版段落,得到规整的文本。简单上手

屏幕截图识别

点击截图按钮或自定义快捷键,唤起截图识别。

将图片粘贴到软件中。

把图片复制到任何地方(比如文件管理器、网页、微信),点击软件上的粘贴按钮,自动识别。

本地图片文件的批量识别

将图片或文件夹拖入软件中,批量转换文本。您也可以单击按钮打开浏览窗口进行导入。

识别结果将保存在本地。可以生成不同格式的原始信息,如纯文本txt文件、带链接的Markdown文件、json文件等。它可以配置为在任务完成后执行关机/待机。

文本块后处理(排版优化)

OCR识别的文本是分“块”的,通常一行文本被分成一个块,有时一行被误分成多个块,给阅读带来不便。文本块后处理是对文本块进行重新处理的过程,将同一行或段落中的单词进行组合,并按照正确的顺序进行排序。

下图显示了不同的排版应该选择什么样的处理方案:

忽略区域功能

忽略区域是本软件的一个特殊功能,可以用来消除图片中水印的干扰,在识别结果中只留下需要的文字。

只需从视频截图中排除水印

排除游戏截图中的两个UI。

下载 & 说明

下载

Https://github.com/hiroi-sora/Umi-OCR/releases/tag/v1.3.0使用说明。

https://github . com/hiroi-sora/海-OCR # % E7 % AE % 80% E5 % 8D % 95% E4 % B8 % 8A % E6 % 89% 8B

-结束-

开源协议:麻省理工学院

开源地址:https://github.com/hiroi-sora/Umi-OCR

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。

发表回复

登录后才能评论