点击此处加入本站用户交流群:949412811

Umi-OCR 免费开源 OCR 工具

Umi-OCR 是一款基于 PaddleOCR 引擎开发的本地化 OCR 工具,无需联网即可快速识别图片中的文字,支持中文、英文等多种语言,操作简单,适合学生、办公族和开发者使用。

什么是 Umi-OCR?

Umi-OCR 是一款免费、开源、完全离线运行的光学字符识别(OCR)工具,专为从图像中高效提取文字而设计。它无需联网、不上传数据,所有识别过程均在本地完成,充分保障用户隐私。

Umi-OCR 免费开源 OCR 工具

项目基于 PaddleOCR 和 RapidOCR 引擎开发,支持简体中文、繁体中文、英文、日文等多种语言,适用于 Windows 7 x64 及 Linux x64 系统,解压即用,绿色便携。

Umi-OCR 免费开源 OCR 工具
Umi-OCR 主界面:多标签页设计,功能一目了然


核心功能一览

截图 OCR:一键识别屏幕文字

只需打开“截图 OCR”标签页,按下快捷键即可截取任意区域,自动识别文字。支持:

  • 从截图中直接复制识别结果
  • 粘贴外部图片进行识别
  • 重复上一次截图操作(方便对比)

Umi-OCR 免费开源 OCR 工具
截图后自动识别,左侧预览,右侧可编辑文本

文本后处理:智能还原排版

OCR 不只是识别文字,更要“读得懂”排版。Umi-OCR 提供多种排版解析方案,自动处理:

  • 多栏布局(如报纸、论文)
  • 代码缩进(保留空格与格式)
  • 横排/竖排混合文本
  • 自然段落换行逻辑

预设方案包括:“多栏-按自然段换行”、“单栏-保留缩进”、“不做处理”等,满足不同场景需求。

Umi-OCR 免费开源 OCR 工具
多种排版方案可选,适配不同文档类型

批量 OCR:高效处理数百张图片

支持一次性导入 JPG、PNG、WebP、BMP、TIFF 等格式图片,无数量限制。

  • 可导出为 TXT、Markdown、JSONL 或 CSV(Excel 兼容)
  • 支持任务完成后自动关机或休眠
  • 可设置忽略区域,自动排除水印、页眉页脚等干扰内容

Umi-OCR 免费开源 OCR 工具
批量导入图片,统一设置识别参数

忽略区域:精准排除干扰文字

在批量识别或文档识别中,可手动绘制矩形区域,自动忽略水印、页码、LOGO 等位置的文字

⚠️ 注意:忽略区域针对的是“完整文本块”,而非单个字符。建议将框画得稍大,确保覆盖所有干扰内容。

Umi-OCR 免费开源 OCR 工具
黄色矩形为忽略区域,仅内部完整文本块被过滤

文档识别:PDF 扫描件变可搜索文档

支持 PDF、XPS、EPUB、MOBI、CBZ 等电子书/文档格式:

  • 对扫描版 PDF 进行 OCR,提取文字
  • 生成“双层可搜索 PDF”——既保留原图,又可全文检索
  • 同样支持忽略区域,排除页眉页脚干扰

Umi-OCR 免费开源 OCR 工具
从扫描 PDF 中提取文字,并生成可搜索版本

二维码:扫码 + 生成,一应俱全

  • 扫码:支持一图多码,兼容 19 种码制(包括 QRCode、DataMatrix、PDF417、EAN13 等)
  • 生成:输入文本即可生成二维码图片,可自定义纠错等级与码制

Umi-OCR 免费开源 OCR 工具
识别多种条码与二维码

Umi-OCR 免费开源 OCR 工具
自定义生成二维码,支持多种参数


如何下载与安装?

Umi-OCR 无需安装,解压即用。推荐以下方式获取:

scoop bucket add extrasscoop install extras/umi-ocr # 使用 RapidOCR 引擎
# 或
scoop install extras/umi-ocr-paddle # 使用 PaddleOCR 引擎

首次启动时会自动下载 OCR 模型(约 100MB),之后即可完全离线使用。


全局设置与个性化

在“全局设置”中,你可以:

  • 切换界面语言(支持中文、英文、日文等)
  • 更换亮色/暗色主题
  • 调整字体大小与类型
  • 切换 OCR 引擎插件
  • 调整渲染器(解决 UI 闪烁或错位问题)

Umi-OCR 免费开源 OCR 工具
丰富的个性化选项,适配不同使用习惯


适用人群与典型场景

  • 学生:快速提取教材、PPT、试卷中的文字,整理笔记
  • 办公族:将扫描合同、发票、报告转为可编辑文本
  • 开发者:通过 CLI 或 HTTP 接口集成 OCR 能力到项目中
  • 隐私敏感用户:避免使用需上传图片的在线 OCR 服务
  • 科研人员:处理多栏论文、技术文档,保留原始排版逻辑

为什么选择 Umi-OCR?

  • 完全离线:数据不出本地,安全可靠
  • 功能全面:截图、批量、PDF、二维码、公式识别(实验性)全覆盖
  • 开源免费:代码透明,社区活跃,持续更新
  • 跨平台支持:Windows 与 Linux 均可使用
  • 高度可定制:插件系统、排版方案、忽略区域等灵活配置

资源与支持

遇到问题?欢迎在 GitHub Issues 提交反馈!


Umi-OCR 正在成为国产离线 OCR 工具的标杆。如果你厌倦了依赖网络、收费或隐私风险高的 OCR 服务,不妨试试这款强大而贴心的开源利器——让文字识别,回归简单与安全。


PaddleOCR 与 RapidOCR 版本有何区别?

Umi-OCR 提供两个主要发行版本:基于 PaddleOCR 引擎的版本umi-ocr-paddle)和 基于 RapidOCR 引擎的版本umi-ocr),它们的核心区别在于底层 OCR 引擎不同,从而在识别速度、准确率、兼容性、资源占用等方面有所差异。

以下是根据官方 README 和社区反馈整理的详细对比:


1. OCR 引擎来源

版本引擎项目地址
umi-ocrRapidOCRRapidOCR-json
umi-ocr-paddlePaddleOCRPaddleOCR-json

两者均由 Umi-OCR 作者封装为 JSON 接口,便于集成。


2. 识别速度 vs 准确率

角度PaddleOCRRapidOCR 版本
识别速度更快(尤其在 CPU 上优化较好)稍慢,但差距不大
中文准确率高,尤其对印刷体、清晰文本略低,但在多数场景下足够用
模糊/低质量图表现更稳健可能漏识或错识
多语言支持支持中、英、日、韩等(需加载对应模型)同样支持多语言,但模型较小

💡 建议

  • 追求速度与高精度 → 选 PaddleOCR 版本
  • 追求兼容性与稳定性(如老旧电脑)→ 选 RapidOCR 版本

3. 兼容性与系统要求

项目PaddleOCR 版本RapidOCR 版本
Windows 7 支持✅ 官方测试通过✅ 官方测试通过
依赖库体积稍大(模型约 100MB+)较小(轻量级模型)
内存占用略高略低
首次启动加载需下载 Paddle 模型需下载 Rapid 模型

两者均无需联网运行,首次启动会自动下载对应 OCR 模型。


4. 功能一致性

⚠️ 重要提示
两个版本的 Umi-OCR 主程序界面、功能模块(截图/批量/PDF/二维码等)完全一致
差异仅在于文字识别的底层引擎

你可以在任一版本中:

  • 使用相同的排版解析方案
  • 设置忽略区域
  • 调用 HTTP/CLI 接口
  • 切换主题、语言等

5. 如何切换引擎?

即使你安装的是 RapidOCR 版本,也可以手动添加 PaddleOCR 插件(反之亦然):

  1. 下载对应引擎插件包:Umi-OCR_plugins
  2. 放入 UmiOCR-data/plugins/ 目录
  3. 全局设置 → OCR 引擎 中切换

🔁 这意味着:你不需要安装两个版本,只需一个主程序 + 多个插件即可自由切换!


总结:如何选择?

使用场景推荐版本
日常办公、学生笔记、清晰截图PaddleOCR 版本(更快更准)
老旧电脑、低配设备、追求轻量RapidOCR 版本(更省资源)
想灵活切换引擎安装任意一个 + 手动添加插件

📌 Scoop 安装命令参考

# 安装 RapidOCR 版本(默认)
scoop install extras/umi-ocr

# 安装 PaddleOCR 版本
scoop install extras/umi-ocr-paddle
下载地址
github
Github
密码:无
本地下载
OSBox
密码:无
📘 教程(Tutorials)🖥️ 软件使用教程(Software Usage Tutorials)🪟 Windows 系统安装教程(Windows Installation Guide)

大白菜U盘 无捆绑系统安装教程

2025-10-11 15:28:16

☁️ 云服务与协作(Cloud & Collaboration)🗂️软件推荐 Software🧪 实验性/小众工具(Niche & Experimental)

File Transfer Server

2025-10-17 9:56:54

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索