type
status
date
slug
summary
tags
category
icon
password
资源信息
OCRmyPDF是一个 Python 应用程序和库,它为 PDF 中的图像添加文本“层”,使扫描的图像 PDF 可搜索。它使用 OCR 来猜测图像中包含的文本。OCRmyPDF还支持允许自定义其处理步骤的插件,并且它对包含扫描图像和不需要文本识别的“原生数字”内容的 PDF 具有很高的容忍度。
主要特点
- 从常规 PDF生成可搜索的PDF/A文件
- 将 OCR 文本准确放置在图像下方,以方便复制/粘贴
- 保持原始嵌入图像的精确分辨率
- 如果可能,请将 OCR 信息作为“无损”操作插入,而不会破坏任何其他内容
- 优化 PDF 图像,通常生成比输入文件更小的文件
- 如果需要,在执行 OCR 之前校正倾斜和/或清洁图像
- 验证输入和输出文件
- 将工作分配到所有可用的 CPU 核心上
- 使用Tesseract OCR引擎识别100多种语言
- 确保您的私人数据保持私密。
- 适当扩展以处理包含数千页的文件。
- 经过数百万份 PDF 的实战测试。


资源地址
如果上面下载链接失效请进群组获取:https://t.me/xiaomoshare
更多资源
1、更多好资源,尽在小默分享站
2、站长的零基础零元建站培训班劲爆活动:通过下面链接成功加入培训班的学员,站长承诺,通过学习或站长的指导没有搭建出属于自己的网站的一律全额退款,加入链接:https://mall.17yong.xyz/?cid=2&mid=2
3、国内可靠的合租平台,各种AI工具【ChatGPT、MJ】、影视【奈飞、Spotify、Youtube、Disney+、HBO】流媒体服务,【优惠码:xiaomook】:https://nf.video/prm0O

4、获取其他资源请扫码加站长VX

- 作者:小默
- 链接:https://www.xiaomook.com//software/608
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。