万网网站到期后续费一年多少钱,赞友商城电商平台排名第几,模板网站建设报价,小程序定制收费0 前言
今天在国产电脑上办公#xff0c;需要从一些PDF文件中复制文字内容#xff0c;但是这些PDF文件是图片转换生成的#xff0c;不支持文字选择和复制#xff0c;除了手工输入#xff0c;我们还可以使用OCR。 1 什么是OCR
OCR #xff08;Optical Character Recogni…0 前言
今天在国产电脑上办公需要从一些PDF文件中复制文字内容但是这些PDF文件是图片转换生成的不支持文字选择和复制除了手工输入我们还可以使用OCR。 1 什么是OCR
OCR Optical Character Recognition光学字符识别最初是指电子设备例如扫描仪或数码相机检查纸上打印的字符通过检测暗、亮的模式确定其形状然后用字符识别方法将形状翻译成计算机文字的过程随着软件功能的发展也可以将图片、PDF等电子文件的文字转换成为黑白点阵的图像文件并通过识别软件将图像中的文字转换成文本格式供文字处理软件进一步编辑加工的技术。
现在不管是Windows系统还是基于Linux的系统都提供了具有OCR功能的软件。
2 Windows平台上的OCR软件
在Windows平台上有很多OCR软件比较常见和常用的有 Adobe Acrobat ProAdobe提供的全功能PDF编辑和处理工具其中包含OCR功能。 ABBYY FineReader一款功能强大的OCR软件可以将扫描的文档、PDF文件等转换为可编辑的文本格式。 Omnipage Ultimate识别准确率较高的OCR软件支持批量处理和自动化的工作流程。 Readiris适用于扫描仪和多功能设备的OCR软件可以将纸质文档转换为可编辑的电子文件。 Nitro Pro一款PDF编辑和管理工具也具备OCR功能。 FreeOCR一款免费的OCR软件虽然功能相对较简单但适合个人和小型项目使用。 一些扫描仪也配备了OCR软件比如汉王OCR。
这些软件都可以将扫描的文档或图片中的文字识别并转换为可编辑的文本格式。用户可以根据自己的需求和预算选择适合自己的OCR软件。
不仅如此腾讯的QQ、微信都提供了对图片的文字提取功能。
免费开源的图片浏览软件irfanView也以插件的形式提供了OCR功能不过只能识别英文。
因此在Windows平台上使用OCR技术来提取图片或电子文档中的文字非常方便。
3 银河麒麟系统上的OCR软件
银河麒麟系统上的QQ、微信目前还不能像在Windows平台上一样支持对图片中文字的提取。
打开银河麒麟系统的软件商店直接搜索OCR结果如下 目前有5款软件。
3.1 OCRFeeder
OCRFeeder 是 GNOME 桌面下的一个开源 OCR 套件。可将纸质或者图形文档转成电子文档。 看起来不错可惜安装后运行不了。
从软件下面的评论来看不止我一个人遇到这个问题。 3.2 The OCR-A
这只是一种字体不是一个软件。所以安装后只会显示“已安装”。 3.3 成者采编王图像编辑PDF/OFD扫描及文字识别OCR软件 安装运行打开上面这张照片点击框选OCR功能按钮选择图中的软件介绍这部分文字 在图片右侧显示出了OCR的结果 软件介绍 成者采编王是专业的图像文档编辑和ocr识别软件 成者采编王图像编辑PDF/OFD扫描打印及文字识别OCR软件是专业的图像处理和ocr识别软件是成者为国产化平台倾力打造的桌面端办公应用软件利用图像算法的优势实现快捷的图像处理方式和高效的批量图片处理和准确的文字识别功能。集成了标准的SANE扫描仪/摄像头类拍摄仪采集功能实现数据的采集录入。同时集成了标准打印文档模块为日常办公提供便利。软件使用自研“成者远识”文字识别系统引擎通过机器学习AI算法完成对海量数据的采样和标定可快速批量的将图片转化成文字对中准确识别率高。支持xtdocx双层pdfxlsx的格式导出可轻松完成文字的编辑、检索等工作完成纸质文件的无纸化转换。支持文件夹快速切换图像缩略图预览支持多文件选取支持批量功能操作如颜色处理、旋转、裁剪、规格化、重命名文字识别等功一个安装包解决图像处理和文字识别的问题以极小体积的本地数据库完成对文字的识别无需互联网即可使用安全应用防止数据泄露。专业的UI设计及交互设计团队精心打造每一个细节让用户越用越流畅越便捷。软件版本会持续送代功能和体验持续升级更新。预置白纸印章、证件底纹等颜色模式实现快速切换。效率高效果好 识别率不错。
这个软件的评论区里也有不少用户发表的评论 就是没注册不知道使用时是否存在功能限制。 3.4 截屏OCR 从软件介绍来看似乎不错。
安装后运行提示要在应用商店下载依赖系统电子档案管理系统。 3.5 Online OCR网页版 从软件介绍来看这是一个在线OCR文字识别软件从PDF或图片支持JPG.BMP中识别提取出文字并将其转换成Word/ExceUTXT文档。
安装后打开会使用浏览器打开网址免费在线OCR - 将PDF转换为Word或图像转换为文本 网页中提示了操作步骤
第一步选择并上传文件
第二步选择识别语言和输出文件格式我们要识别简体中文的话可以选择 CHINESESMPLIFIED
第三步识别并转换
对于一般的文件可以上传和识别
如果是敏感的文件就不能上传和识别了。
4 小结
经过测试在银河麒麟系统软件商店中搜索出了5个OCR软件其中一个The OCR-A实际是字体而非软件所以实际上只有4个在这4个软件中OCRFeeder运行不了截屏OCR不能单独使用Online OCR网页版需要连接互联网而且不能处理敏感信息所以真正可以放心使用的只有成者采编王图像编辑PDF/OFD扫描及文字识别OCR软件。