利用光学文字辨识(OCR)工具进行PDF转档
透过 OCR 工具,你无须再重新设定排版格式或重新建立文档,PDF Reader 直接帮你从图档和扫描档内提取文字信息。你可以先扫描如杂志、期刊或海报等纸本印刷书籍,并配合 OCR 文字识别工具将扫描档转为可编辑的档案,你可接续运用在报告、论文或作业内容中。下列将带你了解 PDF Reader 如何使用 OCR 技术将扫描档转换为可编辑的PDF。
Mac
如何在 Mac 上利用 OCR 识别文字并转为可搜寻内文的 PDF 文档
PDF Reader 中的 OCR 文字识别功能帮你轻松辨识图档内的文字信息。您只需要汇入欲套用 OCR 转档工具的档案,PDF Reader 便可帮你处理后续所有步骤。
从扫描文档中提取文本:
- 打开扫描的 PDF 文档并点击上方选项的OCR。
- 选择欲执行OCR文字识别的页面范围。
- 您可以选择由 PDF Reader 自动侦测文档内容的语言,或手动设定符合该文件所运用的文字语言。
- 设定一目标资料夹存放转出后的档案,再选择要以可搜寻内文的PDF或是以纯文字格式汇出。
- 点击**确认(OK)**后,PDF Reader 将开始进行 OCR 转档。
从图档中提取文本:
- 进入首页分页后,再点击图档转PDF的快捷入口。
- 点击新增档案按钮后,您可以选择从 Mac 的 Finder、相机或已连结的扫描器汇入图片。
- 汇入图像后,您可以在输出设定中勾选**合并全部(Merge All)**的选项,可将所有汇入的图档合并成单一 PDF。同时,您也可以选择直接将汇入的图档直接添加到现有的PDF中。
- 欲执行 OCR,只需点击启用 OCR 的选项并设定图档内本文的语言。
- 点击「另存为PDF(Save as PDF)」按钮,PDF Reader 便会执行 OCR 转档将图像转为可搜寻文字内容的PDF。
OCR 的应用实例带你了解运作方式
OCR 的功能用途主要将纸本印刷档案转为可搜寻且编辑文本的文档。当利用 OCR 转档方式将扫描图档转换为可编辑的档案,可进一步再使用 Microsoft Office 和 Google Docs 等服务做进一步内容编辑。
省去耗时的人工步骤
无论再怎么有经验的人,手动输入资料数据偶尔还是会有出错的机率。如果仅是一个小错误,可能无伤大雅。但若错误的次数和数量过多话,除了让人容易感到沮丧外,还有可能不小心引起财务上的损失。 PDF Reader 搭配 OCR 的技术应用,帮你轻松创建可搜寻及编辑文本信息的文档,可减少重新建立档案时的人为失误!
让纸本转为可搜寻本文的档案
印刷纸本和经过扫描产生的档案多无法搜寻本文或编辑,涵盖大量的冻结且无法使用的文字信息,也因此让读者很难有效地找到特定的字辞或重要资讯。透过 OCR 转档工具,这些倍冻结的文本内容皆可转为可被读取、搜寻的信息,帮你更有效捕捉到档案内的核心内容,而这些文本信息是可以被复制且贴至其他用途上。
在无纸化生活中仍条理分明
尽管许多企业单位都已逐步将收据档案转为数位化格式,但你仍有可能在销售交易中收到纸本收据。若能将纸本收据扫描并以电子档案进行保存,仍不失为一个聪明的作法。尤其, 一般组织单位内要进行核销作业时仍需要提交收据资料,你可以利用 OCR 转档工具提取出收据内的文字信息,让你从过往的收据资料中,找到重要资讯或是用来申请保修维护的依据。
关注 KDAN
关注 KDAN 官方微博,了解最新产品资讯。