首页 理论教育 使用文字识别软件输入文档

使用文字识别软件输入文档

时间:2022-02-27 理论教育 版权反馈
【摘要】:文字识别软件OCR是为满足书籍、报纸杂志、报表票据、公文档案等录入需求而设计的软件系统。OCR软件的种类虽然很多,但其使用方法大同小异。利用OCR软件进行文字识别,可直接在OCR软件中扫描文稿,操作步骤如下:◆扫描文稿如果是Word文件,应选择文本文件“.TXT”保存类型,同时也选择识别内容到外编辑器。扫描后的文档图像出现在OCR软件视窗中。

文字识别软件OCR是为满足书籍、报纸杂志、报表票据公文档案等录入需求而设计的软件系统。 信息资料需要转化成电子文档以便于各种应用及管理,OCR软件能满足海量录入需求。

一、OCR系统的组成

1.OCR界面

OCR软件界面主要是由扫描处理模块、版面划分模块、文字识别模块和文字编辑模块4个部分组成,如下图所示。

2.OCR工具栏

二、OCR软件的使用方法

OCR软件的种类虽然很多,但其使用方法大同小异。 首先要对文稿进行扫描,然后用OCR进行识别。 利用OCR软件进行文字识别,可直接在OCR软件中扫描文稿,操作步骤如下:

(1)连接扫描仪的电源线、数据线后开启扫描仪电源。

(2)打开OCR识别软件,如下图打开“尚书七号OCR”软件。

(3)将需扫描的文稿放入扫描仪中。

(4)单击工具栏的“扫描”工具,或选择文件菜单中的“扫描”命令。

(5)扫描前设置原稿、扫描类型、输出目的、输出比例,如下图所示。

(6)扫描后选择“自动倾斜校正”,纠正扫描文稿的倾斜位置,如下图所示。

(7)准备识别:选择文件范围、进行版面分析、选择修改属性,如下图所示。

(8)开始识别,如下图所示。

(9)对照比较校正,如下图所示。

(10)识别后输出文稿的保存类型、存放位置,可选择识别内容到外编辑器,如下图所示。

友情提示

◆扫描文稿如果是Word文件,应选择文本文件“∗.TXT”保存类型,同时也选择识别内容到外编辑器。 在Microsoft Word打开比较、校正。

(11)识别后的内容在保存的文件路径里打开文件,进行编辑排版,如下图所示。

友情提示

◆扫描文稿在同一页上有文字、表格时,通过选择范围分别识别文字和表格。

◆识别的文稿文件类型也可为∗.BMP,∗.JPG,∗.TIF等文件,如下图所示。

◆将要扫描的文稿放在扫描仪的玻璃面上,使要扫描的一面朝向扫描仪的玻璃面并让文稿的上端朝下,与标尺边缘对齐,再将扫描仪盖上,即可准备扫描。 单击视窗中的“扫描”键,即可进入扫描驱动软件进行扫描。 注意:分辨率可设置在200~400dpi,对于文本文档,调整亮度适中很关键。 扫描后的文档图像出现在OCR软件视窗中。

清晰度较差的文稿可选用高级控制面板扫描,达到好的输出效果。

【做一做】

使用OCR识别文字,写出其操作步骤:

第1步______________________________________________

第2步______________________________________________

第3步______________________________________________

第4步______________________________________________

第5步______________________________________________

第6步______________________________________________

第7步______________________________________________

第8步______________________________________________

【知识窗】

选中“输出到外部编辑器”,则系统在保存文件的同时调入相应的文字处理程序。

•TXT格式只保存文字、表格部分,不保存图片;

•RTF格式可以用Word、WPS等文字处理软件编辑;

•HTML格式可以输出到IE等网络浏览器;

•XLS格式可以用Excel等软件编辑。

【做一做】

用OCR软件扫描我们这本书的文字、图片和表格,然后进行编辑保存。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈