- 存盘的注意事项
-
发布时间:2009-11-23 16:42:30
发布时间:2009-11-23 16:42:30
一般文件 普通文章可以在识别后,直接存储为*.TXT文件,效果同普通打字输入是一样的。 2、版面恢复 如果是表格或者是多栏文章,最好存为*.rtf文件。具体方法是(以表格为例):识别后,在“文件”菜单内选择“导出”命令,选择*.rtf文件格式,起文件名存盘。而后在WORD 97内直接打开该RTF文件,可以进行进一步编辑和打印等操作。 3、识别后的表格恢复EXCEL电子表格形式 (1)根据需要,用户往往要将识别后的表格转为电子表格,以便在以后调入其他应用软件内使用。这是可以实现的,具体方法如下:按照正常表格识别及其存盘(*.RTF文件),自word97内调出该文件,进行校对和修改;而后另存为*.htm文件;再从EXCEL内调出已经存好的*.htm文件,选择另存为*.xls文件即可将该表格转换成了EXCEL表格。 (2)以“复制”和“粘贴”法进行表格转换:在WORD内,单击点选所要转换的表格,自“表格”内执行“选定表格”;自“编辑”内选择“复制”,将表格复制到剪贴板上;启动EXCEL工作表状态,光标移动到插入的地方,自“编辑”菜单内选择“粘贴”即可将表格复制到了所需位置,存盘后,形成EXCEL表格。 四、多页批识别功能 若需识别的文章有多页组成,使用OCR的批量识别功能十分方便。首先将多页文件以TIF的格式按页面顺序依次扫描后存盘。而后再打开它们,一次性进行批量识别,好处是速度快,效率高。(要求:文件版面不可太过复杂,页数根据计算机配置适量进行多页批量识别) 批量识别的方法: 1、 启动紫光OCR,选择“打开”文件命令。 2、 在“打开”对话框中,勾选右下角“[V]打开多页”选框,出现下拉界面。 3、 再上栏中按顺序依次选择文件名,而后选择“增加”,文件随即加入下栏内。 4、 选择完毕,执行“打开”命令。 5、 根据需要,选择文件的格式及字体。 6、 自“命令”菜单内,选择“识别所有页”。 7、 待全部识别完成后,选择退出标记,关闭OCR7.5。 8、 出现“关闭所有文件”窗口后,勾选“合并所有结果文件”,点按“合并为”按钮,将合并后的文件以TXT文件格式定义,起文件名后,点“保存”,退回到“关闭所有文件”窗口。 9、 其余项目根据需要选或不选,并点“确定”,文件识别及合并完毕。 对识别与合并后的文件进行编辑: 1、 启动WORD。 2、 选择“打开”文件,找到所需编辑的文件后,点“打开”。 3、 自“格式”菜单内,选择“自动套用格式”。 4、 选择“现在自动套用格式”(默认“常规文档”),选择“确定”。 5、 根据需要,做手动调整(段落、行间距、缩进等)。 6、 进行重新排版编辑、存盘或打印。 常见问题: 识别后出现乱码 1) 分辨率设定太低,一般应设定为300dpi。 2) 扫描时误设定了镜像,将文字扫描反了。 3) 原稿不清(如传真件、油印试卷、报纸等),若是报纸可使用调节临界值或亮度以得到较好的扫描效果并提高识别率。 4) 设定识别模式不对(纯英文、繁体多体等)。 不识别 1) 是否扫描结果为黑底白字。 2) 是否含有图形、表格等。 3) 是否版面分析做的不正确(横排正文、竖排正文、表格、图形等)。 4) 表格过于复杂会造成识别一半或不识别等错误。 OCR在扫描时报“非法操作” 1) 是否扫描时设置为“彩色或灰度”方式,OCR只能设定“黑白”方式进行文字扫描。 2) OCR的版本是否为3.5。 4.OCR识别繁体字得到简体字而非繁体字? 请在select znner-coder种选择GBK-code(All China) 5.OCR扫描时,报“装入TWAIN.dll错误” 1) 使用的是否为紫光扫描仪。 2) 是否未安装扫描仪的驱动。 6.退不出OCR? 在退出OCR的窗口中是否将“合并所有结果文件”或“以新文件命名”选中,而未命名。