无图版
风格切换
帮助
Home首页
论坛首页
登录
注册
讨论区
推荐
搜索
社区服务
银行
用户名
热门版块:
175豆客CS作弊器交易中心
『 电脑技术支持 』
◆- ┈┋ 事 务 中 心 ┋┈
『网游外挂』
『特种部队』
〖 论坛公告 〗
love
wind
用户中心首页
编辑个人资料
查看个人资料
好友列表
用户权限查看
积分管理
积分转换
特殊组购买
收藏夹
我的主题
基本统计信息
到访IP统计
管理团队
管理统计
在线统计
会员排行
版块排行
帖子排行
个人首页
我的收藏
好友近况
『 电脑技术支持 』
用OCR软件进行扫描识别文本的技巧
●论坛动态帖●
♀论坛新帖.新回复♀
◆- ┈┋ 事 务 中 心 ┋┈
【论坛在线聊天室】
论坛事务所
论坛广告宣传,免费加入VIP
◆- ≡ 论坛公告
〖 论坛公告 〗
〖公告〗加入VIP会员向本站汇款方法
购买175pt,豆客作弊器csol作弊器请于客服联系,QQ130119281
≡ 175豆客作弊器下载区
〖175豆客作弊器自由发布/技术讨论区〗
〖175豆客CS外挂软件和客户端下载〗
175豆客CS作弊器交易中心
[战地之王][反恐行动][特种部队][DOD胜利之日][BF2(战地2)][反恐起源]
『战地之王外挂』
『反恐行动外挂』
『特种部队』
新特种部队
『网游外挂』
『胜利之日』
『BF2(战地2)』
反恐起源CS.S
尊贵VIP下载区——客服QQ:130119281
〖 顶级作弊器下载区 〗
〖顶级作弊器/程序发布区〗
〖 用户脚本下载区 〗
〖 用户问题解答区 〗
≡ 作弊器研讨区
〖 作弊器开发研讨区 〗
┈┋站内事务┋┈ ≡
〖 站内事务 〗
┈┋ 休 闲 娱 乐 ┋┈
≮经典影视≯
≮ 极 限 贴 图 ≯
≮ 影 视 动 漫 ≯
≮ 闲 聊 广 场 ≯
≮ 音 乐 在 线 听,MP3下载,免费下载≯
-=电脑技术,软件发布=-
『 电脑技术支持 』
『 最新软件工具发布 』
【CS1.6175pt豆客平台专区】
【CS1.6175pt豆客平台专区】
aoe豆客v3.24作弊器豆客v3.24外挂豆客v3.23最新透视作弊器豆客v3.23最新透视外挂
175pt5.1.4.8作弊器175pt5.1.4.8外挂175pt5.1.4.7最新透视作弊器175pt5.1.4.7最新外挂
各类源码:辅助源码 软件源码 商业源码 VIP源码
普及信息技术、提升职业技能、学习安全攻防、卫我网络长城
热烈欢迎中国红客联盟华南分组加盟本站
承接软件开发、程序破解(包含基于VM技术加密的破解)、代码审核 源码出售
各种社工库源码的评析 想做库的一定来看看
万挂编程-国内最大的游戏辅助门户网站
逆向工程、协议分析、漏洞研究相关资料大全
华南红客帝国技术论坛和本站强强联合,提供顶级辅助下载
最全最新版本网游辅助点我下载
专业的编程论坛 国内最火爆的万挂编程C语言论坛
上一主题
下一主题
新 帖
复制链接
|
浏览器收藏
|
打印
天蝎飞鹰
175pt作弊器.豆客作弊器
级别: 总版主
作者资料
发送短消息
加为好友
UID:
7
精华:
0
发帖:
10484
威望:
121419 点
金钱:
121590 RMB
贡献值:
0 点
注册时间:
2008-08-23
最后登录:
2016-09-19
楼主
发表于: 2011-07-11 21:15
只看楼主
|
小
中
大
用OCR软件进行扫描识别文本的技巧
用OCR软件进行扫描识别文本的技巧
扫描仪的一个重要功能就是通过OCR软件(即文字识别软件)将扫描后的文字图像转换成文本格式的文件,使文字处理软件能够调用处理。这样可以大大提高文字录入速度,极大地提高工作效率。目前,文字识别软件主要有《尚书OCR》、《汉王OCR》和《紫光OCR》等几种。
不过,我们在进行文字识别时经常会遇到识别率低的问题,其原因除了被识别稿件有问题外,主要还是我们没有掌握好扫描及OCR识别软件的使用技巧。那么进行文字识别时有哪些技巧呢?
一、根据识别稿的质量进行处理
进行扫描识别时,在可能的情况下应尽量选择清晰度与洁净度都很高的识别稿,识别稿的清晰度与洁净度的不同会使扫描后的识别率有很大差距。对一般的印刷稿、打印稿等质量较好的文稿进行识别,只要掌握好方法与技巧,其识别率一般可达到98%以上。而对报纸、杂志等清晰度不佳的原稿进行识别,无论使用何种识别软件都难以达到很高的识别率。
1.对一些带有下划线、分隔线等符号的文本原稿,有些OCR软件是识别不出的,一般会出现乱码。如果必须扫描带有这些符号的原稿,一是要确保使用的识别软件能够识别这些符号。二是使用工具擦掉这些特殊符号,使识别软件能正确识别这些文字。
如果扫描后的文档中含有OCR软件不能识别的图像、图形和一些特殊符号,可以考虑使用“擦拭”工具将文档中的图像、图形和一些特殊符号擦除,同时将图像上一些杂点也一并去除。使图像中除了文字没有多余的东西,这可以大大提高识别率并减少识别后的修改工作。
2.在扫描识别报纸或纸张较薄的文稿时,扫描时稿件背面的文字通常会透过纸张造成错字或乱码,使识别率大大降低。在对这类原稿扫描时,我们可以在原稿的背面覆盖一张黑纸,在进行正式扫描时,适当增加扫描对比度或亮度,即可有效提高识别率。
3.对于一些图文混排的原稿,扫描成一幅图像进行全区识别会严重影响OCR软件的识别率。我们可以根据实际情况将扫描后的版面切分成多个区域后再识别,切分区域的原则是:将图形、图像排除在区域之外(图1),尽量把文字字体、字号一致的划在一个区域内,不要嫌这个过程烦琐而选用自动切分区域,手动选取扫描区域会有更好识别效果,还应注意各识别区域不能有交叉情况。
二、扫描识别稿的操作技巧
1.首先要保持工作环境的清洁,扫描仪的玻璃板以及若干个反光镜片及镜头,其中任何一部分脏污都会影响扫描文字图像的效果。因此,保持扫描仪的清洁是确保文字图像扫描质量及识别率较高的重要前提。
2.扫描仪在刚开启时,光源的稳定性较差,而且光源的色温也没有达到正常工作所需的色温,所以开始扫描以前最好先让扫描仪预热一段时间。
3.在放置扫描原稿时,把扫描的文字材料摆放在扫描起始线正中,可以最大限度地避免由于光学透镜导致的失真而影响识别率。
4.扫描后的文字图像经常会有一定角度的倾斜,出现这种情况必须在扫描后使用自动或手动旋转工具进行纠正,OCR软件一般都设有自动纠偏和手动纠偏工具。否则OCR识别软件会将水平笔画当作斜笔画处理,识别率会下降很多。如果扫描后的文字图像倾斜角度超过15°,倾斜校正会产生较大的失真和误差,从而严重影响识别率,这种情况建议摆正原稿重新扫描。
三、扫描参数的设置
扫描参数的设置主要包括分辨率的设置及亮度和对比度的设置。
1.一般来讲,分辨率越高识别率也就会越高。但这也不是绝对的,对于一些过大过粗的字体,设置过高的分辨率,识别率可能会降低,而且设置高分辨率后,扫描速度会大大降低。根据实际经验,1、2、3号字的文稿推荐使用200dpi,4、小4、5号字的文稿推荐使用300dpi,小5、6号字的文稿推荐使用400dpi,7、8号字的文稿推荐使用600dpi
2.扫描时适当地调整好亮度和对比度值,对识别率的高低影响很大,在进行扫描亮度和对比度的设定时(图3),以扫描后的图像中文字的笔画较细、均匀,且没有明显断点为准。如果扫描后的文字图像存在黑点、黑斑或文字线条很粗很黑,分不清笔画,说明亮度值太小,应该增加亮度值再重新扫描。如果文字线条凹凸不平,有断线甚至图像中汉字轮廓严重残缺时,说明亮度值太大,应减小亮度后再重新扫描。如果要扫描质量比较差的文稿,比如报纸,扫描出的图像可能会出现大量的黑点,而且在字体的笔画上也会出现粘连现象,为获得较好的识别结果,必须仔细进行亮度和对比度值的调整,反复扫描多次才能获得比较理想的效果。
四、识别后的处理工作
1.文字校正
文字校正是OCR识别工作中比较烦琐的一步。一般OCR软件对可能出现错误的文字,会显示出蓝色标记,请用户确认。但在没有提示出错的地方,也有可能出错。所以大家在校对时应该通读一遍,以提高文字录入的准确率。
2.识别后文本的保存
如果把识别后的文本简单复制粘贴到Word中保存处理,就需要去掉多余的硬回车,这样会非常麻烦。正确方法是:先将识别后的文本存盘,在存盘时设置为软回车就行了。对于《紫光OCR》,则需要在识别完成后,选择文件菜单下的导出命令,将存储类型选为TXT,段内回车字符选为无。注意:一定不要直接存盘,否则不能自动去掉文章的硬回车。《尚书OCR》、《汉王OCR》和《紫光OCR》都提供了段内去除硬回车的功能。
这款作弊器希望大家好好用!不要乱给别人。自己用的时候藏好。别叫人给你分享了。呵呵~学作弊就注册VIP会员~精彩多多~爆头多多~装比多多~呵呵回复以后转到第1页可看到作弊器文件~不是VIP的请注册后便可以下载到你期待以久的作弊器了。祝你们玩的开心。
更多更全的作弊器请访问http://www.dcoosxecd.com 作弊器为200元终身,客服QQ:130119281 QQ361639639 QQ 493889523 QQ 626681522 QQ 3159466328 也可以来电话和信息和本人联系:18708222829 )
汇款地址:
①汇款金额:200.XX元
②收款人中国工商银行牡丹灵通卡号码(19位数字)
9558 8223 0700 0382512
③收款人姓名:刘宇航
①中国农业银行金穗通宝卡(19位数字):
9559 9841 1270 1095416
②收款人姓名:刘宇航
作弊器随反作弊软件更新而更新,反作弊软件更新后最迟1-2天发布最新作弊器,您可以随时来下载,让你体验最快最强的作弊效果
顶端
回复
引用
分享
上一主题
下一主题
『 电脑技术支持 』