| 网站首页 | 业界新闻 | 小组 | 威客 | 人才 | 下载频道 | 博客 | 代码贴 | 在线编程 | 编程论坛
欢迎加入我们,一同切磋技术
用户名:   
 
密 码:  
共有 2068 人关注过本帖
标题:请教文字识别与图象识别的方法
只看楼主 加入收藏
卧龙孔明
Rank: 9Rank: 9Rank: 9
等 级:贵宾
威 望:59
帖 子:3872
专家分:684
注 册:2006-10-13
结帖率:100%
收藏
 问题点数:0 回复次数:2 
请教文字识别与图象识别的方法
比如那些扫描后的图象,用一些识别软件就可以识别为汉字,还有指纹识别和照片识别等,具体用了什么算法和方法呢?
搜索更多相关主题的帖子: 图象识别 文字识别 软件 照片 
2007-08-06 16:18
一笔苍穹
Rank: 1
等 级:新手上路
帖 子:640
专家分:0
注 册:2006-5-25
收藏
得分:0 

关于文字这方面会涉及图形识别学——OCR(Optical Character Recognition光学字符识别),目前像汉王,紫光,微软等都在这方面有专门的研究单位。OCR的步骤和过程算是集大成于一体,它会用到各种图形学中的方法来获得最高的正确率,OCR是不确定性科学,百分之百的识别正确率似乎只会存在于理论上。
我简单的介绍一下OCR的一般性过程吧:

首先是提取前预处理
这个过程是将你用扫描仪、数码相机等工具将印刷品或手写品输入到电脑后,先采取一些通用的算法将这些得到的图像特征化:譬如先进行二值化或灰价化,图像的去噪和正规化及可能需要的影像矫正,还会有图文分析、字行间处理等,这个过程做的事可能最多最杂,但所用到的算法理论和技术方面都很成熟了。不过最后的文字的行间距处理就会有一些差异,有些软件可能只会简单的将文字一个个提取出来了事,完全不管之前的印刷格式,这就是一个简单的字行间距处理的实现。复杂得可能会得到印刷品的排版信息。

然后是文字特征提取
这是OCR的关键部分了,用何种方法提取会直接影响到最终正确率,这方面的论文和学术报告也最多,但主要方法一般有两种:一是统计特征,如文字区域内的黑白点数比,当文字区分成好几个区域时,这一个个区域黑白点数比之联合,就成了空间的一个数值向量,在比对时,基本的数学理论就可以应付了;另一类特征为结构的特征,如文字影像矢量化后,取得字的笔划端点、交点的数量及位置,或以笔划为特征,配合相应的比对方法比对,一般的手写输入软件的识别方法多为后者。

再就是数据库对比
不论采用上面的哪种方法进行的提取,都得有一个对比数据库进行比对,比如常用的比对方法说松弛比对法、欧式空间比对法、类神经网络比对等,这些方法也可以互补使用。

后期处理
这部分包括字词处理和人工校正。最后的结果就可以输出了。

基本上就是这些了,里面很多名词可能就是一门学科,需要花费较长时间和精力去研究。

[此贴子已经被作者于2007-8-7 8:33:56编辑过]

2007-08-06 17:52
卧龙孔明
Rank: 9Rank: 9Rank: 9
等 级:贵宾
威 望:59
帖 子:3872
专家分:684
注 册:2006-10-13
收藏
得分:0 

谢谢斑竹的细心详细的解答


My Blog: www.aiexp.info
虽然我的路是从这里开始的,但是这里不再是乐土.感谢曾经影响过,引导过,帮助过我的董凯,飞燕,leeco,starwing,Rockcarry,soft_wind等等等等.别了,BCCN.
2007-08-07 07:29
快速回复:请教文字识别与图象识别的方法
数据加载中...
 
   



关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.021857 second(s), 7 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved