论文部分内容阅读
摘要:本文对银行的票据自动识别技术及其进展进行了论述。主要是票据自动识别系统的构建,包括扫描输入模块和识别模块。介绍OCR在票据自动识别系统中的应用,介绍一些最新票据识别算法,主要是通用票据识别系统中的字符切分方法、基于特征线检取的票据识别算法和滴水算法。
关键词:票据识别;OCR;字符切分
中图分类号:TP311.52文献标识码:A文章编号:1007-9599 (2010) 09-0000-04
Research on Automatical Cheque Identification Technology
Lin Zhaozong
(Guangdong Electric Power Industry School,Education&Training Center of Guangdong Power Grid Corporation,Guangzhou510520,China)
Abstract:In this paper,bank notes automatic identification technology and its progress are discussed.Automatic identification system is mainly the construction bills,including the scan input module and the Identity Module.OCR paper describes the application of automatic identification system to introduce some of the latest bills recognition algorithm. General Notes recognition system are mainly in the character segmentation method,based on characteristic line of the bills seized recognition algorithms and drip method.
Keywords:Identification notes;OCR;Character segmentation
一、概述
現代社会的各种商业活动,特别是银行方面,广泛使用各种票据,特别是支票的使用更加广泛。随着现代社会的发展,人们越来越多的使用支票来代替现金进行消费和结算。支票的广泛使,必然导致支票的存储、管理以及支票信息的查找变得愈加难。计算机逐渐普及,使得使用电脑管理支票成为可能,但足人工输入支票信息需耗费大量的时间和人力,因此没计一个智能系统自动识别支票,从中提取有用信息,并按照一定的分类规则保存到数据库提供用广大用户检索查询,最大程度上减少用户的工作量就显得很有必要。在这些工作的整体规划中,基础是票据识别系统的构建。前提是OCR技术的保证。关键是票据识别算法和规则数据库的优化。
票据识别系统主要由两个模块组成。如图(图1-1)所示。
主要的任务一个是依据OCR技术,将所要识别的票据图像化,并抽取其中的信息。另外一个是将提取的信息放入数据库,再根据相关的算法进行识别。
二、自动识别系统构建
识别模块中,其过程模块又可以细分。如图(图2-1)所示。
图像预处理模块对从扫描仪输入的票据图像进行二值化。版面分析模块从图像中抽取需要的图像,去除噪音。字符识别模块对图像进行识别。信息分类模块在关键字和规则数据库的约束下,对识别出来的数据进行分类,并对信息不全和个别错别字进行自动纠错。修改编辑模块对照输入图像和识别结果,进行手工修改纠错。
版面分析模块是指对于读入的票据图像进行版面分析,包括倾斜校正、去除噪音、抽取信息区域、切分文字行等。对于简单的文档版面分析,很多文献都提出了比较有效的方法,但是对于复杂的版面,特别是像票据这样的手写体和印刷体混排,噪音干扰较强,同时又存在着大量的背景图案和底纹的特殊版面,上面这几种方法都很难取得好的效果,表现为不能有效切分手写字和印刷字,不能从背景图案和底纹中抽取有用信息。
票据识别模块对提取的信息进行行效的识别。对于中文、英文字符的识别,很多文章都提出较好的方法,并且也已经有成熟的软件产品和工具包可供使用
信息分类模块是指在识别后对所得到的文字信息进行分类,分别归入所属的域中,同时对错误字符进行纠正,最后存入数据库。一般英文支票印刷字体的信息域包括姓名、地址、银行账号等。
字符识别工具包并不能准确识别所有的印刷字,而且加上版面噪音的干扰,实际识别后得到的信息域往往不完整,如何利用规则数据库中的信息结合识别后的结果最大程度使所需域中的信息得到完整是系统中的难点。
经过前面的处理后,在后面修改编辑模块中只需要编辑或补充少数几个字符就能得到完整的域信息。
修改编辑模块利用简单友好的操作界面对识别结果手动进行编辑,这对于实际的系统应用足非常必要的。
三、OCR的使用与发展
OCR技术是一种通过扫描等光学输入方式将各种票据文字信息转变成图像信息,再利用计算机的文字识别技术对图像进行识别,最终获得图像上的文字信息的技术。在票据自动识别系统中,这是系统工作的前提条件。OCR的质量直接影响了后续的各个流程的表现。
在输入图像之后,识别系统有三个小步骤需要进行,来对图像进行处理。第一,是识别区定位,确定需要识别的区域。第二,是将目标区域的图像进行切分,输出单个的字符图像。第三,将单个的字符图像进行识别,转化为对应的文字。
在一般的银行票据中,如下图3-1所示:
第一步骤,我们知道待识别区域主要有日期、账号、身份证号、金额等。
其中:第二步骤是能否准确识别字符的关键。观察一般的银行票据。我们发现其中的需要进行字符切分的区域一般是三种情况。也就是带方框的字符、带下划线的字符和无背景图案字符3种。如图3-2所示:
分析票据3种待识别区域可知,由于带方框字符的方框对于切分提供了较多信息,因此对于带方框字符的切分应充分利用方框所提供的信息;而带下划线字符图像中下划线对于切分基本上提供不了什么信息,因此对于带下划线字符应考虑先去掉下划线,再将其看作无背景图案字符进行切分。对于3类待识别区域,其切分方法主要有两种:对于带方框字符采用基于改进的图像分割的分裂一合并模型的字符切分算法;对于带下划线和无背景图案字符采用基于线性规划的切分方法。
(一)基于改进的图像分割的分裂一合并模型的字符切分算法
对于带方框字符,由于图像中方框的上下横边的水平方向的投影具有十分突出的两个尖峰,因此,首先将待识别区域进行水平方向的投影并分析投影计算出上下边框的位置,通过图像处理技术去掉上下边框并保留字符笔划与边框的交点。同样,方框中的多条竖边的垂直投影会产生间隔距离相等、高度相等的一系列尖峰。因此,将待识别区域进行垂直投影,分析投影可计算出每条竖边的位置。记录下这些位置信息,并通过图像处理技术去掉竖边框同时尽可能保留字符笔划与边框的交点。
通过两次投影,可以计算出平均字符宽、平均字符高、平均字符间距等参数,并且通过去掉方框得到了没有边框的字符图像。接下来应用分裂合并算法进行切分。分裂合并算法是在分裂一合并一再分裂的模型上对图像进行逐步求精的一个过程。改进的分裂合并算法主要包括以下3个步骤:
1.通过图像连通域分析求得基本部件,并根据基本部件估计新平均字符宽。
2.利用求得的特征参数进行部件的合并,合并完成后对参数进行2次估計。
3.根据合并结果和估计的参数值指导对粘连块的分裂。对粘连块的分裂需要用到多种图像分割技术,比如用以边缘检测的2次差分函数,或者水平细化、轮廓跟踪等。
大多数情况下,在2次分裂后就可以取得较为满意的结果。如果2次分裂后产生一个字的部件与另一个字粘连的情形,可以考虑使用再次合并。
(二)基于线性规划的切分方法
对于带下划线的字符,由于下划线基本上不能提供字符切分所需的信息,因此应先通过图像处理去掉下划线,再将其视为无背景图案字符进行切分。通过计算其特征参数。1.笔划宽度T。2.字符倾斜度。3.平均字符宽w。再结合代价函数。就可以对字符进行切分。(注析)。
另外对于票据的观察,我们知道在票据中,有许多的直线分割各个区域,因此,专门针对直线,提出如下的一些算法来处理版面中的问题。
一幅图像CI(i,j)可以看成一个二维矩阵,直线
L={(i1,j1),(i2,j2),...,(ik,jk∈CI(i,j)
是图像Cl(i,j)的子集.票据图像中的直线具有以下特点:
1.票据图像中主要直线长度一般较长。
2.直线大多为多像素宽,一般有4-9个像素;(这里,以在实际使用中常用的扫描分辨率15Odpi为例)。
3.直线种类多,包括:实线、虚线、连续线、断续线;图像如图1所示.票据图像中的找线算法应该满足以下要求:
(1)能找多像素宽的线,因为多像素宽的线由于扫描误差会表现为一组短直线,因此要求能够把这组短直线拟合成原来的直线。
(2)能够连接由于扫描误差产生的断线。
(3)找线速度快,准确。另外,由于图像扫描过程中的偏差会造成图像倾斜,产生杂线,还有汉字、手写符号中的长线也会构成杂线,这些都会增加在票据图像中找特征直线的难度,因此要求找线算法必须具有一定的容错能力.直线是图像信息的重要组成部分,因此在图像中提取直线的研究引起了人们的高度重视,近1O年来出现了很多在图像中提取直线的算法,这些算法各有优缺点.基于Hough变换的优点是抗噪性能较好,且能连接共线的短直线,其缺点是参数难以选择且计算复杂,提取直线的分辨率较低。启发式连接算法的最大问题是,对边缘检测的结果比较敏感且容易产生断裂的短直线.Bolt等人提出的层次记号编组法能连接共线短直线,它的缺陷与Hough变换有些类似,如参数难以选择、分辨率低等.本文根据票据图像中直线的结构特点,设计了一种适用于票据图像中直线搜索的算法
在切分字符的功能模块上,由于版面的信号干扰有时候是出人意料之外的,例如由于多个印章的重叠使得某个识别区域背景色与前景色混合得无法区分,这时候,无论算法多好,都有可能会出现某个区域无法准确识别的问题。但是支票是大量使用,在使用自动识别系统的过程中积累了大量的数据,通过直方图,我们可以采用一定的算法,得出那些地方是水平线,那些地方是由于印章等造成的信号干扰。11
四、提高识别率
由于OCR技术本身的局限性,利用字符识别模块对信息区域字符进行识别,往往不能得到完整的文字信息,总是存在着这样那样的字符不能被识别的情况。所以在对信息进行分类之前,需要对这些不能识别的字符进行补充和完整。但是要对这些字符进行补充和完整,又需要先对这些信息进行分类,然后将姓名、地址、邮编等已知的信息和规则数据库中的信息进行匹配,根据这些已知的信息将缺少的信息补充完整。以上过程可用图4-1所示。
在信息分类器的发展中,一个是研究更复杂的分类器,另一个是通过融合一些已有的简单的分类器,来达到提高识别率的目的。下面介绍的就是多分类器融合的一些进展。
多分类器融合算法包括两个基本途径:多个分类器的融合,也就是将每个分类器的输出结果按照特定的融合规则进行融合来得到最终的分类结果;动态分类器选择,也就是对于特定类型的待识别模式动态选择最有可能分类正确的分类器进行分类。
分类器有一种是以方向元素为特征的最小欧式距离分类器,另一种是以标准数字样本为模板的模板匹配分类器。
利用多分类器融合方法来提高字符的识别率。通过选择合理的融合方法,获得了单个数字字符识别率99.527%的高识别率。在单个字符高识别率的基础上,针对银行票据识别系统对识别结果无误识的要求,运用多区域多内容冗余校验的方法对票据中不同部分的内容进行比对。多区域多内容比对通过的票据的识别结果完全正确,无误识,保证了识别处理结果的充分可信赖性。
另外一种提高自动识别率的方法是是将多分类器融合与容错技术相结合,如图4-2所示。
通过对多分类器融合之后的数据,再进行容错技术的纠正。可以进一不提高票据自动识别系统的识别率。
经过容错技术改进的票据自动识别系统,能够提高系统的识别率。
五、展望
在OCR中,现在把纸质文字通过扫描转化为电子文本已经并非难事,当然其前提是用扫描仪先将图文资料和文字资料进行处理,然后再输入计算机进行编辑。
但是基于传统OCR技术的扫描仪功能的单一、应用及携带不方便等弊端日益凸现,这致使人们无法实现随时随地采集文字图像,已成为OCR技术广泛普及应用的主要障碍之一。
与此同时,数码相机、摄像机、PDA、拍照手机正在进入寻常百姓家。利用这些设备拍摄的自然视觉图像与扫描仪扫出的图像不同,它往往会有焦距变化、角度形变、光线变化、背景变化等多种复杂情况出现,因此需要借助超越传统扫描仪的OCR新技术来实现这些图像的识别。
用户利用数码相机、数码摄相机或手机等设备把文章或资料拍下来之后,就可以把这些数字图像资料传入电脑,然后再通过相关识别软件,即可变成可供编辑、使用、保存的文本资料。
数码相机同扫描仪一样都是输入产品,都有信息采集的功能。目前很多用户对数码相机的应用还仅停留在拍照片,但实际上它更大的应用价值却是信息的采集,这一功能之所以没有得到广泛应用,关键就是缺乏相应的软件配合。此外,视觉图像文字识别系统还可以通过嵌入技术与拍照手机、PDA等设备亲密接触,同样轻松实现“识图认字”。
六、结束语
本文对票据自动识别系统的构建进行讨论,提出了系统的各个功能模块。系统能对一般的票据具有较高的识别率,同时提供简单的信息编辑界面,对于少数识别错误的字符用户可以手动进行改正。
针对系统中使用到的OCR技术,讨论对于图像识别中所采用的步骤和算法。这些算法在实际的应用中都有比较好的表现。针对系统应用的背景是银行等金融系统,对于系统的识别率高和出错率低的严格要求,进一步介绍了一些措施和算法,如多分类器融合以及容错技术等等。
参考文献:
[1]N.Gorski,V.Anisimov,E.Augustin,O.Baret,D.Price and J.-C.Simon,A2iA Check Reader a family of bank check recognition systems
[2]Wang Song,Ma Feng,Xia Shaowei.A Chinese bank check recognition system based on the fault tolerant technique.Department of Automation,Tsinghua University,Beijing.
[3]Wang Song,Ma Feng,Xia Shaowei,Su HuP. A Fault Tolerant Chinese Bank Check Recognition System Based on SOM Neural Networks.Department of Automation,Tsinghua University.Beijing.IBM China Research Laboratory
[4]张殿东,包常新,温尚卓.ORC技术在银行票据识别系统中的应用.山东科学,2005
[5]朱辉,唐建龙,孙广玲.多分类器融合在银行票据识别中的应用.计算机工程与应用,2003
[6]张闯,蔺志青,肖波,郭军.适用于银行票据手写数字串切分的滴水算法.北京邮电大学学报,2006
[7]吴畏,丁茂祥,郝红卫.通用票据识别系统中的字符切分方法.计算机工程与设计,2004
[8]李琥,卜佳俊,陈纯.一种新的基于特征线检取的票据识别算法.浙江大学学报,2003
[9]王林水,潘武模,史广顾,薛蜂,万宏武,张辉.自动票据识别系统.计算机工程,2005
关键词:票据识别;OCR;字符切分
中图分类号:TP311.52文献标识码:A文章编号:1007-9599 (2010) 09-0000-04
Research on Automatical Cheque Identification Technology
Lin Zhaozong
(Guangdong Electric Power Industry School,Education&Training Center of Guangdong Power Grid Corporation,Guangzhou510520,China)
Abstract:In this paper,bank notes automatic identification technology and its progress are discussed.Automatic identification system is mainly the construction bills,including the scan input module and the Identity Module.OCR paper describes the application of automatic identification system to introduce some of the latest bills recognition algorithm. General Notes recognition system are mainly in the character segmentation method,based on characteristic line of the bills seized recognition algorithms and drip method.
Keywords:Identification notes;OCR;Character segmentation
一、概述
現代社会的各种商业活动,特别是银行方面,广泛使用各种票据,特别是支票的使用更加广泛。随着现代社会的发展,人们越来越多的使用支票来代替现金进行消费和结算。支票的广泛使,必然导致支票的存储、管理以及支票信息的查找变得愈加难。计算机逐渐普及,使得使用电脑管理支票成为可能,但足人工输入支票信息需耗费大量的时间和人力,因此没计一个智能系统自动识别支票,从中提取有用信息,并按照一定的分类规则保存到数据库提供用广大用户检索查询,最大程度上减少用户的工作量就显得很有必要。在这些工作的整体规划中,基础是票据识别系统的构建。前提是OCR技术的保证。关键是票据识别算法和规则数据库的优化。
票据识别系统主要由两个模块组成。如图(图1-1)所示。
主要的任务一个是依据OCR技术,将所要识别的票据图像化,并抽取其中的信息。另外一个是将提取的信息放入数据库,再根据相关的算法进行识别。
二、自动识别系统构建
识别模块中,其过程模块又可以细分。如图(图2-1)所示。
图像预处理模块对从扫描仪输入的票据图像进行二值化。版面分析模块从图像中抽取需要的图像,去除噪音。字符识别模块对图像进行识别。信息分类模块在关键字和规则数据库的约束下,对识别出来的数据进行分类,并对信息不全和个别错别字进行自动纠错。修改编辑模块对照输入图像和识别结果,进行手工修改纠错。
版面分析模块是指对于读入的票据图像进行版面分析,包括倾斜校正、去除噪音、抽取信息区域、切分文字行等。对于简单的文档版面分析,很多文献都提出了比较有效的方法,但是对于复杂的版面,特别是像票据这样的手写体和印刷体混排,噪音干扰较强,同时又存在着大量的背景图案和底纹的特殊版面,上面这几种方法都很难取得好的效果,表现为不能有效切分手写字和印刷字,不能从背景图案和底纹中抽取有用信息。
票据识别模块对提取的信息进行行效的识别。对于中文、英文字符的识别,很多文章都提出较好的方法,并且也已经有成熟的软件产品和工具包可供使用
信息分类模块是指在识别后对所得到的文字信息进行分类,分别归入所属的域中,同时对错误字符进行纠正,最后存入数据库。一般英文支票印刷字体的信息域包括姓名、地址、银行账号等。
字符识别工具包并不能准确识别所有的印刷字,而且加上版面噪音的干扰,实际识别后得到的信息域往往不完整,如何利用规则数据库中的信息结合识别后的结果最大程度使所需域中的信息得到完整是系统中的难点。
经过前面的处理后,在后面修改编辑模块中只需要编辑或补充少数几个字符就能得到完整的域信息。
修改编辑模块利用简单友好的操作界面对识别结果手动进行编辑,这对于实际的系统应用足非常必要的。
三、OCR的使用与发展
OCR技术是一种通过扫描等光学输入方式将各种票据文字信息转变成图像信息,再利用计算机的文字识别技术对图像进行识别,最终获得图像上的文字信息的技术。在票据自动识别系统中,这是系统工作的前提条件。OCR的质量直接影响了后续的各个流程的表现。
在输入图像之后,识别系统有三个小步骤需要进行,来对图像进行处理。第一,是识别区定位,确定需要识别的区域。第二,是将目标区域的图像进行切分,输出单个的字符图像。第三,将单个的字符图像进行识别,转化为对应的文字。
在一般的银行票据中,如下图3-1所示:
第一步骤,我们知道待识别区域主要有日期、账号、身份证号、金额等。
其中:第二步骤是能否准确识别字符的关键。观察一般的银行票据。我们发现其中的需要进行字符切分的区域一般是三种情况。也就是带方框的字符、带下划线的字符和无背景图案字符3种。如图3-2所示:
分析票据3种待识别区域可知,由于带方框字符的方框对于切分提供了较多信息,因此对于带方框字符的切分应充分利用方框所提供的信息;而带下划线字符图像中下划线对于切分基本上提供不了什么信息,因此对于带下划线字符应考虑先去掉下划线,再将其看作无背景图案字符进行切分。对于3类待识别区域,其切分方法主要有两种:对于带方框字符采用基于改进的图像分割的分裂一合并模型的字符切分算法;对于带下划线和无背景图案字符采用基于线性规划的切分方法。
(一)基于改进的图像分割的分裂一合并模型的字符切分算法
对于带方框字符,由于图像中方框的上下横边的水平方向的投影具有十分突出的两个尖峰,因此,首先将待识别区域进行水平方向的投影并分析投影计算出上下边框的位置,通过图像处理技术去掉上下边框并保留字符笔划与边框的交点。同样,方框中的多条竖边的垂直投影会产生间隔距离相等、高度相等的一系列尖峰。因此,将待识别区域进行垂直投影,分析投影可计算出每条竖边的位置。记录下这些位置信息,并通过图像处理技术去掉竖边框同时尽可能保留字符笔划与边框的交点。
通过两次投影,可以计算出平均字符宽、平均字符高、平均字符间距等参数,并且通过去掉方框得到了没有边框的字符图像。接下来应用分裂合并算法进行切分。分裂合并算法是在分裂一合并一再分裂的模型上对图像进行逐步求精的一个过程。改进的分裂合并算法主要包括以下3个步骤:
1.通过图像连通域分析求得基本部件,并根据基本部件估计新平均字符宽。
2.利用求得的特征参数进行部件的合并,合并完成后对参数进行2次估計。
3.根据合并结果和估计的参数值指导对粘连块的分裂。对粘连块的分裂需要用到多种图像分割技术,比如用以边缘检测的2次差分函数,或者水平细化、轮廓跟踪等。
大多数情况下,在2次分裂后就可以取得较为满意的结果。如果2次分裂后产生一个字的部件与另一个字粘连的情形,可以考虑使用再次合并。
(二)基于线性规划的切分方法
对于带下划线的字符,由于下划线基本上不能提供字符切分所需的信息,因此应先通过图像处理去掉下划线,再将其视为无背景图案字符进行切分。通过计算其特征参数。1.笔划宽度T。2.字符倾斜度。3.平均字符宽w。再结合代价函数。就可以对字符进行切分。(注析)。
另外对于票据的观察,我们知道在票据中,有许多的直线分割各个区域,因此,专门针对直线,提出如下的一些算法来处理版面中的问题。
一幅图像CI(i,j)可以看成一个二维矩阵,直线
L={(i1,j1),(i2,j2),...,(ik,jk∈CI(i,j)
是图像Cl(i,j)的子集.票据图像中的直线具有以下特点:
1.票据图像中主要直线长度一般较长。
2.直线大多为多像素宽,一般有4-9个像素;(这里,以在实际使用中常用的扫描分辨率15Odpi为例)。
3.直线种类多,包括:实线、虚线、连续线、断续线;图像如图1所示.票据图像中的找线算法应该满足以下要求:
(1)能找多像素宽的线,因为多像素宽的线由于扫描误差会表现为一组短直线,因此要求能够把这组短直线拟合成原来的直线。
(2)能够连接由于扫描误差产生的断线。
(3)找线速度快,准确。另外,由于图像扫描过程中的偏差会造成图像倾斜,产生杂线,还有汉字、手写符号中的长线也会构成杂线,这些都会增加在票据图像中找特征直线的难度,因此要求找线算法必须具有一定的容错能力.直线是图像信息的重要组成部分,因此在图像中提取直线的研究引起了人们的高度重视,近1O年来出现了很多在图像中提取直线的算法,这些算法各有优缺点.基于Hough变换的优点是抗噪性能较好,且能连接共线的短直线,其缺点是参数难以选择且计算复杂,提取直线的分辨率较低。启发式连接算法的最大问题是,对边缘检测的结果比较敏感且容易产生断裂的短直线.Bolt等人提出的层次记号编组法能连接共线短直线,它的缺陷与Hough变换有些类似,如参数难以选择、分辨率低等.本文根据票据图像中直线的结构特点,设计了一种适用于票据图像中直线搜索的算法
在切分字符的功能模块上,由于版面的信号干扰有时候是出人意料之外的,例如由于多个印章的重叠使得某个识别区域背景色与前景色混合得无法区分,这时候,无论算法多好,都有可能会出现某个区域无法准确识别的问题。但是支票是大量使用,在使用自动识别系统的过程中积累了大量的数据,通过直方图,我们可以采用一定的算法,得出那些地方是水平线,那些地方是由于印章等造成的信号干扰。11
四、提高识别率
由于OCR技术本身的局限性,利用字符识别模块对信息区域字符进行识别,往往不能得到完整的文字信息,总是存在着这样那样的字符不能被识别的情况。所以在对信息进行分类之前,需要对这些不能识别的字符进行补充和完整。但是要对这些字符进行补充和完整,又需要先对这些信息进行分类,然后将姓名、地址、邮编等已知的信息和规则数据库中的信息进行匹配,根据这些已知的信息将缺少的信息补充完整。以上过程可用图4-1所示。
在信息分类器的发展中,一个是研究更复杂的分类器,另一个是通过融合一些已有的简单的分类器,来达到提高识别率的目的。下面介绍的就是多分类器融合的一些进展。
多分类器融合算法包括两个基本途径:多个分类器的融合,也就是将每个分类器的输出结果按照特定的融合规则进行融合来得到最终的分类结果;动态分类器选择,也就是对于特定类型的待识别模式动态选择最有可能分类正确的分类器进行分类。
分类器有一种是以方向元素为特征的最小欧式距离分类器,另一种是以标准数字样本为模板的模板匹配分类器。
利用多分类器融合方法来提高字符的识别率。通过选择合理的融合方法,获得了单个数字字符识别率99.527%的高识别率。在单个字符高识别率的基础上,针对银行票据识别系统对识别结果无误识的要求,运用多区域多内容冗余校验的方法对票据中不同部分的内容进行比对。多区域多内容比对通过的票据的识别结果完全正确,无误识,保证了识别处理结果的充分可信赖性。
另外一种提高自动识别率的方法是是将多分类器融合与容错技术相结合,如图4-2所示。
通过对多分类器融合之后的数据,再进行容错技术的纠正。可以进一不提高票据自动识别系统的识别率。
经过容错技术改进的票据自动识别系统,能够提高系统的识别率。
五、展望
在OCR中,现在把纸质文字通过扫描转化为电子文本已经并非难事,当然其前提是用扫描仪先将图文资料和文字资料进行处理,然后再输入计算机进行编辑。
但是基于传统OCR技术的扫描仪功能的单一、应用及携带不方便等弊端日益凸现,这致使人们无法实现随时随地采集文字图像,已成为OCR技术广泛普及应用的主要障碍之一。
与此同时,数码相机、摄像机、PDA、拍照手机正在进入寻常百姓家。利用这些设备拍摄的自然视觉图像与扫描仪扫出的图像不同,它往往会有焦距变化、角度形变、光线变化、背景变化等多种复杂情况出现,因此需要借助超越传统扫描仪的OCR新技术来实现这些图像的识别。
用户利用数码相机、数码摄相机或手机等设备把文章或资料拍下来之后,就可以把这些数字图像资料传入电脑,然后再通过相关识别软件,即可变成可供编辑、使用、保存的文本资料。
数码相机同扫描仪一样都是输入产品,都有信息采集的功能。目前很多用户对数码相机的应用还仅停留在拍照片,但实际上它更大的应用价值却是信息的采集,这一功能之所以没有得到广泛应用,关键就是缺乏相应的软件配合。此外,视觉图像文字识别系统还可以通过嵌入技术与拍照手机、PDA等设备亲密接触,同样轻松实现“识图认字”。
六、结束语
本文对票据自动识别系统的构建进行讨论,提出了系统的各个功能模块。系统能对一般的票据具有较高的识别率,同时提供简单的信息编辑界面,对于少数识别错误的字符用户可以手动进行改正。
针对系统中使用到的OCR技术,讨论对于图像识别中所采用的步骤和算法。这些算法在实际的应用中都有比较好的表现。针对系统应用的背景是银行等金融系统,对于系统的识别率高和出错率低的严格要求,进一步介绍了一些措施和算法,如多分类器融合以及容错技术等等。
参考文献:
[1]N.Gorski,V.Anisimov,E.Augustin,O.Baret,D.Price and J.-C.Simon,A2iA Check Reader a family of bank check recognition systems
[2]Wang Song,Ma Feng,Xia Shaowei.A Chinese bank check recognition system based on the fault tolerant technique.Department of Automation,Tsinghua University,Beijing.
[3]Wang Song,Ma Feng,Xia Shaowei,Su HuP. A Fault Tolerant Chinese Bank Check Recognition System Based on SOM Neural Networks.Department of Automation,Tsinghua University.Beijing.IBM China Research Laboratory
[4]张殿东,包常新,温尚卓.ORC技术在银行票据识别系统中的应用.山东科学,2005
[5]朱辉,唐建龙,孙广玲.多分类器融合在银行票据识别中的应用.计算机工程与应用,2003
[6]张闯,蔺志青,肖波,郭军.适用于银行票据手写数字串切分的滴水算法.北京邮电大学学报,2006
[7]吴畏,丁茂祥,郝红卫.通用票据识别系统中的字符切分方法.计算机工程与设计,2004
[8]李琥,卜佳俊,陈纯.一种新的基于特征线检取的票据识别算法.浙江大学学报,2003
[9]王林水,潘武模,史广顾,薛蜂,万宏武,张辉.自动票据识别系统.计算机工程,2005