基于支持向量机的联机手写汉字识别的研究

被引量 : 2次 | 上传用户:yishu888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文字是人类进行信息交流的重要工具之一,是信息进行传播、交换和记载的重要媒介。随着科学技术的飞速发展和计算机的普及,利用计算机对汉字进行处理和识别已成为一个很重要的研究领域。另外移动数码设备等智能终端的迅速普及也加快了联机手写汉字识别技术的发展步伐,使联机手写汉字识别技术成为了汉字识别领域的一个重要的研究课题。在联机手写汉字识别技术中,统计模式识别法由于对局部噪声和微小畸变不敏感,分类性能比较稳定,所以得到了广泛的应用。但是传统的统计模式识别方法是在样本数目足够多的前提条件下进行的,也就是只有在样本数量趋于无穷大时才能达到比较好的效果。在实际问题中,一般样本数量是有限的,这样传统的统计模式识别方法都很难取得比较理想的效果。由于统计学习理论是专门为小样本设计的,所以建立在统计学习理论基础上的支持向量机能够很好的解决有限样本情况下的统计模式识别问题。因此将支持向量机理论运用于联机手写汉字的识别有重要价值。论文详细探讨和研究了联机手写汉字识别中的输入、预处理、特征提取和分类,最终实现了基于支持向量机的联机手写体汉字识别系统。具体工作如下:(1)论文概述了联机汉字识别技术的发展和现状,分析了联机手写体汉字的基本过程,分别对手写输入、预处理、特征提取、分类器、后处理和结果输出进行了介绍。(2)分析了支持向量机的原理和优点,将支持向量机应用到联机手写汉字识别中。对支持向量机的多类分类算法进行了详细分析,并且在此基础上,对联机手写汉字识别的多类分类器进行了改进。(3)运用libsvm测试工具,通过matlab实验对支持向量机算法中的关键参数惩罚因子C进行了研究,并最终确定本文所采用的惩罚因子的最优值。获得算法的优化参数后,对改进的多类分类算法进行了测试,实验数据验证了改进的多类分类算法的有效性。(4)用C++语言实现了基于支持向量机的联机手写汉字识别系统。整个系统包括手写输入模块、预处理模块、特征提取模块、训练模块、分类决策模块和输出模块。该系统通过鼠标在写字区写字,能够实时的输出识别结果,对于手写楷书汉字识别率达到96.7%。
其他文献
纽卡斯尔是英国重要煤炭工业城市,也是英国最大煤炭港口。从中世纪到现代它一直是英国重要的煤炭输出地,从15世纪起这里出产的煤炭就已享誉欧洲,有“海煤”之称。漫长的中世
开始于上世纪九十年代的以建立“现代企业制度”为目标的中国大规模公有制企业改制,道路曲折坎坷。近二十年来,这项付出了让大量城镇居民骤然陷入贫困、引发建国以来最为激烈
伊春是我国重要的国有林区之一,在2006年被国务院确定为全国唯一的国有林权制度改革试点地区。国有林权改革的最终目标是要实现森林资源质量的提高、改善林区人们的生活水平,
农村基层党组织是党的全部工作和战斗力的基础,担负着直接联系农民、组织农民,把党的路线方针政策落实到农村的重要责任。因此,农村基层党内民主制度完善直接影响着党执政基础的
彭家煌的小说创作深受契诃夫影响.从客观叙事原则、挖掘人物灵魂的叙事深度、生活印象的叙事方式、悲喜交融的叙事风格等方面加以比较分析,既可重现彭家煌独特的艺术个性,又
出于伦理学和优生遗传学的考虑,以伦理秩序和优生遗传为两大支柱,我国现行婚姻法做出了“直系血亲和三代以内旁系血亲禁止结婚”的规定。世界各国也都有类似的规定,虽然具体
2007年以来,美国次贷危机引起了一场巨大的经济危机,在对抗危机的过程中,世界主要经济体都采用了宽松的货币政策来应对危机,导致了全球性的流动性过剩,大宗商品期货价格由于
XBRL的快速发展引发了中国会计信息化领域新一轮的研究热潮,但在其推广过程中也出现了一些问题和阻碍。但,XBRL是一种具有很多优点的商业报告语言,随着支持XBRL运行的相关技
现代制造技术具有宽泛性和综合性两大特征,是衡量一个国家综合实力的重要方面.我国在新材料、新工艺和新观念等方面与发达国家相比还存在一定差距.今后,觋代制造技术将朝着无
期刊
~~
随着油田进入高含水后期开发阶段,综合含水多在90%以上,剩余油分布更加零散、复杂,挖潜难度越来越大。实验和实际资料表明,在水驱开发后期及聚驱开发阶段,采出程度只有53%左