论文部分内容阅读
脱机手写体汉字识别属于超多类模式识别问题,是模式识别领域中的难题之一。目前,机器识别的方法中信息流多是前向开环的,其开环的特点决定了系统性能存在着显著的识别正确率与拒识率之间的矛盾。本文模仿人脑辨识汉字时反复推敲和比对的反馈行为并结合智能控制技术,提出了一种具有反馈机制的智能脱机手写体汉字识别方法,并构建了相应的运行机制,这对促进机器识别方法的发展具有一定的理论意义,为探索提高汉字识别系统性能提供了一个新途径。本文主要研究工作如下:1.构建了一种具有反馈机制的三层递阶式智能脱机手写体汉字识别系统。三层结构分别为识别输出层、反馈层和决策层,定义了各层的功能,并给出了基于该结构下的运行机制,建立了具有反馈循环校正机制的智能脱机手写体汉字识别系统。2.自定义了四种包含随机分析的统计广义识字误差,并给出它们的表征方法和获取算法。其中,统计广义识字误差1得到待识别汉字的图像与识别结果的图像的相应粗比对信息特征差;统计广义识字误差2得到待识别汉字的图像与识别结果的图像的相应细比对信息特征差。通过对它们的分析,可为反馈校正决策机制提供定性定量的依据。其中,统计广义识字误差3得到细比对误差的比对字符差的信息特征;统计广义识字误差4得到每轮循环识别的细比对误差的比对趋势差信息特征。通过对它们的分析,可为反馈校正决策运行机制提供依据。3.建立了两种用于反馈调节运行的识字机制。模拟人脑反复斟酌思考的反馈思维过程,将细比对误差的比对趋势差作为反馈循环调节的依据,对该轮识别的识别效果进行评判并依此对识别循环进行调整;采用多识别器集成智能识别方案,根据细比对误差的字符比对差作为选择调节的依据,对新一轮识别器的选择做出判别。反馈控制思想与智能控制技术的结合使得运行决策机制更加合理及完善。采用SCUT-IRAC HCCLIB手写体汉字图像样本数据库中的汉字样本对系统进行了仿真实验。运用VC++及MATLAB7.3仿真软件,选取字库中400个手写体汉字,对本文所研究的具有反馈机制的智能脱机手写体汉字识别系统进行了验证实验。实验结果表明了该方法是有效可行的。