论文部分内容阅读
工业标牌包含许多重要的信息,广泛地应用于各种机电产品中,是企业进行生产管理、质量控制和产品跟踪的重要载体。进行工业标牌的自动识别研究对于提高企业的信息化水平具有重要的意义。工业标牌中的字符分为印刷字符和压印凹凸字符,后者是识别的重点和难点。因为压印凹凸字符是“无色差”字符,和其他字符识别有本质的区别,现有的字符识别研究成果不适合于压印凹凸字符,必须研究与其相适应的识别方法。“环形光源图像”压印凹凸字符和“直接CCD图像”压印凹凸字符是两种通过不同方法得到的压印字符图像。前者特点是图像效果较好,但图像获取过程复杂,且图像效果不太稳定;后者则图像获取容易,但图像效果不理想。图像特点决定了图像处理方法和字符识别算法。文中分别采用不同方法对这两种压印字符进行了识别研究。针对“环形光源图像”压印字符尺寸小,提取字符内部结构困难,但字符外围轮廓清晰的特点,提出一种只通过字符外形轮廓进行字符识别的新方法。构建了基于外形轮廓的压印字符识别的框架,研究了字符轮廓提取、轮廓识别的具体方法,分析了存在的问题并给出了解决途径。研究了压印字符外形轮廓的提取方法。针对轮廓提取中经常出现的出现的边缘断裂问题,提出了一种边缘修补方法。采用二阶梯度图作为模板,采用边界跟踪作为工具来实现断裂边缘的修补。研究表明,该方法对于较大断裂的边缘修补具有良好的效果。研究了字符轮廓特征的提取方法。研究了轮廓矩的特征提取和计算方法。研究了实现压印字符重建所需要的Fourier描述子的个数。并为相应的特征建立了与之相适合的神经网络。实验表明,尽管两种特征都具有平移、旋转、缩放不变性,但是两种特征单独使用时存在区分相似外形能力差或对字符外形变化的鲁棒性较等问题。为此,引入特征融合的思想,提出了融合轮廓矩和Fourier描述子的特征提取方法。分别从特征融合的依据、方法、以及策略等方面研究了适合压印字符特征融合的方法。实验表明,混合特征集合了两种特征单独使用时的优点,提高了识别率。另外,文中还对基于小面模型和地形结构的边缘提取方法进行了研究。对“直接CCD图像”压印字符采用了基于子空间的全局特征提取方法。提出了一种适合压印字符特点的PCA实现方法。分别为每类字符建立一个子空间,通过PCA提取每类字符的共同统计特征,然后通过待识别字符在每类子空间下的重构误差来进行分类。研究表明,该方法充分运用了PCA变换的最佳逼近性能,并提取了单类字符的独有特征,获得了比常用PCA方法更高的识别率。并对该方法的适用范围进行了分析。将Fisher鉴别分析引入压印字符识别,分别采用线性鉴别分析(LDA)和核Fisher鉴别分析(KFDA)进行了压印凹凸字符的识别测试。为解决LDA中广泛存在的小样本问题、Fisher准则非最优问题以及计算量大等问题,将线性加权的思想应用于二维线性鉴别分析(2DLDA),提出了一种新的鉴别分析方法—二维加权的线性鉴别分析(2DWLDA)。给出了2DWLDA的主要思路,推导了采用2DWLDA计算鉴别矢量的方法,并且给出了加权函数的具体形式和计算方法。实验表明,新方法不仅解决了LDA中存在的上述问题,而且提高了识别率、减少了特征提取时间。对工业标牌的版面分析、字符切分及归一化方法进行了研究。研究了适合特定工业标牌的版面分析方法;采用基于最大方差的单字符切分方法实现了低灰度对比情况下的字符切分:并且研究了适合压印字符特点的归一化方法。