论文部分内容阅读
名片作为一种交流的媒介和身份信息的载体,在商务应用中一直有很重要的作用。手工录入名片信息耗时费力而且容易出错,因此利用手机和PDA对名片进行自动识别和存储有一定实际应用价值。名片识别系统主要涉及OCR技术和信息自动分类技术,名片上OCR技术难点是单个字符图像比较小,特征提取比较困难。目前的识别算法比较复杂,时间复杂度比较高;信息分类技术特别是中英文混排名片的分类技术相对不成熟。本文对这两个问题进行了深入的研究。本文的主要工作如下:1.数据库的构建:在实现名片识别系统之前做了相关的调研,发现目前为止没有公开的名片数据库,在实验室全体成员的帮助下,本实验室建立了一个名片数据库,目前名片数据库包含1662张名片,每一张名片都含有其对应的数据库文件。2.预处理:对数据库中的名片图像进行灰度化、二值化、插值算法、去噪、归一化等处理。针对中文和英文不同的结构特点,在预处理之前增加了一个粗分类。基于此分类方法可以区分出不同的字符,并将其送入不同的识别引擎进行识别。针对名片上字符比较小,归一化时容易出现锯齿状的情况,本文研究了几种插值算法,并对其性能进行比较。3.识别算法的研究:本文对方向线素、穿越线特征、Gabor特征和基于Gabor特征的KNN分类器等算法进行了对比研究。在特征向量比较多的情况下,尝试使用主成分分析(Principal Component Analysis,PCA)和线性判别分析(LinearDiscriminant Analysis,LDA)两种降维方法,以达到降低复杂度提高识别性能的目的。通过数据分析,最终选择性能良好的LDA降维方法进行降维,通过此方法将数据库信息压缩为原来的近1/3,识别时间降低到原来的四分之三,且准确率也有一定的提升。对上面所提及的识别算法进行了实现,并且进行了性能分析。4.信息提取算法的研究和名片识别系统:在基于关键字(邮编,电话,百家姓等信息)分类的基础上,使用名片的位置信息来辅助名片信息的分类,实现信息的自动分类,而且在信息分类时可以纠正一些逻辑性错误。最后本文实现了一个完整的名片识别系统。