场景图像文本定位与字符识别方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:wyh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
场景图像中的文本包含着丰富而又准确的信息,在工业自动化、交通管理、自动翻译、残障人士服务等领域中存在广泛的应用需求。但由于场景图像受非均匀光照、背景纹理和文字多样性等影响,现有方法场景文本提取的准确性较低。因此,如何从这些场景图像中准确地提取文本信息已成为模式识别领域的研究热点,开展本项目的研究对提高场景图像文本识别系统的准确性和鲁棒性具有重要的实用价值。本文主要工作及贡献包括:首先,基于文本区域字符灰度值一致性,x方向梯度幅值呈凸形分布和文本字符相近邻的特点,本文提出一种基于卷积神经网络(CNN)和支撑向量机(SVM)输出得分的场景图像文本定位方法。依据文本区域x方向梯度幅值的凸形分布和字符灰度值一致性,检测文本区域的典型点,并通过典型点位置和灰度聚类提取候选连通成分,再对上述候选连通成分以外的区域,用k-means聚类方法进一步提取其它的候选连通成分。然后,使用基于CNN的文本连通成分SVM分类器,利用CNN提取连通成分的纹理特征,再使用SVM输出得分抑制非文本连通成分,并将近邻的连通成分组合成候选文本区域;最后,针对提取的候选区域梯度方向直方图HOG特征,利用支持向量机验证候选区域。对于ICDAR2011和ICDAR2013的场景文本图像数据集,本文定位方法分别获得76%和78%的F值,表明该方法有效地抑制了复杂背景纹理干扰。其次,基于文本行内字符颜色的相似性,提出一种基于颜色聚类和梯度向量流的文本区域字符切割方法。先利用k-means聚类方法,对像素点色彩空间位置分布进行聚类获得k个候选图层,再用连通成分的占空比、宽高比等几何特征,提取候选字符连通成分所在图层;并在同质区域寻找远离边缘的点作为候选切分像素点,利用灰度差值的平方作为代价,寻找累计代价最小的切割路径。在ICDAR2013场景图像文本数据集上,本文方法获得87.9%的F值,实验表明,颜色聚类可有效地抑制非均匀光照和遮挡的干扰。最后,基于字符结构的旋转不变性,提出一种多方向单个字符识别模型。采用变形HOG算子和同心圆形模板采样,提取局部联合HOG纹理特征和采样点之间的象限关系结构特征,组合上述两种特征得到字符特征,进而通过学习建立特征词典的字符词袋模型,然后,利用支持向量机识别字符。针对ICDAR字符数据集、Chars74K数据集和手工收集的数据集进行字符识别实验,本文提出的方法分别获得82%、87%和73%的准确率,表明提出的模型对旋转变化具有较好的鲁棒性。
其他文献
图像作为人类最重要的信息来源,有着直观性、易理解性。随着科学技术的发展,尤其是计算机和数字图像技术的发展,出现了很多新理论,新方法,新算法,新手段和新技术,而且在科学
近年来,主从式微创手术机器人成为微创手术机器人领域的一个重要研究方向,它令医生的操作更加精确和方便,同时,也对机器人控制系统各个部分之间的通讯性能和人机交互性能的要求越
水下航行器在海洋作战和海洋开发中发挥着越来越重要的作用,航行器的航路规划是实现水下航行器的自主航行及作战的一个重要环节。研究水下航行器航路规划对提高其智能化水平
随着全球经济的迅速发展,汽车逐步的走进了我们的日常生活中,人们对汽车的需求逐渐提高,然而经济增长的同时,汽车尾气的排放逐渐增加,使我们面临严重的环境问题。为了净化环境,使汽车尾气实现零排放,电动汽车的研发和改进成为未来汽车行业的一个重要发展方向,对电动汽车的控制成为了重中之重。本文主要是针对电动汽车驱动电机变频调速系统进行了研究。随着电力电子器件以及现代控制理论的发展,交流调速取代直流调速已经成为
本文以我校学科群实验中心的自动化物流系统为研究平台,针对该物流系统的任务规划提出了一种新的Petri网分解方法,对所建的物流系统的Petri网模型∑进行分解,分析判断出此物
核磁共振成像(MRI)是医学影像中的一种重要成像技术,由于其高质量的图像显示效果,现在已经被广泛的应用到人体各种组织器官病变的诊断,其中较为主要的一个应用就是检测脑部病变组
移动IPv6作为下一代移动互联网的基本协议规范,给未来的全IP移动通信系统提供了一个标准的全球移动性解决方案。而就移动切换这一关键问题而言,现有的基于MIPv6扩展的方案主
合成孔径雷达是一种先进的利用电磁波进行感知的对地观测工具。对比于光学、红外等成像技术,合成孔径雷达在具有高分辨率及大面积数据获取能力的同时,还具有全天时、全天候观
随着机器人技术和人工智能的快速发展,移动机器人领域的研究得到了越来越多的关注。同步定位和地图构建(Simultaneous Localization and Mapping,SLAM)是目前移动机器人领域
空间机器人是当前机器人领域的热点问题。论文针对空间自由漂浮机器人做了以下两方面的研究:首先是自由漂浮空间机器人的模型建立以及模型分析,然后在建立模型的基础上进行控