多区域图像的分割和倾斜检测方法研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:lxj5186101
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现代信息社会里,计算机已经进入了社会的各个领域,互联网也日益普及,人们越来越多地依赖计算机获得各种信息,大量的处理工作也都转移到计算机上进行。研究如何将传统的纸张文本转换成电子文本就成为了人们关注的课题。在日常生活和工作中,存在着大量的文件资料的处理问题,这些文件不仅包括那些只有文字信息的文件还包括那些图文混排的文件和图像文件,因而如何将文件快速准确的输入计算机的要求变得非常迫切。本文主要研究的是多区域图像的分割和倾斜检测方法。针对常用的文本图像分割算法进行了综述,并对各个分割算法的优缺点进行了介绍。一般的文本图像的处理算法大体可以分成两类:几何分析法和纹理分析法。其中几何分析法又可以分为自顶向下、自底向上、混合法。本文详细介绍了两种自顶向下的分割算法,分别是游程平滑算法和投影轮廓算法,以及两种自底向上的处理方法:近邻线密度法和连通分量分析法。除此之外,还列举了几种常见的图像分割算法。本文总结以上的基本分割方法,针对多区域图像提出了改进的投影轮廓算法。该算法解决了使用一般的投影轮廓算法不能适用于复杂的具有倾斜角度的多区域图像的分割,本文首先对图像进行二值化,使用数学形态学的腐蚀—膨胀操作降低图像上的噪声。对于得到的图像使用改进的投影轮廓算法,该算法即使在X、Y轴方向上没有谷点,也可以根据图像像素的分布状况找出切分点,将图像切成小块,再对小块图像进行投影分析,循环此过程,直到将图像的各个区域分割出来为止。文档倾斜角的检测大体可以归为五大类,基于Hough变换的方法、基于交叉相关性的方法、基于投影的方法、基于Fourier变换的方法和K-最近邻簇法,其中基于Fourier变换的方法计算量非常大,故而很少使用。通常文档图像在扫描入计算机时难免会有损失,文档图像的边缘也很不规则。如果用普通的边缘提取方法寻找图像轮廓,不仅增加了计算量而且增加了许多不必要的计算。本文针对一般倾斜检测算法计算量大的问题,提出了一种简单的寻找边缘的方法,这里并不需要精确地找出文档图像的边缘轮廓,只是找出含有图像的区域就可以了,这个区域就是外接矩形,即bounding box。本文引入GA方法检测图像的倾斜角,该方法使用bounding box的面积作为适应度函数值,只需要找出图像的上下左右四个坐标值便可以了,这样大大减少了计算量。实验结果表明该算法对倾斜角的检测具有较高的精确度。
其他文献
近年来,关于Agent和多Agent系统(MAS)的理论、技术和应用研究,已经成为人工智能、软件工程与互联网络Internet等领域共同关注的研究内容。由于单个Agent不足以完成全部的问题求解
专利文献集技术、法律与经济等信息于一体,反映了最新的科学技术研究情况。自增强自主创新能力在全国科技大会上被提出以来,作为对科技创新有重要指导作用的专利信息服务受到
科技的飞速发展推动着医疗事业的进步,老龄化社会的加剧又给医疗事业带来前所未有的挑战,不仅医疗机构所能提供的服务远不能满足老龄群体的需求,而且老年病几乎都需要长期的
人脸检测与识别技术是近年来图象处理、模式识别、人工智能等领域内最为活跃的研究课题之一,它具有广泛的应用领域和重要的理论研究价值。人脸识别与指纹,虹膜等生物特征识别
系统通过前端设备对古建筑室内外场景进行监控与采集。所有的前端设备组成一个Zig Bee网络,网络中的协调器通过无线以太网将各个前端采集的图像信息传送到后端嵌入式设备,后
软件产业在IT产业中历来占有重要的地位,进入21世纪,这种地位继续得到巩固和凸现。随着软件产业技术的不断发展,对软硬件的要求也越来越高,为了不断提高软件开发效率,人们一
在知识经济飞速发展的时代,日益增强的市场竞争对产品的创新能力提出了更高的要求,也为产品的设计增加了难度。概念设计在设计阶段起着重要作用,它决定了产品的基本特征和主
近年来随着通信技术的进步以及移动设备的普及,移动网络成为当今世界发展最快、市场潜力最大、前景最诱人的业务之一。TCP流作为移动网络中承载绝大多数任务的传输协议,它的
当无线自组织网络作为下一代网络的接入网时,需要解决包括终端移动性、提供服务质量保证(QoS)、安全性以及计费在内的一系列的问题。其中,在无线自组织网络中提供服务质量保
近10年来,个人电脑在性能有了长足进步的同时,其价格也越来越便宜。因此在需要服务器的领域和在需要一定的运算性能的领域,以廉价的个人电脑而组建的机群正在以其不俗的性能