基于深度学习的发票图像信息识别算法研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:zch_kitty
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,我国发票的使用量剧增,其中增值税专用发票和增值税普通发票使用量极大,占各类发票总量的90%。发票的报销流程十分繁琐,需要手动录入发票中关键信息,浪费大量人力和时间,所以设计一种用于发票信息智能识别的算法尤为重要。目前,传统算法可以对扫描的发票图像进行信息的识别,但对手机拍摄的缩放比、模糊程度、亮度、倾斜角度、尺寸以及背景干扰各不相同的发票图像中的信息进行识别还存在挑战。本文提出的基于深度学习的发票图像信息识别算法,结合计算机视觉技术和文本检测识别算法对手机拍摄的发票图像信息进行识别,信息准确率高达99.10%。首先,提出一种基于霍夫变换的HTA算法,对自然场景下倾斜的发票图像进行智能倾斜矫正。接着,创新性地结合YOLOv3深度学习算法和Open CV裁减技术对已倾斜矫正的发票图像进行区域定位、分割及提取,有效去除发票图像上的冗余信息,并对信息进行归类。然后,通过CDNets算法对提取到的发票区域图像上的信息进行文本检测和识别。最后,提出一种基于OCR的格式化文本处理方法对识别后的结果进行本文格式化输出。接着,针对发票图像中价税合计区域中大写中文金额字符进行识别。本文提出基于深度学习的发票图像文字识别算法模型,该模型连续使用卷积核为5×5组成的卷积层,连续卷积层后连接批归一化层一种新的卷积神经网络架构,实验表明该模型优于对比模型,识别准确率高达99.79%。最后,对基于深度学习的发票图像文字识别算法模型进行压缩,提出剪枝网络用于发票图像文字识别算法,对模型进行逐层通道剪枝,压缩后轻量级模型权重大小为2537KB,识别准确率为99.38%。
其他文献
随着信息时代的到来,人们一直探索如何利用光学与射频技术来解决在通信与信息技术的发展过程中遇到的问题。微波光子学在这一时期得到了飞速的发展。作为微波光子学的重要组成部分—光电振荡器(OEO)可以有效打破“电子瓶颈”,一举成为了研究热点。OEO相对于传统的振荡器,其优点在于可以产生更优质的微波信号,具有低相位噪声、宽调谐范围、高频谱纯度和抗电磁干扰等特点。然而,工作频率受限于OEO中器件带宽。因此,展
本文以王渊花鸟画中鸟禽形象为突破口,在用笔、用墨方面深入研究其艺术形式。笔者就王渊“用笔”中遒劲丰富的笔法、平和内敛的笔势、简逸抒情的笔意,探讨三者所形成刚柔并济的审美特征。分析了王渊“用墨”中“落墨法”的装饰性及所产生的墨色韵味、以墨代色、色中有墨的纯墨色鸟禽艺术形象。王渊独特的用笔、用墨为我们展现了其特有的水墨鸟禽艺术形象,在花鸟史上形成了独特的艺术形式。在用笔用墨上,王渊的花鸟画继承了院体画
目前,我国国有企业混合所有制改革是经济改革的首要任务,政府也通过出台相关政策,鼓励国有企业自主进行混合所有制改革,另一方面,由于国有企业在运营管理过程中出现了较多由于体制问题就存在的漏洞,例如权责不对等,管理效率低下,核心竞争力不足等等诸多缺陷,如何有效的解决这些问题也就成了我国国有企业改革的重点内容。云南白药此次换股并购白药控股,公司由国有企业一家独大转变到国有企业民营企业共同治理,在缩短企业管
在互联网经济逐步发展的背景下,移动互联网的线上红利已逐步退潮,企业新入口的机遇在于将战略关注重点转化为对线下流量需求的深度挖掘和系统地提取利用。数字化驱动和智能化运营逐渐在实体消费经济中体现,线下消费的大数据价值也日趋凸显。大数据和机器学习在线下消费市场的结合与应用的实践中,将不断提升市场营销策略制定的科学性。利用机器学习能够对用户的消费行为进行统计、分析,并根据用户的消费行为进行客户分类,从而实
中国科学院西双版纳热带植物园位于云南省南端的西双版纳自治州,常年碧草如茵,因其得天独厚的气候条件,是国内拥有着热带植物品种最为丰富的植物园,亦是我花鸟画创作最初的灵感来源。《寻花》系列作品是基于我对于传统中国工笔画和现代优秀绘画作品的临摹,结合平时对热带题材绘画作品的鉴赏,将于植物园写生期间所遇见的花卉绘制成具体可感的作品的一种创作实践。本文主要从四个章节展开:第一章是对于作品题材的选择,主要描述
随着现代企业的发展,股权激励成为解决委托代理问题的良好方案,其运用越来越广泛,多数上市企业采用股权激励计划来促进公司业绩的提升,结果显示在一定程度上确实可以起到积极作用。近年来,创业板发展迅速,成为我国资本市场不可或缺的一部分,创业板实施股权激励计划的企业约占全部上市企业三分之一,可见创业板市场已经掀起股权激励的热潮。但股权激励的实施效果受多种因素影响,创业板相对主板而言,成立时间较短,市场环境不
中国画艺术承载着中国传统文化的精华,其中注重意境的营造,是艺术作品提升感染力的一个重要因素,重要目的。虚实在意境的生成过程中是很重要的一个表现手段,有虚实画面才能产生气韵。无论山水画、花鸟画还是人物画,虚实关系都是中国绘画风格的基本核心内容。艺术家通过作品中虚实关系的表现,与观者产生情感交流。通过对历代优秀绘画作品的解析对比,逐步走进工笔花鸟画中虚实关系的宏观和微观,通过分析学习艺术理论家、艺术家
随着目前互联网技术的飞速进步及广泛普及,互联网企业的数量正在不断增加,其中互联网视频企业作为其中较为热门的一个领域也得到了快速成长。但是目前为止在我国互联网视频企业市场中,已经出现一些由于资金链断裂导致企业破产的案例,使得互联网视频企业的管理者们越来越重视企业资金链运营的健康程度。在复杂的经济环境和激烈的市场竞争中,互联网视频企业由于较高的外购版权和平台运营成本,在短期内难以实现理想的盈利结果,因
随着先进半导体制造技术的不断发展,静电放电(Electrostatic Discharge,ESD)逐渐成为集成电路可靠性的主要威胁,所以研究出有效且合适的ESD防护技术成为研究人员迫在眉睫的任务之一。而进行有效ESD防护的难点在于,晶体管尺寸的减小要求器件在保持一定鲁棒性的同时拥有较小的ESD防护窗口。本文首先介绍了常规的ESD保护原理,而后较为详细地讨论了典型ESD防护方式。在此基础上,本论文
水源是人类生活中不可缺少的一部分,而降水就是其重要来源,准确的预测降水不仅能有效的防范洪涝、干旱、台风以及泥石流等自然灾害,而且可以预报天气更加方便人们出行。随着卫星遥感信息的不断丰富,应用卫星降水反演产品的领域也越来越多,如何利用卫星降水产品进行降水预测,进而满足气象、水文等领域的需求,已成为重要的研究方向。人类活动的影响及全球气候变化,导致中国大陆地区极端干旱事件发生频次不断增加,如何利用卫星