营业执照自动识别技术的研究

来源 :新疆农业大学 | 被引量 : 0次 | 上传用户:sleon001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能的飞速发展,基于深度学习的场景文字识别方法被越来越多的人接受并使用,识别效果也越来越突出,逐渐成为计算机视觉领域研究热点内容之一。图像复杂的背景使图像特征中存在大量的无用信息,导致了传统OCR(Optical Character Recognition )的识别率低,满足不了客户的需求,所以本文将利用卷积神经网络来实现图像文字的检测和识别。
  由于新疆维吾尔自治区重大科技专项“马产业科技创新平台建设”中身份验证模块需要对单位授权委托认证,根据此项目的需求展开了此次研究。本文以最新版的营业执照作为研究对象,但是营业执照图像中存在光照不均匀、运动模糊、以及背景复杂等问题,因此本文的主要研究内容是通过卷积神经网络准确识别出营业执照图像中的目标文字。目前对背景复杂的图像文字识别技术比较成熟,在身份证、火车票、银行票据、发票等方面应用比较广泛,但是对营业执照文字识别的研究甚少,开源的文字识别模型识别率较低,若直接用于项目中实用性不佳,因此对现有的模型进行优化和再训练,来提高营业执照的文字识别率。
  关于深度学习来实现文字识别的方法有很多,每种算法都有一定的优点和缺点,本文将重点介绍目前比较流行的文字检测和文字识别算法,分别是CTPN(Connectionist Text Proposal Network)、CRNN(Convolutional Recurrent Neural Network)、DenseNet(Dense Convolutional Network),并设计了基于CTPN+CRNN和基于CTPN+DenseNet的文字识别模型,实现了端到端的图像文字识别,两个模型都已封装好,可根据使用数据的不同,在Demo中进行切换使用。首先手动标注了2500张营业执照数据,对开源的CTPN网络进行了再训练,且AP值为94%。经过测试发现CTPN对营业执照中字体很小的文字会出现漏检,还有当出现多行文字时每一行文字没有被分开检测,为了解决这个问题,对营业执照进行版面分析,然后进行区域分割,得到10个子图像,这样就很好的解决了上述的问题,且经过上述处理后文字检测的AP值达到98%,经过处理后CTPN模型的AP值提高了4%。然后使用541126张不定长字符数据集对CRNN模型进行了再训练。最后确定了更适合于营业执照的识别模型是基于CTPN+CRNN的文字识别模型,最终文字识别率达到96%,对营业执照文字识别的方法具有一定的借鉴意义。
其他文献
根据新疆马业协会统计,新疆目前已有85万匹马入库,其中伊犁马的数量居全国前列。随着科技的进步,培养改良伊犁马工作的步伐不断加快,但由于育马人主要是广大农牧民,其马匹饲养管理方式粗放,大部分都是凭借经验饲养。因此为了更好地促进马业的发展,必须紧随市场的发展和马饲养方案的变化,制定科学合理的饲料配方。
  根据对新疆伊犁昭苏地区马场多次实地调查的结果,针对马场信息化管理中精准喂饲的实际需求,通过对饲料的营养成分、价格和处于不同体重、用途及身体状况的伊犁马进行研究,结合美国国家科委(NRC)喂养标准中马对
森林是陆地生态系统最大的碳库,在全球碳循环中发挥着重要的作用,对缓解全球气候变暖具有十分独特的意义。森林资源调查和监测是人类保护和经营森林的重要基础工作,长期以来,人工地面调查和卫星遥感监测已成为获取森林状态和结构等关键参数的重要技术手段,分别适用于样地等小尺度和区域等大尺度。近年来,随着高精度轻小型无人机遥感技术的飞速发展,基于无人机系统的林班和林场等中尺度森林资源精准无损测量技术的应用日益广泛,通过无人机近地面遥感影像高精度提取森林参数的方法逐渐成为研究热点。
  本研究以新疆山地森林优势树种天
摘 要:通过对河南省G县周边乡镇居民进行新农合参保可持续意愿的问卷调查,利用SPSS软件进行数据分析,发现当缴费标准提高时,个体特征、家庭结构、社会因素和国家政策四个方面会影响居民参保可持续意愿。为此,从提高农村地区经济发展水平,增加参保群体个人收入;确立适度筹资标准,完善新农合缴费和财政补贴机制;加大新农合政策的宣传力度,扩大新农合政策的普及面;建立多层次医疗保障体系,提高农村的医疗健康水平四个
期刊
马匹体重是反映与衡量其健康状况的重要指标之一,并在马匹选育、肉质评价、饲养管理、马匹鉴定等方面具有重要参考意义,然而伊犁马体型高大,性情活泼且长时间处于野外放养状态,这就造成伊犁马称重困难现象。本文在通用性马匹体重估测模型基础上,阐述并实现多种针对伊犁马品种的体重估测模型,并将这些体重估测模型嵌入软件系统中,以方便用户使用伊犁马体重估测模型。
  本研究数据主要来源于新疆伊犁地区昭苏县,该地区是伊犁马的中心产区之一。本文研究对象为两岁左右的伊犁马,主要采集马匹年龄、性别、胸围、体长、体高、管围和体重
近来,国家和新疆维吾尔自治区对马产业高度重视,构建产业技术创新平台,以促进新疆马产业的发展。随着马产业平台的转型和升级,将全面实行平台的深度电子化。其中新疆马产业创新平台的用户登陆模块,需要进行实名认证,实名认证用户是通过上传身份证照片进行信息自动识别登记用户的身份信息,进行实名认证的用户可以拥有平台上更多的功能权限。由于身份证照片的拍摄场景、角度、设备、摄影师各有差异,传统身份证信息识别方法已经不能满足复杂环境下对身份证信息的识别准确性的需求。为了进一步提高身份证识别的准确率,克服外界环境干扰下的身份证
摘 要:产业转型升级事关就业稳定和城市与产业的协调发展,需要在产城融合的视角下进行审视。通过对郑州市就业与居住关系,以及就业结构与产业结构的梳理发现,虽然产业结构演变和就业形势总体向好,但产业、就业、居住三者之间的关系仍有待进一步改善。为了提升产城融合程度,应该在推進产业转型升级时更多地考虑到就业的重要性。  关键词:产城融合;产业;就业;转型升级  中图分类号:F207;F293 文献标志码:A
期刊
摘 要:随着1980年中国武术片《少林寺》的拍摄和热播,迅速打开了中国武术影片的市场,从而引发一股席卷全国的武术文化热潮。当代少林武术文化產业的发展不仅在本地、国内,而且也已经在世界上受到越来越多的关注,少林武术文化产业以前所未有的速度向世界各地扩展其市场,作为凝聚全球华人、教育中华儿女、培育中国精神、和谐世界人民的少林武术文化产业,已经成为中国梦的载体和实现中国梦的重要组成成分,必将继续发展壮大
期刊
摘 要:从全域旅游的视角出发,对桂林市红色旅游发展的优势、劣势、机遇、威胁进行分析,在此基础上提出桂林市红色旅游发展的路径,以期进一步提升桂林红色旅游的经济、社会复合价值。  关键词:红色旅游;全域旅游;桂林  中图分类号:F592.7 文献标志码:A 文章编号:1673-291X(2018)23-0103-03  引言  2016年全国旅游工作会议上,国家旅游局李金早局长做了主题为《从景点旅游走
期刊
摘 要:创新是产业升级的动力源之一,但产业升级是否对创新产生影响?因此,研究产业升级对技术创新、制度创新的影响,并以2001—2015年中国省际面板数据进行实证验证。实证研究结果表明,产业升级对中国技术创新、制度创新存在正向影响效应,并且影响的程度存在较大的差异。充分利用产业升级带动技术、制度创新的能力,关键要加大开放程度、加强科研投入等,需要多方面因素的协同发展。  关键词:技术创新;制度创新;
期刊
近年来,随着国家和新疆维吾尔自治区对马产业发展的高度重视,为保障新疆马产业的不断发展,急需在新疆推行马品种登记工作。目前,国内马品种登记工作主要依靠传统手工登记方式完成,登记机构将符合标准的马匹体尺外貌等特征资料在纸质版的登记簿上进行登记管理和存放。为了实现马品种登记的电子化和信息共享,需要研究开发一套马品种电子登记系统来对马品种进行登记管理,同时为规范马品种的管理及赛马、评比等活动的开展,需要对马匹发放护照。但目前马品种登记和护照信息中的外貌特征提取方式主要靠手工方式完成,需要对马匹面部的特征进行文字描