论文部分内容阅读
手写体数字识别技术是模式识别下一个重要的支派,拥有非常广泛的应用前景。该技术可以应用在财政报表、邮政自动分拣、试卷成绩统计、银行单据、金融数字统计等手写数字自动化识别录入系统上。在全球信息化全面发展和自动化程度提升的背景下,对手写体数字识别技术的需求变得十分急迫,研究出精准且高效率的识别方式有重要的意义和价值。随着卷积神经网络对图像分类的研究兴起,给手写体数字识别带来了无限的可能。卷积神经网络独特的二维数据处理方式和在分类识别时自动提取图像特征的特点,可以提高手写体数字识别的泛化能力和准确度。本文依托于清华大学苏研院大数据处理中心的企业项目,针对手写体数字识别的性能低效和准确率不足等问题,依据卷积神经网络在图像分类处理上的优势,开展了对手写体数字识别的一系列研究与设计工作。着重对卷积神经网络的LeNet-5模型进行设计与优化,使其在实现手写体数字识别的同时获得较高的识别率与更优的性能。针对传统手写体数字识别方法中特征提取数据冗余、图片预处理复杂、收敛速度缓慢、泛化能力差等问题,提出将卷积神经网络应用到手写体数字识别上。研究了卷积神经网络LeNet-5模型7层结构与各层中的工作原理,确定并推导了卷积神经网络训练时使用的前向传播、反向传播及梯度下降算法。对网络模型各层的训练参数以及初始化参数进行了设计。利用Caffe深度学习框架搭建手写体数字识别的LeNet-5模型结构,使用MNIST数据样本库训练和测试该网络模型。在此基础上实现了基于卷积神经网络LeNet-5模型的手写体数字识别,实验结果验证了卷积神经网络在手写体数字识别上的可行性。本文对于卷积神经网络LeNet-5模型用在手写体数字识别上出现的问题,提出三项优化改进办法:1、为了有效解决局部极小点的问题,在网络的损失代价函数里添加一个权值衰减项;2、为了提高网络的泛化能力和识别率并且避免过拟合,提出用Dropout技术来构造网络高层结构;3、为了解决LeNet-5模型训练识别时出现的不收敛问题,提高收敛速度,选择ReLU函数代替常用的Sigmoid等饱和函数作为LeNet-5中各层输出的激活函数。本文在研究中将改进项整合到一起,搭建出一个性能更优的网络模型LeNet-5+,与LeNet-5模型的识别结果和性能进行对比分析,通过实验探究了不同模型对网络误识率、识别率、迭代误差及网络收敛速度的影响。改进后的网络模型将识别率从93.61%提高到了97.30%,误识率从0.96%下降到了0.75%,拒识率从5.43%下降到了1.95%,迭代误差从0.40降低至0.15,识别收敛速度也大大提高。由此验证了本文改进的网络模型LeNet-5+在手写体数字识别上的有效性及优势。目前,本文所研究的技术成果已成功应用在了成都准星云学科技有限公司的一系列人工智能教育产品中,提供笔记识别和自动判卷等智能精准的教学服务。本文的研究成果对手写数字识别技术应用到人工智能教育领域有较大的现实价值及意义(1)。