论文部分内容阅读
文本图像二值化在数字图像处理中具有重要的研究意义与广泛的应用,尤其在提高光学字符识别系统(OCR,Optical Character Recognition)对文本图像处理的效率与准确性方面发挥着重要的作用。然而,文本图像在拍摄的过程中会受到设备或者拍摄环境等因素的干扰,产生抖动模糊、光照不均匀、部分文本被遮挡等现象。因此,快速而精确的文本图像二值化受到了研究者的广泛重视。 当前现存的图像二值化方法按其原理主要可以分为两类:阈值方法和偏微分方程方法。经典的阈值方法有全局阈值法、局部自适应阈值法和混合阈值法。这些方法的实质都是先确定图像阈值,然后通过阈值技术实现图像的二值化目标。具体的各种阈值方法的区别是它们各自在确定图像阈值时所利用的图像信息不同:全局阈值法利用的是图像的整体信息,局部自适应阈值法利用的是图像像素点及其邻域的信息,而混合阈值法则是将图像的整体与局部信息相结合。近些年,基于偏微分方程的图像二值化方法得到了广泛的关注与研究,究其原因是偏微分方程可以为图像二值化提供完善的理论框架和原理解释。偏微分方程方法首先是为原始图像寻找一个合理的偏微分方程作为它的演化方程,然后对图像进行演化直到收敛于稳定状态,即可得到原始图像的二值化结果图像。 本文提出了一种文本图像二值化的变分偏微分方程方法。第一步为原始图像设计一个变分模型,其极小点就是所求的最终二值化结果;第二步运用变分原理将变分模型转化为一个偏微分方程;最后通过有限差分法求解这个偏微分方程。变分模型的能量泛函包含三项:第一项是数据保真项,其作用是使最终求得的二值图像与原始图像尽可能接近;第二项叫作二值归类项,可以促使原始图像在演化过程中目标区域的像素值逐渐趋于-1,而背景区域的像素值逐渐趋于1,从而达到二值归类的目的;第三项为H2正则项,能够避免原始图像的二值化结果出现震荡。本文在相机文本图像数据集中进行模拟实验,实验结果表明,所提变分模型可以实现良好的文本图像二值化效果,并且对噪声具有较强的鲁棒性。