论文部分内容阅读
文本行和段落分割是文档图像处理过程中的重要步骤。本文提出了一种基于简化Mumford-Shah模型的新的文本行和段落分割算法,该算法是脚本语言独立的。为了提高文本行和段落分割算法的有效性,首先使用高斯滤波器对文档图像进行平滑,然后再在此基础上运用简化的Mumford-Shah模型的水平集图像分割算法分割文档图像。最后,利用数学形态学方法处理文档中粘连和交叠情况。实验表明,该算法可以准确快速的分割目标物体,而且算法与初始轮廓线位置无关、不受边界轮廓线连续性限制、对图像噪声具有很强的鲁棒性。