四季垫厂家
免费服务热线

Free service

hotline

010-00000000
四季垫厂家
热门搜索:
成功案例
当前位置:首页 > 成功案例

最火二值印刷文档图像黑白背景归一化技术

发布时间:2021-09-30 15:14:43 阅读: 来源:四季垫厂家

二值印刷文档图像黑白背景归一化技术

摘 要:对于包含白底黑字和黑底白字两种背景的二值印刷文档图像,要进行后续的文字切分或OCR,首先必须进行背景色的归一化。本文在假设字体、字号已知的前提下提出了利用数学形态学中的开运算提取图像中黑底白字区域的方法,并将该区域转化为白底黑字从而实现文字背景色的归一。

关键词:数学形态学;背景归一化展会期间;二值图像;印刷

文档图像处理系统的目的是在数字图像中识别文字、图形和图片,并按照人们的需要提取出所需的信息,其中的文字处理包括段落、行和单字的切分以及随后进行的OCR[1,2](OpticalCharacter Recognition,光学字符识别)。但是如果一幅印刷文档不仅仅是单一的白底黑字(或黑底白字),而是包含了白底黑字和黑底白字两种背景的图像,显然这是目前的OCR系统不能处理的。必须把该图像转换成背景一致的白底黑字图像才能够进行后续的文字处理。

对此提出了一种基于数学形态学[3,4]方法的文档图像黑白背景归一化的方法。事先假设所有文字字体、字号是一致的,且字体和字号已知,同时假设黑字和黑底不相交。在此限制条件下,对一幅包含白底黑字和黑底白字的印刷文档图像,通过形态学的开运算识别出其中的黑底白字部分,并将其转换成白底黑字,以实现黑白背景归一的目的。

1 基于形态学的文档图像背景归一化

1.1 数学形态学方法

形态学图像处理的基本思想是利用一个结构元素收集图像的信息,当结构元素在图像中不断移动时,便可考察图像各部分的愈来愈多的厂商具有提供成套工业化解决方案的能力相互关系,从而了解图像的结构特征。因此结构元素的选择与从图像中抽取何种信息有密切的关系,构造不同的结构元素,便可完成不同的图像分析。数学形态学中的开运算,一般能够去除图像中孤立的小点、毛刺和连通两块区域的部分,而图像总的位置和形状不变。利用结构元素B对图像A做开运算,用公式可表示为:

A。B=∪{B+X:B+XA}

即开运算可以通过计算所有可以填入图像内部的结构元素平移的并求得。

要进行黑白文档图像背景色的归一,关键在于对于图像中的一块黑色区域要能够区别出该区域是属于黑色笔画还是属于黑色背景(即黑底)。只要能识别出图像中的黑底白字部分,则将这一部分的所有象素反色,而黑色笔画部分不变,就可以实现把整幅文档图像转变成单一的白底黑字图像。本文利用形态学拉力实验机所用的夹具在结构上没有固定的模式, 根据不同的试样及实验力大小,在结构上差别很大开运算找出了文档图像中所有的黑底白字成份。

1.2 文档图像背景色的归一

本算法通过选择尺寸合适的结构元素,利用开运结构元素的大小就相当于筛子眼的大小,如果其大小选择合理,就能够把图像中所有黑色笔画都筛除,仅剩其中的黑底白字部分。但是,如果结构元素选择过大,则在去除黑色笔画的同时也会把面积较小的黑底也完全过滤掉;相反,如果结构元素选择过小,则经过开运算以后还有部分较粗的黑色笔画存在(如图1所示)。所以必须选择一个大小合适的结构元素。

本文通过实验,对常用印刷汉字的不同字体、字号所选结构元素列于表1中。

对一幅要处理的文档图像,参照表1选定结构元素,用其对原图像进行开运算将去除所有黑色笔画,仅剩有损失的黑底白字部分(如图1(b)所示)。将开运算结果映射回原图像中就找到了原图像中所有的黑底白字部分,对每一块黑底白字进行轮廓跟踪[5]找出其轮廓线后,将轮廓线范围内所有象素进行反色处理就实现了文字背景色的归一化。

2 实验结果

本文提出的算法已通过编程实现,所得实验结果如图2所示。其中图2(a)表示要进行处理的客户均要求出具英文报告原始图像,在该图像中包含了黑底白字和白底黑字两种成份,已知字体为小五号宋体字,图2(b)为用本算法进行背景归一化,将黑底白字部分转变成白底黑字后的结果,所选结构元素为3×3(象素)。

3 结 论

本文对包含2种背景的二值文档图像的背景归一化问题进行了探讨,提出了一种基于数学形态学中的开运算识别出图像中黑底白字区域的方法,实验表明这种方法在字体、字号已知的情况下,能够检测出图像中的黑底白字成份,对这些区域进行反色处理便可完成文字背景色的归一化。但该方法只能处理字体、字号已知且一致的二值图像,如何改进该算法使其有更广的通用性是下一步研究的工作。

作者/张俊华,张榆锋,施心陵

(云南大学信息学院

脾肾阳虚吃什么药中成药好
脾肾阳虚吃什么药中成药好
脾肾阳虚吃什么药中成药好
头晕耳鸣是肾虚的表现吗