基于 M atlab图像的文字区域检测新方法
闻京(广州军区司令部建筑工程设计院.广东广州510515)
摘 要:嵌入在图像中的文字信息是图像语义的一种重要表达方式,通常反映了图像的主要内容,因此.准确检测出图像中的文字区域是
正确理解图像内容的关键。本文提出一种边缘纹理特征与灰度特征相结合的文字区域检测算法。实验证明该算法效果较好。
关键词:边缘检测;纵向边缘;灰度直方图;文字区域
中图分类号:TP391 4 文献标识码:A
1引言
随着多媒体技术和计算机网络的飞速发
展,越来越多的信息以数字图像的形式传播
和存储。图像中的文字包含丰富、明确的信
息,一定程度上反映了图像的主要内容。图像
中文字区域的准确提取是正确理解图像内容
的关键.对于信息检索、图像注释、网络监控、
网络垃圾图像过滤、智能交通、数字图书馆等
领域都有着重要意义。
近年来,对于彩色图像文字区域提取的
研究已经取得了大量研究成果,Agnihotri{ 通
过边缘滤波与形态学运算结合处理图像。利
用启发性规则确定文字区域;DatongChenla
利用 Canny算子提取图像边缘,并用支持向
量机方法确认文本行;HuaP]~lJ用文字条角点
特征提取出文字块等。但由于图像存在背景
纹理复杂,文字尺寸不一致、字体多变、颜色
多样、排列方式多变等的复杂性,仍存在文字
区域提取的准确率不高、精确度不高、效率不
高等问题。
针对国内外对图像中文字区域提取方法
研究现状中存在的问题,提出一种结合图像
边缘纹理与灰度特征的方法。实验证明.该方
法文字区域提取的准确率较高,对复杂背景
图像也能较好地实现文字区域与背景区域的
分离。
】 丑口
算法主要分为5个关键步骤:(1)输入彩
色图像;(2)将彩色图像转化为灰度图像,并
对灰度图像进行纵向边缘检测;(3)通过等值
行分割、动态列分割、相邻矩形区域合并确定
候选文字区域;(4)候选文字区域灰度直方图
分析
定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析
;(5)根据二值图像生成的四邻域连通域
的几何形状特征确定最终文字区域。
2 1边缘检测
一 个可识别的文字串通常具有这样的特
点【 :文字的边缘颜色通常和背景有着较强的
对比;字符边缘是由横向边缘、纵向边缘、斜
向边缘组成的,这些边缘线条使字符具有与
背景不同的纹理特征。因此考虑从边缘的角
度来检测文字。
边缘检测前先对彩色图像作灰度化处
理。
常见的边缘检测算子有 Roberts算子、
Prewitt算子、Sobel算子、Laplacian算子等。
对比之下,Sobel算子通过增加权重的方法
作卷积处理效果更好,在一定程度上抑制了
噪声,且计算代价相对降低 。因此,采用
Sobel算子检测灰度图像边缘。
对于灰度数字图像 f(i.j),Sobel算子的
横向和纵向梯度定义如下 :
《= 一i+1)+2x^Lf+l}十九,+Li+li]一嘶一I,j—n+ f 『_l】+“f儿卜l】】
=[1ii-[j-I+2~fti一【/】+^j—l/+ +L卜n÷2×_九f+ f +I}
如果综合考虑横向和纵向梯度,像素点
对应的梯度定义为:
、j)= +(
由此可得到了一个边缘图S(i,j)。根据文
字纵向边缘尤为明显的特征,只考察灰度图
像的纵向边缘。
将边缘图二值化,并通过细化、去噪等处
理,得到如图 1一b所示纵向边缘二值图像。
网
a原彩色图像
b边缘二值图
图 1边缘检测
2_2候选文字区域的确定
得到纵向边缘二值图后,采用等高行
割与动态列分割结合的方法检测文字区域
(1)等高行分割
行区域的高度取值要适当。取值太大,‘
使高度较小的文字行区域包含大量背景,!
分析带来困难。考虑到文字的高度至少要.
于 6才可以保证文字清晰可见,将原图像
均分成高为 6的行区域。
(2)动态列分割
图像中的文字尺寸可能大小不一,因
分割出的不同行区域中的文字边缘间隔距
也可能不相等。解决方法:求每个行区域中
边缘间隔距离均值 d,将水平距离小于 d
边缘归为同一区域,大于 d的边缘分隔开。
图 2一a为行列分割后得到的等高矩
区域。绝大部分含文字的矩形区域被检测
来,部分背景区域被删除。小部分的背景矩
区域被误判为文字矩形区域被保留下来。
(3)相邻矩形区域的合并
分割出的矩形区域的高度仅为6,而
寸较大的文字是由多个高为 6像素的矩形
域组成的。因此需要将相邻接的矩形区域
并。得到完整的文字区域。
设图像中共有 N个矩形区域,用 M 表
某个矩形区域,i值从 1取到 N。若两矩形框
相邻,即 M nM ≠由,则合并这两个矩形区
域。
如图2-b,在灰度图像上标识出了合并
小矩形区域后得到的候选文字区域。
l 二⋯ 二二一 一一一一 。_。!=一 ] l 蓍蓦善兽莹薯
量蓦 委 兰芸耋妻 J
l ’ ’ { I
}j iijjj 一 == ====;I I霎 重萤 ‘ 雾
l喜譬 量量量量量 ’ 耋誊耋蚕
lli尹 ————Ei ’I l藿量
一
熏 雾 薹耋
I ⋯ · ·.1 1
. 重蚕蕈誊萤 1 l 量妻蕈 兰
’
I l亭 ‘ 藿
I ’ I 量妻墓雪 耋雾童 暮亳垂羞荨蓍 1
I . ·
a等高矩形区域
b合并后的矩形区域
图2候选文字区域的确定
2 3灰度直方图分析
消除残留的少量背景区域是准确提取出
图像中的文字区域和降低文字区域误检率的
关键步骤之一。
同一文字区域内的文字通常灰度相近或
者相同.由此可知候选文字区域中不是文字
的灰度占大部分,就是背景的灰度占大部分。
灰度直方图往往呈现明显的峰值特性 (如图
3一a)。
由于文字纵向边缘丰富。且纵向边缘与
背景的灰度值存在较大梯度才能使文字从背
景中得以明显显现。因此,要统计出所有水平
元素梯度之和.计算出梯度均值作为衡量标
准。假设背景灰度占大部分,则将与背景灰度
值相差大于均值的像素视为前景。差值小于
均值的视为背景。
设候选灰度区域图像为×(i.j).根据灰度
直方图求出数量最多、占图像比例最大的灰
度值 max gray,假设此灰度值为背景灰度
值;根据算子(一1 0 1)求灰度图像水平梯度,
将大于一定阈值的梯度记录并求和,设梯度
TechnologY APPIiCatlon
和为 sumgray,实验发现 .闻值为 1O时,人
眼较易区分灰度视觉特征且效果较好;计算
梯度均值 meangray;如果像素点(i.j)的灰度
值 X范 围 为 :max gray—meangray≤×≤
max gray+meangray。则将该像素点视为背
景像素 ,取值 0.如果像素点(i,j)的灰度值 X
范围为:X
max gray+meangray,则将该像素点视为文
字像素,取值 1。这样,就得到一个文字与背
景分割开的二值图像(如图3一d)。对于文字
灰度值占图像比例较大的图像来说,只需对
图像作反色处理即可。
a候选文字区域灰度直方图
舞鼍 ‘_ _
墒
《蕊 嗣麟 团隧
图4文字区域检测结果
3实验结果
l 算法实验在 Matlab环境下进行,共对
l 91帧文字图像进行了文字区域检测。实验结
I果显示,图像中文字区域正确检出率为
l 90.952%,效果较好。
j 从结果图(图4)可以看出,算法较好地
l解决了图像中文字尺寸不一致与背景复杂造
l成文字区域检测准确度下降这一难点,并且
I有效避免了复杂的纹理计算。较准确地检测
I出图像中的文字区域。
b候选区域灰度图像
。
.:
C迭代法得到的二值图像
d本文方法得到的二值图像
图3灰度直方图与二值图像
2.4确定最终文字区域
二值图像生成四邻域的连通域,分析连
通域的面积、长、宽和长宽比等几何形状特
征,滤除非文字连通域。得到如图4所示的最
终文字区域。
参考文献
【1]L.Agnihotri.N.Dimitrova.Text detection
for video analysis.IEEE Workshop on Con—
tent-Based Access of Image and Video
Libraries,1999.
[2]CHEN Datong,SHEARER K,BOURLARD
H Text enhancement with asymmetric filter
for video OCR:p roc.of International Con—
ference on Image Analysis and Processing
[C】【S.I.】=【s n.】,2001:192—197.
【3]X.一S.Hua。X.一R.Chen,W.Liu,et a1.Auto—
matic Iocation of text in video frames In
Proceeding of ACM Multimedia 2001
Workshops:Multimedia Information Re-
trieval,PP.24—27.Canada,Oct,2001.
[4】胡小锋.周勇。叶庆泰.复杂背景彩色图像
中的 文 字分 割 .光 学 技 术 ,2006.32(1):
141—143
【5]RAFAEL C G.RICHARD E W.Digital Im—
age Processing [M](4th ed)[S.I]:Prentice
Hal1.2001.
[6]Rafael C,Gonzalez.Richard E.Woods.数
字图像处理 (第 2版)[M】.电子工业出版社,
2003(3):463—474
[7】吴燕.数字水印技术研究及其 matlab仿
真.网络与信息。2010(8):37.
[8】许剑峰,黎绍发 基于颜色边缘与SVM的
图像文本定位 计算机应用研究,2006(3):
155-157