首页 基于投影法的文档图像分割算法

基于投影法的文档图像分割算法

举报
开通vip

基于投影法的文档图像分割算法基于投影法的文档图像分割算法 () 自然科学版 Vo l. 28 No. 2 成都大学学报 第 28卷 第 2期 ()2009年 6月Jou rna l of Chengdu U n ive rsity N a tu ra l Sc ience Ed ition J un. 2009 ( ) 文章编号 : 1004 - 5422 2009 02 - 0139 - 03 基于投影法的文档图像分割算法 杨晓娟 , 宋 凯 ()沈阳理工大学 信息科学与工程学院 , 辽宁 沈阳 110168 摘 要 : 提出了一...

基于投影法的文档图像分割算法
基于投影法的文档图像分割算法 () 自然科学版 Vo l. 28 No. 2 成都大学学报 第 28卷 第 2期 ()2009年 6月Jou rna l of Chengdu U n ive rsity N a tu ra l Sc ience Ed ition J un. 2009 ( ) 文章编号 : 1004 - 5422 2009 02 - 0139 - 03 基于投影法的文档图像分割算法 杨晓娟 , 宋 凯 ()沈阳理工大学 信息科学与工程学院 , 辽宁 沈阳 110168 摘 要 : 提出了一种基于投影法的中文文档图像分割算法 ,从文档图像的投影出发 ,根据文档图像水平投影的统计特性 ,进行灰度值累加 ,找到每行文字所在坐标 ;根据文字的竖直投影形状特征 ,进行竖直方向上的分割 , 通过对字符图像的分割 ,实现对整篇文档的分割 ;对各种字体的文档图像的灰度图进行了试验. 结果 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 明 ,该算 法能够准确地对文档图像进行分割. 关键词 : 文档图像 ;图像分割 ;字符切割 ;投影法 中图分类号 : TN39114 文献标识码 : A 字行图像切割出来 , 行切割的具体方法是 :对二值化 言0 引图像从上到下逐行扫描并同时计算每个扫描行的像 文档图像是以像素形式存贮的 , 很难直接操纵素 , 以获取图像的水平投影; 根据水平投影值确定文 其中的文本 内容 财务内部控制制度的内容财务内部控制制度的内容人员招聘与配置的内容项目成本控制的内容消防安全演练内容 , 为了识别单个汉字 , 必须进行文档 字行的位置; 利用文字行间空白间隔造成的水平投 [ 1 - 4 ] 图像分割 . 本文基于中文文档图像的特征 , 提出 影空白间隙 , 使可将各行文字分割开来. 任何一个图像都是由像素构成的 , 我们约定图了一种基于投影法的文档图像分割算法. 像文件上的背景所对应的像素是白点 , 文字、图形、1 文档图像的预处理 ( 图像等所对应的像素是黑点. 那么 , 一个像素行 列文档图像的预处理采用二值化处理方法 , 即采用 ) 的投影值 的黑点数的总和 , 就是这一行像素行[ 5, 6 ] 基于梯度均值的阈值选取方法 ,其实现方法如下 : () () 列 的投影值 , 把所有的像素行 列 的投影值都统 ( ) 1 计算文档图像的梯度直方图. () 计出来 , 就得到整个图像文件的水平 垂直 投影 ( ) G - h is ton g ram [ f x, y ] () 见图 1 . ( ( ) ) = G - h is tog ram [ f x, y ] + [ f x + 1, y - 投影是一种特征函数 , 它把二维图像的像素分 ( ) ( ) ( ) ( )布特征简化为 x 轴和 y轴上的两个一维函数. 投影算 f x - 1, y] + [ f x, y + 1- f x, y - 1] 1 ) ( 法正是从这两个一维函数出发来进行分割的. 其中 : f x, y 为输入图像; h is tog ram 为梯度直方图. M ( ) 2 直方图归一化.( ) ( )列投影 H i= f i, j i = 1 N 255 ?j = 1 ( )5 ( )( )G - H = G -h is ton g ram i 2 ?N i = 0 ( )( ) 行投影 V j= f i, jj = 1 M ?( )G - h is tog ram i i = 1 ( ) ( ) ( )( )= G - h istong ram i/ G - H i = 0, 1, , 255 3 1 i, j点为黑点( ) 其中 , f i, j=( ) ( ) 3 计算阈值i, j点为白点.T. 0 255 2. 2 字切割 ( )T = i3 G -( )h is ton g ram i. 4 ?i = 0 字切割是从行切割后得到的文字图像行中将单 个汉字的图像分割出来. 其方法是利用字与字之间 2 文档图像的分割算法的空白间隙在图像行垂直投影上形成的空白间隙将 单个汉字的图像切割开来. 但是 , 汉字中有相当数量 2. 1 行切割的字是由左右两部分构成的二分字和由左中右三部 图 1 行切割投影图 ( ) ) ( 分组成的三分字 , 这些字的图像垂直投影在其内部2 若 w i< L, 则可能是标点符号或左右结 1 ( ) ( ) ( 也会出现空白间隙 , 因而单纯使用垂直投影空白间 构汉字的一部分 , 如果 w i + 1 < L, 则将 w i、w i1 ) (+ 1 合为一个字符图像 , 否则认为是标点符号 这里 隙切分汉字的切割算法会产生误分. 本文为解决这 ) 并未考虑有连续 2个以上小于 L的情况 . 一问 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 , 利用字间的间隔一般大于字内部间隔这一 1 ( ) ( ) 特点将二者进行区分.3 若 w i> L, 则可能是粘连、重叠、交叠等 2 因素造成的二个或多个字符的粘合 , 这时 , 可根据字 2. 3 字间的粘连 符的 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 宽度 L 进行分割.影响文字分割质量的主要因素有 : 文字间的粘 [ 7, 8 ] 2 4 连、重叠和交叠等 . 粘连是指字符间轮廓线的接 ( ) ) ( 4 从 w i的 L 处向左至 L , 向右至 L 的范3 3 触 , 可以用直线分开; 重叠是指字符间虽然没有粘 () 围内搜索从上至下 垂直方向 的非连接通道 , 并以连 , 但字符区域有重叠 , 不易用直线将其分开; 交叠 此通道作为字符间的分割线. 若没有非连接通道 , 则 则是指既有粘连又有重叠的情况 , 不易分割 , 但出现 ( ) 将在此范围内与 w i交点最少的直线作为字符分割 交叠的情况并不多见. 线. 对于分割后余下的部分可重复到第 3步.我们设计了一种中文字符分割方法 : 先利用水 平投影算法进行字符行分割 , 由于文档中行与行之 可以看出 , 这种分割方法具有很高的准确率 , 同 间的间隙比较明显 , 因此用投影分割方法效率较高 一文档图像中 , 即使不同行中的字符尺寸不一致 , 但 () 这里不考虑行倾斜情况 ; 得到字符行后 , 可对其进 只要在同一字符行中字号一致 , 均可实现正确分割. 行垂直投影 , 分割出单个中文字符 , 但由于中文字符 3 文档图像的算法验证 的左右结构、标点符号以及字符间的粘连 、重叠、交 叠等因素 , 这种分割结果比较粗糙 , 需要做进一步处 为了验证本文提出的算法 , 我们建立了 1 000 幅 中文文档图像 , 并对每幅图像进行处理 , 其处理流程 理. () 如图 2所示 , 分割结果 示例 如图 3所示. 假设对字符行垂直投影后得到了 N 个字符图 ( ) 像 , 每个字符图像宽度为 w i, i = 0, i,, N - 1, 按 宽度将其分为 3 类. 若样本个数最多的类为 C, 则此 类中的样本将被视为正确分割出来的字符图像 , 将 这些样本的字符宽度的均值 L 作为本行的标准字符 2 文档图像处理流程图 宽度. 那么 , 本行正确字符图像的宽度应在 [L, L] 1 2 2 4 ( ) = | L , L | 之间. 故可根据字符图像宽度 w i进4 结论3 3 141??第 2期杨晓娟 ,等 :基于投影法的文档图像分割算法 图 3 文档图像分割结果图 [ 4 ] Kankanha lli M S, M eh tre B M , W u J K. C luster2based color 字切割 , 将整篇文档图像切割成单个字符图像. 通过 m a tch ing for im age retrieva l [ J ]. Pa tte rn R ecogn ition, 1996 , 实验证明 , 该算法不仅速度较快 , 且识别率很高 , 在 ( ) 29 4 : 701 - 709. 此基础上做进一步工作 , 还可将其推广应用于彩色 [ 5 ] Ca ste lli V , B e rgm an L D. Im age D a tabases2S ea rch and R e2 文字图像的处理.trieva l for D ig ita l Im agery [M ]. San F ranc isco: John W iley & Son s, 2002. 参考文献 : [ 6 ]叶芗芸 , 戚飞虎 , 吴健渊. 文本图像的快速二值化方法 [ 1 ]章毓晋. 图像处理和分析 [ M ]. 北京 : 清华大学出版社 ,( ) [ J ]. 红外与毫米波学报 , 1997, 16 5: 344 - 3501 1999. [ 7 ]陈 艳 ,孙羽菲 ,张玉志. 灰度图像中字符切分方法的研 [ 2 ]田村秀行. 计算机图像处理技术 [M ]. 北京 : 北京师范大 ( ) 究 [ J ]. 中文信息学报 , 2004 , 18 4 : 44 - 49. 学出版社 , 19861 [ 8 ]丁明跃 ,彭嘉雄. 基于内点保留的二值图像细化算法 [ J ]. [ 3 ]高 吉吉 , 康耀红 , 雷景生 1 基于统计投影法的图像检索 ( ) 华中理工大学学报 , 1994 , 22 1 : 79 - 83. ( ) [ J ]. 海南大学学报自然科学版 , 2008 , 26 1 : 43 - 471 A lgor ithm of D ocum en t Image Segm en ta t ion Ba sed on Projec t ion M e thod YAN G X iaojuan, SON G Ka i ( )Schoo l of Info rm a tion and Enginee ring, Shengyang L igong U n ive rsity, Shenyang 110168 , Ch ina A b stra c t:A wo rd s im age segm en ta tion a lgo rithm wa s p ropo sed ba sed on p ro jec tion. To find the coo rd i2 na te wh ich eve ry line loca te s, acco rd ing to the ho rizon ta l p ro jec tion sta tistic s cha rac te ristic s of docu2 m en t im age, the gray va lue wa s accum u la ted sta rting from the p ro jec tion of docum en t im age; to rea lize the segm en ta tion of the who le docum en t, the ve rtica l segm en ta tion of cha rac te r p ic tu re wa s m ade ac2 co rd ing to the ve rtica l p ro jec tion shap e fea tu re of wo rd s. In th is re sea rch, a lgo rithm of wo rd s im age segm en ta tion in docum en t im age p roce ss wa s de sc ribed in de ta il and grey2sca le m ap s of docum en t im 2 age s of d iffe ren t k ind s of fon ts we re stud ied. The re su lts show tha t th is a lgo rithm is ab le to accu ra te ly segm en t docum en t im age. Key word s: docum en t im age; im age segm en ta tion; cha rac te r segm en ta tion; p ro jec tion m e thod
本文档为【基于投影法的文档图像分割算法】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_036899
暂无简介~
格式:doc
大小:53KB
软件:Word
页数:6
分类:生活休闲
上传时间:2017-10-16
浏览量:24