© 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
一种基于兴趣点的图像检索
方法
快递客服问题件处理详细方法山木方法pdf计算方法pdf华与华方法下载八字理论方法下载
α
鲍永生, 韩军伟, 郭 雷
(西北工业大学 自动化学院, 陕西 西安 710072)
摘 要: 提出一种基于兴趣点的图像检索方法。此方法主要有兴趣点检测、基于兴趣点的特征描述
和相似度度量 3 个步骤。先使用一个自适应滤波器平滑图像, 然后提取兴趣点;
设计
领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计
一个包含兴趣
点局部灰度变化、兴趣点相互位置关系和兴趣点分布的 3D 直方图来
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
征图像特征; 用图像间 3D
直方图距离来测量图像间的相似程度。在含有 3 200 幅图像的数据库上的大量实验结果证明: 本文
提出的算法是有效的。
关 键 词: 图像检索, 兴趣点, 自适应平滑滤波器, 3D 直方图
中图分类号: TN 911. 73 文献标识码: A 文章编号: 100022758 (2004) 0220192204
基于内容的图像检索技术是多媒体信息检索的
热点。兴趣点是图像中灰度在 x 和 y 方向上都有很
大变化的一类特殊点, 有着计算简单、信息含量高、
匹配容易、数据量小等优点[1~ 5 ], 因此, 国外已有学
者[4~ 6 ]把它应用于图像检索中, 然而这些方法仅仅
考虑兴趣的灰度变特征, 忽视了兴趣点作为整体所
暗含的形状结构特征。
本文提出了一种新的基于兴趣点进行图像检索
的方法, 把兴趣点的分布以及呈现出的组织结构作
为刻画图像的主要特征, 以达到更好的检索效果。
1 兴趣点的提取
1. 1 兴趣点检测算子
兴趣点指图像中灰度在 x 和 y 方向上都有很大
变化的点, 采用 K itchen 和 Ro senfeld [2 ]的算子来检
测兴趣点。兴趣点测度值为
K =
I x x I 2y + I y y I 2x - 2I x y I x I y
I 2x + I 2y
(1)
式中, I 表示图像灰度值, I x , I y 分别是在x 和y 方向
上的一阶导数, I x x , I y y , I x y 为 I 的二阶导数。
1. 2 自适应平滑滤波器
影响兴趣点误检的最大因素是噪声, 方法[4~ 6 ]
都采用了高斯滤波器对图像进行平滑后再检测。高
斯滤波器存在一个缺陷: 模糊图像中的重要细节并
导致轮廓变形。本文使用一种自适应平滑滤波器[8 ] ,
此滤波器基于各向异性的热扩散方程, 借用松弛迭
代的思想, 使得梯度幅度较大的边缘点 (显著边缘)
的幅度随迭代次数的增加而增强, 而梯度幅度较小
的边缘和噪声随着迭代而平滑。算法的具体实现过
程为
(1) 计算梯度
G x (x , y ) = 0. 5[ I (x + 1, y ) - I (x - 1, y ) ] (2)
G y (x , y ) = 0. 5[ I (x , y + 1) - I (x , y - 1) ] (3)
(2) 计算导热系数
c (x , y ) = exp - G
2
x (x , y ) + G 2y (x , y )
2Α2 (4)
(3) 由 I t (x , y ) 迭代计算 I t+ 1 (x , y ) , 其中 I 0 (x ,
y ) = I (x , y )
I t+ 1 (x , y ) =
∑
1
i= - 1
∑
1
j = - 1
I t (x + i, y + j ) ct (x + i, y + j )
∑
1
i= - 1
∑
1
j= - 1
c
t (x + i, y + j )
(5)
导热系数 c (x , y ) 为梯度幅度的降函数, 梯度幅度高
处导热系数小, 梯度幅度低处导热系数大。Α是决定
梯度显著度的自由参数 (本文中 Α= 50)。自适应滤
波器既考虑到点自身的梯度特征又考虑到局部的结
2 0 0 4年 4 月
第22卷第2期
西 北 工 业 大 学 学 报
Journal of N o rthw estern Po lytechn ical U niversity
A p r. 2004
V o l. 22 N o. 2
α 收稿日期: 2003204225 基金项目: 国家自然科学基金 (60175001)和 973 项目
作者简介: 鲍永生 (1966- ) , 西北工业大学博士生, 主要从事信号与图像处理的研究。
© 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
构特征, 即孤立的梯度突变点将被平滑而局部具有
整体集团优势的突变点即显著边缘将被增强。
图 1 是一幅冰结晶体图像。图 2 是使用 K- R
算子直接对原图检测出来的兴趣点图。用“+ ”标记
每一个兴趣点。图 3 是图 1 经过 Ρ= 1 的Gau ss 滤波
器平滑后检测的兴趣点图。图 4 是图 1 经过 Ρ= 2. 3 的 Gau ss 滤波器平滑后检测的兴趣点图。图 5 是图1 经过自适应平滑滤波器 5 次迭代后检测出的兴趣点。图 6 是图 1 经过自适应平滑滤波器 8 次迭代后检测出的兴趣点。从实验结果看出: 采用自适应平滑滤波器, 在平滑掉噪声的同时晶体上的兴趣点保留了下来, 并且保留的兴趣点具有结构性。
图 1 一幅冰晶体图像 图 2 未经平滑检测出的兴趣点图 图 3 Ρ= 1 的 Gauss 平滑后的兴趣点图
图 4 Ρ= 2. 3 的 Gauss
平滑后的兴趣点图
图 5 自适应滤波器 5 次
迭代后的兴趣点图
图 6 自适应滤波器 8 次
迭代后的兴趣点图
2 基于兴趣点的图像特征
文献[ 4~ 6 ]都使用兴趣点的测度值或测度值的
统计量来表征图像, 仅考虑到了兴趣点的局部灰度
变化情况, 把兴趣点当作孤立的单位, 没有考虑兴趣
点整体的分布情况和图像中物体形状结构。因此, 本
文提出一种可以表征兴趣点分布的 3D 直方图特征
表示方法。
2. 1 基于兴趣点的直方图
3D 直方图是以兴趣点对为最小的计量单位。x
维是兴趣点对的测度值差, y 维是兴趣点对之间的
距离, z 维是点对出现的频率。用 H 3D 代表 3D 直方
图; Χ( i, j ) 表示兴趣点; K ( i, j ) 代表兴趣点 Χ( i, j )
的测度值; d i, j ,m , n 代表兴趣点 Χ( i, j ) 与兴趣点 Χ(m ,
n) 之间的象素点距离; ∃K i, j ,m , n 表示 Χ( i, j ) 与 Χ(m ,
n) 测度值差; N (∃K , d ) 表示图像中测度值差为∃K , 距离为 d 的兴趣点对数; T 表示图像中所有用
于统计的点对数; p (∃K , d ) 表示测度值差为 ∃K , 距
离为 d 的兴趣点对频率。3D 直方图生成步骤为
(1) 提取出图像中所有的兴趣点, 记为: Χ( i,
j ) , ( i, j ) 表示在图像中的位置。
(2) 依次扫描每一个兴趣点。设正在扫描的兴
趣点Χ( i, j ) , 在以它为中心的n ×n 邻域中搜寻其它
兴趣点 Χ(m , n) , 设搜寻到兴趣点, 则计算∃K i, j ,m , n = ûK ( i, j ) - K (m , n) û (6)
d i, j ,m , n = m ax (û i - m û , û j - nû ) (7)
更新点对数
N (∃K i, j ,m , n , d i, j ,m , n) = N (∃K i, j ,m , n , d i, j ,m , n) + 1
(8)
T = T + 1 (9)
(3) 扫描完所有兴趣点后, 统计 p (∃K , d )
p (∃K , d ) = N (∃K , d )T
0 Φ ∃K Φ 254 1 Φ d Φ n (10)
(4) 生成直方图
H 3D = { (∃K , d , p (∃K , d ) ) } 0 Φ ∃K Φ 254
1 Φ d Φ n ∑p (∃K , d ) = 1 (11)
式 (11) 中的直方图存储量和计算量都相当大,
通过实验总结了一个便于存储和计算且不会显著影
响检索准确率的量化直方图。在实际中, 发现兴趣点
对间的测度值差超过 100 的概率几乎为 0, 因此, 只
需计算 0 Φ ∃K Φ 100, 超过 100 的测度值差就按
100 计算, 邻域尺寸 n 一般取为 40, 因此距离 1 Φ d
·391·第 2 期 鲍永生等: 一种基于兴趣点的图像检索方法
© 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
Φ 20。距离以2为量化单位, 即: dδ= [d ö2 ]N , [õ ]N 表
示取整; 测度差值以5为量化单位, ∃Kδ= [∃K ö5 ]N。
所以, 量化直方图 Hδ3D 为 Hδ3D = { (∃Kδ, dδ, p (∃Kδ,
dδ) ) }, ∃Kδ = 0, 1, ⋯, 20; dδ = 0, 1, ⋯, 10; ∑p
(∃Kδ, dδ) = 1。图 7 是图 1 经过 5 次迭代后统计的兴
趣点 3D 直方图, 为了节省篇幅, 仅显示了 ∃Kδ = 0,
1, 2; dδ = 0, 1, 2 部分。
图 7 图 1 经过 5 次迭代平滑后统计的兴趣点直方图
(只显示部分)
3 相似性度量
图像间的相似性用它们 3D 直方图间的距离来
表示。设一幅待查询图像Q 的兴趣点直方图为HδQ3D ,
图像数据库中的图像U 的兴趣点直方图为HδU3D , 定
义图像Q 与图像U 的相似度 S (Q ,U ) 为
S (Q ,U ) = D (HδQ3D , HδU3D ) = - ln∑20∃Kδ= 0∑10dδ= 0 õ
pQ (∃K^ , d^ ) õ pU (∃K^ , d^ ) (12)
4 实 验
用V C+ + 5. 0 实现了一个图像检索系统, 图像
数据库中共有 3 200 幅图像, 主要包括人物、风景、
建筑物等。检索系统运行环境为: P4 1. 7G PC,
512M 内存,W indow s2000 操作系统。
随机挑选了 100 幅图像作为待查询图像, 计算
了平均检索准确率和平均检索时间。为了对比, 使用
同样的图像, 计算了文献[ 4 ]和[ 5 ]中提出的基于兴
趣点检索方法的平均检索准确率和平均检索时间。
图 8 和图 9 给出了 3 种方法的检索准确率和平均检
索时间。可以看出, 本方法优于文献[ 4 ]和[ 5 ]中的方
法。
图 8 3 种方法平均检索准确率曲线图
图 9 3 种方法平均检索时间曲线图
5 结 论
提出了一种新的基于兴趣点的图像检索方法,
对兴趣点的使用摆脱了传统的模式, 把兴趣点的分
布以及兴趣点呈现的组织结构作为代表图像性质的
首要因素。实现了一个基于本文方法的图像检索系
统, 大量的实验和与同类方法的比较表明, 此方法检
索效率很高。
参考文献:
[ 1 ] Beaudet P R. Ro tationally Invarian t Im age Operato rs. In ternational Conference on Pattern R ecogn it ion, 1978, 579~
583
[2 ] K itchen L , Ro senfeld A. Gray2L evel Co rner D etection. Pattern R eccogn it ion L etters, 1982, 1: 95~ 102
[3 ] H arris C, Stephens M. A Com bined Co rner and Edge D etection. Im age V ision Computt ing, 1998, 6: 121~ 128
[4 ] Schm id C, M oh r R. L ocal Grayvalue Invarian ts fo r Im age R etrieval. IEEE T rans on PAM I, 1997, 19: 530~ 535
[ 5 ] B res S, Schett in i R. D etection of In terest Po in ts fo r Im age Indexation. IEEE Conference on Im age P rocessing, 1999,
227~ 234
[ 6 ] H einrich s A , Koubarou lis D , L evienaise B. Im age Index ing and Conten t2Based Search U sing P re2A tten tive Sim ilarit ies.
·491· 西 北 工 业 大 学 学 报 第 22 卷
© 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
IEEE Conference on Im age P rocessing, 2000, 132~ 138
[7 ] W o lf C. Conten t2Based Im age R etrieval U sing In terest Po in ts and T ex ture Featu res. In 3rd In t Conf on V isual Inf
System , 2000, 427~ 434
[ 8 ] Perona P, M alik J. Scale2Space and Edge D etection U sing A niso trop ic D iffusion. IEEE T rans on PAM I, 1990, 12: 629
~ 639
A Better Image Retr ieva l Approach
B ao Yongsheng, H an Junw ei, Guo L ei
(D epartm ent of A utom atic Contro l, N o rthw estern Po lytechn ical U niversity, X i′an 710072, Ch ina)
Abstract: R efs. 7 and 8 offered im age retrieval app roaches that are, in ou r op in ion, no t qu ite eff icien t.
L ike R ef. 7, w e u se in terest po in ts and like R ef. 8, w e u se an iso trop ic d iffu sion. U n like R ef. 7, w e design
a self2adap t ive filter tha t can sign if ican t ly low er the erro r of detect ion of in terest po in ts; sub sect ion 1. 2
gives in som e deta il ou r design of th is self2adap t ive filter. U n like R ef. 8, w e do no t t rea t in terest po in ts as
being iso la ted; in stead w e at tach great impo rtance to essen t ia l fea tu res abou t in terest po in ts as a w ho le;
sect ion 2 gives in som e deta il ou r con sidera t ion of these fea tu res. A fair amoun t of test resu lts, based on a
database of 3200 im ages and show n in F igs. 8 and 9, show p relim inarily that ou r im age retrieval app roach
is indeed bet ter than R efs. 7 and 8 in that ou r app roach can sign if ican t ly ra ise the accu racy of erro r
detect ion and decrease the t im e of detect ion.
Key words: im age retrieval, in terest po in t, adap t ive filter, an iso trop ic d iffu sion
至 2003 年 4 月为止西北工业大学有 8 篇为
《国际航空宇航摘要》( IAA)收录在 20 行以上的第一作者论文
《国际航空宇航摘要》( In ternat ional A ero space A b stracts, 简称 IAA ) 收录在 20 行以上的论文是很少
的。1998~ 2001 四年间麻省理工学院等 5 校只有 IAA 收录在 20 行以上的论文 7 篇: 27 行 1 篇 (麻省理工学
院)、21 行 1 篇 (西北工业大学)、20 行 5 篇 (麻省理工学院 2 篇、成功大学 2 篇、西北工业大学 1 篇)。5 校中的
北航及南航均无 IAA 收录在 20 行以上的论文。
下表中列出西北工业大学 8 篇为 IAA 收录在 20 行以上第一作者论文情况。
行数 25 行 23 行 21 行 20 行 20- 25 行
西工大学报 A 03- 23648
A 02- 39226
A 97- 19870
A 96- 34338 A 97- 19874 5 篇
非西工大学报 A 02- 31515 A 00- 42162 A 00- 29966 3 篇
西北工业大学 1 篇 3 篇 2 篇 2 篇 8 篇
胡沛泉
2004 年 3 月 23 日
·591·第 2 期 鲍永生等: 一种基于兴趣点的图像检索方法