首页 基于正交线性判别分析的植物分类方法

基于正交线性判别分析的植物分类方法

举报
开通vip

基于正交线性判别分析的植物分类方法基于正交线性判别分析的植物分类方法 。。,据集进行植物分类试验结果表明该算法对植物分类是有效可行的 ; ; ; 关键词 流形学习线性判别分析正交线性判别分析植物分类 Q 949A中图分类号 文献标识码 0517 ) 6611( 2012) 01 ) 00009) 02文章编号 A ethod of Plant Taxonomy Based on Othogona nea Dscmnant Anayss AgothmMrlLiririililri ZHANG Shan-wen et al ( SIAS Inte...

基于正交线性判别分析的植物分类方法
基于正交线性判别 分析 定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析 的植物分类方法 。。,据集进行植物分类试验结果 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 明该算法对植物分类是有效可行的 ; ; ; 关键词 流形学习线性判别分析正交线性判别分析植物分类 Q 949A中图分类号 文献标识码 0517 ) 6611( 2012) 01 ) 00009) 02文章编号 A ethod of Plant Taxonomy Based on Othogona nea Dscmnant Anayss AgothmMrlLiririililri ZHANG Shan-wen et al ( SIAS International University,Zhengzhou University,Zhengzhou,Henan 451150) Abstract At first,the within-scatter and between-scattera tmrices are calculated respectively,and the‘minus’form objective function is ob- tained, Secondly,the projection matrix is obtained by calculating the eigenvector, Finally,the plant taxonomye xperiment if carriedout based on real plant leaf database, Results show that the rpoposed methodi s effective and feasible for plant taxonomy Key words Manifold learning; Linear discriminant analysis ( LDA) ; Orthogonal linear discriminant analysis ( OLDA) ; Plant taxonomy ,( 1) :,植物是人类赖以生存和发展的重要物质资源在水土保 为了克服小样本问题将式改写为差的形式T 、。J″( w) = w持荒漠抑制和气候改善等方面起至关重要的作用随着人 )β S ) w b wT T ( S , 类生产活动日益增加人类赖以生存的生态环境不断遭到破 s, t, wXXw = nI,( 3) ,1 ) 2,T ,。,坏很多植物物种濒临灭绝因此保护植物 物 种 显 得 w ,w ,…,w ,ww =为了得到一组正交基向量 即使得 1 2dd 1 TT,,越来越重要而保护植物物种首先要认识植物对植物物种 w= … = ww= 0。L = S) S,( 3) w令 β则式改写为 d 2 d d ) 1 b w T 。、、、,进行分类相对于植物的根茎花果和皮而言基于叶片 maxt{r wLw}( 4) T T T 、、图像的植物物种识别与分类研究是一种最直接简单有效 w,wXXw = n,wLw对于任意 的 将 其 归 一 化 为 使 得 T T 。和代价最小的手段国内外已有很多基于叶片图像的植物 wXXw ,( 4) 与 之比保持不变则式的最大化问题转换为带 ,3 ) 13,T T T ,物种分类与识别方法和技术但由于实际植物叶片图像 wXXw = n wLw 。约束条件 的最大化 问题 ,的复杂性使很多算法的识别效果不能满足植物物种自动化 w wLw = 对应的最大特征值的特征 假设 为特征问题 λ1 T ) 1 。,分类的要求而流行学习是一种有效的维数约简方法已广 ,w ) L ( XX向量则 为 矩 阵 对应的最大特征 值 的 特 征 向 1,14 ) 16,。( LDA) 泛应用于模式识别中线性判别分析是一种经 d 。,量为了得到第 个正交基向量最大化下面有约束条件的 、,LDA ,典有效的维数约简方法但 是非正交的即判别向量 :目标函数 T,,是线性非独立性的很难估计数据的本征维数且在实际应 Lw}max{ w d d 。LDA ,LDA 用中会遇到小样本问题为克服 的不足笔者在 TTTT T w= ww= … = ww= 0,wXX w= n( 5) s, t, w d 1 d 2 d d ) 1 d d ,基础上提出一种基于正交判别分析的植物分类算法以期为 Lagrangian :利用 数乘法 。TT TT该领域的学习和研究提供一定的理论依据 ))J = wLw( wXX w) n ) ww) … λ μ d dd d1 d 1 d 1( OLDA) 正交线性判别分析算法 T( 6) ) wwμ d ) 1 d d ) 1j X C n N ,xi 假设 是属于 类的 个 维样本数据为 类中第 iJ w 0,求 关于 的偏导数并令其等于 得 dd1 2 N iT = ,x,x,…,x,…,j ,Nl ,X 为第 类的样本个数则 个样本l 1 1 1 2Lw ) 2XXw ) w )… ) λμ μ w= 0( 7) dd 1 1d ) 1 d ) 1NCC ,N= N。Sx?记类间和类内的散度矩阵分别为 和和C i = 1 i b 则 ,17 ) 18, S。LDA ,T T算法试图寻找一个最佳映射 使类间与类内 Tw Lw) 2wXX w= 02w( 8) λ d d d d ,LDA : 散度矩阵之比最大即 算法就是下面的一个优化问题得 T wS w T bwLw J( w) = ( 1) d dT =( 9) λ wS w T T wwXX w d d,其中 ( 7) d ) 1 :由式得到下面 个方程 N CCC ) 1TT ) 1T TT Tw( XX) w+ … + w( XX) w= 2wS= N( m)m ) ( m)m ) ,S= ( x)m ) ( xμ μ ???1 1 1d ) 1 1 d ) 11b C c c w i c i c = 1c = 1 i = 1 ) 1T T) ( XX ) Lw m)d( 2) c TT ) 1TT ) 1Tw( XX) w+ … + w( XXwμ μ ) = 2w ,mc ,m ,N其中为第 类样本的均值为所有样本的均值为 1 2 1d ) 1 2 d ) 12c C T ) 1 。 ( 10)( XX) Lw 每一类样本的数目 d …… 60975005) 。( 国家自然科学基金项目基金项目 TT ) 1TT ) 1Tw( XX ) w+ … + w( XX )μμ w= 2w 1 d ) 1 1 d ) 1 d ) 1 d ) 1 d ) 1( 1965 )) ,,,,作者简介 张善文男陕西阎良人博士从事模糊模式识别 T ) 1 ,E-mail: wjdw716@ 163, com。及其应用方面的研究 ( XX) Lw d 2011-09-29收稿日期 T=,,,…,,μμμμ 应用中国科学院合肥机械研究所智能计算实验室建立 d ) 1 1 2 d ) 1 W=,w,w,…,w,( http: / / 的植物叶片数据库进行试验d ) 1 1 2 d ) 1 T T ) 1www, comp, polyu, edu,hk / biometrics / ) 。50 选择的 种植物叶Q=,Q( i,j) ,= W( XX )W d ) 1 d ) 1 d ) 1 d ) 1 T T ) 11,15 。片图像见图 每种叶 片选取 幅不同的图像每幅叶片Q( i,j) = w( XX ) w d ) 1 i j 32 × 32 、256 ,图像大小为 像 素灰度级每幅图像表示为 10) : ( 则式表示成矩阵形式 T T ) 11024 。n维向量从每种植物 叶片图像中选取 幅图像作为Q= 2W( XX )Lwμ ( 11) 1 d ) 1 d ) 1 d ) 1 d ,n0, 05 。训练集剩余 幅图像作为 测试集选取 β 从 到 则 2 ) 1 T T ) 11, 00、0, 1,步长为 通过试验最佳 结果选取对应的最佳 β = 2QW( XX )Lwμ ( 12) d ) 1 d ) 1 d ) 1 dT ) 1 。,1 值在维数约简过程中低维数据维 数被压缩到原数据的 XX) ,( 7) ( 式两边同乘得 T ) 1 T ) 1 /4。; 利用训练样本建立分类模型利 用测试集估计算法的分)… ) μ 2 ( XX) Lw )2 w ) ) w ( XXλμ dd 11d ) 1T ) 1 ; 1类率采用最简单的最近邻分类器 ( XX) w = 0 d ) 1)N N 。10 。进行分类对每个数据分配方案进行 次试验叶 写成矩阵形式为 T ) 1 T ) 1 10 片图像不同分配方案中 次试验的平均分类率和分类方差 = 02( XX) Lw ) 2w )( XX) W λμ ddd ) 1 d ) 11。1 ,。见表 由表 可知该研究提出的方法分类效果最好 ( 8) 由式得 T ) 1 T ) 1 ) 1 T = w ( 13) { I )( XX) W} ( XX) Lw λQ W d ) 1 d ) 1 d ) 1d d ( 9) ,,与式一样参数 λ 只是使得最大化的一个准则即 wR。 是下面方程 对应的最大特征值的特征向量d d ) 1 T ) 1) 1 TT ) 1 LR= { I )( XX )VQV} ( XX )( 14) d ) 1 d ) 1 d ) 1 d ) 1 ,( OLDA) 根据上面分析得到正交线性判别分析算法的 : X PCA ,步骤如下?将 样 本 点 映 射 到 子 空 间舍 去 较 小 分 ; ( 2) SS; 量?由式计算类间和类内散度矩阵 和 ?选取一 b w TS) S; XX ; ( 14) d ,个 β计算 β?计算 ?由式求解 个正交特 b w W =,w,w,…,w,; X ,Y = 征向量 ?映 射 到 低 维 空 间即 1 2 d T WX。 50 1 图 种植物叶片图像 1 PCA、LDA、LPP、RS-Isomap OLDA 表 和 的植物叶片分类结果 n= 2; n= 13n= 4; n= 11n= 6; n= 9n= 8; n= 7n= 10; n= 4n= 12; n= 3n= 14; n= 1 方法 1 2 1 2 1 2 1 2 1 2 1 2 1 2 PCA0, 549 3 ? 0, 0430, 628 1 ? 0, 0510, 720 4 ? 0, 0630, 791 2 ? 0, 0570, 833 6 ? 0, 0680, 912 1 ? 0, 0720, 914 8 ? 0, 057,17 ) 18, 0, 643 7 ? 0, 054 0, 758 2 ? 0, 062 0, 812 7 ? 0, 056 0, 853 5 ? 0, 063 0, 913 6 ? 0, 064 0, 927 3 ? 0, 063 0, 930 4 ? 0, 071 LDA,1,90, 725 7 ? 0, 058 0, 887 1 ? 0, 069 0, 907 2 ? 0, 064 0, 918 2 ? 0, 059 0, 923 8 ? 0, 068 0, 933 5 ? 0, 071 0, 936 2 ? 0, 064 RS-Isomap 0, 763 0 ? 0, 047 0, 876 2 ? 0, 067 0, 918 2 ? 0, 065 0, 924 3 ? 0, 063 0, 938 6 ? 0, 065 0, 938 9 ? 0, 059 0, 946 7 ? 0, 062 ,15, OLDA SnakesT echnique,C,/ / Proceedings of IEEE International Conferenceo n 3结论与讨论 Neural Networks andB rain, Beijing,China: ,s, n, ,,2005: 885 ) 888, LDA 、,LDA 是一种经典有效的监督维数约简算法利用 ,6, NETO J C,MEYER G,JONES D D,et al, Plant species identification using Elliptic Fourier leaf shape naalysis,J,, Computers andE lectronics in Agri- 。LDA 可以有效地对高维线性数据进行维数约简但由于 算 culture,2006,50: 121 ) 134, ,。LDA 法存在小样本问题限制了其应用该研究在 基础上提 ,7, BRUNO O M,PLOTZE R O,FALVO M,et al, Fractal dimension applied to plant identification,J,, Inform Sci,2008,178( 12) : 2722 ) 2733, LDA ,。出一种正交 算法并应用于植物叶片图像分类中结果 ,8, ,,, ,J,,祁亨年寿韬金水虎基于叶片特征的计算机辅助植物识别模型 ,。 证明该方法是可行的下一步将针对植物叶片图像分类问2003,20( 3) : 281 ) 284,,浙江林学院学报 ,9, , ,J,, 祁亨年植物外观特征自动获取及计算机辅助植物分类与识别浙 ,、、。 题进一步研究鲁棒有监督的高效的维数约简算法2004,21( 2) : 222 ) 227,,江林学院学报 参考文献,10, ,,,, ,J,, 傅弘池哲儒常杰等基于人工神经网络的叶脉信息提取植物 ,1, KNAPP A K,FAY P A,BLAIR J M,et al, Rainfall variability,carbon cyc- 2004,21( 4) : 429 ) 436,,学通报 ing,and pant species diversity in a mesic grassand,J,, Science,2002, lll,11, , ,D,, : 王晓峰植物叶片图像自动识别系统的研究与实现合肥中国科 ,2005,298: 2202 ) 2205, 学院合肥智能机械研究 ,12, ,,,, 王晓峰黄德双杜吉祥等叶片图像特征提取与识别技术的研究 ,2, POUNDS J A,PUSCHENDORF R, Ecology: Clouded futures,J,, Nature, ,J,, ,2006( 3) : 190 ) 193,计算机工程与应用 2004,427: 107 ) 109, ,13, , ,D,, : 贺鹏基于叶片综合特征的阔叶树机器识别研究杨凌西北农林 ,3, NETO J C,MEYER G,JONES D D,et al, Plant species identification using ,2008,大学 eptc fourer eaf shape naayss,J,, Computers andE ectroncs in Agr- lliiillilii,14, de RIDDER D,DUIN R P W, Locally linear embedding for classification culture,2006,50: 121 ) 134, ,R,, IEEE Transactions on PatternA nalysis and Machine Intelligence,2002, ,4, MOKHTARIAN F,ABBASI S, Matching shapesw ith self-intersection: Ap- ,15, HE X,NIYOGI P, Locality preserving projections,R,, Advancesi n Neural plication to leaf classification,J,, IEEE Transaction on Image Processing, Information Processing Systems1 6 ( NIPS2, 003) ,2003, 2004,13( 5) : 653 ) 661, ,5,LI Y F,ZHU Q S,CAO Y K,et a, A Leaf en Extracton Method Baseodn lVii( 16 )下转第 页 5 Q1, 70 × 10) ,: 1, 85 ×捆绑在一起计算出各表的 值接近 ,合关系确定密码表中其他二重态捆绑均可用突变危险性极 Imax ,3,5 5 ,10,Q( ag) = 1, 80 × 10( Q 。 小化进行解释这可从氨基酸距离表中得到据此可定义 各反常密码表 的 MaxImax I:) ,I 平均值反常表 及其极小表 的相对距离可定义为 2, 2 二重态效应 证明现存无脊椎动物线粒体反常密码 min | Q) Q| 表是自然适应性条件下的极小表时还需对上述约束条件进 I Imin D=( 2) I,Imin Q( ag))Q 。,Max Imin一步细化在一定的约束条件下寻求极小表时即使二重态 ( 2) 用式可计算出 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 表和所有反常密码表与其极小表的相 ,, 捆绑固定也不意味着找到了极小表因为在二重态捆绑中,10, 。,对距离 该研究以无脊椎动物线粒体反常表 为 例为 体 2 ,若上下调换 个 氨 基 酸表的总体突变危险性值将 发 生 改 现反常表从标准表进化的痕迹将标准表的相关计算也纳入 。2 变该研究将由于二重态捆绑中上下调换 个元素对表的 ,3。( 其中结果见表 其中包括二重态效应发生处即调换二 。总体突变危险值的影响称为二重态效应若附加二重态效 2 ) ,重态捆绑中的 个元素使极小值发生变化处二重态效应 ( ) 应在一定约束条件下前后表的总体突变危险性值分别用 ( ) 对约束条件下的极小表标准表或各个反常密码表总体突 QQ( I ) ,和 表示代表所讨论的反常密码表则二重态效应 Ib I ,。变危险性的影响因子及两个表与其极小表的相对距离 Q:对 的影响因子 I 3表 导出反常密码表的约束条件 ( 约束条件忽略二重态效应时预先固定 反常表与极小 表、二重态效应对标准表 物种 附加二重态效应 %)? 的相对距离Q E%的二重态组合和相应编码关系 反常表 的影响因子 ? Standard( 1,2) ,( 2,2) ,( 2,4) ,( 4,2) ,( 4,4) ( 1,1) ,( 2,3) 0, 169, 86nvertebrate 2, 74 11, 53 I ( 1,4) ,( 2,3) ,( 3,1) ( 1,2) ,( 2,2) ,( 2,4) ,( 3,4) ,( 4,3) ,( 4, 4) 3 ,MD ,,表 数据显示标准表是 在表组态空间的相对极小 突变危险性值因此该二重态效应在生命密码研究中是不 ,,。值即一定约束条件下的极小而无脊椎动物线粒体反常密 可忽视的二重态效应是突变危险性理论研究的进一步细 ( MD) ,。,码表是在标准表的邻近组态中另外一些 的 相 对 极 小 化可加深人们对适应性约束条件的理解同时二重 态 预 ,。3 2、3 2 ,值即另外一些约束条件下的极小表 第 列显示了 先组合作为一种适应性条件在密码稳定性进化研究中具有 ( ) ,。个表的二重态组合的部分相似性红色部分这可能反映了 重要的生物学意义 。 反常密码表从标准表演变的痕迹 参考文献 ,1, , 、、———罗辽复基因组信息密码进化折叠动力学和熵产生理论生物学 3结论 ,J,, 2010,28( 15) : 106 ) 111,,的几个基本问题科技导报 , 该研究结果表明无脊椎动物反常密码表中的氨基酸分,2, LUO L F,LI X Q, Construction of gneetic code fromev olutionary stability ,J,, Bio Systems,2002,65: 83 ) 97, ,布可由约束条件下的极小表导出总体突变危险性极小意味 ,3, , ,M,, : ,2000,罗辽复生命进化的物理观上海上海科学技术出版社 ,。着进化的稳定性约束条件体现了进化中的冻结偶然性约 ,4, ,, ,J,, 孙咏萍罗辽复线粒体反常密码表的进化稳定性内蒙古大学学 : 2006,37( 2) : 147 ) 152,,报自然科学版 11, 53% E ,束条件使线粒体反常密码表冻结在极小值上方 处,5, LUO L F,LI X Q, Codng rues for amno acds in the genetc code the ge- iliii:2, 74% 。Q 表明二重态效应可使此线粒体表的 值改变 若约 netic codei s a minimal code omf utational deterioration,J,, Origins of Life and Evolution of theB iosphere,2002,32: 23 ) 33, ,束条件中没有对二重态的上下位置做出规定则得到的线粒 ,6, LUO L F, The degeneracy rule of gneetic code,J,, Origins of Life,1989,18: Q ,体极小 表 比 反 常 密 码 表 的 值 略 低即极小化的误差为 65 ) 70,,7, 罗辽复, 遗传密码的进化稳定性,J,, 物理学进展,2001,21( 1) : 66 ) 86, 2, 74% ,,该微小差别可归因于理论参数的误差因为氨基酸相 ,8, LUO L F, The distribution of amino acids in genetic code,J,, Origins of ,2 ) 3,; Lfe,1989,19 621 ) 631, i:似性与突变危险性参数均存在误差也可归因于选取的 ,9, FREELAND S J,KNIGHT R D, Early Fixation of anO ptimal Genetic Code ( 约束条件不完全在约束条件中增加对二重态上下位置的规 ,J,, Molecular Biology and Evolution,2000,17: 511 ) 518, ,10, , ,D,, 孙咏萍线粒体与细胞核反常密码表及其进化关系的研究呼和 ,) 。定可消除误差 : ,2005,浩特内蒙古大学 , 在密码表中二重态的组合元素互相交换会影响密码的 檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪 tor fori mage retrieval,C,/ / Proc, British Machine Vision Conf, Cardiff, ( 10 )上接第 页 UK: BMVC,2002: 507 ) 526, ,16, LIN Y,RUAN Q Q, Orthogona Locaty Senstve Dscrmnant Anayss lliiiiiili,18, FUKUNAGA K, ntroducton to Statstca PatternR ecognton,M,, 2nd Iiiiliifor FaceR ecognition,J,, Journal of Information Science andE ngineering, ed, NewY ork: Academic Press,1990, 2009,25: 419 ) 433, ,19, ,, 张善文黄德双一种鲁棒的监督流形学习算法及其在植物分类中的 ,17, KIM T K,KIM H,HWANG W,et al, Component-basLeDdA faced escrip- ,J,, ,2010,23( 6) : 836 ) 841,应用模式识别与人工智能
本文档为【基于正交线性判别分析的植物分类方法】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_511210
暂无简介~
格式:doc
大小:40KB
软件:Word
页数:9
分类:生活休闲
上传时间:2017-10-15
浏览量:38