R语言聚类分析实例教程

R语言聚类分析实例教程R语言聚类分析聚类函数r语言中使用hclust(d,method="complete",members=NULL)来进行层次聚类method表示类的合并方法，有：single 最短距离法complete 最长距离法median 中间距离法mcquitty 相似法average 类平均法centroid 重心法ward 离差平方和法聚类分析过程数据的聚类分析，首先要进行数据的标准化，消除量纲的影响，才能得到准确的聚类分析结果。1、数据标准化数据的标准化（normali...

R语言聚类分析聚类函数r语言中使用hclust(d,method="complete",members=NULL)来进行层次聚类method 表示类的合并方法，有：single 最短距离法complete 最长距离法median 中间距离法mcquitty 相似法average 类平均法centroid 重心法ward 离差平方和法聚类分析过程数据的聚类分析，首先要进行数据的标准化，消除量纲的影响，才能得到准确的聚类分析结果。1、数据标准化数据的标准化（normalization）是将数据按比例缩放，使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到，去除数据的单位限制，将其转化为无量纲的纯数值，便于不同单位或量级的指标能够进行比较和加权。其中最典型的就是数据的归一化处理，即将数据统一映射到[0,1]区间上，常见的数据归一化的方法有：min-max标准化(Min-maxnormalization)也叫离差标准化，是对原始数据的线性变换，使结果落到[0,1]区间，转换函数如下：其中max为样本数据的最大值，min为样本数据的最小值。这种方法有一个缺陷就是当有新数据加入时，可能导致max和min的变化，需要重新定义。log函数转换通过以10为底的log函数转换的方法同样可以实现归一下，具体方法如下：看了下网上很多介绍都是x*=log10(x)，其实是有问题的，这个结果并非一定落到[0,1]区间上，应该还要除以log10(max)，max为样本数据最大值，并且所有的数据都要大于等于1。atan函数转换用反正切函数也可以实现数据的归一化：使用这个方法需要注意的是如果想映射的区间为[0,1]，则数据都应该大于等于0，小于0的数据将被映射到[-1,0]区间上。而并非所有数据标准化的结果都映射到[0,1]区间上，其中最常见的标准化方法就是Z标准化，也是SPSS中最为常用的标准化方法：z-score标准化(zero-meannormalization)也叫标准差标准化，经过处理的数据符合标准正态分布，即均值为0，标准差为1，其转化函数为：其中μ为所有样本数据的均值，σ为所有样本数据的标准差。2、聚类分析实例对新疆地区进行聚类分析：placeheightwaterfallicesoildepthwindday哈巴河532.6173.815061.8阿勒泰735.1191.514637.7克拉玛依427114.419775.4巴楚1116.541.6647.6莎车1231.242.59311于田142746.4811.4xinj<-read.csv("xinjiang.csv",header=TRUE)fun<-function(x)(x-min(x))/(max(x)-min(x))xj3<-apply(xinj[,2:5],2,FUN=fun)#usemethod"min-max"xj3<-data.frame(xinj[,1],xj3)hc.single=hclust(dist(xj3[2:5]),method="single")#最短距离法聚类plot(hc.single,main="SingleLinkage",xlab="",labels=xj3$xinj...1.,ylab="",sub="place",cex=.9)#制作聚类图聚类结果如下图所示：

                    本文档为【R语言聚类分析实例教程】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，
                    图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。 
 该文档来自用户分享，如有侵权行为请发邮件ishare@vip.sina.com联系网站客服，我们会及时删除。

                    [版权声明] 本站所有资料为用户分享产生，若发现您的权利被侵害，请联系客服邮件isharekefu@iask.cn，我们尽快处理。

                    本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用。

                    网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
                

下载需要：免费已有0 人下载

立即下载

R语言聚类分析实例教程

你可能还喜欢