首页 主成分分析、因子分析、聚类分析的比较与应用

主成分分析、因子分析、聚类分析的比较与应用

举报
开通vip

主成分分析、因子分析、聚类分析的比较与应用 2007年第 6期 山 东 教 育 学 院 学 报 总第 124期 主成分分析、因子分析、 聚类分析的比较与应用 李新蕊 (济南大学 政治与公共管理学院, 山东 济南 250022) 摘要:主成分分析、因子分析、聚类分析是三种比较有价值的多元统计方法,但同时也是在使用过程中容易误 用或混淆的几种方法。本文从基本思想、数据的标准化、应用上的优缺点等方面,详细地探讨了三者的异同,并且 举例说明了三者在实际问题中的应用。 关键词 :主成分分析;因子分析 ;聚类分析 中图分类号~C,441 文献...

主成分分析、因子分析、聚类分析的比较与应用
2007年第 6期 山 东 教 育 学 院 学 报 总第 124期 主成分分析、因子分析、 聚类分析的比较与应用 李新蕊 (济南大学 政治与公共管理学院, 山东 济南 250022) 摘要:主成分分析、因子分析、聚类分析是三种比较有价值的多元统计方法,但同时也是在使用过程中容易误 用或混淆的几种方法。本文从基本思想、数据的 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 化、应用上的优缺点等方面,详细地探讨了三者的异同,并且 举例说明了三者在实际问题中的应用。 关键词 :主成分分析;因子分析 ;聚类分析 中图分类号~C,441 文献标识码:A 文章编号:1008--2816(2007)(~--0023--(B 一 、 引言 主成分分析就是将多项指标转化为少数几项 综合指标,用综合指标来解释多变量的方差 一协 方差结构。综合指标即为主成分。所得出的少数 几个主成分,要尽可能多地保留原始变量的信息, 且彼此不相关。因子分析是研究如何以最少的信 息丢失,将众多原始变量浓缩成少数几个因子变 量,以及如何使因子变量具有较强的可解释性的 一 种多元统计分析方法。聚类分析是依据实验数 据本身所具有的定性或定量的特征来对大量的数 据进行分组归类以了解数据集的内在结构,并且 对每一个数据集进行描述的过程。其主要依据是 聚到同一个数据集中的样本应该彼此相似,而属 于不同组的样本应该足够不相似⋯㈣)。 三种分析方法既有区别也有联系,本文力图 将三者的异同进行比较,并举例说明三者在实际 应用中的联系,以期为更好地利用这些高级统计 方法为研究所用有所裨益。 二、基本思想的异同 (一)共同点 主成分分析法和因子分析法都是用少数的几 个变量(因子)来综合反映原始变量(因子)的主要 信息,变量虽然较原始变量少,但所包含的信息量 却占原始信息的 85%以上,所以即使用少数的几 个新变量,可信度也很高,也可以有效地解释问 题。并且新的变量彼此间互不相关,消除了多重 共线性。这两种分析法得出的新变量 ,并不是原 始变量筛选后剩余的变量。在主成分分析中,最 终确定的新变量是原始变量的线性组合 ,如原始 变量为 x ,x2,⋯ ,x3,经过坐标变换,将原有的 p 个相关变量 xi作线性变换,每个主成分都是由原 有 p个变量线性组合得到。在诸多主成分 zi中, z.在方差中占的比重最大,说明它综合原有变量 的能力最强 ,越往后主成分在方差中的比重也小, 综合原信息的能力越弱。因子分析是要利用少数 几个公共因子去解释较多个要观测变量中存在的 复杂关系,它不是对原始变量的重新组合,而是对 原始变量进行分解,分解为公共因子与特殊因子 两部分。公共因子是由所有变量共同具有的少数 几个因子;特殊因子是每个原始变量独 自具有的 因子。对新产生的主成分变量及因子变量计算其 得分,就可以将主成分得分或因子得分代替原始 收稿日期:20町一lo_-23 作者简介:李新蕊(1982一),女,山东莱阳人,发展与教育心理学硕士研究生。 维普资讯 http://www.cqvip.com 李新蕊:主成分分析 、因子分析、聚类分析的比较与应用 2007年第 6期 变量进行进一步的分析,因为主成分变量及因子 变量比原始变量少了许多,所以起到了降维的作 用,为我们处理数据降低了难度 2](H 。 聚类分析的基本思想是:采用多变量的统计 值,定量地确定相互之间的亲疏关系,考虑对象多 因素的联系和主导作用,按它们亲疏差异程度,归 入不同的分类中一元,使分类更具客观实际并能 反映事物的内在必然联系。也就是说,聚类分析 是把研究对象视作多维空间中的许多点,并合理 地分成若干类,因此它是一种根据变量域之间的 相似性而逐步归群成类的方法,它能客观地反映 这些变量或区域之间的内在组合关系。_3]( 聚类 分析是通过一个大的对称矩阵来探索相关关系的 一 种数学分析方法,是多元统计分析方法,分析的 结果为群集。对向量聚类后,我们对数据的处理 难度也自然降低,所以从某种意义上说,聚类分析 也起到了降维的作用。[4](3 (二)不同之处 主成分分析是研究如何通过少数几个主成分 来解释多变量的方差一协方差结构的分析方法, 也就是求出少数几个主成分(变量),使它们尽可 能多地保留原始变量的信息,且彼此不相关。它 是一种数学变换方法,即把给定的一组变量通过 线性变换,转换为一组不相关的变量(两两相关系 数为0,或样本向量彼此相互垂直的随机变量),在 这种变换中,保持变量的总方差(方差之和)不变, 同时具有最大方差,称为第一主成分;具有次大方 差,称为第二主成分。依次类推。若共有 P个变 量,实际应用中一般不是找 P个主成分,而是找出 m(m
本文档为【主成分分析、因子分析、聚类分析的比较与应用】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_532250
暂无简介~
格式:pdf
大小:171KB
软件:PDF阅读器
页数:4
分类:
上传时间:2011-04-17
浏览量:40