下载

1下载券

加入VIP
  • 专属下载特权
  • 现金文档折扣购买
  • VIP免费专区
  • 千万文档免费下载

上传资料

关闭

关闭

关闭

封号提示

内容

首页 多元统计分析-因子分析

多元统计分析-因子分析.ppt

多元统计分析-因子分析

ywb860608
2014-02-16 0人阅读 举报 0 0 暂无简介

简介:本文档为《多元统计分析-因子分析ppt》,可适用于高等教育领域

*第四章因子分析*第一节因子分析的基本思想因子分析的基本思想*因子分析的基本思想因子分析是根据相关矩阵内部的依赖关系把一些具有错综复杂关系的变量综合为数量较少的几个因子。通过不同因子来分析决定某些变量的本质及其分类的一种统计方法。简单地说就是根据相关性大小把变量分组使得同组内的变量之间相关性较高不同组的变量相关性较低。每组变量代表一个基本结构这个基本结构称为因子。例如*例如某机关对其职员就以下个方面进行考核这个方面是职员的词汇、阅读、写作能力以及数字、代数、微积分的运算能力。而这个方面可归结为职员的语文能力和数学能力两个方面。例如*例如某公司与名申请工作的人进行面谈然后就申请人十五个方面进行打分这十五个方面分别是:申请书的形式、外貌、学术能力、讨人喜欢的能力、自信心、洞察力、诚实、推销能力、经验、工作积极性、抱负、理解能力、潜力、入围公司的强烈程度、适应性。这个方面可归结为应聘者的外露能力、讨人喜欢的能力、经验、专业能力这个方面。*因子分析(factoranalysis)是一种数据简化的技术。它通过研究众多变量之间的内部依赖关系探求观测数据中的基本结构并用少数几个假想变量来表示其基本的数据结构。这几个假想变量能够反映原来众多变量的主要信息。原始的变量是可观测的显在变量而假想变量是不可观测的潜在变量称为因子。例如在企业形象或品牌形象的研究中消费者可以通过一个有个指标构成的评价体系评价百货商场的个方面的优劣。*但消费者主要关心的是三个方面即商店的环境、商店的服务和商品的价格。因子分析方法可以通过个变量找出反映商店环境、商店服务水平和商品价格的三个潜在的因子对商店进行综合评价。而这三个公共因子可以表示为:注意:*注意:因子分析与回归分析不同因子分析中的因子是一个比较抽象的概念而回归因子有非常明确的实际意义。主成分分析分析与因子分析也有不同主成分分析仅仅是变量变换而因子分析需要构造因子模型。主成分分析:原始变量的线性组合表示新的综合变量即主成分。因子分析:潜在的假想变量和随机影响变量的线性组合表示原始变量。第二节因子分析模型*第二节因子分析模型一、数学模型****用矩阵的表达方式*、因子载荷aij的统计意义(载荷矩阵中第i行第j列的元素)反映了第i个变量与第j个公共因子的相关性。绝对值越大相关的密切程度越高。根据公共因子的模型性质有三、因子载荷矩阵中的几个统计特征*因子载荷不是惟一的且满足因子模型的条件*、变量共同度的统计意义统计意义:两边求方差*第三节因子载荷矩阵的估计方法*第三节因子载荷矩阵的估计方法设随机向量的均值为协方差为,为的特征根为对应的标准化特征向量则主成分分析法*上式给出的表达式是精确的然而它实际上是毫无价值的因为我们的目的是寻求用少数几个公共因子解释故略去后面的pm项的贡献有上式有一个假定模型中的特殊因子是不重要的因而从的分解中忽略了特殊因子的方差。*上式有一个假定模型中的特殊因子是不重要的因而从的分解中忽略了特殊因子的方差。**例假定某地固定资产投资率通货膨胀率失业率相关系数矩阵为试用主成分分析法求因子分析模型。*特征根为:*可取前两个因子F和F为公共因子第一公因子F物价就业因子对X的贡献率为。第二公因子F为投资因子对X的贡献为。共同度分别为。第四节因子旋转(正交变换)*第四节因子旋转(正交变换)因子分析的数学目的不仅仅要找出公共因子以及对变量进行分组更重要的要知道每个公共因子的含义以便进行进一步的分析。如果每个公共因子的含义不清则不便于进行实际背景的解释。由于因子载荷阵是不惟一的所以应该对因子载荷阵进行旋转。目的是使因子载荷阵的结构简化使载荷矩阵每列或行的元素平方值向和两极分化。主要的正交旋转法有方差最大法和四次方最大法。(一)为什么要旋转因子*奥运会十项全能运动项目得分数据的因子分析*因子载荷矩阵可以看出除第一因子中所有的变量在公共因子上有较大的正载荷可以称为一般运动因子。其他的个因子不太容易解释。似乎是跑和投掷的能力对比似乎是长跑耐力和短跑速度的对比。于是考虑旋转因子得下表***(二)旋转方法、方差最大法、四次方最大旋转*、方差最大法方差最大法从简化因子载荷矩阵的每一列出发使和每个因子有关的载荷值平方的方差最大。当只有少数几个变量在某个因子上有较高的载荷值时对因子的解释最简单。方差最大的直观意义是希望通过因子旋转后使每个因子上的载荷值尽量拉开距离一部分的载荷趋于另一部分趋于。**根据求极值的原理使*当公共因子个数m>时可以将上述m=的方法用于逐次对每两个公共因子进行旋转。每旋转一次V值就会增大即V是单调不减的并且V是有界的因为因子载荷的绝对值不大于。因此经过若干次旋转后V变化相对就不大了即可停止旋转。对两因子的旋转*、四次方最大旋转四次方最大旋转是从简化载荷矩阵的行出发通过旋转初始因子使每个变量只在一个因子上有较高的载荷而在其它的因子上尽可能低的载荷。如果每个变量只在一个因子上有非零的载荷这时的因子解释是最简单的。四次方最大法通过使因子载荷矩阵中每一行的因子载荷平方的方差达到最大。*旋转后因子的共同度*旋转后因子的共同度设正交矩阵做正交变换旋转后因子的共同度没有发生变化!旋转后公共因子的方差贡献*旋转后公共因子的方差贡献设正交矩阵做正交变换旋转后公共因子的方差贡献发生了变化!第五节因子得分*第五节因子得分(一)因子得分的概念前面我们主要解决了用公共因子的线性组合来表示一组观测变量的有关问题。如果我们要使用这些因子做其他的研究比如把得到的因子作为自变量来做回归分析对样本进行分类或评价这就需要我们对公共因子进行测度即给出公共因子的值。*因子分析的数学模型为:因子得分函数:可见要求得每个因子的得分必须求得分函数的系数而由于p>m所以不能得到精确的得分只能通过估计。、回归法*、回归法)思想****人均要素变量因子分析。对我国个省市自治区的要素状况作因子分析。指标体系中有如下指标:X:人口(万人)X:面积(万平方公里)X:GDP(亿元)X:人均水资源(立方米人)X:人均生物量(吨人)X:万人拥有的大学生数(人)X:万人拥有科学家、工程师数(人)RotatedFactorPatternFACTORFACTORFACTORXXXXXXX**StandardizedScoringCoefficientsFACTORFACTORFACTORXXXXXXXF=XXXXXXXF=XXXXXXXF=XXXXXXX*前三个因子得分*国民生活质量的因素分析国家发展的最终目标是为了全面提高全体国民的生活质量满足广大国民日益增长的物质和文化的合理需求。在可持续发展消费的统一理念下增加社会财富创自更多的物质文明和精神文明保持人类的健康延续和生生不息在人类与自然协同进化的基础上维系人类与自然的平衡达到完整的代际公平和区际公平(即时间过程的最大合理性与空间分布的最大合理化)。从年开始联合国开发计划署(UYNP)首次采用“人文发展系数”指标对于国民生活质量进行测度。人文发展系数利用三类内涵丰富的指标组合即人的健康状况(使用出生时的人均预期寿命表达)、人的智力程度(使用组合的教育成就表达)、人的福利水平(使用人均国民收入或人均GDP表达)并且特别强调三类指标组合的整体表达内涵去衡量一个国家或地区的社会发展总体状况以及国民生活质量的总水平。*在这个指标体系中有如下的指标:X预期寿命X成人识字率X综合入学率X人均GDP(美元)X预期寿命指数X教育成就指数X人均GDP指数*旋转后的因子结构RotatedFactorPatternFACTORFACTORFACTORXXXXXXXFACTOR为经济发展因子FACTOR为教育成就因子FACTOR为健康水平因子*被每个因子解释的方差和共同度VarianceexplainedbyeachfactorFACTORFACTORFACTORFinalCommunalityEstimates:Total=XXXXXXX*StandardizedScoringCoefficients标准化得分系数FACTORFACTORFACTORXXXXXX第六节因子分析的步骤、展望和建议*第六节因子分析的步骤、展望和建议计算所选原始变量的相关系数矩阵相关系数矩阵描述了原始变量之间的相关关系。可以帮助判断原始变量之间是否存在相关关系这对因子分析是非常重要的因为如果所选变量之间无关系做因子分析是不恰当的。并且相关系数矩阵是估计因子结构的基础。选择分析的变量用定性分析和定量分析的方法选择变量因子分析的前提条件是观测变量间有较强的相关性因为如果变量之间无相关性或相关性较小的话他们不会有共享因子,所以原始变量间应该有较强的相关性。一、因子分析通常包括以下五个步骤*提取公共因子这一步要确定因子求解的方法和因子的个数。需要根据研究者的设计方案或有关的经验或知识事先确定。因子个数的确定可以根据因子方差的大小。只取方差大于(或特征值大于)的那些因子因为方差小于的因子其贡献可能很小按照因子的累计方差贡献率来确定一般认为要达到%才能符合要求因子旋转通过坐标变换使每个原始变量在尽可能少的因子之间有密切的关系这样因子解的实际意义更容易解释,并为每个潜在因子赋予有实际意义的名字。*计算因子得分求出各样本的因子得分有了因子得分值则可以在许多分析中使用这些因子例如以因子的得分做聚类分析的变量做回归分析中的回归因子。*用因子分析方法进行综合评价*因子分析是十分主观的在许多出版的资料中因子分析模型都用少数可阐述因子提供了合理解释。实际上绝大多数因子分析并没有产生如此明确的结果。不幸的是评价因子分析质量的法则尚未很好量化质量问题只好依赖一个“哇!”准则如果在仔细检查因子分析的时候研究人员能够喊出“哇我明白这些因子”的时候就可看着是成功运用了因子分析方法。作业:*作业:阐述因子分析的基本思想因子模型与回归模型相比较之异同因子分析与主成分分析之比较procfactordata=文件名r=vn=?out=文件名outstat=文件名runSAS程序主成份分析和因子分析的异同主成份分析和因子分析的异同降维、简化数据结构基于变量之间的内部依赖关系(R)可以用于综合评价可以用于图解样品和回归分析结合因子载荷的统计含义相同之处主成份分析和因子分析的异同主成份分析和因子分析的异同数学模型不同主成份是原变量的线性组合是综合的过程因子分析实际上是对原变量进行分组因子载荷矩阵综合评价函数的构造方法(主成份分析:取第一主成份因子分析:和回归分析结合时主成份、公共因子的作用是不同的不同之处

用户评价(0)

关闭

新课改视野下建构高中语文教学实验成果报告(32KB)

抱歉,积分不足下载失败,请稍后再试!

提示

试读已结束,如需要继续阅读或者下载,敬请购买!

文档小程序码

使用微信“扫一扫”扫码寻找文档

1

打开微信

2

扫描小程序码

3

发布寻找信息

4

等待寻找结果

我知道了
评分:

/62

多元统计分析-因子分析

VIP

在线
客服

免费
邮箱

爱问共享资料服务号

扫描关注领取更多福利