下载

1下载券

加入VIP
  • 专属下载特权
  • 现金文档折扣购买
  • VIP免费专区
  • 千万文档免费下载

上传资料

关闭

关闭

关闭

封号提示

内容

首页 多元统计分析课程设计

多元统计分析课程设计.doc

多元统计分析课程设计

巴黎靠左岸
2017-09-02 0人阅读 举报 0 0 暂无简介

简介:本文档为《多元统计分析课程设计doc》,可适用于职业岗位领域

多元统计分析课程设计主成分分析法在我国居民生活质量状况综合评价中的应用多元统计分析课程设计内容摘要:改革开放以来我国各地区间的经济发展速度有着明显差别而人民的生活质量也因此产生了不同本文用主成分分析法选取多个指标对全国个省市居民的生活质量进行了简单的分析。关键词:数据选取数据分析主成分分析使用软件:SPSS多元统计分析课程设计一主成分分析主成分分析定义主成分分析也称主分量分析旨在利用降维的思想把多指标转化为少数几个综合指标。在实证问题研究中为了全面、系统地分析问题我们必须考虑众多影响因素。这些涉及的因素一般称为指标在多元统计分析中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息并且指标之间彼此有一定的相关性因而所得的统计数据反映的信息在一定程度上有重叠。在用统计方法研究多变量问题时变量太多会增加计算量和增加分析问题的复杂性人们希望在进行定量分析的过程中涉及的变量较少得到的信息量较多。主成分分析法方法简介主成分分析法是一种数学变换的方法,它把给定的一组相关变量通过线性变换转成另一组不相关的变量这些新的变量按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变使第一变量具有最大的方差称为第一主成分第二变量的方差次大并且和第一变量不相关称为第二主成分。依次类推I个变量就有I个主成分。其中Li为p维正交化向量(Li,Li,)Zi之间互不相关且按照方差由大到小排列则称Zi为X的第I个主成分。设X的协方差矩阵为Σ则Σ必为半正定对称矩阵求特征值λi(按从大到小排序)及其特征向量可以证明λi所对应的正交化特征向量即为第I个主成分Zi所对应的系数向量Li而Zi的方差贡献率定义为λi,Σλj,通常要求提取的主成分的数量k满足Σλk,Σλj>。主成分分析主要目的是希望用较少的变量去解释原来资料中的大部分变异将我们手中许多相关性很高的变量转化成彼此相互独立或不相关的变量。通常是选出比原始变量个数少能解释大部分资料中的变异的几个新变量即所谓主成分并用以解释资料的综合性指标。由此可见主成分分析实际上是一种降维方法。二问题背景及数据问题及背景背景:随着生产力水平的不断提高我国居民生活水平不断提高生活质量也在不断改善。但是受各地生产力发展水平不平衡的影响我国各地居民的生活质量也表现为不平衡。多元统计分析课程设计问题:利用主成分分析法对我国个省市、自治区居民的生活状况进行评价分析。为全面分析各地居民生活状况可选取如下指标体系进行反应:职工人均工资、人均居住面积、城市人均用水普及量、城市煤气普及量、人均拥有道路面积、人均绿地公共面积、批发零售贸易商品销售总额、旅游外汇收入。数据图数据来源:《中国统计年鉴》三详细分析过程第一步:录入数据有以下变量:职工人均工资人均居住面积城市人口用水普及量城市煤气普及量人均拥有道路面积人均绿地公共面积批发零售贸易商品销售总额旅游外汇收入见图多元统计分析课程设计图第二步:选择功能模块图第三步:将变量添加到Varicribles中图多元统计分析课程设计第四步:输入信息图图图多元统计分析课程设计图图第五步:单击“OK”按钮完成运算。图多元统计分析课程设计三(结果分析CommunalitiesInitialExtraction人均工资居住面积人均用水煤气普及人均道路人均绿地商品总额旅游外汇分析:第一列是列出八个原始变量第二列是根据主成分分析初始解计算出变量共同度第三列是是根据主成分分析最终解计算出变量共同度这时由于因。例如第一子变量个数少于原始变量个数因此每个变量的共同度必然小于行中表示m个因子变量共同解释掉原始变量“人均工资”方差。TotalVarianceExplainedExtractionSumsofSquaredRotationSumsofSquaredInitialEigenvaluesLoadingsLoadingsComponofCumulativeofCumulativeofCumulativeentTotalVarianceTotalVarianceTotalVarianceExtractionMethod:PrincipalComponentAnalysis分析:上表为spss输出结果从上表可以看出特征值和和贡献率。从上表可以看出公共因子对原变量总体的描述情况。可以看出前个公共因子的的贡献多元统计分析课程设计率达到所以提取个公共因子就可以反映原变量的大部分信息。分析:上图为公共因子碎石图它的横坐标为公共因子数纵坐标为公共因子的特征值。可以看出前个公共因子的特征值变化非常明显到个以后趋于平稳。所以得出提取个公共因子可以对原变量的信息描述有显著作用。这与Communalities的结论也相符合。ComponentScoreCoefficientMatrixComponent人均工资居住面积人均用水煤气普及人均道路人均绿地商品总额多元统计分析课程设计旅游外汇分析:该表格是因子得分矩阵这是根据回归年算法计算出来的因子得分函数的系数根据这个表格可得下面的因子得分函数F=xxxxxxxxF=xxxxxxxxSPSS将根据个因子得分函数自动计算样本的个因子得分并且个因子作为新变量保存到SPSS窗口中第一主成分在人均拥有道路面积的系数上为负其他为正而且职工人居工资、人均居住面积、批发零售贸易商品销售总额、旅游外汇收入的系数绝对值比较大说明第一主成分代表了我国居民生活质量状况针对职工人居工资、人均居住面积、批发零售贸易商品销售总额、旅游外汇收入和其他居民生活质量状况的反应指标之间的差异。第二主成分在职工人均工资、人均居住面积、批发零售贸易商品销售总额、人均拥有道路面积和人居绿地公共旅游外汇收入的系数上为负其他为正而且面积的系数的绝对值比较大说明第二主成分代表了我国居民生活质量状况针对人均公共设施需求(人均拥有道路面积和人居绿地公共面积)和其他居民生活质量状况的反应指标之间的差异。主成分得分表分析主成分得分表如下:北京天津河北山西内蒙古辽宁吉林黑龙江上海江苏浙江安徽福建江西山东河南湖北湖南广东广西海南多元统计分析课程设计重庆四川贵州云南西藏陕西甘肃青海宁夏新疆结论:第一主成得分较高的有北京、天津、上海、江苏、浙江、辽宁这几个省份都是经济比较发达的地区第一主成分代表的意义为我国居民生活质量状况针对职工人居工资、人均居住面积、批发零售贸易商品销售总额、旅游外汇收入和其他居民生活质量状况的反应指标之间的差异。第二主成得分较高的有山东、河北、陕西等地由于第二主成分代表的意义为我国居民生活质量状况针对人均消费品普及量及人均公共设施需求由此可见这几个地区非常注重人均公共设施需求及人均消费品普及量这些方面。

用户评价(0)

关闭

新课改视野下建构高中语文教学实验成果报告(32KB)

抱歉,积分不足下载失败,请稍后再试!

提示

试读已结束,如需要继续阅读或者下载,敬请购买!

文档小程序码

使用微信“扫一扫”扫码寻找文档

1

打开微信

2

扫描小程序码

3

发布寻找信息

4

等待寻找结果

我知道了
评分:

/12

多元统计分析课程设计

VIP

在线
客服

免费
邮箱

爱问共享资料服务号

扫描关注领取更多福利