首页 多元统计分析小论文

多元统计分析小论文

举报
开通vip

多元统计分析小论文多元统计分析小论文 全国各省市关于行业就业人员工资总额的分析 摘要: 改革开放以来,中国经济社会的到了巨大的发展,老百姓的物质生活水平也日益提高。进入新世纪以来,各行业的从业人员的收入水平均有比较明显的提升。但不同行业之间收入的巨大差距和不同地区工资水平的巨大差异,也严重制约着我国经济社会的全面发展。本文以应用多元分析中的聚类分析为主要知识基础,spss和sas为主要分析工具,研究全国各省市关于行业就业人员工资总额的问题。希望通过此次数据上的研究探索,一方面可以增强自身对于书本知识的理解与运用,另一方面也是即...

多元统计分析小论文
多元统计分析小 论文 政研论文下载论文大学下载论文大学下载关于长拳的论文浙大论文封面下载 全国各省市关于行业就业人员工资总额的分析 摘要: 改革开放以来,中国经济社会的到了巨大的发展,老百姓的物质生活水平也日益提高。进入新世纪以来,各行业的从业人员的收入水平均有比较明显的提升。但不同行业之间收入的巨大差距和不同地区工资水平的巨大差异,也严重制约着我国经济社会的全面发展。本文以应用多元分析中的聚类分析为主要知识基础,spss和sas为主要分析工具,研究全国各省市关于行业就业人员工资总额的问题。希望通过此次数据上的研究探索,一方面可以增强自身对于书本知识的理解与运用,另一方面也是即将来临的大四 毕业论文 毕业论文答辩ppt模板下载毕业论文ppt模板下载毕业论文ppt下载关于药学专业毕业论文临床本科毕业论文下载 做好基础与寻求灵感。也从增加对于中国就业人员工资水平的认识,并希望在此社会问题中,做出自己身为统计学学生可以尽到的绵薄之力。 关键词:应用多元分析、聚类分析、工资总额。 具体数据如下:单位(亿元) X1: 农林牧业 x2 : 采矿业 x3: 制造业 x4: 资源供应业 x5: 建筑业 x6: 批发零售业 x7: 交通运输业 资源供应批发零交通运region 农林牧业 采矿业 制造业 业 建筑业 售业 输业 北京 15.7 56.1 763.7 88.8 302.2 592.6 422.2 天津 3 63.6 768.3 44.1 180.4 96.8 118 河北 7.3 175.5 608.1 125.3 327.6 91.1 128.7 山西 6.5 694.4 269.8 70.5 157.7 69.4 130.8 内蒙古 71.5 150.2 217.7 84.6 138.6 45.9 120.3 辽宁 30.2 194.5 821.1 87.4 526.6 112.5 208.5 吉林 31.7 77.9 409.3 74.3 145.8 44.4 82.9 黑龙江 188.8 213.6 261.2 99.8 181.9 74.1 140.1 上海 7.7 0.6 1538.5 66.7 241.8 669.3 394.1 江苏 19.8 81.7 3036.1 176.5 1905.8 318.6 273 浙江 3.6 4.6 1650 127.9 1259.8 219.9 198.5 安徽 12.2 231.8 531.3 86.7 436.5 87.8 103.5 福建 11.9 10.7 1091.7 63.3 654.4 121.7 134.3 江西 15.3 34.9 493.1 68.5 339.2 60.8 114.9 山东 7.2 478.7 1807.5 138.3 769 262 274.9 河南 13 318.9 1034.1 131.9 621.5 176.3 191.4 湖北 22.1 37.9 815 101.5 594.5 156.3 164 湖南 4.9 57.5 579.7 87 381.9 89.4 121.5 广东 15.5 20.3 4756.7 286.4 648.3 491.2 507.8 广西 20.9 16.9 304.1 83.1 221.3 53 104 海南 9.4 3.7 43.6 11.6 30.3 41.6 31.6 重庆 4 45.6 401.5 49.7 428 96.9 141.1 四川 12.9 118.7 916.6 185.4 624.7 138.5 224.7 贵州 5.2 84.4 199.8 87.7 164.2 62.2 58.6 云南 17.4 95.3 299.9 66 225.3 99 89.2 西藏 1.2 3.4 4.8 5.3 7 5.1 4 陕西 9.5 253.2 476.6 69.4 280.5 88.8 124.5 甘肃 15.2 61.7 182.1 57.6 171 25.1 64.6 青海 4.7 32.2 53.3 11.6 31.7 9.4 27.7 宁夏 7.1 53.7 54.8 27.2 45.6 11.3 21.9 新疆 162.7 161 176.9 51.4 271.8 41 113.3 系统聚类分析 对上述数据进行系统的聚类分析,以下主要使用了最短距离法、重心法和 Ward方法。 (1)最短距离法; Dd,min 对于该方法,有,计算新类和任一类之间的距离递推公式为 KLij,,iGjGKL, DdddDD,,,minminmin,minmin, ,,MJijijijKJLJ,,,,,,,,iGjGiGjGiGjGMJKLMJ,,, 通过sas进行聚类分析,得出: The CLUSTER Procedure Single Linkage Cluster Analysis Eigenvalues of the Correlation Matrix Eigenvalue Difference Proportion Cumulative 1 3.68041235 2.52129887 0.5258 0.5258 2 1.15911349 0.25357947 0.1656 0.6914 3 0.90553401 0.13155981 0.1294 0.8207 4 0.77397420 0.42913889 0.1106 0.9313 5 0.34483531 0.23189465 0.0493 0.9806 6 0.11294066 0.08975068 0.0161 0.9967 7 0.02318998 0.0033 1.0000 The data have been standardized to mean 0 and variance 1 The CLUSTER Procedure Single Linkage Cluster Analysis Root-Mean-Square Total-Sample Standard Deviation 1 Mean Distance Between Observations 3.228709 (2)重心法 设GK和GL的重心分别为 ,则GK与GL之间的平方距离为 xx和KL 22,Dd,,,,xxxx,,,,KLKLKLxxKL 合并GK和GL之后的新类GM的重心是 nnxx,KKLL x,MnM 其中nM=nK+nL为GM的样品个数。 重心法的递推公式为 nnnn2222KLKL DDDD,,,MJKJLJKL2nnnMMM 同样通过sas有 The CLUSTER Procedure Centroid Hierarchical Cluster Analysis Eigenvalues of the Correlation Matrix Eigenvalue Difference Proportion Cumulative 1 3.68041235 2.52129887 0.5258 0.525 2 1.15911349 0.25357947 0.1656 0.691 3 0.90553401 0.13155981 0.1294 0.8207 4 0.77397420 0.42913889 0.1106 0.9313 5 0.34483531 0.23189465 0.0493 0.9806 6 0.11294066 0.08975068 0.0161 0.9967 7 0.02318998 0.0033 1.0000 The data have been standardized to mean 0 and variance 1 The CLUSTER Procedure Centroid Hierarchical Cluster Analysis Root-Mean-Square Total-Sample Standard Deviation 1 Root-Mean-Square Distance Between Observations 3.741657 (3)Ward法 定义GK和GL之间的平方距离为 2DWWW,,, KLMKL 也可表达为 nn2 KL,,,,,D,,,xxxxKLKLKLnM nnnnnnn1KLKLKLK,,,,当时,nn=KLnnnnnn,,112 MKLLKM 同样由sas程序,可得出 The CLUSTER Procedure Ward's Minimum Variance Cluster Analysis Eigenvalues of the Correlation Matrix Eigenvalue Difference Proportion Cumulative 1 3.68041235 2.52129887 0.5258 0.5258 2 1.15911349 0.25357947 0.1656 0.6914 3 0.90553401 0.13155981 0.1294 0.8207 4 0.77397420 0.42913889 0.1106 0.9313 5 0.34483531 0.23189465 0.0493 0.9806 6 0.11294066 0.08975068 0.0161 0.9967 7 0.02318998 0.0033 1.0000 The data have been standardized to mean 0 and variance 1 The CLUSTER Procedure Ward's Minimum Variance Cluster Analysis Root-Mean-Square Total-Sample Standard Deviation 1 Root-Mean-Square Distance Between Observations 3.741657 由上述3种分析方法,尤其树状图分析。在结合我们所拥有的实际知识可以可看出,相对于最小距离法和重心法而言,Ward法作出的聚类相对较为合理的反应了数据和现实情况。我们大致依据Ward方法所作出的树状图,将31个地区分成以下几类: 第一类:北京、上海、江苏和广东。 第二类:天津、重庆、江西、广西、湖南、吉林、云南、甘肃、贵州、内蒙古、海南、青海、宁夏、黑龙江、新疆。 第三类:河北、安徽、陕西、辽宁、河南、浙江、四川、福建、湖北、山西、山东。 总的来说,分类结果和现实经济社会发展情况是一致的。从分析结果看出,比如第一类分类,北京上海江苏广东这四省市的经济社会发展是出于全国领先的地位,而其工资就业总额也就随之较高。所以从分类中我们可以看出。地区职工工资总额是与地区的经济社会发展是相关的。另外,经济结构相对于比较多元的地区,其分类也相对靠前。 动态聚类分析 那么由上述方法进行的分类应该为: 第一类:北京、上海。 第二类:天津、河北、内蒙古、辽宁、吉林、安徽、福建、江西、湖南、湖北、广西、海南、重庆、四川、贵州、云南、西藏、陕西、甘肃、青海、宁夏 第三类:黑龙江、新疆 第四类:山西、山东、河南 第五类:广东、江苏、浙江。 总结 初级经济法重点总结下载党员个人总结TXt高中句型全总结.doc高中句型全总结.doc理论力学知识点总结pdf : 总的来说,对比系统聚类分析和动态聚类分析,我们会发现,其大体的分类是相近的。但结合我们的实际情况来看,我们不难发现,动态聚类分析的结果是相对较为合理的。对于第一类而言,北京上海是中国的经济文化中心,其产业反正也较为均衡,百姓涉及的行业较多,其工资收入也与之经济发展大环境吻合。而第二类来说,大多数是经济发展较为落后的地区。分类也较为准确的反应出其工资水平的问题。 从分析结果我们大体可以得出这样的一个结论。各行业工资总额与当地经济社会发展水平,人口,产业链等息息相关。经济发展较为发达的东部沿海地区和北京上海此类的经济社会中心其工资总额水平处于较高的地位。而中西部等地,由于其经济发展的制约,和产业的相对单一,其职工工资总额相对较低。通过动态聚类分析所得出的结果,也非常明显的反应出这样的情况。 参考文献: [1]王学民.上海财经出版社.《应用多元分析》. [2]胡良平.SAS统计分教程. [3]2014年度《中国统计年鉴》. [4]薛微.Spss统计分析方法及应用.
本文档为【多元统计分析小论文】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_321575
暂无简介~
格式:doc
大小:249KB
软件:Word
页数:12
分类:工学
上传时间:2017-10-14
浏览量:190