下载

1下载券

加入VIP
  • 专属下载特权
  • 现金文档折扣购买
  • VIP免费专区
  • 千万文档免费下载

上传资料

关闭

关闭

关闭

封号提示

内容

首页 多元统计分析小论文

多元统计分析小论文.doc

多元统计分析小论文

zhang巧儿
2017-10-14 0人阅读 举报 0 0 暂无简介

简介:本文档为《多元统计分析小论文doc》,可适用于高等教育领域

多元统计分析小论文全国各省市关于行业就业人员工资总额的分析摘要:改革开放以来中国经济社会的到了巨大的发展老百姓的物质生活水平也日益提高。进入新世纪以来各行业的从业人员的收入水平均有比较明显的提升。但不同行业之间收入的巨大差距和不同地区工资水平的巨大差异也严重制约着我国经济社会的全面发展。本文以应用多元分析中的聚类分析为主要知识基础spss和sas为主要分析工具研究全国各省市关于行业就业人员工资总额的问题。希望通过此次数据上的研究探索一方面可以增强自身对于书本知识的理解与运用另一方面也是即将来临的大四毕业论文做好基础与寻求灵感。也从增加对于中国就业人员工资水平的认识并希望在此社会问题中做出自己身为统计学学生可以尽到的绵薄之力。关键词:应用多元分析、聚类分析、工资总额。具体数据如下:单位(亿元)X:农林牧业x:采矿业x:制造业x:资源供应业x:建筑业x:批发零售业x:交通运输业资源供应批发零交通运region农林牧业采矿业制造业业建筑业售业输业北京天津河北山西内蒙古辽宁吉林黑龙江上海江苏浙江安徽福建江西山东河南湖北湖南广东广西海南重庆四川贵州云南西藏陕西甘肃青海宁夏新疆系统聚类分析对上述数据进行系统的聚类分析以下主要使用了最短距离法、重心法和Ward方法。()最短距离法Dd,min对于该方法有计算新类和任一类之间的距离递推公式为KLij,,iGjGKL,DdddDD,,,minminmin,minmin,,,MJijijijKJLJ,,,,,,,,iGjGiGjGiGjGMJKLMJ,,,通过sas进行聚类分析得出:TheCLUSTERProcedureSingleLinkageClusterAnalysisEigenvaluesoftheCorrelationMatrixEigenvalueDifferenceProportionCumulativeThedatahavebeenstandardizedtomeanandvarianceTheCLUSTERProcedureSingleLinkageClusterAnalysisRootMeanSquareTotalSampleStandardDeviationMeanDistanceBetweenObservations()重心法设GK和GL的重心分别为则GK与GL之间的平方距离为xx和KL,Dd,,,,xxxxKLKLKLxxKL合并GK和GL之后的新类GM的重心是nnxxKKLLx,MnM其中nM=nKnL为GM的样品个数。重心法的递推公式为nnnnKLKLDDDD,,MJKJLJKLnnnMMM同样通过sas有TheCLUSTERProcedureCentroidHierarchicalClusterAnalysisEigenvaluesoftheCorrelationMatrixEigenvalueDifferenceProportionCumulativeThedatahavebeenstandardizedtomeanandvarianceTheCLUSTERProcedureCentroidHierarchicalClusterAnalysisRootMeanSquareTotalSampleStandardDeviationRootMeanSquareDistanceBetweenObservations()Ward法定义GK和GL之间的平方距离为DWWW,,,KLMKL也可表达为nnKL,D,,,xxxxKLKLKLnMnnnnnnnKLKLKLK,,,当时nn=KLnnnnnnMKLLKM同样由sas程序可得出TheCLUSTERProcedureWard'sMinimumVarianceClusterAnalysisEigenvaluesoftheCorrelationMatrixEigenvalueDifferenceProportionCumulativeThedatahavebeenstandardizedtomeanandvarianceTheCLUSTERProcedureWard'sMinimumVarianceClusterAnalysisRootMeanSquareTotalSampleStandardDeviationRootMeanSquareDistanceBetweenObservations由上述种分析方法尤其树状图分析。在结合我们所拥有的实际知识可以可看出相对于最小距离法和重心法而言Ward法作出的聚类相对较为合理的反应了数据和现实情况。我们大致依据Ward方法所作出的树状图将个地区分成以下几类:第一类:北京、上海、江苏和广东。第二类:天津、重庆、江西、广西、湖南、吉林、云南、甘肃、贵州、内蒙古、海南、青海、宁夏、黑龙江、新疆。第三类:河北、安徽、陕西、辽宁、河南、浙江、四川、福建、湖北、山西、山东。总的来说分类结果和现实经济社会发展情况是一致的。从分析结果看出比如第一类分类北京上海江苏广东这四省市的经济社会发展是出于全国领先的地位而其工资就业总额也就随之较高。所以从分类中我们可以看出。地区职工工资总额是与地区的经济社会发展是相关的。另外经济结构相对于比较多元的地区其分类也相对靠前。动态聚类分析那么由上述方法进行的分类应该为:第一类:北京、上海。第二类:天津、河北、内蒙古、辽宁、吉林、安徽、福建、江西、湖南、湖北、广西、海南、重庆、四川、贵州、云南、西藏、陕西、甘肃、青海、宁夏第三类:黑龙江、新疆第四类:山西、山东、河南第五类:广东、江苏、浙江。总结:总的来说对比系统聚类分析和动态聚类分析我们会发现其大体的分类是相近的。但结合我们的实际情况来看我们不难发现动态聚类分析的结果是相对较为合理的。对于第一类而言北京上海是中国的经济文化中心其产业反正也较为均衡百姓涉及的行业较多其工资收入也与之经济发展大环境吻合。而第二类来说大多数是经济发展较为落后的地区。分类也较为准确的反应出其工资水平的问题。从分析结果我们大体可以得出这样的一个结论。各行业工资总额与当地经济社会发展水平人口产业链等息息相关。经济发展较为发达的东部沿海地区和北京上海此类的经济社会中心其工资总额水平处于较高的地位。而中西部等地由于其经济发展的制约和产业的相对单一其职工工资总额相对较低。通过动态聚类分析所得出的结果也非常明显的反应出这样的情况。参考文献:王学民上海财经出版社《应用多元分析》胡良平SAS统计分教程年度《中国统计年鉴》薛微Spss统计分析方法及应用

用户评价(0)

关闭

新课改视野下建构高中语文教学实验成果报告(32KB)

抱歉,积分不足下载失败,请稍后再试!

提示

试读已结束,如需要继续阅读或者下载,敬请购买!

文档小程序码

使用微信“扫一扫”扫码寻找文档

1

打开微信

2

扫描小程序码

3

发布寻找信息

4

等待寻找结果

我知道了
评分:

/12

多元统计分析小论文

VIP

在线
客服

免费
邮箱

爱问共享资料服务号

扫描关注领取更多福利