首页 spss聚类分析与因子分析

spss聚类分析与因子分析

举报
开通vip

spss聚类分析与因子分析基于因子分析的31个省行业就业情况分析 基于因子分析的31个省行业就业情况分析 摘要:就业问题已经越来越受人重视,通过对31个省的17个就业指标进行因子分析,得出3个因子的较为合理的解释,并结合对31个省的就业情况做出相应的聚类分析,给出相应的综合分析结论。 关键词:因子分析 聚类分析 1、​ 指标的确定 根据《中国统计年鉴2009》中的数据表,选取 X1: 农、林、牧、渔业就业人数 X2: 采矿业就业人数 X3:制造业就业人数 X4:电力、燃气及水的生产及水的生产和供应业就业人数 X5:建筑业就业人数 X6:交通...

spss聚类分析与因子分析
基于因子 分析 定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析 的31个省行业就业情况分析 基于因子分析的31个省行业就业情况分析 摘要:就业问 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 已经越来越受人重视,通过对31个省的17个就业指标进行因子分析,得出3个因子的较为合理的解释,并结合对31个省的就业情况做出相应的聚类分析,给出相应的综合分析结论。 关键词:因子分析 聚类分析 1、​ 指标的确定 根据《中国统计年鉴2009》中的数据 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf ,选取 X1: 农、林、牧、渔业就业人数 X2: 采矿业就业人数 X3:制造业就业人数 X4:电力、燃气及水的生产及水的生产和供应业就业人数 X5:建筑业就业人数 X6:交通运输、仓储和邮政业就业人数 X7:信息传输、计算机服务和软件业就业人数 X8:批发和零售业就业人数 X9:住宿和餐饮业就业人数 X10:金融业就业人数 X11:租赁和商务服务业就业人数 X12:科学研究、技术服务和地质勘查业就业人数 X13:水利、环境和公共设施管理业就业人数 X14:教育就业人数 X15:卫生、社会保障和社会福利业就业人数 X16:文化、体育和娱乐业就业人数 X17:公共管理和社会组织就业人数 这17个数据对31个省的就业情况进行相关分析。 2、​ 因子分析及结果 先 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 化数据,且因子分析过程以特征值大于0为标准提取因子,以主成分法做因子分析,由KMO检验值0.766可判别该问题可使用因子分析。再考察累计贡献率>85﹪的成分,由图1可知应选择3个因子较为适合。 Total Variance Explained Component Initial Eigenvalues Extraction Sums of Squared Loadings Total % of Variance Cumulative % Total % of Variance Cumulative % 1 10.557 62.102 62.102 10.557 62.102 62.102 2 3.167 18.627 80.730 3.167 18.627 80.730 3 1.314 7.731 88.461 1.314 7.731 88.461 4 .721 4.240 92.700 .721 4.240 92.700 5 .437 2.569 95.269 .437 2.569 95.269 6 .295 1.737 97.006 .295 1.737 97.006 7 .160 .944 97.949 .160 .944 97.949 8 .113 .666 98.616 .113 .666 98.616 9 .064 .378 98.994 .064 .378 98.994 10 .045 .266 99.260 .045 .266 99.260 11 .037 .217 99.477 .037 .217 99.477 12 .033 .197 99.673 .033 .197 99.673 13 .019 .114 99.787 .019 .114 99.787 14 .016 .091 99.879 .016 .091 99.879 15 .011 .064 99.942 .011 .064 99.942 16 .008 .045 99.987 .008 .045 99.987 17 .002 .013 100.000 .002 .013 100.000 图1 再次以3个主分做标准做提取因子,并以主成分法做因子分析,采用方差极大化方法对因子载荷矩阵进行旋转,可得旋转后的因子特征值和贡献率 (图2)以及旋转后的因子载荷矩阵(图3)。 图2 Rotated Component Matrix(a) Component 1 2 3 Zscore(X1) -.077 -.018 .836 Zscore(X2) .484 -.105 .641 Zscore(X3) .783 .329 -.221 Zscore(X4) .909 .136 .316 Zscore(X5) .781 .150 -.215 Zscore(X6) .576 .750 .147 Zscore(X7) .117 .968 -.044 Zscore(X8) .664 .690 .037 Zscore(X9) .403 .860 -.208 Zscore(X10) .803 .538 -.025 Zscore(X11) .088 .970 -.140 Zscore(X12) .123 .952 .059 Zscore(X13) .819 .409 .288 Zscore(X14) .949 .171 .099 Zscore(X15) .930 .319 .055 Zscore(X16) .394 .892 .061 Zscore(X17) .945 .146 .150 图3 图4 由因子载荷矩阵可以看出 ,第一公因子在x3,x4,x5,x8,x10,x13,x14,x15,x16,x17上有较大正载荷,将其命名为社会服务性从业人口因子。 第二公因子在x6,x7,x9,x11,x12上有较大正载荷,将其命名为科学与交通、餐饮服务从业人口因子。 第三公因子在x1,x2上有较大正载荷,将其命名为国内主产业从业人口因子。 由因子得分系数矩阵可得相应的因子得分: F1=-0.106x1+0.045x2+0.147x3+0.14x4+0.17x5+0.008x6-0.096x7+0.047x8-0.004x9+0.103x10-0.092x11-0.104x12+0.088x13+0.168x14+0.149x15-0.039x16+0.165x17 F2=0.071x1-0.038x2-0.039x3-0.601x4-0.082x5+0.119x6+0.217x7+0.084x8+0.141x9+0.025x10+0.214x11+0.22x12+0.015x13-0.074x14-0.039x15+0.171x16-0.076x17 F3=0.606x1+0.398x2-0.219x3+0.137x4-0.228x5+0.1x6+0.031x7+0.007x8-0.126x9-0.064x10 -0.034x11+0.103x12+0.148x13-0.021x14-0.038x15+0.07x16+0.015x17 由此可以得出公共因子的综合得分公式 :F=0.4346F1+0.3601F2+0.089F3 (2.1) 利用(2.1)可以计算综合得分,如图5 。 3、​ 聚类分析及结果 使用默认的欧氏距离和离差平方和法,对31省的数据进行聚类分析,结果如图5 F1因子得分 F2因子得分 F3因子得分 F总得分 地区 排名 聚类结果 -1.42 5.04 -0.1 1.19 北京 1 1 1.84 0.71 -0.88 0.98 广东 2 2 2.25 -1.15 0.31 0.59 山东 3 2 1.91 -1.08 0.6 0.5 河南 4 2 1.12 -0.02 -0.34 0.45 江苏 5 2 1.14 0.09 -1.98 0.35 浙江 6 2 -0.64 1.48 -0.65 0.2 上海 7 3 0.41 -0.41 1.38 0.15 辽宁 8 2 1.14 -0.89 -0.3 0.15 四川 9 2 0.56 -0.28 0.03 0.14 湖北 10 2 0.72 -0.44 -0.4 0.12 湖南 11 2 -0.32 -0.22 3.63 0.1 黑龙江 12 2 1.02 -1.23 0.41 0.04 河北 13 2 0.09 -0.29 1.12 0.04 山西 14 3 -0.09 -0.1 0.19 -0.06 陕西 15 3 0.16 -0.45 0.13 -0.08 安徽 16 3 -0.17 -0.12 -0.16 -0.13 广西 17 3 -0.2 -0.11 -0.16 -0.14 云南 18 3 -0.41 -0.05 0.44 -0.16 吉林 19 3 0 -0.2 -0.98 -0.16 福建 20 3 -0.87 0.12 1.62 -0.19 新疆 21 3 -0.23 -0.31 -0.04 -0.21 江西 22 3 -0.51 -0.29 0.8 -0.25 内蒙古 23 3 -0.44 -0.08 -0.74 -0.28 重庆 24 3 -0.89 0.45 -0.65 -0.29 天津 25 3 -0.57 -0.23 -0.33 -0.36 甘肃 26 3 -0.46 -0.33 -0.49 -0.36 贵州 27 3 -1.3 0.28 -0.32 -0.49 海南 28 3 -1.29 0.14 -0.74 -0.58 青海 29 3 -1.18 -0.14 -0.55 -0.61 宁夏 30 3 -1.37 0.13 -0.87 -0.63 西藏 31 3 图5 4、​ 相关结论 从因子总得分来看,可将北京、广东、山东、河南、江苏、浙江、上海划分为第一类地区,这些地区就业岗位较多,总体就业情况很好;辽宁、四川、湖北、湖南、黑龙江、河北、山西可划为第二类地区,这些地区总体就业情况比较好;其余省份则多为以农、林、木、渔、采矿等行业为主,可将它们划分为第三类地区,第三类地区总体就业机会较第一类与第二类地区偏少,这一情况也与中国人口多以农、林、木、渔、采矿等国内主产业就业为主的实际事实以及聚类分析的相应结果较为符合。 从聚类分析角度,虽然北京、广东、山东、河南、江苏、浙江、上海可根据因子分析划分为第一类地区,但是各省份的实际情况却是不同的,北京因其总体就业比较平均,各行业从业人口都比较多,因此其聚为第一类;而广东、江苏、浙江虽然也比较发达,但在在国内占就业主要地位的国内主产业从业人口因子方面并不占优势,而其中的山东、河南都是传统的农业大省且外出务工人员较多,而在科学与交通、餐饮服务从业人口因子方面不占优势,所以它们以各自不同的优势被聚为第二类;上海虽然有很高的GDP,但其在从事社会服务性人口因子与国内主产业人口因子方面都不占有优势,故其被划分为第三类。 第二类地区中的辽宁、四川、湖北、湖南、黑龙江、河北都是比较发达的省份,都因其各自的优势被聚为第二类;而山西虽然从因子得分角度与其他第二类地区省份的因子总得分比较接近,但其从业人口主要以农、林、木、渔、采矿等在国内占就业主要地位的国内主产业从业人口行业为主,故被聚为第三类。 第三类地区大多以农、林、木、渔、采矿等在国内占就业主要地位的国内主产业从业人口行业为主,故它们被聚为第三类。 因此,从聚类分析角度来看所聚第一类可表示在三个因子方面都具有优势的地区,第二类可表为在两个因子方面都有优势的地区,第三类则表示仅在一个因子方面有优势的地区。而因子分析得出的是就业的总体三类地区。
本文档为【spss聚类分析与因子分析】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_880816
暂无简介~
格式:doc
大小:191KB
软件:Word
页数:4
分类:
上传时间:2011-05-18
浏览量:192