首页 SPSS因子分析

SPSS因子分析

举报
开通vip

SPSS因子分析 第 10章 因子分析 138 第 10章 因子分析 在各个领域的科学研究中往往需要对反映事物的多个变量进行大量的观测,收集大 量数据以便进行分析寻找规律。多变量大样本无疑会为科学研究提供丰富的信息,但也 在一定程度上增加了数据采集的工作量,更重要的是在大多数情况下,许多变量之间可 能存在相关性而增加了问题分析的复杂性。由于各变量间存在一定的相关关系,因此有 可能用较少的综合指标分别综合存在于各变量中的各类信息,而综合指标之间彼此不相 关,即各指标代表的信息不重叠。这样就可以对综合指标根据专业知识和指...

SPSS因子分析
第 10章 因子 分析 定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析 138 第 10章 因子分析 在各个领域的科学研究中往往需要对反映事物的多个变量进行大量的观测,收集大 量数据以便进行分析寻找规律。多变量大样本无疑会为科学研究提供丰富的信息,但也 在一定程度上增加了数据采集的工作量,更重要的是在大多数情况下,许多变量之间可 能存在相关性而增加了问题分析的复杂性。由于各变量间存在一定的相关关系,因此有 可能用较少的综合指标分别综合存在于各变量中的各类信息,而综合指标之间彼此不相 关,即各指标代表的信息不重叠。这样就可以对综合指标根据专业知识和指标所反映的 独特含义给予命名。这种分析方法称为因子分析,代表各类信息的综合指标就称为因子 或主成份。根据因子分析的目的我们知道,综合指标应该比原始变量少,但包含的信息 量应该相对损失较少。 [例子 10.1] 现以美国大城市洛杉矾对12个地区的总人口数、中等学校平均校龄、专业服务项目 数和中等房价等5个经济指标的调查数据进行因子分析。数据见表10-1。 表10-1 调查数据表 编号 总人口数 中等学校校龄 总雇员数 专业服务目 中等房价 1 5700 12.8 2500 270 25000 2 1000 10.9 600 10 10000 3 3400 8.8 1000 10 9000 4 3800 13.6 1700 140 25000 5 4000 12.8 1600 140 25000 6 8200 8.3 2600 60 12000 7 1200 11.4 400 10 16000 8 9100 11.5 3300 60 14000 9 9900 12.5 3400 180 18000 10 9600 13.7 3600 390 25000 11 9600 9.6 3300 80 12000 12 9400 11.4 4000 100 13000 10.1 操作步骤 1)准备数据 在SPSS数据编辑窗口建立数据变量:no、pop、school、employ、services、house。 分别代表:编号、总人口数、中等学校校龄、总雇员数、专业服务目、中等房价。 然后输入对应变量的数据。 数据保存配套光盘中(\SPSS\DATA\DATA10-1.SAV)。 SPSS 统计分析 139 2)启动因子分析过程 在 SPSS 主菜单中按“Analyze→Data Reduction→Factor”顺序逐一单击鼠标键,打 开因子分析主对话框,如图 10-1所示。 图10-1 因子分析主对话 3)指定参与分析的变量 指定分析变量:在左面的矩形柜中选择变量,单击“Variables”框左边的向右拉箭 头按钮,把选中的变量名移到该显示框中。 本例将总人口数[pop]、中等学校校龄[school]、总雇员数[employ]、专业服务目 [services]、中等房价[house]五个变量移到“Variables”框中。 指定控制变量:在左面的矩形柜中选择控制变量,单击“Selection Varizble”栏 左边的向右拉箭头按钮,把选中的变量名移到该显示栏里。然后点击“Valye”按钮,在 打开的对话框里输入控制的变量值。本例没有控制变量,不操作此项。 4)“Descriptives”选择描述统计量 在因子分析主对话中,单击“Descriptives”按钮,打开“Descriptives”对话框, 见图10-2。 见图10-2 “Descriptives”对话框 第 10章 因子分析 140 ①“Statistics”统计量栏选项: l Univariate descriptives复选项,单变量描述统计量。选择此项可以输出参与分析 的各原始变量的均值、标推差等。 l Initial solution复选项,初始分析结果。选择此项可以给出因子提取前分析变量 的公因子方差。对主成分分析来说,这些值是要进行分析变量的相关或协方差矩阵的 对角元素。对因子分析来说,是每个变量用其他变量作预测因子的载荷平方和。 本例选择“Univariate descriptives”和“Initial solution”项。 ②“Correlation Matrix” 相关矩阵栏选项: l Coefficients复选项,相关系数。选择此项给出原始分析变量间的相关系数矩阵。 l Significance levels复选项,显著性水平。选择此项给出每个相关系数相对于相 关系数为0的单尾假设检验的概率水平。 l Determinant复选项,相关系数矩阵的行列式。 l Inverse复选项,相关系数矩阵的逆矩阵。 l Reproduced复选项,再生相关矩阵。选择此项给出因子分析后的相关矩阵。还给出 残差,即原始相关与再生相关之间的差值。 l Anti-image复选项,反映象相关阵。包括偏相关系数的负数:反映象协方差阵,包 括偏协方差的负数;在一个好的因子模型中除对角线上的系数较大外,远离对角线 的元素应该比较小。 l KMO and Bartlett's,test of sphericity复选项,KMO和Bartlett检验。选择 此项给出对采样充足度的Kaisex-Meyer-Olkin测度。检验变量间的偏相关是否很 小。Bartlett球形检验,检验的是相关阵是否是单位阵。它表明因子模型是否是不 合适的。 本例选中“Coefficients”和“Significance levels”项。 5)“Extraction”选择公因子提取 在因子分析主对话框中,单击“Extraction”按钮,打开“Extraction”对话框, 见图10-3。 图10-3 Extraction对话框 SPSS 统计分析 141 ① 因子提取方法选择项 “Method”参数框是一组指定提取方法的选择项。单击矩形框右面的下拉箭头按钮 可以展开提取方法选择项表,提供七种提取方法可以选择: l Principal components选项,主成份法。该方法假设变量是因子的纯线性组合。第 一成分有最大的方差,后续的成分其可解释的方差逐个递减。往往使用主成分法获 取初始的因子分析结果。 l Unweighted least square选项,不加权最小平方法。该方法使观测的和再生的相 关阵之差的平方和最小,不计对角元素。 l Generalized least squares选项,加权最小平方法。使观测的和再生的相关阵之 差的平方和最小。 l Maximum likelihood选项,最大似然法。此方法不要求多元正态分布。给出参数估 计,如果样本来自多元正态总体它们与原始变量的相关阵极为相似。原始分析变量 用变量单值倒数加权。使用迭代算法。 l Principal axis factoring选项,主轴因子提取法。使用多元相关的平方作为对公 因子方差的初始估计。初始估计公因子方差时多元相关系数的平方置于对角线上。 这些因子载荷用于估计新公因子方差,替换对角线上的前一次的公因子方差估计。 这样的迭代持续到本次到下一次迭代结果公因子方差的变化满足提取因子的收敛 判据。 l Alphafa ctoring选项,α因子提取法。 l Image factoring选项,映象因子提取法。是由Guttman提出的因子提取方法。根 据映像学原理提取公因子的方法。把一个变量看作其他各变量的多元回归。而不是 假设因子的函数。 本例选择“Principal components”项。 ② Analyze 栏中分析矩阵的选择项 l Correlation matrix选项,指定以分析变量的相关矩阵为提取因子的依据。如果 参与分析的变量的测度单位不同时应该选择此项。 l Covariance matrix选项,指定以分析变量的协方差矩阵为提取因子的依据。 本例选择“Correlation matrix”项。 ③ 在 Display栏中指定与因子提取有关的输出项 l Unrotated factor solution复选项,要求显示未经旋转的因子提取结果。此项 为系统默认的输出方式。 l Scree plot复选项,要求显示按特征值大小排列的因子序号,以特征值为两个 坐标轴的碎石图。可以有助于确定保留多少个因子。典型的碎石图会有一个明显 的拐点,在该点之前是与大因子连接的陡峭的折线,之后是与小因子相连的缓坡 折线。 第 10章 因子分析 142 本例选择“Unrotated factor solution”和“Scree plot”项。 ④ Extract栏提取进程和提取结果的选择项 理论上因子数目与原始变量数目相等,但因子分析的目的是用少量因子代替多个原 始变量,选择提取多少个因子由本栏选择项决定。 l Eigenvalues over选项,该选择项指定提取的因子的特征值。在此项后面的矩形框 中给出。系统默认值为1即要求提取那些特征值大于1的因子。指定特征值决定提 取因子数目的方法是系统默认的方法。 l Number off actors选项,该选择顶指定提取公因子的数目。用鼠标单击选择此项 后,将指定其数目。理论上有多少个分析变量就有多少个因子。 本例选择“Number off actors”项,提取2个因子。在小矩形框里输入值2。 ⑤ 指定因子分析收敛的最大迭代次数 l Maximum iterations for Convergence参数框,指定因子分析收敛的最大迭代次 数。系统默认的最大迭代次数为25。 本例选择系统默认值。 6)“Rotation”选择因子旋转方法 在因子分析主对话框中,单击“Rotation”按钮,打开“Rotation”对话框,如图 10-4所示。 图10-4 Rotation 对话框 ①“Method”栏选择旋转方法选项 l None选项,不进行旋转。此为系统默认的选择项。 l Varimax选项,方差最大旋转法。是一种正交旋转方法。它使每个因子上的具有最 高载荷的变量数最小,因此可以简化对因子的解释。 l Direct Oblimin选顶,直接斜交旋转法,指定此项可以在下面的“Delta”矩形框 中键入δ值,该值应该在0~1之间。0值产生最高相关因子,大负数产生旋转的结 果与正交接近。 SPSS 统计分析 143 l Quartmax选项,四次方最大正变旋转法。该旋转方法使每个变量中需要解释的因子 数最少。可以简化对变量的解释。 l Equamax选项,平均正交旋转法。是简化对因子的解释的 vaMm方法与简化对变量解 释的 Quartmax方法的结合。结果在一个因子上有高载荷的变量数和在需要解释的 变量的因子数最少。 l Promax选项,斜交旋转方法。允许因子彼此相关。它比直接斜交旋转更快,因此适 用于大数据集的因子分析。指定此项可以在下面的“Kappa”矩形框中键入“к” 值,默认为4。 本例选择“Varimax”项,方差最大旋转。 ②“Display”栏中选择有关输出显示 l Rotated solution选项,旋转结果。指定旋转方法才能选择此项。选择此项将对正 交旋转显示旋转后的因子矩阵模式、因子转换矩阵对斜交旋转显示旋转后的因子矩 阵模式、因子结构矩阵和因子间的相关阵。 l Lodingp lot(s)选项,因子载荷散点图。指定此项将给出以两因子为坐标轴的各变 量的载荷散点图。如果有两个因子,给出各原始变量在FaDtorl—Factm2坐标系中 的散点如果多于两个因子,则给出前三个因子的三维因子载荷散点图。如果只提取 了一个因子,则不会输出载荷散点图。 注意:选择此项给出的是经旋转后的因子载荷图。 本例选择“Rotated solution”和“Lodingp lot”项。 ③ 旋转收敛的最大迭代次数 l Maximum iterations for Convergence参数框,指定旋转收敛的最大迭代次数。系 统默认值为25。可以在此项后面的矩形框中输入指定值。 7)“Scores”得分选择 有关因子得分的选择项在因子分析主对话框中,单击“Scores”按钮,打开“Factor Scores”对话框,如图10-5所示。 图10-5 Factor Scores对话框 第 10章 因子分析 144 ① 将因子得分作为新变量保存在数据文件中 l Save as variables复选项,将因子得分作为新变量保存在工作数据文件中。程 序运行结束后,在数据窗中显示出新变量。对每一次分析产生一组新变量,用最 后一个数字字符表示分析的顺序号。每次分析中产生多少个因子,就生成多少个 新变量,因子序号占倒数第三个字符的位置。倒数第二个字符为“-”。在输出窗 中给出对因子得分的命名和变量标签,表明用以计算因子得分的方法。 本例选中“Save as variables”项。 ②“Method”栏中指定计算因子得分的方法 l Regression选项,回归法。其因子得分的均值为 0。方差等于估计因子得分与实 际因子得分之间的多元相关的平方。 l Bartlett选项,巴特利特法。因子得分均值为 0。超出变量范围的各因子平方和 被最小化。 l Anderson-Rubin选项,安德森一鲁宾法。是为了保证因子的正交性而对巴特利特 因子得分的调整。其因子得分的均值为0, 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 差为l,且彼此不相关。 本例选中“Regression”项。 ③ 在输出窗中显示因子得分 l Display factor score coefficient matrix复选项,选择此项将在输出窗中显 示因子得分系数矩阵。是标准化的得分系数,原始变量值进行标准化后,可以根 据该矩阵给出的系数计算各观测量的因子得分。还显示协方差阵。 本例选中该项。 8)“Options”输出选择 在因子分析主对话框中,单击“Options”按钮,打开“Options”对话框,如图10-6 所示。有关输出方式以及对带有缺失值的观测量处理方法的选择项均在该对话框中。 图10-6 Options 对话框 SPSS 统计分析 145 ①“MissingValues”栏选择处理缺失值方法 l Exclude cases listwise选项,在分析过程中对那些指定的分析变量中有缺失值的 观测量一律剔除。所有分析变量带有缺失值的观测量都不参与分析。 l Exclude cases pairwise选项,成对剔除带有缺失值的观测量。换句话说,在计算 两个变量的相关系数时,只把这两个变量中带有缺失值的观测量剔除。如果一个观 测量在正进行相关系数计算的变量中没有缺失值,其他变量中带有缺失值,那么不 影响当前相关系数的计算。 l Replace with mean选项,用该变量的均值代替工作变量的所有缺失值。 本例选中“Exclude cases listwise”项。 ②“Coefficient Display Format”决定载荷系数的显示格式 l Sorted by size复选项,选中此项,载荷系数按其数值的大小排列并构成矩阵。使 在同一因子上具有较高载荷的变量排在一起。便于得出结论。 l Suppress absolute values less than 复选项,不显示那些绝对值小于指定值的 载荷系数。选择此项后还需要在该项的框中键入O~1之间的数作为临界值。系统默 认的临界值为0.10。选择此项可以突出载荷较大的变量。便于得出结论。 本例选中“Sorted by size”项。 9)提交各项设置 所有设置完成后,在主对话框里点击“OK”按钮,SPSS输出结果将显示在输出浏览 器中。输出结果见表10-2至表10-10,图10-7和图10-8。 表10-2 各变量描叙统计量 Descriptive Statistics Mean Std. Deviation Analysis N 总人口 6241.67 3439.99 12 中等校平均校龄 11.442 1.787 12 总雇员数 2333.33 1241.21 12 专业服务项目数 120.83 114.93 12 中等房价 17000.00 6367.53 12 表10-3 原始变量的相关分析结果 Correlation Matrix 总人口 中等校平 均校龄 总雇员数 专业服务 项目数 中等房价 总人口 1.000 .010 .972 .439 .022 中等校平均校龄 .010 1.000 .154 .691 .863 总雇员数 .972 .154 1.000 .515 .122 专业服务项目数 .439 .691 .515 1.000 .778 Correlation 中等房价 .022 .863 .122 .778 1.000 总人口 .488 .000 .077 .472 中等校平均校龄 .488 .316 .006 .000 总雇员数 .000 .316 .043 .353 专业服务项目数 .077 .006 .043 .001 Sig. (1-tailed) 中等房价 .472 .000 .353 .001 第 10章 因子分析 146 表10-4 公因子方差表 Communalities Initial Extraction 总人口 1.000 .988 中等校平均校龄 1.000 .885 总雇员数 1.000 .979 专业服务项目数 1.000 .880 中等房价 1.000 .938 Extraction Method: Principal Component Analysis. 表10-5 总方差分解 Total Variance Explained Initial Eigenvalues Extraction Sums of Squared Loadings Rotation Sums of Squared Loadings Component Total % of Variance Cumulative % Total % of Variance Cumulative % Total % of Variance Cumulative % 1 2.873 57.466 57.466 2.873 57.466 57.466 2.522 50.437 50.437 2 1.797 35.933 93.399 1.797 35.933 93.399 2.148 42.963 93.399 3 .215 4.297 97.696 4 9.993E-02 1.999 99.695 5 1.526E-02 .305 100.000 Extraction Method: Principal Component Analysis. 表10-6 旋转前的因子(主成分)提取结果 Component Matrixa Component 1 2 专业服务项目数 .932 -.104 中等房价 .791 -.558 中等校平均校龄 .767 -.545 总人口 .581 .806 总雇员数 .672 .726 Extraction Method: Principal Component Analysis. a 2 components extracted. 表10-7 旋转后的因子(主成分)提取结果 Rotated Component Matrixa Component 1 2 中等房价 .968 -6.050E-03 中等校平均校龄 .941 -8.817E-03 专业服务项目数 .825 .447 总人口 1.602E-02 .994 总雇员数 .137 .980 Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. a Rotation converged in 3 iterations. 表10-8 因子转换的转换阵 Component Transformation Matrix Component 1 2 1 .821 .571 2 -.571 .821 Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. 表10-10 估计回归因子的协方差矩阵 Component Score Covariance Matrix Component 1 2 1 1.000 .000 2 .000 1.000 Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. Component Scores. 表10-9 有关因子得分的信息 Component Score Coefficient Matrix Component 1 2 总人口 -.091 .484 中等校平均校龄 .392 -.096 总雇员数 -.039 .465 专业服务项目数 .299 .138 中等房价 .403 -.098 Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. Component Scores. SPSS 统计分析 147 Scree Plot Component Number 54321 Ei ge nv al ue 3.5 3.0 2.5 2.0 1.5 1.0 .5 0.0 图10-7 表现各成分特征值的碎石图 Component Plot in Rotated Space Component 1 1.0.50.0-.5-1.0 C o m p o n e n t 2 1.0 .5 0.0 -.5 -1.0 中等房价 专业服务项目数 中等校平均校龄 图 10-8 旋转后的主成分图 10.2 结果解释 1)表 10-2为各变量描述统计量: 第一栏是显示变量名称,与Option设置的系统参数有关。 第二栏“Meam”是各变量的均值。 第三栏“Sd.Deviation”是各变量的标准差。 第四栏“Analysis”计算这些统计量的观测量数。 2)表 10-3为原始变量的相关分析结果 “Correlation”大栏是各变量间的相关系数;“Sig.”大栏是单位检验的概率值。 3)表 10-4公因子提取前后的公因子方差表。 “Initial”栏是在提取因子(或成分,系统默认的是主成分法)之前的各变量的 公因子方差。对主成分分析来说,该值是要被分析的矩阵(相关矩阵或协方差矩阵) 的对角元素;对因子分析来说,这些值是用其他变量作为预测变量时每个变量的载荷 的平方和。原始变量的公因子方差均为1,五个变量的公因子方差之总和为5。 “Extraction”栏是各变量的未旋转的公因子方差。这些公因子方差是用作预测 因子的变量的多重相关的平方。 4)表 10-5 各成分的公因子方差表 “Components”栏为各主成分的序号。 “Initial Eigenvalues”栏相关矩阵或协方差矩阵的特征值。这些值是用于确 定哪些因子(或成分)应保留。共有三项: ² “Total”列各成分的特征值。第一主成分特征值为Total=2.873,第二主成 第 10章 因子分析 148 分特征值为Total=1.797。表中只有前两个因子的特征值大于1。 ² “% of Variance”列各成分所解释的方差占总方差的百分比。也就是各因 子特征值占特征值总和的百分比。 ² “Cumulative %”列自上而下各因子方差占总方差百分比的累积百分比。表 中看出前两个因子的特征值之和占总方差的93.4%。 “Extraction Sums of Squared Loadings”栏是因子提取结果。未旋转的因子 载荷的平方和。给出的是每个因子(或成分)的特征值、说明的方差占总方差的百分比 和累计百分比。从初始分析的统计量可以看出按照系统默认值给出的分析 原则 组织架构调整原则组织架构设计原则组织架构设置原则财政预算编制原则问卷调查设计原则 ,提取 原则是特征值大于1。那么应该取前两个因子(就本次分析来说应该称作主成份)。而 前两个因子已经对大多数数据给出了充分的概括,可以看出前两个成分所解释的方差 占总方差的93.4%。因此,最后结果是确定提取两个主成分。 5)表 10-6 旋转前的因子(主成分)提取结果。 因为默认的提取公因子的方法是主成分法,因此可以称之为成分矩阵。根据该表可 以写出两个主成分表达式(使用变量名): Component1 = O.932×service + O.791×house + 0.767×school + 0.581×pop + 0.672×employ Component2 = -0.104×service - 0.558×house - 0.545×school + 0.806×Pop + 0.726×employ 可以说,用这两个因子代替五个原始变量,可以概括原始变量所包含信息的93.4%。 由以上输出结果可以认为对因子的提取结果是比较理想的。但是要想对两个因子命名就 感到比较困难,每个因子中各原始变量的系数没有很明显的差别。因此为了对因子进行 命名进行旋转,使系数向0和1两极分化。 6)表 10-7 旋转后的因子(主成分)提取结果。 表下方是有关因子提取与旋转方法的说:使用主成分法提取因子,使用最大方差法 (Varimax)方法旋转,经3次迭代收敛。 表中给出了旋转后的因子负荷矩阵,是按系数由大到小排列的。可以看出经过旋转 后负荷系数已经明显地向两极分化了。第一个主成分“Component1”对中等房价 (House)、中等校平均校龄(school)、专业服务项目(services)有绝对值较大的负荷系 数;第二个因子负荷系数绝对值较大的正好是五个原始变量中的另外两个即总人口 (pop)和总雇员数(employ)。根据这些变量的原始含义可以对两个因子进行命名:第一 个因子主要概括了一般的社会福利情况的因子:中等房价、中等学校校龄和社会服务 项目可以命名为福利条件因子;第二个因子主要概括了人的情况,人口数和就业人数, 可以称为人口因子。 SPSS 统计分析 149 7) 表 10-8为因子转换矩阵。 8) 表 10-9为有关因子得分的信息 因子得分系数矩阵。根据因子得分系数和原始变量的标准化值可以计算每个观测量 的各因子的得分数。并可以据此对观测量进行进一步的分析。旋转后的因子(主成分)表 达式可以写成: fac1_l = – 0.091×pop + O.392×school - 0.039×employ + 0.229×services + 0.403×house fac2_1 = 0.484×pop - O.096×school + 0.465×employ + 0.138×services - 0.098×houe 9) 表 10-10是估计回归因子分数的协方差矩阵 即因子(两个主成分)间的相关矩阵。可以看出旋转后“Component 1”与“Component 2”是完全不相关的。这也是因为正交旋转(Varimax)后因子仍然正交。 10)图 10-7 各成分特征值的碎石图 分析碎石图可以看出因子1与因子2,以及因子 2与因子3之间的特征值之差值比较 大。而因子 3、4、5之间的特征值差值均比较小。可以初步得出保留两个因子将能概括 绝大部分信息。 11) 图 10-8为旋转后的主因子(成分)载荷图 分别以第一主成分和第二主成分值为横、纵坐标,按表10-6中数据作图得到主成分 图。从图中可以看出旋转后各成分的变量更集中了。 12)因子得分信息 SPSS在数据编辑窗中以新变量的形式保存因子得分信息。数据文件中新变量fac1_1 是第一个回归因子得分变量,fac2_l是第二个回归因子得分变量。 有了观测量的因子得分变量的值,我们可以进一步对观测量估计因子得分变量进行 聚类分析,进一步对每个调查区进行人口与福利方面的分类或分析。 10.3.根据因子分析结果进行聚类分析 根据因子分析产生的新变量(因子得分)对12个调查区进行聚类分析。要求聚为两 类、三类。然后利用SPSS绘图(Graph)功能作散点图比较分为两类和三类的结果。 10.3.1操作步骤 1)启动分层聚类过程 按“Analyze→Classify→Hierarchical Cluster”顺序逐一单击鼠标键,打开分层 第 10章 因子分析 150 聚类主对话框(图8-6)。 3) 指定分析变量 指定“fac1_1”和“fac2_1”变量为分析变量,单击“Variables”矩形框左边的右 拉箭头按钮,使这两各变量进入“Variables”矩形框中。 4)设置聚类数 在主对话框(图 8-6)中点击“Statistic”按钮,打开统计量输出设置对话框,如图 8-7。 在图8-7的“Cluster Membership”栏中选择“Single solution”选项,在其参数 框中键入2。即要求聚为2类的结果。以后再调用聚类过程时改变此项,以便得到聚为3 类的结果。 5) 聚类图输出设置 在分层聚类分析的主对话框中(图 8-6),点击“Plots”按钮,打开统计图输出选择 对话框。如图8-8所示。选择“Dendrogram”项,输出树形图形。 6) 选择聚类方法 在主对话框(图8-6)中点击“Method”按钮,打开分层聚类分析的方法选择对话框如 图8-9。 在“Cluster Method”选择聚类方法中选中“Between-groups linkage ”项,合并 两类的结果使所有的两类的平均距离距离最小。 7)选择存入聚类的新变量 在单击主对话框(图8-6)的“save”按钮,打开相应的对话框,如图8-10所示。 在对话框里选“Single solution”选项,在该项后面的矩形框中输入类数2。 以后再次调用聚类过程时改变此项,以便得到聚为3类的结果。 8)聚类结果 聚为两类和三类各观测量的分类结果,见表10-10。聚类过程的树型图见图10-9。 从以上输出信息很难看出各调查区在经济特性方面的区别。 五个变量转变为两个综合指标(两个因子)的好处在于减少了指标数目(降维)但综合 指标包含的信息没有损失多少。使用两个综合指标可以对调查区的经济状况更清楚地进 行分析。 SPSS 统计分析 151 表10-10a 聚为2类的结果 Cluster Membership Case 2 Clusters 1 1 2 2 3 2 4 1 5 1 6 1 7 2 8 1 9 1 10 1 11 1 12 1 表10-10b 聚为3类的结果 Cluster Membership Case 3 Clusters 1 1 2 2 3 2 4 1 5 1 6 3 7 2 8 3 9 3 10 1 11 3 12 3 图10-9 聚类过程的树型图 10.4根据聚类分析结果作散点图分析 利用因子得分变量,调用SPSS散点图(Graphs-Scatterplot)过程作因子散点图。 因子1的得分变量“fac1_1”作为X轴变量(X Axis),因子2的得分变量“fac2_2”作 为Y轴变量(Y Axis),用“no”变量作标签变量(Label Cases by);聚类变量“clu2_1” 作分类变量(Set Markers by)作图结果见图 10-9。再使用聚类变量“clu3_2”作分类 第 10章 因子分析 152 变量作图结果见图10-10。 REGR factor score 1 for analysis 1 2.01.51.0.50.0-.5-1.0-1.5 R EG R f ac to r sc or e 2 fo r an al ys is 1 1.5 1.0 .5 0.0 -.5 -1.0 -1.5 -2.0 Average Linkage (Bet 2 1 12 11 109 8 7 6 5 43 2 1 图10-9 聚为两类的因子得分图 REGR factor score 1 for analysis 1 2.01.00.0-1.0-2.0 R E G R f a c t o r s c o r e 2 f o r a n a l y s i s 1 1.5 1.0 .5 0.0 -.5 -1.0 -1.5 -2.0 Average Linkage (Bet 3 2 1 12 11 109 8 7 6 543 2 1 图10-10 聚为三类的因子得分散点图 从图10-9可以看出如果将调查区分为两类,第2、3、7区类号为2的,是福利因素 和人口因素均比较地低的,其余调查区的这两个因素水平比较高。可以认为经济状况是 相对来说比较好的。 SPSS 统计分析 153 从图15-10可以更细致地划分和分析各调查区的经济水平。 ①类号为l的调查区位于散点图的右偏上方。可以看作人口和就业人数均较少,福 利条件比较好的地区。有编号为1、4、5号地区。 ②类号为2的调查区有编号为2、3、7三个地区,在图的左下角,是两个因子得分 均比较低的,可以认为从五个经济指标来看均较差的地区。 ③类号为3的调查区“fac1_1”比较低,即福利因子得分较低;而“fac2_1”比较 高即人口因子得分较高说明总人口多,就业人数多。但反映福利的学校、服务项 目、中等房价均比较低。这样的地区有6、8、9、11、12号地区。 以上分析使用因子得分绘制出散点图是比较容易进行的。反过来对照原始数据,也 可以得出同样的分析结论。但是直接使用五个原始变量来分类,就不够直观。由此我们 对因子分析的作用也可以有较直观的体会。
本文档为【SPSS因子分析】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_923914
暂无简介~
格式:pdf
大小:283KB
软件:PDF阅读器
页数:8
分类:工学
上传时间:2011-10-29
浏览量:66