spss回归分析
回归分析的SPSS应用
实验二
学院:理学院
班级
班级管理量化考核细则初中班级管理量化细则班级心理健康教育计划班级建设班级德育计划
:信息1001班
姓名:陈元玲
学号:07101022
一、实验目的:
通过本实验项目,旨在使学生理解掌握SPSS软件包的基本功能以及相关的具体操作,具体包括:
(了解SPSS软件包的基本情况; 1
2(掌握SPSS团见报的启动与退出,数据的输入与保存等;
3(掌握SPSS软件包中有关数据文件整理的基本操作,熟悉均值比较检验的SPSS应用,会用配对检验进行实际问题分析。
二、实验题目:
研究国家财政收入问题,建立国家财政收入的回归模型,我们以财政收入Y(亿元)为因变量,自变量如下:X1为农业增加值(亿元);X2 为工业增加值(亿元);X3为建筑业增加值(亿元);X4为人口数(万人);X5为社会消费总额(亿元);X6为受灾面积(万公顷)。据《中国统计年鉴》获得1978-1998年共21个年份的统计数据。有定性分析可知,所选自变量都与变量Y有较强的相关性,请做自变量选取,用回归分析的方法研究该数学模型。
三、实验数据:
四、实验原理:
运用逐步回归法的基本思想是:将变量一个一个引入,每引入一个变量后,对已选入的变量要一个一个进行逐个检验,当原引入的变量因后面变量的引入而显得不再显著时,要将其剔除。 引入一个变量或从回归分析中剔除一个变量,为逐步回归的一步,每一步都要进行F检验,以确保每次引入新的变量之前回归方程中只包含显著的变量。这个过程反复进行,直到既无显著的自变量选入回归方程,也无不显著的自变量从回归方程中剔除为止。
五、实验步骤:
1、输入数据:
2、按照顺序:回归―>线性
3、在左侧的源变量中选择财政收入Y作为因变量,选择剩余的源变量作为自变
量,在方法栏中选择‘逐步’
4、点击选项栏->在进入栏后面输入0.1,在删除栏后面输入0.11
五、实验结果及分析:
a输入,移去的变量
模型 输入的变量 移去的变量 方法
1 最终消费x5 . 步进:准则:
F-to-enter 的概
率 <= .100,
F-to-remove 的
概率 >= .110:。 2 建筑业x3 . 步进:准则:
F-to-enter 的概
率 <= .100,
F-to-remove 的
概率 >= .110:。 3 农业x1 . 步进:准则:
F-to-enter 的概
率 <= .100,
F-to-remove 的
概率 >= .110:。 a. 因变量: 财政收入y
x显示变量的引入或剔除过程,逐步回归法首先是引入了变量,建立了模型5
xx1,然后引入了变量,建立了模型2,没有变量剔除,接着又引入了变量,31
xxx最终建立了模型3,包含变量、、。 351
模型汇总
模型 R R 方 调整 R 方
标准
excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载
估计的误差
a1 .980 .960 .958 540.79361
b2 .983 .967 .963 505.10844
c3 .987 .973 .968 466.17915 a. 预测变量: (常量), 最终消费x5。
b. 预测变量: (常量), 最终消费x5, 建筑业x3。
c. 预测变量: (常量), 最终消费x5, 建筑业x3, 农业x1。
R显示各个模型的拟合情况,模型3的复相关系数=0.987,判定系数R
Square=0.973,调整判定系数Adjusted R Square=0.968,估计值的标准误差
Std.Error of the Estimate=466.179。
dAnova
模型 平方和 df 均方 F Sig.
a1 回归 1.323E8 1 1.323E8 452.304 .000
残差 5556696.860 19 292457.729
总计 1.378E8 20
b2 回归 1.332E8 2 6.662E7 261.125 .000
残差 4592421.617 18 255134.534
总计 1.378E8 20
c3 回归 1.341E8 3 4.471E7 205.749 .000
残差 3694491.004 17 217323.000
总计 1.378E8 20
a. 预测变量: (常量), 最终消费x5。
b. 预测变量: (常量), 最终消费x5, 建筑业x3。
c. 预测变量: (常量), 最终消费x5, 建筑业x3, 农业x1。
d. 因变量: 财政收入y
显示各个模型的方差分析结果,模型3的回归均方Regression Mean
Square=4.471E7, 残差的均方Residual Mean Square=217323,F=205.749,
P=0.000.线性回归方程显著。
a系数
非标准化系数 标准系数
模型 B 标准 误差 试用版 t Sig.
1 (常量) 837.184 172.055 4.866 .000
最终消费x5 .178 .008 .980 21.267 .000
2 (常量) 390.796 280.262 1.394 .180
最终消费x5 .383 .106 2.106 3.625 .002
建筑业x3 -1.732 .891 -1.130 -1.944 .068
3 (常量) 669.819 292.829 2.287 .035
最终消费x5 .672 .172 3.699 3.896 .001
建筑业x3 -2.461 .897 -1.605 -2.744 .014
农业x1 -.641 .315 -1.121 -2.033 .058 a. 因变量: 财政收入y
x显示各个模型的偏回归系数结果,模型3的常数项=669.819,的回归系5数=0.672,回归系数的标准误差=0.172,回归系数的t检验的t值=3.896,P=0.001;
x的回归系数=-2.461,回归系数的标准误差=0.897,回归系数的t检验的t值3
=-2.774,P=0.014;的回归系数=-0.641,回归系数的标准误差=0.315,回归系数的t检验的t值=-2.003,P=0.058。按照=0.1的水平,认为三个偏回归系数,
y,669.819,0.641x,2.461x,0.672x,,都显著有意义。模型3的回归方程为。 135
d已排除的变量
共线性统计量 模型 Beta In t Sig. 偏相关 容差
a1 年份 .104 .967 .346 .222 .186
a农业x1 -.516 -.874 .394 -.202 .006
a工业x2 -1.674 -1.801 .088 -.391 .002
a建筑业x3 -1.130 -1.944 .068 -.417 .005
a人口x4 .096 .943 .358 .217 .207
a受灾面积x6 .026 .478 .639 .112 .739
b2 年份 -.028 -.212 .835 -.051 .114
b农业x1 -1.121 -2.033 .058 -.442 .005
b工业x2 -.748 -.516 .613 -.124 .001
b人口x4 -.034 -.271 .790 -.066 .125
b受灾面积x6 .002 .045 .964 .011 .694
c3 年份 .105 .784 .444 .192 .090
c工业x2 -1.200 -.899 .382 -.219 .001
c人口x4 .100 .766 .455 .188 .096
c受灾面积x6 -.014 -.290 .775 -.072 .674 a. 模型中的预测变量: (常量), 最终消费x5。
b. 模型中的预测变量: (常量), 最终消费x5, 建筑业x3。
c. 模型中的预测变量: (常量), 最终消费x5, 建筑业x3, 农业x1。
d已排除的变量
共线性统计量 模型 Beta In t Sig. 偏相关 容差
a1 年份 .104 .967 .346 .222 .186
a农业x1 -.516 -.874 .394 -.202 .006
a工业x2 -1.674 -1.801 .088 -.391 .002
a建筑业x3 -1.130 -1.944 .068 -.417 .005
a人口x4 .096 .943 .358 .217 .207
a受灾面积x6 .026 .478 .639 .112 .739
b2 年份 -.028 -.212 .835 -.051 .114
b农业x1 -1.121 -2.033 .058 -.442 .005
b工业x2 -.748 -.516 .613 -.124 .001
b人口x4 -.034 -.271 .790 -.066 .125
b受灾面积x6 .002 .045 .964 .011 .694
c3 年份 .105 .784 .444 .192 .090
c工业x2 -1.200 -.899 .382 -.219 .001
c人口x4 .100 .766 .455 .188 .096
c受灾面积x6 -.014 -.290 .775 -.072 .674 a. 模型中的预测变量: (常量), 最终消费x5。
b. 模型中的预测变量: (常量), 最终消费x5, 建筑业x3。
c. 模型中的预测变量: (常量), 最终消费x5, 建筑业x3, 农业x1。
d. 因变量: 财政收入y
显示各个模型方程外的变量的相关统计量,包括Beta、 t值、P值偏相
xx关系数和共线性统计的容忍值。可见模型3外的变量、的偏回归系数的P24值都大于0.1,故不能引入方程。
六、实验总结:
逐步选择变量,逐步分析结果,最终得出较为最优的结果。