SPSS多元线性回归
分析
定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析
实例操作步骤
SPSS 统计分析
多元线性回归分析方法操作与分析
实验目的:
引入1998~2008年上海市城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率和房屋空置率作为变量,来研究上海房价的变动因素。
实验变量:
以年份、商品房平均售价(元/平方米)、上海市城市人口密度(人/平方公里)、城市居民人均可支配收入(元)、五年以上平均年贷款利率(%)和房屋空置率(%)作为变量。
实验方法:多元线性回归分析法
软件:spss19.0
操作过程:
第一步:导入Excel数据文件
1. open data document——open data——open;
2. Opening excel data source——OK.
第二步:
1.在最上面菜单里面选中Analyze——Regression——Linear ,Dependent(因变量)选择商品房平均售价,Independents(自变量)选择城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率、房屋空置率;Method选择Stepwise.
进入如下界面:
2.点击右侧Statistics,勾选Regression Coefficients(回归系数)选项组中的Estimates;勾选Residuals(残差)选项组中的Durbin-Watson、Casewise diagnostics默认;接着选择Model fit、Collinearity diagnotics;点击Continue.
3.点击右侧Plots,选择*ZPRED(标准化预测值)作为纵轴变量,选择
DEPENDNT(因变量)作为横轴变量;勾选选项组中的Standardized Residual Plots(标准化残差图)中的Histogram、Normal probability plot;点击Continue.
4.点击右侧Save,勾选Predicted Vaniues(预测值)和Residuals(残差)选
项组中的Unstandardized;点击Continue.
5.点击右侧Options,默认,点击Continue.
6.返回主对话框,单击OK.
输出结果分析:
1.引入/剔除变量
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
aVariables Entered/Removed
Model Variables Entered Variables Removed Method
城市人口密度 (人/平方公里) 1 . Stepwise (Criteria:
Probability-of-F-to-enter
<= .050,
Probability-of-F-to-remove >=
.100).
城市居民人均可支配收入(元) 2 . Stepwise (Criteria:
Probability-of-F-to-enter
<= .050,
Probability-of-F-to-remove >=
.100).
a. Dependent Variable: 商品房平均售价(元/平方米)
该表显示模型最先引入变量城市人口密度 (人/平方公里),第二个引入模型的是变量城市居民人均可支配收入(元),没有变量被剔除。
2. 模型汇总
cModel Summary
Std. Error of the Model R R Square Adjusted R Square Estimate Durbin-Watson
a 1 1.000 1.000 1.000 35.187
b2 1.000 1.000 1.000 28.351 2.845 a. Predictors: (Constant), 城市人口密度 (人/平方公里)
b. Predictors: (Constant), 城市人口密度 (人/平方公里), 城市居民人均可支配收入(元)
c. Dependent Variable: 商品房平均售价(元/平方米)
该表显示模型的拟合情况。从表中可以看出,模型的复相关系数(R)为1.000,判定系数(R Square)为1.000,调整判定系数(Adjusted R Square)为1.000,估计值的标准误差(Std. Error of the Estimate)为28.351,Durbin-Watson检验统计量为2.845,当DW?2时说明残差独立。
3. 方差分析表
cANOVA
Model Sum of Squares df Mean Square F Sig.
a1 Regression 38305583.506 1 38305583.506 30938.620 .000
Residual 11143.039 9 1238.115
Total 38316726.545 10
b2 Regression 38310296.528 2 19155148.264 23832.156 .000
Residual 6430.018 8 803.752
Total 38316726.545 10
a. Predictors: (Constant), 城市人口密度 (人/平方公里)
b. Predictors: (Constant), 城市人口密度 (人/平方公里), 城市居民人均可支配收入(元)
c. Dependent Variable: 商品房平均售价(元/平方米)
该表显示各模型的方差分析结果。从表中可以看出,模型的F统计量的观察值为23832.156,概率p值为0.000,在显著性水平为0.05的情形下,可以认为:商品房平均售价(元/平方米)与城市人口密度 (人/平方公里),和城市居民人均可支配收入(元)之间有线性关系。
4. 回归系数
aCoefficients
Standardize
Unstandardized d Collinearity
Coefficients Coefficients Statistics
TolerancModel B Std. Error Beta T Sig. e VIF
1 (Constant) 1652.246 24.137 68.454 .000
城市人口密度 (人/平1.072 .006 1.000 175.89.000 1.000 1.000
方公里) 4
2 (Constant) 1555.506 44.432 35.009 .000
城市人口密度 (人/平1.020 .022 .951 46.302 .000 .050 20.126
方公里)
城市居民人均可支配.017 .007 .050 2.422 .042 .050 20.126
收入(元)
a. Dependent Variable: 商品房平均售价(元/平方米)
该表为多元线性回归的系数列表。表中显示了模型的偏回归系数(B)、标准误差(Std. Error)、常数(Constant)、标准化偏回归系数(Beta)、回归系数检验的t统计量观测值和相应的概率p值(Sig.)、共线性统计量显示了变量的容差(Tolerance)和方差膨胀因子(VIF)。
令x表示城市人口密度(人/平方公里),x表示城市居民人均可支配收12
入(元),根据模型建立的多元多元线性回归方程为:
y=1555.506+1.020 x +0.017x12
方程中的常数项为1555.506,偏回归系数b1为1.020,b2为0.017,经T检验,b1和b2的概率p值分别为0.000和0.042,按照给定的显著性水平0.10的情形下,均有显著性意义。
根据容差发现,自变量间共线性问题严重;VIF值为20.126,也可以说明共线性较明显。这可能是由于样本容量太小造成的。 5. 模型外的变量
cExcluded Variables
Collinearity Statistics
Partial TolerancMinimum Model Beta In t Sig. Correlation e VIF Tolerance
a城市居民人均可支配1 .050 2.422 .042 .650 .050 20.126 .050
收入(元)
a五年以上平均年贷款-.001 -.241 .815 -.085 .999 1.001 .999
利率(%)
a房屋空置率(%) .004 .596 .568 .206 .928 1.078 .928
b五年以上平均年贷款2 .002 .391 .708 .146 .913 1.096 .045
利率(%)
b房屋空置率(%) .002 .452 .665 .168 .914 1.094 .049 a. Predictors in the Model: (Constant), 城市人口密度 (人/平方公里)
b. Predictors in the Model: (Constant), 城市人口密度 (人/平方公里), 城市居民人均可支配收入(元) c. Dependent Variable: 商品房平均售价(元/平方米)
该表显示的是回归方程外的各模型变量的有关统计量,可见模型方程外的各变量偏回归系数经重检验,概率p值均大于0.10,故不能引入方程。
6. 共线性诊断
aCollinearity Diagnostics
Variance Proportions
城市人口密度 城市居民人均可
(人/平方公里) 支配收入(元) Model Dimension Eigenvalue Condition Index (Constant)
1 1 1.898 1.000 .05 .05
2 .102 4.319 .95 .95 2 1 2.891 1.000 .00 .00 .00
2 .106 5.213 .21 .03 .00
3 .003 30.736 .78 .97 1.00 a. Dependent Variable: 商品房平均售价(元/平方米)
该表是多重共线性检验的特征值以及条件指数。对于第二个模型,最大特征值为2.891,其余依次快速减小。第三列的各个条件指数,可以看出有多重共线性。
7. 残差统计量
aResiduals Statistics
Minimum Maximum Mean Std. Deviation N Predicted Value 3394.71 8382.83 5465.64 1957.302 11 Residual -47.035 40.271 .000 25.357 11 Std. Predicted Value -1.058 1.490 .000 1.000 11 Std. Residual -1.659 1.420 .000 .894 11 a. Dependent Variable: 商品房平均售价(元/平方米)
该表为回归模型的残差统计量,标准化残差(Std. Residual)的绝对值最大为1.659,没有超过默认值3,不能发现奇异值。
8. 回归标准化残差的直方图
该图为回归标准化残差的直方图,正态曲线也被显示在直方图上,用以判断标准化残差是否呈正态分布。但是由于样本数只有11个,所以只能大概判断其呈正态分布。
9.回归标准化的正态P-P图
该图回归标准化的正态P-P图,该图给出了观测值的残差分布与假设的正态分布的比较,由图可知标准化残差散点分布靠近直线,因而可判断标准化残差呈正态分布。
10.因变量与回归标准化预测值的散点图
该图显示的是因变量与回归标准化预测值的散点图,其中DEPENDENT为x轴变量,*ZPRED为y轴变量。由图可见,两变量呈直线趋势。
附件:
原始数据:
自变量散点图:
由散点图可以看出,可进入分析的变量为城市人口密度、城市居民人均可支配收入。