spss回归分析
一、多元线性回归模型的设立
首先是对线性回归模型基本知识介绍:随机变量y与一般变量x1,x2,x3...xp的理论线性回归模型为:
yxxx,,,,,,,,,,,...01122pp
其中,,..., 是P+1个未知参数,称为回归常数,,...,称,,,,,,pp0101为回归系数。y称为被解释变量(因变量),当可以明确此时的经验回归方程对我们的样本数据拟合得好,可以用此时的回归模型作控制与预测了。 根据所获得的花生产量,油菜籽产量,芝麻产量等数据,可以考虑下面一个线性回归模型。
yxxx,,,,,,,,,,,...01122pp
其中因变量Y为油料产量,自变量X1花生产量,X2为油菜籽产量,X3为芝麻产量 二、回归模型初步建立与检验
a系数
非标准化系数 标准系数
模型 标准 误差 试用版 B t Sig.
1 70.922 40.432 1.754 .094 (常量)
.958 .075 .505 12.828 .000 花生
1.117 .081 .474 13.704 .000 油菜籽
2.525 .911 .047 2.771 .011 芝麻
a. 因变量: 油料
收集的数据由于存在单位上的差异,且数据量很大,故可能存在误差、量纲的影响。首先将数据取以10为底的对数做标准化处理,再对样本作模型假设,可得出y对3个自变量的线性回归方程为:
Y,70.922+0.958X1+1.117X2+2.525X3
bAnova
模型 平方和 均方 df F Sig.
a1 1.353E7 3 4509416.001 2670.262 .000 回归
35463.843 21 1688.754 残差
1.356E7 24 总计 a. 预测变量: (常量), 芝麻, 油菜籽, 花生。
b. 因变量: 油料
1
应用F检验对回归方程进行显著检验,检验统计量为:F=2670.262,从上
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
中的结果可以看出显著性p值,由于p近似为0,在显著水平为0.05的条件下:p,0.05,可知其回归方程高度显著。
模型汇总
模型 R 方 调整 R 方 标准 估计的误差 R
a1 .999 .997 .997 41.09446
a. 预测变量: (常量), 芝麻, 油菜籽, 花生。
三、模型的最终解释(结论)
通过运用SPSS统计软件,把表中数据按照以10为底的对数进行处理后,对模型进行计算得到的回归结果为:
Y,70.922+0.958X1+1.117X2+2.525X3
Se=(0.075) (0.081)(0.911)
t=(12.828) (13.704((2.771) d.f.=21
p值=(0.094)(0.000)(0.000)(0.011)
分析:从对中国1978-2011年油料产量和花生产量,油菜籽产量,芝麻产量的回归结果进行分析可知,回归系数B1为0.958的统计是显著的(t值大于2;P值为小于0.05),表明花生产量对油料产量有显著影响,回归系数B2为1.117的统计是显著的(t值大于2;P值为小于0.05),表明油菜籽产量对油料产量有显著影响,回归系数B3为2.525的统计是不显著的(t值大于2;P值为大于0.05),表明芝麻产量2对油料产量没有显著影响。r (拟合度) 为0.997表明在中国1978-2011年,花生产量,油菜籽产量,芝麻产量和油料产量之间有明显的相关性。因此在长达33年的花生产量,油菜籽产量和芝麻产量数据说明,花生产量,油菜籽产量和油料产量之间有必然的因果关系。
多元回归方程分析:
Y,70.922+0.958X1+1.117X2+2.525X3
Se=(0.075) (0.081)(0.911)
t=(12.828) (13.704((2.771) d.f.=21
p值=(0.094)(0.000)(0.000)(0.011)
分析:从对中国1978-2011年花生产量,油菜籽产量,芝麻产量和油料产量等数据的回归结果进行分析可知,回归系数B1为0.958的统计是显著的(t值大于2;P值为小于0.05);回归系数B2为1.117的统计是显著的(t值大于2;P值为小于0.05),回归系数B3为2.525的统计是不显著的(t值大于2;P值为大于0.05),统计量芝麻产量对油料产量不显著,说明该自变量不能通过检验,对因变量没有显著
2
2影响;r (拟合度) 为0.997表明在中国1978-2011年,花生产量,油菜籽产量,芝麻产量和油料产量之间有明显的相关性。。因此中国长达33年的国民生产总值和财政支出数据说明,因此在长达33年的花生产量,油菜籽产量和芝麻产量数据说明,花生产量,油菜籽产量和油料产量之间有必然的因果关系。
从方程中可以看到花生产量和油菜籽产量对油料产量影响最大,而其中的油菜籽产量系数大于花生产量的系数,由此可知油菜籽产量对油料产量的贡献大于花生产量对油料产量的贡献。虽然该模型建立了油料产量的回归方程,但我们需要注意的是,影响油料产量的因素很多,且影响程度不同,它涵盖的具体范围很广,我们只能从有限的数据中选取一些合适的变量,再对其研究分析。并不是模型中没有的变量就对y没有影响。
3