首页 多元回归分析

多元回归分析

举报
开通vip

多元回归分析 多元回归分析 在大多数的实际问题中,影响因变量的因素不是一个而是多个,我们称这类回问题为多 元回归分析。可以建立因变量 y 与各自变量 xj(j=1,2,3,…,n)之间的多元线性回归 模型: 其中:b0 是回归常数;bk(k=1,2,3,…,n)是回归参数;e 是随机误差。 多元回归在病虫预报中的应用实例: 某地区病虫测报站用相关系数法选取了以下 4 个预报因子;x1 为最多连续 10 天诱蛾量 (头);x2 为 4 月上、中旬百束小谷草把累计落卵量(块);x3 为 4 月中旬...

多元回归分析
多元回归 分析 定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析 在大多数的实际问题中,影响因变量的因素不是一个而是多个,我们称这类回问题为多 元回归分析。可以建立因变量 y 与各自变量 xj(j=1,2,3,…,n)之间的多元线性回归 模型: 其中:b0 是回归常数;bk(k=1,2,3,…,n)是回归参数;e 是随机误差。 多元回归在病虫预报中的应用实例: 某地区病虫测报站用相关系数法选取了以下 4 个预报因子;x1 为最多连续 10 天诱蛾量 (头);x2 为 4 月上、中旬百束小谷草把累计落卵量(块);x3 为 4 月中旬降水量(毫米), x4 为 4 月中旬雨日(天);预报一代粘虫幼虫发生量 y(头/m2)。分级别数值列成 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 2-1。 预报量 y:每平方米幼虫 0~10 头为 1 级,11~20 头为 2 级,21~40 头为 3 级,40 头 以上为 4 级。 预报因子:x1 诱蛾量 0~300 头为 l 级,301~600 头为 2 级,601~1000 头为 3 级,1000 头以上为 4 级;x2 卵量 0~150 块为 1 级,15l~300 块为 2 级,301~550 块为 3 级,550 块 以上为 4 级;x3 降水量 0~10.0 毫米为 1 级,10.1~13.2 毫米为 2 级,13.3~17.0 毫米为 3 级,17.0 毫米以上为 4 级;x4 雨日 0~2 天为 1 级,3~4 天为 2 级,5 天为 3 级,6 天或 6 天以上为 4 级。 表 2-1 x1 x2 x3 x4 y 年 蛾量 级别 卵量 级别 降水量 级别 雨日 级别 幼虫密度 级别 1960 1022 4 112 1 4.3 1 2 1 10 1 1961 300 1 440 3 0.1 1 1 1 4 1 1962 699 3 67 1 7.5 1 1 1 9 1 1963 1876 4 675 4 17.1 4 7 4 55 4 1965 43 1 80 1 1.9 1 2 1 1 1 1966 422 2 20 1 0 1 0 1 3 1 1967 806 3 510 3 11.8 2 3 2 28 3 1976 115 1 240 2 0.6 1 2 1 7 1 1971 718 3 1460 4 18.4 4 4 2 45 4 1972 803 3 630 4 13.4 3 3 2 26 3 1973 572 2 280 2 13.2 2 4 2 16 2 1974 264 1 330 3 42.2 4 3 2 19 2 1975 198 1 165 2 71.8 4 5 3 23 3 1976 461 2 140 1 7.5 1 5 3 28 3 1977 769 3 640 4 44.7 4 3 2 44 4 1978 255 1 65 1 0 1 0 1 11 2 数据保存在“DATA6-5.SAV”文件中。 1)准备分析数据 在 SPSS 数据编辑窗口中,创建“年份”、“蛾量”、“卵量”、“降水量”、“雨日”和“幼虫密 度”变量,并输入数据。再创建蛾量、卵量、降水量、雨日和幼虫密度的分级变量“x1”、“x2”、 “x3”、“x4”和“y”,它们对应的分级数值可以在 SPSS 数据编辑窗口中通过计算产生。编辑后 ? ? ? ? ? ? ? w w w .1 00 0t j .c o m ??????? www.1000tj.com ????? www.100xuexi.com ??????? www.1000tj.com ????? www.100xuexi.com 的数据显示如图 2-1。 图 2-1 或者打开已存在的数据文件“DATA6-5.SAV”。 2)启动线性回归过程 单击 SPSS 主菜单的“Analyze”下的“Regression”中“Linear”项,将打开如图 2-2 所示的线 性回归过程窗口。 图 2-2 线性回归对话窗口 3)设置分析变量 设置因变量:用鼠标选中左边变量列表中的“幼虫密度[y]”变量,然后点击“Dependent” 栏左边的 向右拉按钮,该变量就移到“Dependent”因变量显示栏里。 ? ? ? ? ? ? ? w w w .1 00 0t j .c o m ??????? www.1000tj.com ????? www.100xuexi.com ??????? www.1000tj.com ????? www.100xuexi.com 设置自变量:将左边变量列表中的“蛾量[x1]”、“卵量[x2]”、“降水量[x3]”、“雨日[x4]” 变量,选移到“Independent(S)”自变量显示栏里。 设置控制变量:本例子中不使用控制变量,所以不选择任何变量。 选择标签变量:选择“年份”为标签变量。 选择加权变量:本例子没有加权变量,因此不作任何设置。 4)回归方式 本例子中的 4 个预报因子变量是经过相关系数法选取出来的,在回归分析时不做筛选。 因此在“Method”框中选中“Enter”选项,建立全回归模型。 5)设置输出统计量 单击“Statistics”按钮,将打开如图 2-3 所示的对话框。该对话框用于设置相关参数。其 中各项的意义分别为: 图 2-3 “Statistics”对话框 ①“Regression Coefficients”回归系数选项: “Estimates”输出回归系数和相关统计量。 “Confidence interval”回归系数的 95%置信区间。 “Covariance matrix”回归系数的方差-协方差矩阵。 本例子选择“Estimates”输出回归系数和相关统计量。 ②“Residuals”残差选项: “Durbin-Watson”Durbin-Watson 检验。 “Casewise diagnostic”输出满足选择条件的观测量的相关信息。选择该项,下面两项 处于可选状态: “Outliers outside standard deviations”选择标准化残差的绝对值大于输入值的观测量; “All cases”选择所有观测量。 本例子都不选。 ③其它输入选项 “Model fit”输出相关系数、相关系数平方、调整系数、估计标准误、ANOVA 表。 “R squared change”输出由于加入和剔除变量而引起的复相关系数平方的变化。 “Descriptives”输出变量矩阵、标准差和相关系数单侧显著性水平矩阵。 “Part and partial correlation”相关系数和偏相关系数。 “Collinearity diagnostics”显示单个变量和共线性分析的公差。 本例子选择“Model fit”项。 ? ? ? ? ? ? ? w w w .1 00 0t j .c o m ??????? www.1000tj.com ????? www.100xuexi.com ??????? www.1000tj.com ????? www.100xuexi.com 6)绘图选项 在主对话框单击“Plots”按钮,将打开如图 2-4 所示的对话框窗口。该对话框用于设置要 绘制的图形的参数。图中的“X”和“Y”框用于选择 X 轴和 Y 轴相应的变量。 图 2-4“Plots”绘图对话框窗口 左上框中各项的意义分别为: “DEPENDNT”因变量。 “ZPRED”标准化预测值。 “ZRESID”标准化残差。 “DRESID”删除残差。 “ADJPRED”调节预测值。 “SRESID”学生氏化残差。 “SDRESID”学生氏化删除残差。 “Standardized Residual Plots”设置各变量的标准化残差图形输出。其中共包含两个选项: “Histogram”用直方图显示标准化残差。 “Normal probability plots”比较标准化残差与正态残差的分布示意图。 “Produce all partial plot”偏残差图。对每一个自变量生成其残差对因变量残差的散点图。 本例子不作绘图,不选择。 7)保存分析数据的选项 在主对话框里单击“Save”按钮,将打开如图 2-5 所示的对话框。 ? ? ? ? ? ? ? w w w .1 00 0t j .c o m ??????? www.1000tj.com ????? www.100xuexi.com ??????? www.1000tj.com ????? www.100xuexi.com 图 2-5 “Save”对话框 ①“Predicted Values”预测值栏选项: Unstandardized 非标准化预测值。就会在当前数据文件中新添加一个以字符“PRE_” 开头命名的变量,存放根据回 归模型拟合的预测值。 Standardized 标准化预测值。 Adjusted 调整后预测值。 S.E.of mean predictions 预测值的标准误。 本例选中“Unstandardized”非标准化预测值。 ②“Distances”距离栏选项: Mahalanobis:距离。 Cook’s”:Cook 距离。 Leverage values:杠杆值。 ③“Prediction Intervals”预测区间选项: Mean:区间的中心位置。 Individual:观测量上限和下限的预测区间。在当前数据文件中新添加一个以字符 “LICI_”开头命名的变量,存放 预测区间下限值;以字符“UICI_”开头命名的变量,存放预测区间上限值。 Confidence Interval:置信度。 本例不选。 ④“Save to New File”保存为新文件: 选中“Coefficient statistics”项将回归系数保存到指定的文件中。本例不选。 ⑤“Export model information to XML file”导出统计过程中的回归模型信息到指定文件。 本例不选。 ⑥“Residuals”保存残差选项: ? ? ? ? ? ? ? w w w .1 00 0t j .c o m ??????? www.1000tj.com ????? www.100xuexi.com ??????? www.1000tj.com ????? www.100xuexi.com “Unstandardized”非标准化残差。 “Standardized”标准化残差。 “Studentized”学生氏化残差。 “Deleted”删除残差。 “Studentized deleted”学生氏化删除残差。 本例不选。 ⑦“Influence Statistics”统计量的影响。 “DfBeta(s)”删除一个特定的观测值所引起的回归系数的变化。 “Standardized DfBeta(s)”标准化的 DfBeta 值。 “DiFit”删除一个特定的观测值所引起的预测值的变化。 “Standardized DiFit”标准化的 DiFit 值。 “Covariance ratio”删除一个观测值后的协方差矩隈的行列式和带有全部观测值的协 方差矩阵的行列式的比率。 本例子不保存任何分析变量,不选择。 8)其它选项 在主对话框里单击“Options”按钮,将打开如图 2-6 所示的对话框。 图 2-6 “Options”设置对话框 ①“Stepping Method Criteria”框用于进行逐步回归时内部数值的设定。其中各项为: “Use probability of F”如果一个变量的 F 值的概率小于所设置的进入值(Entry),那么 这个变量将被选入回归方程 中;当变量的 F 值的概率大于设置的剔除值(Removal),则该变量将从回归方程中被 剔除。由此可见,设置 “Use probability of F”时,应使进入值小于剔除值。 “Ues F value”如果一个变量的 F 值大于所设置的进入值(Entry),那么这个变量将被 选入回归方程中;当变量的 F 值小于设置的剔除值(Removal),则该变量将从回归方程中被剔除。同时,设置“Use F value”时,应使进 入值大于剔除值。 本例是全回归不设置。 ②“Include constant in equation”选择此项表示在回归方程中有常数项。 ? ? ? ? ? ? ? w w w .1 00 0t j .c o m ??????? www.1000tj.com ????? www.100xuexi.com ??????? www.1000tj.com ????? www.100xuexi.com 本例选中“Include constant in equation”选项在回归方程中保留常数项。 ③“Missing Values”框用于设置对缺失值的处理方法。其中各项为: “Exclude cases listwise”剔除所有含有缺失值的观测值。 “Exchude cases pairwise”仅剔除参与统计分析计算的变量中含有缺失值的观测量。 “Replace with mean”用变量的均值取代缺失值。 本例选中“Exclude cases listwise”。 9)提交执行 在主对话框里单击“OK”,提交执行,结果将显示在输出窗口中。主要结果见表 2-2 至 表 2-4。 10)结果分析 主要结果: 表 2-2 表 2-2 是回归模型统计量:R 是相关系数;R Square 相关系数的平方,又称判定系数, 判定线性回归的拟合程度:用来说明用自变量解释因变量变异的程度(所占比例);Adjusted R Square 调整后的判定系数;Std.Error of the Estimate 估计标准误差。 表 2-3 表 2-3 回归模型的方差分析表,F 值为 10.930,显著性概率是 0.001,表明回归极显著。 表 2-4 ? ? ? ? ? ? ? w w w .1 00 0t j .c o m ??????? www.1000tj.com ????? www.100xuexi.com ??????? www.1000tj.com ????? www.100xuexi.com 分析: 建立回归模型: 根据多元回归模型: 把表 6-9 中“非标准化回归系数”栏目中的“B”列系数代入上式得预报方程: 预测值 的标准差可用剩余均方估计: 回归方程的显著性检验: 从表 6-8 方差分析表中得知:F 统计量为 10.93,系统自动检验的显著性水平为 0.001。 F(0.05,4,11)值为 3.36,F(0.01,4,11)值为 5.67,F(0.001,4,11)值为 10.35。 因此回归方程相关非常显著。(F 值可在 Excel 中用 FINV()函数获得)。 回代检验 需要作预报效果的验证时,在主对话框(图 6-8)里单击“Save”按钮,在打开如图 3-6 所示对话框里,选中“Predicted Values”预测值选项栏中的“Unstandardized”非标准化预测值选 项。这样在过程运算时,就会在当前文件中新添加一个“PRE_1”命名的变量,该变量存放根 据回归模型拟合的预测值。 然后,在 SPSS 数据窗口计算“y”与“PRE_1”变量的差值(图 2-7),本例子把绝对差值大 于 0.8 视为不符合,反之则符合。结果符合的年数为 15 年,1 年不符合,历史符合率为 93.75%。 图 2-7 多元回归分析法可综合多个预报因子的作用,作出预报,在统计预报中是一种应用较为 普遍的方法。 在实际运用中,采取将预报因子和预报量按一定标准分为多级,用分级尺度代换较大的 数字,更能揭示预报因子与预报量的关系,预报效果比采用数量值统计方法有明显的提高, 在实际应用中具有一定的现实意义。 ? ? ? ? ? ? ? w w w .1 00 0t j .c o m ??????? www.1000tj.com ????? www.100xuexi.com ??????? www.1000tj.com ????? www.100xuexi.com
本文档为【多元回归分析】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_253683
暂无简介~
格式:pdf
大小:351KB
软件:PDF阅读器
页数:8
分类:经济学
上传时间:2013-07-14
浏览量:86