首页 matlab多元非线性回归 实验8_多元线性回归分析与非线性回归分析

matlab多元非线性回归 实验8_多元线性回归分析与非线性回归分析

举报
开通vip

matlab多元非线性回归 实验8_多元线性回归分析与非线性回归分析matlab多元非线性回归 实验8_多元线性回归分析与非线性回归分析 SAS 软件与统计应用实验 徐雅静、汪远征编著 实验 8 多元线性回归分析与非线性回归分析 多元线性回归分析研究多个变量的数量伴随关系,内容主要包括模型的假定与检验、参 数的估计与检验、回归诊断与预测。 很多非线性回归问题都可以转化为线性回归问题处理,如多项式回归、指数回归、对数 回归、幂函数回归等。 1 8.1 实验目的 掌握使用 SAS 多元线性回归分析与非线性回归分析的方法。 8.2 实验内容 一、用“分析家”作多元...

matlab多元非线性回归 实验8_多元线性回归分析与非线性回归分析
matlab多元非线性回归 实验8_多元线性回归分析与非线性回归分析 SAS 软件与统计应用实验 徐雅静、汪远征编著 实验 8 多元线性回归分析与非线性回归分析 多元线性回归分析研究多个变量的数量伴随关系,内容主要包括模型的假定与检验、参 数的估计与检验、回归诊断与预测。 很多非线性回归问题都可以转化为线性回归问题处理,如多项式回归、指数回归、对数 回归、幂函数回归等。 1 8.1 实验目的 掌握使用 SAS 多元线性回归分析与非线性回归分析的方法。 8.2 实验内容 一、用“分析家”作多元线性回归分析 二、用 INSIGHT 模块作多项式回归 三、使用 REG 过程作回归分析 四、一元非线性回归分析 8.3 实验指导 一、用“分析家”作多元线性回归分析 【实验 8-1】某研究人员需要分析我国固定资产投资状况的影响因素,选取 5 个可能的影 响因素:国内生产总值、 2 商品房屋销售额、财政支出、社会消费品零售总额、进出口 总额,统 计 1987,2001 共 15 年的各项指标如表 8-1 所 示(sy8_1.xls)所示。试在 0.05 的显著性水平下 进行多元 回归分析,判断哪些因素对固定资产投资有着显著影响,给 出回归方程。 表 8-1 年度 1987 1988 1989 1990 1991 1992 1993 固定投资总额 3791.7 4753.8 4410.4 4517 5594.5 8080.1 13072.3 国内生产 总值 11962.5 14928.3 16909.2 18547.9 21617.8 26638.1 34634.4 15 年的统计数据 财政支出 2262.18 2491.21 2823.78 3083.59 3386.62 3742.2 4642.3 社会消费品零售总额 5820 7440 8101.4 8300.1 9415.6 10993.7 12462.1 进出口总额 3084.2 3821.8 4155.9 5560.1 7225.8 9119.6 11271 商品房屋销售额 1100967 1472164 1637542 2018263 2378597 4265938 8637141 1 3 4 SAS 软件与统计应用实验 1994 1995 1996 1997 1998 1999 2000 2001 17042.1 20019.26 22913.55 24941.11 28406.17 29854.71 32917.73 37213.49 46759.4 58478.1 67884.6 74462.6 78345.2 82067.46 89442.2 95933.3 10184950 12577269 14271292 17994763 25133027 29878734 39354423 48627517 5792.62 6823.72 7937.55 9233.56 10798.18 13187.67 15886.5 18902.58 16264.7 20620 24774.1 27298.9 29152.5 31134.7 34152.6 37595.2 徐雅静、汪远征编著 20381.9 23499.9 24133.8 26967.2 26857.7 29896.3 39274.2 42193.3 1. 生成数据集 在“分析家”中直接打开上面的 Excel 数据 表(sy8_1.xls),选择编辑状态,修改每个变量 的属性,将变 量名分别改为:年度:n、固定投资总额:y、国内生产总值: x1、商品房屋销 售额:x2、财政支出:x3、社会消费品零 售总额:x4、进出口总额:x5。 以数据集 Mylib.sy8_1 存 盘。 2. 全回归分析 1) 选 择 主 菜 单 “ Statistics ( 统 计 ) ”? “Regression(回归) ”?“Linear(线性) ” , 打开 “Linear Regression(线性回归) ”对话框。 2) 选择 变量列表中的变量 y, 单击 “Dependent” 按钮,选定响应 5 变量,选择变量列表中的变量 x1、 x2、x3、x4、x5,单击 “Explanatory”按钮,选定 图8-1 Linear Regression对话框 解释变量,如图 8-1 所示。 3) 单击“OK”按钮,得到分析结果如图 8-2 所示。 图8-2 多元回归分析结果 分析结果包括方差分析表、拟合的汇总信息以及回归系数估计值与显著性检验。方差分 析表中显示模型的作用是显著的(F 统计量的值为 1567.35,p 值0.05,因此不能拒绝残差来自正态总体的假定。 5. 预测 通过回归诊断得知模型: y = 3023.27814 + 0.36911x1 + 0.00078157 x 2 ? 2.09048 x3 是合适的,可以用于预测。 1) 假定 02,03 年国内生产总值(x1) 、商品房屋销售额(x2) 、财政支出(x3)的数据 已存入数据集 Mylib.sy8_1_new 中,如图所示。 图8-11 6 数据集Mylib.sy8_1_new 2) 重复上面逐步回归步骤,并在图 8-1 所示的“Linear Regression(线性回归) ”对话框 中,单击“predictions”按钮,打开“Linear Regression:predictions”对话框。按图 8-12 所 示进行预测的 Input(输入) 、Output(输出)设置。 图8-12 “Linear Regression:predictions”对话框 3) 两次单击“OK” ,得到结果。在分析家的项目管理器中点击“predictions”可以看到 预测结果,如图 8-13 所示。 图8-13 预测结果 二、用 INSIGHT 模块作多项式回归 【实验 8-2】某研究人员统计了房地产行业 2003 年主营业务收入和净利润的关系,从中 6 7 8 SAS 软件与统计应用实验 徐雅静、汪远征编著 随即抽取 20 家上市公司,统计后的主营业务收入和净利 润如表 8-2(sy8_2.xls)所示。试采用 多项式回归方程给出净利润y与主营业务收入x的关系。 表 8-2 股票代码 0000029 0000031 0000046 0000511 0000558 0000608 0600064 0600322 0600376 主营业务收入 96.24 33.09 57.60 36.77 20.10 45.53 110.07 72.05 39.82 20 家公司的净利润和主营业务收入(百万元) 净利润 11.35 85.11 36.61 27.26 6.72 36.37 80.13 20.88 37.15 股票代码 600533 600603 600638 600639 600641 600648 600663 600675 600736 主营业务收入 48.05 0.85 51.66 61.07 64.54 35.50 226.55 188.60 81.32 净利润 70.50 2.57 63.70 127.13 33.59 25.01 664.02 175.31 108.68 1. 生成数据集 将表 8-2 在 Excel 中修改后导入成 SAS 数据集 Mylib.sy8_2,在 INSIGHT 中打开后如图 8-14 所 示。其中变量 n、x、y 分别表示股票代码、主营业收入和 9 净利润。 2. 回归分析 为了大致地了解y与x的关系,首先利用INSIGHT作y与x的带有曲线拟合的散点图,具体 方法是: 1) 选择菜单“Analyze(分析)”?“Fit(Y X) (拟合)”打开“Fit(Y X)”对话框,选择变量 如图 8-15 所示。 图8-14 数据集Mylib.sy8_2 图8-15 选择变量 单击“OK” ,得到拟合线性模型: y = β 0 + β1 x + ε 主要部分如图 8-16 所示。 7 10 SAS 软件与统计应用实验 徐雅静、汪远征编著 图8-16 一元线性模型的拟合结果 从图 8-16 可以发现,虽然模型检验显著,但R2只有 0.6494,且常数项未通过检验。为改 进模型,移动图 8-16 右上第一张表中“Degree(Polynomial)”栏下的滚动条,可以做高次多 项式拟合试验,其中R-Square、F Stat可以说明拟合的效果。 作二次和三次多项式拟合试验的结果如图 8-17 所示。 图8-17 2 调整拟合模型 拟合三次多项式的R 已接近 94%,不需要再高的阶次了。 重新回到“Fit(Y X)”对话框,按图 8-18 左设置分析变量,可 11 以拟合下面的三次多项式 模型: y = β 0 + β1 x + β 2 x 2 + β 3 x 3 + ε 8 12 SAS 软件与统计应用实验 徐雅静、汪远征编著 图8-18 设置拟合变量 单击“Output”按钮,按图 8-18 右选择输出结果,两次单击“OK”后,得到拟合结果, 如图 8-19 所示。 图8-19 三次多项式拟合结果 虽然模型检验通过,但常数项未通过检验,进一步改进模型,再次回到“Fit(Y X)”对话 框,按图 8-18 进行有关设置后,取消常数项复选框,如图 8-20 所示。 图8-20 取消常数项复选框 13 单击“OK”按钮,得到拟合模型 y = 所示。 β1 x + β 2 x 2 + β 3 x 3 + ε ,主要部分如图 8-21、8-22 9 14 SAS 软件与统计应用实验 徐雅静、汪远征编著 图8-21 不含常数项的三次多项式拟合结果 其中模型和系数检验均通过,且R2高达 84.98%,所以该模型为比较理想的模型,最后的 回归方程具体形式为: y = 3.3145 x ? 0.0527 x 2 + 0.0002 x 3 3. 回归诊断 从图 8-22 可以看出残差数据随机独立并大致服从均值为零的 正态分布。 图8-22 残差图和残差QQ图 三、使用 REG 过程作回归分析 【实验 8-3】某种水泥在凝固时放出的热量y(cal/g)与水泥 15 中四种化学成分x1,x2,x3,x4 有关,现测得 13 组数据, 如表 8-3(sy8_3.xls)所示。试从中选出主要的变量,建立 y关于它 们的线性回归方程。 表 8-3 x1 7 1 11 11 7 11 x2 26 29 56 31 52 55 热量 y 与四种化学成分的实测数据 x3 6 15 8 8 6 9 x4 60 52 20 47 33 22 y 78.5 74.3 104.3 87.6 95.9 109.2 10 16 SAS 软件与统计应用实验 3 1 2 21 1 11 10 71 31 54 47 40 66 68 17 22 18 4 23 9 8 6 44 22 26 34 12 12 徐雅静、汪远征编著 102.7 72.5 93.1 115.9 83.8 113.3 109.4 1. 建立数据集 输入以下代码建立数据集 sy8_3 并显示: data mylib.sy8_3; input x1 x2 cards; 7 1 11 11 7 11 3 1 2 21 1 11 10 ; Title „数据集 sy8_3?; Proc print ; run; 26 29 56 31 52 55 71 31 54 47 40 66 68 6 15 8 8 6 9 17 22 18 4 23 9 8 60 52 20 47 33 22 6 44 22 26 34 12 12 78.5 74.3 104.3 87.6 95.9 109.2 102.7 72.5 93.1 115.9 83.8 113.3 109.4 x3 x4 y; 运行结果如图所示。 2. 向后逐步剔出法进行回归 执行以 下代码: proc var reg y data = Mylib.sy8_3; x1 - x4; model y = x1 - x4/selection=backward; plot residual. * predicted.; run; 输出结果如下: 17 图8-23 数据集sy8_3 11 18 SAS 软件与统计应用实验 徐雅静、汪远征编著 图8-24 向后逐步剔除的第0步(全回归) 图8-25 向后逐步剔除的第1步 图8-26 向后逐步剔除法第2步 12 19 SAS 软件与统计应用实验 徐雅静、汪远征编著 图8-27 向后逐步剔除法结果汇总 向后逐步剔除法的分析结果给出回归模型: Y = 52.57735 + 1.46831x1 + 0.66225x2 残差对预测值的散点图显示如下: 图8-28 残差散点图 3. 结果分析 采用向后逐步剔除法回归的第 0 步是做全回归,结果如图 8-24 所示,所有系数均未通过 检验(P值均大于 0.05) ,向后逐步剔除法第 1 步将变量x3 剔除,结果如图 8-25 所示,其中 x2 和x4 的系数仍不能通过检验,接下来第 2 步将变量x4 剔除,结果如图 8-26 所示,此时的 回归方程及x1 和x2 的系数均能通过检验,残差对预测值的散点图(图 8-28)基本正常符合 模型假定,所以 20 方程Y = 52.57735 + 1.46831x1 + 0.66225x2为有效回归方程。 四、一元非线性回归分析 【实验 8-4】已知数据如表 8-4(sy8_4.xls)所示。试分别采用指数回归、对数回归、幂函 数回归和倒幂函数回归 4 种非线性回归方法进行回归分析,并选择一个较好的回归方程。 13 21 SAS 软件与统计应用实验 表 8-4 X Y 1.1 109.95 1.2 40.45 1.3 20.09 1.4 24.53 1.5 11.02 1.6 7.39 徐雅静、汪远征编著 实验数据 1.7 4.95 1.8 2.72 1.9 1.82 2 1.49 2.1 0.82 2.2 0.3 2.3 0.2 2.4 0.22 1. 生成数据集 运行下面程序生成并显示数据集 sy8_4, 如图 8-29 所示。 data sy8_4; input x y; cards; 1.1 1.2 1.3 1.4 1.5 1. 6 1.7 1.8 1.9 2 2.1 2.2 2.3 2.4 ; run; title „数据集 sy8_4?; proc print; run; 109.95 40.45 20.09 24.53 11.02 7.39 4.95 2.72 1.82 1.49 0.82 0.3 0.2 0.22 图8-29 数据集sy8_4 2. 对 x 和 y 作相关分析 执行如下代码: /*画 x 和 y 的散点图*/ goptions ftext=„宋体?; proc gplot data = sy8_4; plot y*x; title „x 和 y 的散点图?; symbol v=dot i=none cv=orange ; run; /*求 x 和 y 的相关系数*/ proc var run; x corr y; data = sy8_4; 22 14 23 SAS 软件与统计应用实验 徐雅静、汪远征编著 运行上面程序,得到散点图(图 8-30 左)以及 x 与 y 的相关系数(图 8-30 右) : 图8-30 x与y的散点图与相关系数 由图可见x和y有一定的非线性关系,根据散点分布的形状考虑用下面几种非线性回归方 法建立非线性回归方程,并从中选出较为合适的回归方程。 3. 倒幂函数 y = a + b 1 回归 x 首先考虑倒幂函数拟合,执行如下代码: goptions ftext=„宋体?; data new1; set sy8_4; u = 1/x; v = y; run; /*画 u 和 v 的散点图*/ title „u 和 v 的散点图?; proc gplot data = new1; 图8-31 u和v的散点图 plot v*u; symbol v=dot i=none cv=red ; run; 24 运行结果得到散点图 8-31,由图可见,u 和 v 有着较弱的线性关系。做线性回归: proc var reg v data = new1; u; model v = u; print cli; title „残差图?; plot residual. * predicted.; run; 运行结果如图 8-32 和图 8-33 所示。 15 25 SAS 软件与统计应用实验 徐雅静、汪远征编著 图8-32 倒幂函数回归结果 倒幂函数回归结果(图 8-32) :方差分析表中显示模型的作用是显著的(F 统计量的值为 24.95,p 值 26
本文档为【matlab多元非线性回归 实验8_多元线性回归分析与非线性回归分析】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_079973
暂无简介~
格式:doc
大小:31KB
软件:Word
页数:12
分类:
上传时间:2017-09-17
浏览量:253