首页 第五讲 多元线性回归预测法

第五讲 多元线性回归预测法

举报
开通vip

第五讲 多元线性回归预测法null第五讲 多元线性回归预测法第五讲 多元线性回归预测法在实际经济问题中,一个变量往往受到多个原因变量的影响,表现在线性回归模型中解释变量有多个。这样的模型被称为多元线性回归模型。多元线性回归模型参数估计的原理与一元线性回归模型相同,只是计算更为复杂。 设被解释变量y与解释变量 之间存在着线性相关关系: 设 是对总体的n次独立样本观测值,将它们代入上式得, 相应的估计的样本回归方程 null与一元线性回归模型一样,根据最小二乘准则,我们的目的是使 回归值 ...

第五讲 多元线性回归预测法
null第五讲 多元线性回归预测法第五讲 多元线性回归预测法在实际经济问题中,一个变量往往受到多个原因变量的影响, 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 现在线性回归模型中解释变量有多个。这样的模型被称为多元线性回归模型。多元线性回归模型参数估计的原理与一元线性回归模型相同,只是计算更为复杂。 设被解释变量y与解释变量 之间存在着线性相关关系: 设 是对总体的n次独立样本观测值,将它们代入上式得, 相应的估计的样本回归方程 null与一元线性回归模型一样,根据最小二乘准则,我们的目的是使 回归值 与实际观测值 之间的离差平方和 最小 令 则正规方程组可写成矩阵形式 null若矩阵 可逆,则正规方程组有唯一解 例1:从中国统计年鉴中取得西部各地区2009年电力消费量、国内生产总值(GDP)、电力价格变动(以水电燃料价格指数代表)等数据作为样本,列于下表中 依上式,所估计的样本回归模型为 nullnull例2:建立中国消费模型。选择消费总额为被解释变量,国内生产总值和前一年的消费总额为解释变量,变量之间关系为简单线性关系,选取1982-1996年统计数据为样本观测值。样本观测值列于下表中。得null最小二乘估计量的特性 1、线性性 是被解释变量的观测值 的线性函数 2 、无偏性 3 、参数估计量 的方差-协方差矩阵 ,其中 为矩阵 主对角线上的第j+1个元素 也就是说, 服从正态分布,即 被解释变量的估计值与观测值之间的残差 随机误差项方差的估计量为 多元线性回归模型的检验多元线性回归模型的检验一、拟合优度检验 总体平方和、残差平方和、回归平方和 定义 TSS为总体平方和,反映样本观测值总体离差的大小; ESS为回归平方和,反映由模型中解释变量所解释的那部分离差的大小; RSS为残差平方和, 反映样本观测值与估计值偏离的大小,也是模型中解释变量未解释的那部分离差的大小 TSS=ESS+RSS null(一)多重可决系数 ESS越大,RSS就越小,从而被解释变量观测值总变差中能由解释变量解释的那部分变差就越大,模型对观测数据的拟合程度就越高。 我们定义多重可决系数为 它是介于0与1之间的一个数, 越接近于1,模型对数据的拟合程度就越好 统计量的自由度指可自由变化的样本观测值个数,它等于所用样本观测值的个数减去对观测值约束个数。 TSS的自由度是(n-1),RSS的自由度是(n-k-1) null(二)修正的可决系数 当模型参数估计量已经得到后,可以方便地计算 。在应用过程中发现,如果在模型中增加一个解释变量,模型的解释功能增强了,回归平方和既然增大了, 就增大了。这给人一个错觉:要使得模型拟合得好,就必须增加解释变量。但是,在样本容量一定的情况下,增加解释变量必定使得待估参数的个数增加,从而会使自由度减少。 为此,可以用自由度去修正多重可决系数中的残差平方和与回归平方和。从而引入修正的可决系数 修正可决系数与未经修正的多重可决系数之间有如下关系 这意味着随着解释变量的增加, 将小于 例1当中, =0.9469, =0.9336 null在实际的计量分析当中,往往希望所建立模型的 或 越大越好。 但应明确,可决系数只是对模型拟合优度的度量,只是说明列入模型中的解释变量对被解释变量的联合影响程度越大,并非说明模型中各个解释变量对被解释变量的影响程度也大。 在实际应用中, 达到多大才算模型通过了检验,没有绝对的标准,要看具体情况而定。模型的拟合优度并不是判断模型质量的唯一标准,有时甚至为了追求模型的经济意义,可以牺牲一点拟合优度。null二、回归方程的显著性检验(F检验) 由于多元线性回归模型包含着多个解释变量,它们同被解释变量之间是否存在显著的线性关系呢? 需要对模型中被解释变量与所有解释变量之间的线性关系在总体上是否显著作出推断。 null对回归模型整体显著性的检验 可以证明,在 为真的条件下,统计量 即统计量F服从自由度为k和(n-k-1)的F分布。 例1当中,已计算得 给定显著性水平α,在F分布表中查 计算统计量 说明回归方程是显著的,即列入模型的解释变量”国内生产总值”和”水电燃料价格指数”联合起来对被解释变量”电力消费量”有显著影响。 null一般来说,模型对观测值的拟合程度越高,模型总体线性关系的显著性就越强。 F统计量与可决系数 之间有以下关系: 可以看出,伴随着可决系数 和修正可决系数 的增加,F统计量的值将不断增加。 当 =0时 ,F=0;当 越大时,F值也越大;当 =1时, 这说明两者之间具有一致性。 也就是说,对方程联合显著性检验的F检验,实际上也是对 的显著性检验。 可决系数和修正可决系数只能提供对拟合优度的度量,它们的值究竟要达到多大才算模型通过了检验呢?并没有给出确定的界限。 而F检验则不同,它可以在给定显著性检验下,给出统计意义上严格的结论。 找出两个用作检验标准的统计量之间的数量关系,在实际应用中互为验证,是有实际意义的。 null三、单个回归系数的显著性检验(t检验) 由前面知道 所以在 成立的条件下, 其中 仍称为剩余标准差,它是σ的无偏估计 对给定的显著性水平α,查t分布表。 若由观测值算得的 则拒绝假设 ,认为第j个自变量 对y有显著影响;否则认为影响不显著,可将 从回归模型中剔除,然后重新建立y与其余自变量的经验回归方程,再重复上述检验步骤,直至所有的自变量都对y有显著影响为止。 null对于例1中的 、 分别给定显著性水平 α=0.05,查自由度为n-k-1=8的t分布表,得临界值 已知S=36.1055 可分别计算 由样本数据计算的两个回归系数的t统计量的绝对值均大于临界值,可分别拒绝各个 ,说明在其它解释变量不变的情况下,解释变量”国内生产总值”、”水电燃料价格指数”对被解释变量的影响都是显著的。 四、多元线性回归模型的预测 null1、点预测 设多元线性回归模型为 若根据样本已经估计出参数,得到样本回归方程且模型通过检验,即 把样本以外各个解释变量的值表示为行向量 直接代入多元样本回归函数,就可以计算出点预测值 两边取期望,得 说明 是 的无偏估计,从而可以用 作为 和 的点预测值 例1,当本部地区某省区的GDP达到3500亿元,而且水电燃料价格不变(指数为100%)时,可预测其电力消费量为 = 1941.738+0.0936*3500-17.1507*100=554.268(亿kw.h) null2、平均值 的区间预测 可以证明, 其中 是 的无偏估计量 所以 的置信度为(1-α)的预测区间可由上式推出。 3 、个别值 的区间预测 可以证明 所以 的置信度为(1-α)的预测区间可由上式推出 null例3:我国1988-1998年的城镇居民人均全年耐用消费品支出、人均全年可支配收入以及耐用消费品价格指数的统计资料如表所示。试建立城镇居民人均全年耐用消费品支出Y关于人均全年可支配收入X1和耐用消费品价格指数X2的回归模型,并进行回归分析。 null解:依据经济理论和对实际情况的分析可以知道,城镇居民人均全年耐用消费品支出Y信赖于人均全年可支配收入X1和耐用消费品价格指数X2的变化,设定回归模型。 应用Eviews的最小二乘法,得估计的回归方程为 残差平方和RSS=3270.001, 经济意义检验:回归系数的符号和大小与经济理论和人们的经验期望值相一致。 统计检验:拟合优度检验 表明估计的样本回归方程较好地拟合了样本观测值 F检验 F统计量F-statistic=72.9065> 总体回归方程是显著的,即在我国城镇居民人均全年耐用消费品支出与人均全年可支配收入和耐用消费品价格指数之间存在着显著的线性关系。 t检验   b1和b2的t-statistic分别为10.5479和-0.9213, 即可认为我国城镇居民家庭人均可支配收入对耐用消费品的支出有显著影响,而耐用消费品价格指数对耐用消费品的支出没有显著影响。null预测: 如果在2000年,我国城镇居民家庭人均可支配收入达到5800元,耐用消费品价格指数为135,对2000年我国城镇居民家庭人均耐用消费品的支出进入预测 将自变量代入估计的回归方程,得点估计值 得到    的置信度为95%的预测区间为(293.2180,350.7426) 得到 的置信度为95%的 预测区间为(267.2002,376.7604) null例4:本例研究影响中国税收收入增长的主要原因,预测中国税收未来的增长趋势,需要建立计量经济模型。(从《中国统计年鉴》收集到以下数据) 影响中国税收收入增长的因素很多,主要因素可能有:1、经济整体增长 2 、预算支出所表现的公共财政的需求 3 、物价水平 4 、税收政策因素,如税制改革,难以量化,而且1985年以后影响不大 nullnull模型估计的结果为 (940.6128) (0.0056) (0.0332) (8.7383) t=(-2.7459) (3.9566) (21.1247) (2.7449) F=2717.238 df=21 1、经济意义检验 2、统计检验 ①拟合优度 模型对样本的拟合很好 ②F检验 给定显著性水平α=0.05 说明回归方程显著,即”国内生产总值”、”财政支出” 、”商品零售物价指数” 等变量联合起来确实对”税收收入”有显著影响。 ③t检验 分别针对 ,给定显著性水平α=0.05,查t分布表得 自由度为n-k-1=21 临界值 =2.08 各t统计量绝对值均大于 ,这说明分别都应当拒绝原假设, 也就是说,当在其它解释变量都不变的情况下,解释变量”国内生产总值”、”财政支出” 、”商品零售物价指数”等分别对解释变量”税收收入”有显著影响。
本文档为【第五讲 多元线性回归预测法】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_942240
暂无简介~
格式:ppt
大小:362KB
软件:PowerPoint
页数:0
分类:企业经营
上传时间:2014-04-09
浏览量:45