首页 第7章_回归分析法

第7章_回归分析法

举报
开通vip

第7章_回归分析法nullnull案例引入 2007年的统计数据表明:首都机场全年出港航班正常率为86.28%,其中,衡量航班起飞情况的航班放行正常率高达94.49%。中国民航总局代局长李家祥表示我国航空公司的正点率,在世界来说,这个比例属于中等水平,略微偏上。但是近两年因航班延误造成的旅客与航空公司激烈冲突接连不断,如果按航班延误每客补偿200元计,仅南航一家2007年就要付出1.6亿元的巨额赔款,这对于还属于“投入大,产出低”的国内航空公司而言是难以承受的,其结果必然导致企业为减少成本而降低服务,引发恶性竞争。为此,对于航...

第7章_回归分析法
nullnull案例引入 2007年的统计数据表明:首都机场全年出港航班正常率为86.28%,其中,衡量航班起飞情况的航班放行正常率高达94.49%。中国民航总局代局长李家祥表示我国航空公司的正点率,在世界来说,这个比例属于中等水平,略微偏上。但是近两年因航班延误造成的旅客与航空公司激烈冲突接连不断,如果按航班延误每客补偿200元计,仅南航一家2007年就要付出1.6亿元的巨额赔款,这对于还属于“投入大,产出低”的国内航空公司而言是难以承受的,其结果必然导致企业为减少成本而降低服务,引发恶性竞争。为此,对于航空公司航班正点率和顾客投诉率之间关系的研究就显得至关重要。null 7.1 概述 7.2 一元线性回归 分析 定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析 法 7.3 多元线性回归分析法 7.4 非线性回归分析法7.1 概述7.1 概述1.回归分析的内涵 在信息分析研究中,我们经常会发现所研究的对象事物之间往往存在某种相关关系,它们互相联系、互相影响、互相制约。当研究对象的一个或多个变量X1,X2,…,Xm的变化会引起另一个或多个变量Y1,Y2,…,Yn发生变化时,我们就说它们之间存在着某种相关关系。其中诸X带有“原因”的性质,故称为自变量;诸Y带有“结果”的性质,称之为因变量。 7.1 概述7.1 概述2. 回归分析与相关分析的区别 回归(Regression,或Linear Regression)和相关都用来分析两个定距变量间的关系,但回归有明确的因果关系假设。即要假设一个变量为自变量,一个为因变量,自变量对因变量的影响就用回归表示。如年龄对收入的影响。由于回归构建了变量间因果关系的数学表达,它具有统计预测功能。null3. 回归分析法主要解决以下两个问题 一是确定几个变量(X与Y)之间是否存在因果关系、相关 关系( X1与X2等),如果存在,找出他们之间适当的 数学表达式; 二是根据一个或几个变量的值,预测或控制另一个或几 个变量的值,且要估计这种控制或预测可以达到何种精 确度。 7.1 概述7.1 概述7.1 概述7.1.2 类型☆回归方程为线性的称为线性回归,否则称为 非线性回归。 ☆ 线性回归是回归分析的基本模型,很多复杂 的情况都是转化为线性回归进行处理的。 ☆ 回归方程的自变量只有一个的称为一元回归, 多于一个的称为多元回归。 null7.1.2 类型☆一元线性回归,即只有一个自变量的线性回归,用于两 个变量接近线性关系的场合,如y=a+bx 。 ☆多元线性回归,用于一个因变量Y同多个自变量X1,X2 ,…,Xm线性相关的问题,如y=a+b1x1+ b2x2+… bnxn ☆非线性回归,又可分为两类:一类可通过数学变换变成 线性回归,如取对数可使乘法变成加法等;另一类可 直接进行非线性回归,如多项式回归。null7.1.3 步骤☆根据自变量与因变量的现有数据以及关系,绘制散点图, 并观察散点图是否近于呈直线趋势,若是,则设定回归 方程y=a+bx; ☆求出合理的回归系数(对于一元线性回归而言,即用最 小二乘法求出a、b),并确定回归方程; ☆进行相关性检验,确定相关系数; ☆在符合相关性要求后,即可根据已得的回归方程与具体 条件相结合,来确定事物的未来状况;并计算预测值的 置信区间. null 7.1 概述 7.2 一元线性回归分析法 7.3 多元线性回归分析法 7.4 非线性回归分析法null7.2.1 设定回归方程 两个定距变量的回归是用函数y= f(x)来分析的。 我们最常用的是一元回归方程 其中x为自变量;y为因变量;a为截距,即常量;b为回归系数,表明自变量对因变量的影响程度。null7.2.1 设定回归方程 例题:现在我们来研究全国技术贸易额的变化规律并进行预测。全国每年的技术贸易额与很多因素有关,但经过分析,它主要受全国GDP这一因素的影响和制约,于是,我们来寻求二者之间的统计规律,并进行预测。 以x表示自变量——全国GDP数量, 以y表示因变量——全国技术贸易额。谁是自变量?谁是因变量?null7.2.1 设定回归方程 表7-1 全国GDP及技术贸易额统计数据null7.2.1 设定回归方程 根据表列数据,我们可以在直角坐标系中绘出散点图 从散点图中,我们假定y与x之间大致呈线性关系,可用直线方程: y=a+bx              (7-1) 这条直线称为y对x的回归直线 其表达式(7-1)称为回归方程,a、b称为回归系数 null7.2.1 设定回归方程 根据表列数据,我们可以在直角坐标系中绘出散点图 从散点图中,我们假定y与x之间大致呈线性关系,可用直线方程: y=a+bx              (7-1) 这条直线称为y对x的回归直线 其表达式(7-1)称为回归方程,a、b称为回归系数 null7.2.2 确定回归系数 例题:现在我们来研究全国技术贸易额的变化规律并进行预测。全国每年的技术贸易额与很多因素有关,但经过分析,它主要受全国GDP这一因素的影响和制约,于是,我们来寻求二者之间的统计规律,并进行预测。根据最小二乘法原理,求得 a=-69.8587 b= 0.0073 Y=-69.8587+0.0073X r=0.9471null7.2.2 设定回归方程 用SPSS软件实现演示(在变量窗口中建立变量) null7.2.2 设定回归方程 用SPSS软件实现演示(在数据窗口中输入数据)null7.2.2 设定回归方程 用SPSS软件实现演示(分析->回归分析->线性)null7.2.2 设定回归方程 用SPSS软件实现演示(分析->回归分析->线性)null7.2.2 设定回归方程 回归系数相关系数 用SPSS软件实现演示(得到相关输出结果)null7.2.2 设定回归方程 用SPSS软件实现演示(绘制散点图)null7.2.2 设定回归方程 null7.2.3 相关性检验 1.相关性检验的含义 对回归模型描述实际数据的近似程度,也即对所得的回归模型的可信程度进行检验,称为相关性检验。 2.相关性检验的规则 0≤|r| ≤1,当|r|越接近1时,剩余平方和的值越接 近于0,则回归模型描述y与x的关系的近似程度越好, y与x的关系越接近于线性. 当|r| =1时,为完全线性相关; 当|r| =0时,称无线性相关.null3.r的取值情况 情况一图7-2null情况二图7-23.r的取值情况 null情况三图7-23.r的取值情况 null情况四图7-23.r的取值情况 null4.相关系数临界值 上面的讨论中,知道只有当r比较大时,才可以用回归直线来近似地描述y与x的关系.那么r应该至少大到什么程度,才可以使得用回归直线来描述y与x的关系达到足够好的近似程度?相关系数的最低值称为相关系数临界值,记为ra,它是相关性检验的 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 。 null 7.1 概述 7.2 一元线性回归分析法 7.3 多元线性回归分析法 7.4 非线性回归分析法null 多元线性回归的提出背景 在信息分析研究中,研究对象的变化往往和多个因素有关,是多个因素的同时作用导致研究对象的变化,而不是只受一个因素的影响。在某些情况下,这多个因素的作用能够分出明显的主次,这样我们就可以找出一个主要因素,而忽略其他次要因素,进而研究该对象和该主要因素之间的定量关系并预测对象的发展。但在许多实际问题中,一元线性回归分析只不过是回归分析中的一种特例,它通常是我们对影响某种现象的许多因素进行了简化考虑的结果。在实践活动过程中,我们更多遇到的是,一个因变量往往与多个自变量有关。 null 案例引入 某公司管理人员要预测来年该公司的销售额y时,研究认为影响销售额的因素不只是广告宣传费x1,还有个人可支配收入x2、价格x3、研究与开发费用x4、各种投资x5、销售费用x6等。这样因变量y就与多个自变量x1 ,x2 ,x3 ,x4 ,x5 ,x6有关。因此,我们就需要进一步讨论多元线性回归问题。        null 多元线性回归例题1 土地问题是当今世界令人瞩目的重大经济问题,人口和经济发展都和土地之间存在着密不可分的联系。人口数(X1)、粮食总产量(X2)和粮食作物面积(X3)是影响土地面积(Y)的重要因素。因变量土地面积与三个自变量之间呈线形相关,因此用三元线形回归方程来分析。某地区的基本数据见        null 用SPSS进行求解(在变量窗口中建立变量)       null 用SPSS进行求解(在数据窗口中输入数据)       null 用SPSS进行求解(分析->回归分析->线性)       null 用SPSS进行求解(选择变量)       null 用SPSS进行求解       回归系数相关系数null 多元线性回归例题2 某地区1973年到1990年水稻产量和水稻播种面积、化肥使用量、生猪存栏数以及水稻扬花期降水量的数据资料,数据中有18个观测样本,代表了1973到1990共18个年份,有7个属性变量:id(序号)、x1(水稻播种面积)、x2(化肥使用量)、x3(生猪存栏数)、x4(水稻扬花期降水量)、y水稻产量、year(年份)。 问题:用线性回归分析为该地区水稻产量寻求一个恰当的回归模型,分析产量对它具有显著影响因素之间的关系。       nullnull       均值标准差观测量总数 描述性统计量解读:null       从表中看到Y(水稻总产量)与自变量X1,X2,X3之间相关系数一次为 0.798,0.913,0.887,反映水稻总产量与播种面积、化肥施用量、生猪 存栏数之间存在显著的相关关系。化肥使用量(X2)对粮食作物产量的 增长有显著的作用;自变量X4与因变量Y之间的相关系数为0.293,它与 其他几个自变量之间的相关系数也很小,说明他们之间的线性相关不显著。 这反映降水过程作为完全随机自然现象,与生产活动中人为控制的自变量 之间的关系本来就应该是相互独立的。 相关系数矩阵解读:null       此外,播种面积X1与化肥施用量X2、生猪存栏数X3之间的相关系数分别为 0.774和0.782,说明它们之间存在较为显著的相关关系,这也符合常识。 化肥施用量X2与生猪存栏数X3之间的相关系数为0.826,说明两者关系也 是显著的。null       该表说明模型整体拟合效果,模型的拟合优度系数为 0.956,反映了因变量与自变量之间具有高度显著的线 性关系。 模型表解读:调整后的R2调整后R值估计标准误差null 本章重点什么是回归分析法?它与相关分析有何联系和区别 回归分析法主要解决哪两个问题? 简述回归分析法的工作步骤。 以一元线性回归分析为例,说明为何及如何进行相关性检验。 null 实践问题讨论请同学结合自己的课题,分析是否可以采用 回归分析的方法?自变量和因变量分别是什 么?
本文档为【第7章_回归分析法】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_802351
暂无简介~
格式:ppt
大小:928KB
软件:PowerPoint
页数:0
分类:企业经营
上传时间:2010-07-08
浏览量:39