首页 分位数回归模型在R环境下的实现

分位数回归模型在R环境下的实现

举报
开通vip

分位数回归模型在R环境下的实现分位数回归模型在R环境下的实现中国人民大学统计学院左辰潘岚锋大纲引言分位回归模型的基本结构回归系数的渐进分布参数估计残差形态的检验一个实例一、引言传统回归模型的缺陷:1只反映均值变化2Gauss-Markov假设条件太强分位回归模型1拟合在不同分位数水平下的估计值,可以反映更多的信息2对残差分布放松假设Rpackage:quantregbyRogerKoenker二、模型的构造其中:因变量相互独立自变量残差项回归系数表示分位数水平的回归系数rq(y~x,tau=…,method=‘br’)以quantreg包中的e...

分位数回归模型在R环境下的实现
分位数回归模型在R环境下的实现中国人民大学统计学院左辰潘岚锋大纲引言分位回归模型的基本结构回归系数的渐进分布参数估计残差形态的检验一个实例一、引言传统回归模型的缺陷:1只反映均值变化2Gauss-Markov假设条件太强分位回归模型1拟合在不同分位数水平下的估计值,可以反映更多的信息2对残差分布放松假设Rpackage:quantregbyRogerKoenker二、模型的构造其中:因变量相互独立自变量残差项回归系数表示分位数水平的回归系数rq(y~x,tau=…,method=‘br’)以quantreg包中的engel为例:自变量:income--年收入因变量:foodexp--食品消费额fit1=rq(foodexp~income,data=engel)#tau值缺省为0.5,表示中位数回归fit2=rq(foodexp~income,data=engel,tau=c(0.1,0.25,0.75,0.9))#对0.1,0.25,0.75,0.9四个分位数水平进行回归中位数回归和均值回归的差异均值回归受到离群点影响稳健性的试验目的:比较均值回归、中位数回归系数的稳定性 方法 快递客服问题件处理详细方法山木方法pdf计算方法pdf华与华方法下载八字理论方法下载 :1计算原模型的预测值、残差2从残差中抽样加入到预测值中,重新作均值回归和中位数回归3统计两种回归系数的分布结果三、回归系数的渐进分布考虑独立同分布的场合模型:残差分布:双尾指数(Laplace)随机生成1000次,统计在0.1,0.2,…,0.9水平上的分位回归系数:rq(y~x,tau=seq(0.1,0.9,length=9))此外,可以观察回归系数的误差在不同分位数水平上的变化四、参数估计给出一个分位回归模型fit=rq(y~x)后,命令summary(fit,se=‘…’)可以查看参数估计的结果se选项用于选择参数估计的不同方法,主要有1se=‘ker’:核 函数 excel方差函数excelsd函数已知函数     2 f x m x mx m      2 1 4 2拉格朗日函数pdf函数公式下载 估计法2se=‘boot’:Bootstrap方法3se=‘rank’:秩检验1核函数估计法因为残差分布未知,无法直接求出Powell给出如下估计方法:2秩检验秩检验是R中进行参数估计的默认方法。该方法绕开了对未知变量的非参数估计,Jurekova,Guttenbrunner(1992)通过对偶规划问 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 的解,构造出一组秩统计量,渐进服从T分布>summary(fit,se=‘nid’)结果:Call:rq(formula=foodexp~income)tau:[1]0.5Coefficients:ValueStd.ErrortvaluePr(>|t|)(Intercept)81.4822519.250664.232700.00003income0.560180.0282819.810320.00000秩检验(续)Koenker,Machado(1994)推广了秩检验的思路,构造出非渐进分布意义下的参数估计方法summary(fit)结果:Call:rq(formula=foodexp~income)tau:[1]0.5Coefficients:coefficientslowerbdupperbd(Intercept)81.4822553.25915114.01156income0.560180.487020.6019注意:置信区间不是关于估计值对称的3Bootstrap通过放回抽样的Monte-Carlo试验,得到回归系数的均值和 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 差运用T统计量的方法,构造置信区间>summary(fit,se=‘boot’,bsmethod=‘xy’)结果:Call:rq(formula=foodexp~income)tau:[1]0.5Coefficients:ValueStd.ErrortvaluePr(>|t|)(Intercept)81.4822526.624213.060460.00247income0.560180.0339916.482630.00000五、残差形态的检验分位数回归模型的一个重要应用就是对两种残差分布的如下两种形态作检验:1位置漂移模型(locationshiftmodel)2位置-尺度漂移模型(location-scaleshiftmodel)检验的思路:观察随的变化情况位置漂移模型:除常数项分量之外,与分位数水平无关反映在图上,不同分位数水平上的回归直线相互平行对分位数回归过程(regressionquantileprocess)作图分位数回归过程:对一簇分位数水平作回归得到的一组模型例子rqpr=rq(y~x,tau=1:99/100)plot(summary(rqpr))位置-尺度漂移模型由表达式可以看出,向量的各分量随变化的规律是一致的模拟实例:x1<-seq(1,10,length=1000)x2=rnorm(1000,mean=0,sd=10)x3=rexp(1000,rate=0.1)u=runif(1000,min=-2,max=2)y=x1+2*x2-x3+u*(-2*x1+x2-x3)rqpr=rq(y~x1+x2+x3,tau=10:90/100)plot(summary(rqpr))回归系数的变化情况基本一致,是位置-尺度漂移模型的典型特征检验方法Khmaladze检验Koenker&肖志杰(2002)引入Khmaladze鞅变换技术,计算统计量R:KhmaladzeTest(y~x1+x2+x3…,nullH=‘location’/‘location-scale’)#nullH:零假设(nullhypothesis),默认为‘location’,表示位置漂移模型六、一个例子:barro该数据记录了世界各国GDP的增长率和相关因子,共有161个观测;其中前71个观测在1965年~1975年取得;后90个观测是1985~1987年间取得。因子包括:y.net:GDP年增长率lgdp2:人均GDPmse2:男性高中教育情况fse2:女性高中教育情况fhe2:女性高等教育情况mhe2:男性高等教育情况lexp2:人均期望寿命lintr2:人均资本占有gedy2:教育投入占GDP的比重Iy2:投资占GDP的比例gcony2:公共设施建设占GDP的比例lblakp2:黑市借贷佣金率pol2:政治稳定性指数ttrad2贸易增长率。1、中位数回归library(quantreg)data(barro)attach(barro[62:161,])rqm=rq(y.net~lgdp2+mse2+fse2+fhe2+mhe2+lexp2+lintr2+gedy2+Iy2+gcony2+lblakp2+pol2+ttrad2)summary(rqm,se='nid')2分位数回归过程rqa=rq(y.net~lgdp2+mse2+fse2+fhe2+mhe2+lexp2+lintr2+gedy2+Iy2+gcony2+lblakp2+pol2+ttrad2,tau=10:90/100)rqas=summary(rqa)plot(rqas)红色区域:最小二乘回归的参数图中看出各参数显著性3剔除自变量的影响rrs.test(lgdp2+lexp2+lblakp2+mse2+fse2,pol2+fhe2+mhe2+lintr2+gedy2+Iy2+gcony2+ttrad2,y.net)结果:$sn[,1][1,]4.66242$ranks[1]0.3355367390.3265540080.2952627520.3038393480.398400879……待检验的自变量个数为8个查表知,,可见剔除这些自变量对模型无显著影响对剩余自变量作分位数回归过程rqa=rq(y.net~lgdp2+lexp2+lblakp2+mse2+fse2,tau=10:90/100)rqas=summary(rqa)plot(rqas)4残差分布形态的检验位置漂移模型:KhmaladzeTest(y.net~lgdp2+lexp2+lblakp2+mse2+fse2)位置-尺度漂移模型:KhmaladzeTest(y.net~lgdp2+lexp2+lblakp2+mse2+fse2,nullH='location-scale')2.532*3.093总计0.763*0.910fse20.895*1.018mse21.0800.631*lblakp20.309*1.744lexp20.636*1.229lgdp2位置-尺度漂移位置漂移模型变量查表可知,在0.1的显著性水平下,两种模型都不能被拒绝但从统计量数值看,位置尺度漂移模型相对更合理八、总结线性分位数回归模型中的应用,quantreg中的基本函数和 分析 定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析 流程分位数模型与传统回归模型相比,回归参数更加稳健,同时可以反映更多的信息通过不同分位数水平的残差分布,可以对位置-漂移模型和位置-尺度漂移模型做出检验quantreg包中还包括非参数统计的分位数估计,此外,分位数回归在时间序列方面也逐渐有更多的应用
本文档为【分位数回归模型在R环境下的实现】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
爱笑的小黑贼
暂无简介~
格式:ppt
大小:2MB
软件:PowerPoint
页数:31
分类:
上传时间:2022-08-02
浏览量:1