关闭

关闭

关闭

封号提示

内容

首页 A题思路之一多元非线性回归分析

A题思路之一多元非线性回归分析.doc

A题思路之一多元非线性回归分析

崔少华 2018-06-13 评分 0 浏览量 0 0 0 0 暂无简介 简介 举报

简介:本文档为《A题思路之一多元非线性回归分析doc》,可适用于行业分析领域,主题内容包含A题思路之一多元非线性回归分析A题思路之一多元非线性回归分析本题求解关键为建立工资与其他个因素之间的关系模型可以考虑采用回归分析法也可以考虑其他方法符等。

A题思路之一多元非线性回归分析A题思路之一多元非线性回归分析本题求解关键为建立工资与其他个因素之间的关系模型可以考虑采用回归分析法也可以考虑其他方法以下仅以回归分析法过程为例给出分析思路仅供参考:注意:根据下述结果发现本问题应该考虑为多元非线性回归因此请大家优先挑出使用非线性回归模型的论文其余酌情考虑。数据预处理)为数据分析方便应该考虑名义变量或有序变量的量化处理(编码)如可以考虑如下编码方案(含符号约定):,日平均工资的对数便于回归分析作为因变量。y~男性,x,,~女性,x:工龄~男性或单身女性,x,,~已婚女性,,本科,,,硕士,x(受教育状况),,,博士,,,博士后,~管理岗位,x()工作部门性质,,~技术岗位,~受过培训,x(培训情况),,~未受过培训,~两年以上未从事一线工作,x(一线工作情况),,~其它情况,)分别作出y与各自变量之间的散点图发现与x非线性关系较为明显(下图所示)所以应该考虑为非线性模型data=xlsread('Adataxls',)y=data(:,)x=data(:,:)plot(x(:,),y,'r*')title('lnyvsx')lnyvsx)相关性分析data=xlsread('Adataxls',)y=data(:,)x=data(:,:)s=corrcoef(data)xlswrite('coefxls',s)lnyXXXXXXX相关系数表也提示y仅与x,x关系密切与婚姻状况x,x关系不明显、建模及简易求解(第、问)以下考虑分别用多元线性回归模型、线性逐步回归模型、非线性模型分析从中选择相对最优的模型。)多元线性回归结果源程序:data=xlsread('Adataxls',)Y=data(:,)x=data(:,:)X=ones(,),xb,bint,r,rint,stats=regress(Y,X)b,bint,stats结果:b(系数)=常数项xxxxxxxBint(系数,置信区间)=置信区间包含零点可认为在,置信度下相应变量对y影响不显著应该考虑改进模型。stats(统计量)=(决定系数)(F值)(P值)关于异常值:利用上述多元线性回归模型分析结果继续做异常点分析rcoplot(r,rint)发现个异常点:ResidualCaseOrderPlotResidualsCaseNumber从原始数据中将其剔除后重新做多元线性回归源程序:data=xlsread('Adataxls',)Y=data(:,)x=data(:,:)X=ones(,),xb,bint,r,rint,stats=regress(Y,X)b,bint,stats结果b=bint=stats=可见决定系数与F值均提高~)线性逐步回归结果(考虑采用逐步回归方法)data=xlsread('Adataxls',)y=data(:,)x=data(:,:)stepwise(x,y)系数:beta=系数,置信区间:betaci=统计量stats=intercept:(常数项)rmse:rsq:(决定系数)adjrsq:fstat:(F值)pval:(P值)较多元线性模型相比尽管决定系数略有下降但F值上升很快逐步回归整体效果优于多元线性模型。)多元非线性回归(含平方项、交叉项)模型:y=ab*xc*x^d*xe*x*x(仅为一特例考虑工资可能与x,x有一定的关系。另外其他组合较多留给大家更多思考空间~)data=xlsread('Adataxls',)y=data(:,)x=data(:,:)rstool(x,y,'quadratic')X=ones(,)x(:,),x(:,)^,x(:,),x(:,)*x(:,)b,bint,r,rint,stats=regress(y,X)b,bint,statsb=bint=(包含零点)stats=(决定系数)(F值)(P值)可见上述交叉项对y影响不够显著考虑剔除。)多元非线性回归(仅含平方项)模型:y=ab*xc*x^d*xdata=xlsread('Adataxls',)y=data(:,)x=data(:,:)X=ones(,)x(:,),x(:,)^,x(:,)b,bint,r,rint,stats=regress(y,X)b,bint,stats结果:b=bint=stats=(决定系数)(F值)(P值)本模型较带交叉项模型决定系数减小但是系数,置信区间均显示各变量对y影响显著并且F大幅提升因此最终选择模型如下:yxxx,,特别注意:本问题可能还有更加优秀的模型及结果~、第二问关于女工是否受到不公正待遇以及她们的婚姻状况是否影响其收入可以从以下几个角度之一考虑:y与x相关系数逐步回归结果中剔除了x和x也可采用单因素方差分析考虑。其他做法。**********************完~****************************

用户评论(0)

0/200

精彩专题

上传我的资料

每篇奖励 +1积分

资料评分:

/10
0下载券 下载 加入VIP, 送下载券

意见
反馈

立即扫码关注

爱问共享资料微信公众号

返回
顶部

举报
资料