首页 chap6两变量相关与回归

chap6两变量相关与回归

举报
开通vip

chap6两变量相关与回归Chap6correlation®ressionofBivariateP88~105目的与要求:6学时.§1~5,§6~9.掌握:相关与回归、协方差分析的意义、联合用药效应判断、SPSS17.0操作。熟悉:回归的应用、LD50的意义和计算。了解:协变量的条件。教学内容提要:重点讲解:相关与回归、协方差分析的思想和意义、SPSS17.0操作。讲解:回归的应用、LD50的意义和计算。介绍:协方差分析与一般方差分析的区别。重点:相关与回归的意义、协方差分析思想。难点:协方差分析与一般方差分析的区别。变量间的关系确定...

chap6两变量相关与回归
Chap6correlation®ressionofBivariateP88~105目的与要求:6学时.§1~5,§6~9.掌握:相关与回归、协方差 分析 定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析 的意义、联合用药效应判断、SPSS17.0操作。熟悉:回归的应用、LD50的意义和计算。了解:协变量的条件。教学内容提要:重点讲解:相关与回归、协方差分析的思想和意义、SPSS17.0操作。讲解:回归的应用、LD50的意义和计算。介绍:协方差分析与一般方差分析的区别。重点:相关与回归的意义、协方差分析思想。难点:协方差分析与一般方差分析的区别。变量间的关系确定性(函数)关系:x—y对应。随机性关系:x—y不确定性。   相关分析的统计指标:(1)正态分布的双变量计量:散点图→直线趋势→Pearson相关系数。皮尔逊(2)不服从正态分布的双变量计量资料,或等级或相对数,或总体分布类型不知的资料:散点图→直线趋势→等级相关系数。(3)两个有关的分类变量:交叉分类的R×C 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf →独立性χ2检验和列联系数描述其相关性。§1 直线相关(linearcorrelation) P85直线相关or简单相关(simplecorrelation):两变量相互呈直线变化趋势的随机性关系。一、散点图、积差相关系数1.散点图2.相关系数(correlationcoefficient):定量描述两变量间直线相关方向和密切程度的统计指标。(1)积差相关系数(Product-momentcorrelationcoefficient)Pearson相关系数,相关系数:参数统计,双变量正态分布。-1≤r≤1,符号→相关方向,绝对值→密切程度。r>0:正相关。r<0:负相关。r=0:零相关。非线性相关or无相关。(2)等级相关系数:非参数统计法§2二、积差相关系数的假设检验r估计总体相关系数ρ,当r≠0时,因为存在抽样误差,不能认为ρ≠0,需要检验样本相关关系是否来自ρ=0的总体。tor直接用r三、直线相关分析应注意的问题1.慎重处理离群值点(outlier)。仅在证实离群值点源于过失误差时方可修正或剔除该数据。2.合并分层资料要慎重。两变量关系不会因为合并而被歪曲时才可考虑合并。3.样本相关系数必须进行假设检验。4.要结合专业背景。不要把P值大小误解为相关程度,样本相关系数有统计学意义并不一定反映相关就很密切。§2 等级相关(秩相关) P88条件:①不服从正态分布;②总体分布类型不知;③用等级或相对数表示的资料;④数据一端或两端有不确定值。方法:Kendall法:等级相关系数rkSpearman法:等级相关系数rsrk和rs的取值范围和意义同r,都需进行检验。rs=1-6Σd2/[n(n2-1)],n对子数,d配对秩次之差.【例6-2】12名2~7岁急性白血病患儿的血小板数与出血症状资料见表6-1,分析两者之间有无直线关系:【SPSS操作】以血小板数和出血症状(标0=-,1=+,2=++,3=+++)为变量名,建立2列12行数据文件L6-2.sav(1)作散点图:Graphs→Scatter→→Define,出血症状入YAxis,血小板数入XAxis→Continue→OKx与y无直线趋势,只为 说明 关于失联党员情况说明岗位说明总经理岗位说明书会计岗位说明书行政主管岗位说明书 SPSS作等级相关分析的操作。(2)等级相关:Analyze→Correlate→Bivariate,血小板与出血入Variable,√Kendallˊstau-b和√Spearman→OK输出结果:Kendallrk=-0.377,P=0.117;Spearmanrs=-0.422,P=0.172。§3 直线回归 P90一、直线回归的模型 散点图呈直线(或曲线)趋势,但随机因素的影响,不完全在一条线上。回归(regression)关系:随机性数量依存关系。回归分析:研究一个应变量与一个或多个自变量之间数量依存关系的统计方法。简单线性回归或简单回归(simpleregression):只有一个自变量的直线回归(linearregression)。图6-8简单线性回归统计学模型 y的总体均数μy都位于直线μy=α+βx上。 =a+bx儿科:=8+2xa:截距(intercept)。b:斜率(slope),回归系数(regressioncoefficient)。x每改变1个单位时y平均改变b个单位。b>0表示自变量↑应变量↑,直线上升。│b│↑→越陡→y随x变化率大。二、直线回归方程的建立与检验建立:最小二乘法原则。检验:能否使用。使用:在样本数据范围内。预测:x估y。控制:y估x。1.建立回归直线 =a+bx。剩余误差(y- ),残差:各实测值y至回归直线纵向距离。剩余平方和(residualsumofsquare)或残差平方和SS剩余=Σ(y- )2=Σ[y-(a+bx)]2(6-9)最小二乘法(methodofleastsquares):SS剩余最小。2.检验n>100,r假设检验有统计学意义时:︱r︱>0.7,两个变量高度相关;0.4<︱r︱<0.7,中度相关;0.2<︱r︱<0.4,低度相关。3.决定系数(determiningcoefficient,相关指数correlationindex,R2)R2=SS回/SS总=(SS总-SS剩)/SS总=1-SS剩/SS总R2表示y的总变异中被x所决定的占多少。0≤R2≤1,→1,回归效果越好,强度↑。R2密切程度(相关强度)。回归强度R2=SS回/lyy=(n-1)sy2r2/lyy=r2例:两变量,df=100,r=0.20时,查附表11,P<0.05,可认为两变量间存在直线相关。R2=0.202=0.04,y的变异只有4%与回归有关,两个变量直线相关的实际意义不大,除x外,还有其它因素等待我们去认识。由这样的资料求出的回归方程是无任何预测价值的。区别相关显著(r有统计学意义)与相关强度4.回归系数β的CIb±tα/2(n–2)sb=b±tα/2(n–2)(sy/sx)两回归系数比较时可用CI作假设检验:无重叠→不同重叠→同。【例6-3】例6-1资料3岁儿童体重与体表面积资料,建立直线回归方程并进行检验。【SPSS】L6-1.sav→Analyze→Regression→LinearRegression,体重为Independent、体表面积为dependent→Statistic,选Confidenceintervals→Continue→OK。§4 简单回归与相关的区别和联系 P95一、区别1.资料要求:(1)相关:X、Y正态(2)回归:①X、Y正态②X选定,Y随机2.应用:(1)相关:X、Y相互关系(2)回归:X推Y3.计量单位:相关系数r无,回归系数b有单位二、联系(1)方向一致:r与b的正负号一致。(2)同一资料假设检验等价:tr=tb(3)r与b可相互推导获得。(4)用回归解释相关:R2=r2§5 回归分析的应用 P95一、应用1.描述变量间数量变化关系:量-效关系、配伍规律。【例6-4】《医宗金鉴》治积聚处方,y=1.967+0.735x,有统计学意义,R2=0.9996,拟合度达99.96%,用回归方程描述名医治病用药的配伍规律准确有效。表6-26个治积聚方的川乌与茯苓用量处方川乌x茯苓y新制阴阳攻积丸3024肥气丸3.64.5息贲丸3.04.5伏梁丸1.53.0痞气丸1.53.0奔豚丸1.53.02.预测y值容许区间即预测区间(predictionintervalPI)x=x0时,y0值的(1–α)预测区间计算公式为:3.估计µ的CI:自变量x0,应变量估计值的总体均数 的(1-α)CI为:二、注意事项1.专业上要有意义:专业→相关→回归分析。2.选择合适的回归模型:散点图。直线趋势→直线回归分析曲线趋势→曲线方程。3.不随意外延:以自变量的观测范围为限。L2:§6曲线回归(curvelinearregression)P97曲线拟合(curvefitting):根据样本资料找出能反映变量间关系的曲线回归方程的过程。散点图→曲线类型:对数、指数、幂函数、Logistic等。曲线关系→最小二乘法→曲线直线化→直线回归→还原得到曲线方程。统计软件对一组资料常可同时拟合多种模型:R2接近1、 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 估计误差SY较小、变量数最少,结构最简单的模型为首选。【例6-7】研究板蓝根注射液含量的稳定性,在pH=6.28,温度为78℃下,测得保温时间与含量破坏百分比的结果如下,作保温时间t与含量破坏百分比p间的曲线拟合。散点图→线形模型或对数模型。线形模型:p=1.60+0.14t,R2=0.932,P<0.05。对数模型:T=lnt,p=-29.0+9.78T,还原t得到p=-29.0+9.78lnt,R2=0.994,P<0.05。两者都有统计学意义,取决定系数大者。【SPSS操作】以t、P为变量名,建立L6-7.sav。Analyze→Regression→CurveEstimation,p入Dependent[s],t入Variable,在Modeles框将11个复选项全选→OK。ModelSummaryandParameterestimates(模型概述和参数估计),都有意义。S形模型决定系数和F最大,p=exp(b0+b1/t)=exp(3.38-59.08/t)=e(3.38-59.08/t)§7 概率单位回归法计算半数致死量LD50P97一、LD50的意义1.基本概念(1)质反应:在群体所引起的(+)率表示的效应。(2)效量(effectivedose,E):能引起某种质反应的剂量,说明质反应的大小,如致死量、致死时间等。(3)半数致死量(50%lethaldose,LD50):使半数试验动物死亡的剂量。(4)剂量-死亡率曲线:以剂量为横轴,死亡率为纵轴作图。不对称的“S”型曲线。剂量D-死亡曲线(非对称的S型曲线)二.概率单位法计算LD50 【例6-8】注射不同剂量厚朴注射液的小白鼠死亡情况如表6-3。求LD50及其95%置信区间。【SPSS】以剂量、鼠数、死亡数建L6-8.savAnalyze→Regression→Probit(概率单位回归),死数入ResponseFrequency,鼠数入TotalObserved,剂量入Covariates(协变量)→OK剂量的回归系数=0.480,z=3.555,P=0.000,截距=-2.772,P=0.000,都有统计学意义;PROBIT(p)=Intercept+BX=-2.772+0.480×剂量2.意义:剂量D→lgD,则(lgD,P)散点图呈现为对称的S形,对称中心在死亡率=50%处。对数剂量-死亡率曲线为一条对称的“S”型曲线,在死亡率50%处斜率最大,药物剂量稍有变动,死亡率有明显差别。LD50衡量毒力大小,稳定,误差较小。 Pearson拟合优度(PearsonGoodness-of-fitTest):χ2=0.238,P=0.888,P>0.15(预设),CI不异质性校正。Prob=.50对应LD50点估计5.771mg/g。§8 联合用药效应判断 P1011.协同、叠加与拮抗关系:剂量-效应:曲线关系,D↑l倍,E不一定↑1倍。协同:(1+1)>2叠加(独立):1<(1+1)<2拮抗:(1+1)<1用等效概念表达两药联合应用效应:2.联合用药计量效应的判断【例6-9】已知A与B对抗体指数均有抑制作用,研究二者联合用药的效应。(1)A、B两药各按近似等比级数取3个剂量,另加1空白,试验结果如表6-4。【SPSS操作】以A药、效应为变量名建立L6-91.savA药剂量对数变换→Analyze→Regression→LinearRegression,ln为Independent、效应为dependent→Statistic,Confidenceintervals→Continue→OK。同样操作,以B药、效应为变量名建立数据L6-92.sav。A药单用时对数剂量-效应回归无统计学意义,不建方程。为说明操作,求出A药单用时EA=1.18-0.51logDAB药单用时对数剂量-效应回归有统计学意义。EB=1.12-0.51logDB§9协方差分析(analysisofcovariance)P102 一.基本思想和应用条件 1.概念:利用直线回归法消除混杂因素影响后进行的方差分析。常用于难以完全控制混杂因素的观察研究。 2.基本思想:扣除混杂因素(covariable协变量)x对y的影响→评价各种处理的效应。3.应用条件:①独立,正态,方差齐性;②回归系数b有统计学意义;③各组b之间差别无统计意义。④协变量是连续变量或等级变量,不能是影响处理的变量。比较的是修正均数,H0为修正后的均数相等。协变量有多个时,可用多元协方差分析。二.完全随机 设计 领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计 资料的协方差分析【例6-10】降压宁的临床实验的资料如表6-5,比较两组疗效是否相同。【SPSS】以组别、用药前、用药后为变量名,建立3列28行的数据文件L6-10.sav。分3步来进行协方差分析。  第一步:散点图→直线趋势。(无直线趋势则不宜作协方差分析)。Graphs→legacydialogs→Scatter→→Define,SimpleScatterplot,用药后入YAxis框,用药前入XAxis→OK。两组均有直线趋势→协方差分析。  第二步:交互项→两总体β是否相等:Analyze→GeneralLinearModels→Univariate用药后入Dependentvariable,组别入FixedFactors,用药前入Covariate→Model,⊙Custom,先组别、再用药前入Model,又将组别、用药前同时送入Model,选TypeⅠ(Ⅰ型方差分析模型)→Continue→OK。交互作用F=1.515,P=0.230,两组的斜率相同,故进一步分析。若交互作用有统计学意义,则不宜作协方差分析。第三步:比较修正均数,操作同第二步。①不分析交互,把组别*用药前从Model移除;②对两组进行比较,采用LSD法。Analyze→GeneralLinearModels→Univariate→Model,⊙Custom,将组别*用药前送出Model,TypeIII(III型方差分析模型)→Continue→Options,将组别入DisplayMeansfor,Comparemaineffects→Continue→OK。三.配伍组(随机区组)设计资料协方差分析【例6-11】将每窝3只出生3周体重34~38g的12窝大鼠,随机分到3组:A组喂缺乏核黄素饲料,B组喂核黄素饲料、限制食量与A组相近,C组喂核黄素饲料、不限食量。1周后,体重增加量y如表6-6。分析核黄素缺乏对体重增加的影响。为消除进食量对体重增加的影响,以进食量为协变量,采用协方差分析比较三种饲料对体重增加的差异。【SPSS】以饲料,窝别,进食量,体重增量为变量名,建立4列36行L6-11.sav,用配伍组设计资料的协方差分析。第一步:散点图→x与体重增量的直线趋势。Graphs→legacydialogs→Scatter→→Define,SimpleScatterplot,体重入YAxis,进食量入XAxis→OK。均有直线趋势→协方差分析。  第二步:交互项→三组总体β相等?Analyze→GeneralLinearModels,→Univariate,体重增量入Dependentvariable,饲料、窝别入FixedFactors,进食量入Covariate→Model,⊙Custom,按因素的重要顺序将饲料、窝别、进食量、依次送入Model,再同时选饲料、进食量送入Model框,TypeⅠ→Continue→OK。饲料*进食量F=0.273,P=0.764,斜率同→协方差分析。第三步:比较修正均数是否相等。Analyze→GeneralLinearModels→Univariate →Model,⊙Custom,把饲料*进食量从Model框删除,选用TypeIII→Continue→Options,饲料,窝别入DisplayMeansfor,√Comparemaineffects,LSD(none)→Continue→OK
本文档为【chap6两变量相关与回归】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
机构认证用户
希望图文
公司秉着用户至上的原则服务好每一位客户,专注课件、范文、教案设计制作
格式:ppt
大小:2MB
软件:PowerPoint
页数:81
分类:其他高等教育
上传时间:2022-05-05
浏览量:2