下载

1下载券

加入VIP
  • 专属下载特权
  • 现金文档折扣购买
  • VIP免费专区
  • 千万文档免费下载

上传资料

关闭

关闭

关闭

封号提示

内容

首页 医学统计学

医学统计学.doc

医学统计学

勇敢的小清新张张
2019-05-23 0人阅读 举报 0 0 暂无简介

简介:本文档为《医学统计学doc》,可适用于医药卫生领域

一、假设检验t检验单样本t检验即已知样本均数(代表未知总均数)与已知总体均数(一般为理论值、标准值或经过大量观察所得的稳定值等)的比较。检验统计量按下式计算:配对样本t检验即差值样本均数所代表的的未知总体均数与已知总体均数=的比较其检验统计量按下式计算:其中d是每对数据的差值n为对子数两样本t检验适用于完全随机设计两样本均数比较两样本均数所代表的两总体均数是否不等。当两样本含量较小(如)且均来自正态总体时要根据两总体方差是否相等而采用不同检验方法。()总体方差相等的t检验即()CochranCox近似t检验当时用双尾概率时,,。()Satterthwaite近似t检验()Welch近似t检验正态性检验概率图(PP图)分位数图(QQ图)。如果所分析的数据服从正态分布则在PP图和QQ图上的数据点应分布在从左下到右上的直线附近。方差齐性检验levene检验变量变换()对数变换适用于对数正态分布资料各样本标准差与均数成比例或变异系数是常数或接近某一常数的资料。后三个适用于原始数据较小或有时。()平方根变换适用于服从Poisson分布即各样本方差与均数近似相等轻度偏态分布资料。后两个适用于原始数据较小或有时。()平方根反正弦变换适用于率或百分比的资料()倒数变换X’=X适用于数据两端波动较大的资料。多个样本均数比较的方差分析方差分析方差分析又称F检验。处理因素至少有两个水平通过所获得的样本信息来推断各处理组均数间的差别是否有统计学意义即处理有无效果。()完全随机设计资料的方差分析将全部实验对象分配到g个处理组(水平组)各组分别接受不同的处理实验结束后比较各组均数之间的差别有无统计学意义。变异来源自由度SSMS(均方)FP总变异N   组间g 组内NgSS总SS组间        其中。如果想比较两两间的差别可采用多重比较。()随机区组设计资料的方差分析先按影响实验结果的非处理因素(如性别、体重、年龄、职业、病情等)将实验对象配成区组。再分别将各区组内的实验对象随机分配到各处理组或对照组。对于正态分布且方差齐同的资料采用双向分类的方差分析或配对t检验。变异来源自由度SSMS(均方)FP总变异N(N=ng)   处理间g(g为处理组数) 区组间n(n为区组数) 误差(n)(g)SS总SS处理SS区组        多个样本均数间的多重比较() LSDt检验即最小显著差异t检验适用于一对或几对在专业上有特殊意义的样本均数间的比较。一般公式为:其中()Dunnettt检验适用于g个实验组与一个对照组均数差别的多重比较。计算公式为:其中、为对照组的样本均数和样本例数。()SNKq检验适用于多个样本均数两两之间的全面比较。计算公式为:其中多样本(也适用于两样本)方差比较的Bartlett检验和Levene检验检验方差齐性()Bartlett检验设在g各正态总体中分别独立地随机抽取g个样本记各样本含量为ni、样本方差为Si(i=,,…,g)。假设检验为:H:H:各总体方差不全相等在H成立的条件下Bartlett检验统计量为:其中为合并方差计算公式为:对于完全随机设计资料有按查界值表得若则P>不拒绝H反之则拒绝H。()Levene检验该检验所分析的资料可以不具正态性。设在g各正态总体中分别独立地随机抽取g个样本记各样本含量为ni、第j各观察值为Xij(i=,,…,g)。假设检验为:H:H:各总体方差不全相等在H成立的条件下Levene检验统计量为:其中N=nn…ngZij可根据资料选择下列三种计算方法:a。b其中Mdi为第i个样本的中位数。c其中为第i个样本截除样本含量后的均数。按查F界值表得若则P>不拒绝H反之则拒绝H。卡方检验四格表资料abcd  只有个数是表的基本数据其余数据都是由这四个基本数据推算出来的称为四格表资料。卡方检验统计量为公式为:也成为Pearson。式中A为实际频数T为理论频数。四格表资料卡方检验的校正公式通常规定为:a当n>=且所有的T>=时用检验的基本公式当时改用四格表资料的Fisher确切概率法。b当n>=但有=<T<时用四格表资料卡方检验的校正公式或改用四格表资料的Fisher确切概率法。c当n<或T<时用四格表资料的Fisher确切概率法。四格表资料的Fisher确切概率法基本思想:在四格表周边合计数固定不变的条件下计算表内个实际频数变动时的各种组合的概率Pi再按检验假设用单侧或双侧的累计概率P依据所取的检验水准做出推断。双向无序分类资料的关联性检验又称双向无序R*C表资料。计算Pearson列联系系数C:C取值范围在~之间。表示完全独立表示完全相关。越接近表示关系越不密切越接近表示关系越密切。注意事项:()一般认为行*列表资料中各格的理论频数不应小于并且=<T<的格子数不宜超过格子总数的若出现上述情况可以采用以下方法解决:最好是增加样本含量使理论频数增大根据专业知识考虑能否删去理论频数太小的行或列能否将理论频数太小的行或列与性质相近的邻行或邻列合并改用双向无序R*C表资料的Fisher确切概率法(SAS实现)。()行*列表资料的卡方检验主要是用于多个样本率的比较两个或多个样本构成比的比较以及双向无序R*C表资料的关联性检验。不适用于有序R*C表资料。多个样本率间的多重比较卡方分割法、Scheffe可信区间法、SNK法。有序分组资料的线性趋势检验R*C表资料可以分为双向无序、单向无序、双向有序属性相同和双向有序属性不同。()双向无序:两个分类变量皆为无序分类变量卡方检验、Pearson列联系数()单向有序:一种是分组变量有序(年龄)指标变量无序(传染病类型):卡方检验一种是分组变量无序(疗法)指标变量有序(疗效按等级分组):秩转换的非参数检验。()双向有序属性相同:目的通常是分析两种检测方法的一致性一致性检验或称Kappa检验特殊模型分析方法()双向有序属性不同:若研究目的为分析不同年龄组患者疗效之间有无差别时可视为单项有序选用秩转换的非参数检验若研究目的为分析两个有序分类变量间是否存在相关关系宜用等级相关分析若研究目的为分析两个有序分类变量间是否存在线性变化趋势采用线性趋势检验。频数分布拟合优度(goodnessoffit)的卡方检验利用已知分布求观察频数秩转换的非参数检验对于等级资料常用非参数检验。配对样本比较的Wilcoxon符号秩检验又称秩和检验用于配对样本差值的中位数和比较还可用于单个样本中位数和总体中位数比较。()配对样本差值的中位数和比较省略所有差值为的对子数令余下的有效对子数为n按照n个差值的绝对值从小到大编正秩和负秩遇差值的绝对值的绝对值相等的取平均秩称为相同秩。取正秩或负秩的和为T。求P值:n<=时查T界值表。若n>用正态近似法作u检验。其中tj为第j个相同秩的个数。符号资料先把等级从强到弱转换成秩。()单个样本中位数和总体中位数比较推断样本来自的总体中位数M和某个已知的总体中位数M是否有差别。用样本各变量值和M的差值即推断差值的总体中位数和是否有差别。两个独立样本比较的wilcoxon秩和检验()原始数据的比较。计量资料为原始数据方差不齐。求T值:把两样本数据混合从小到大编秩遇数据相等者取平均秩以样本例数小者为n其秩和(T)为T若两样本例数相等可任取一样本秩和为T。求P值:当n<=和nn<=时查T界值表否则可用正态近似法作u检验令nn=N按下式计算:()频数表资料和等级资料的两样本比较完全随机设计多个样本比较的KruskalWallisH检验()多个独立样本比较的KruskalWallisH检验()多个独立样本两两比较的Nemenyi法检验随机区组设计多个样本比较的FriedmanM检验多因素实验资料的方差分析单因素与多因素是指“处理”而言多因素试验资料通常采用多向分类方差分析(multiwayclassificationANOVA)。析因设计资料的方差分析析因设计是一种多因素的交叉分组设计。它不仅可检验每个因素各水平间的差异而且可检验各因素间的交互作用。设有k个因素每个因素有lj个水平析因设计的处理组是k各因素lj个水平的全面交叉组合。()*两因素析因设计资料的方差分析A(缝合方法)外膜缝合(a)束膜缝合(a)合计B(缝后时间)个月(b)个月(b)个月(b)个月(b)           Ti()()      C==,SS总=均属差别表 A因素B因素平均bb bb   a a平均   aa       单独效应:其他因素的水平固定时同一因素不同水平间的差别。如A因素固定水平B因素的单独效应为A因素固定为水平B因素的单独效应为。主效应:是指某一因素各水平间的平均差别。将单独效应平均后为主效应如B因素的主效应为()=交互作用:当某因素的各个单独效应随另一因素变化而变化时则称这两个因素间存在交互作用。A与B的交互作用:AB=()B与A的交互作用:BA=()=均数比较的变异分解变异来源自由度SSMSFP总变异   处理间   误差        SS处理的变异分解变异来源自由度SS处理组间A因素主效应B因素主效应AB交互作用   ()I*J两因素析因设计资料的方差分析g个处理组n为每组例数变异来源自由度SSMSFP总变异gn   A因素主效应IMSA B因素主效应JMSB AB交互作用(I)(J)MSAB 误差g(n)MSE        ()I*J*K三因素析因设计资料的方差分析变异来源自由度SSMSFP总变异gn   A主效应IMSA  B主效应JMSB  C主效应KMSC  AB(I)(J)MSAB  AC(I)(K)MSAC  BC(J)(K)MSBC  ABC(I)(J)(K)MSABC  误差g(n)MSE        正交设计与方差分析析因设计是全面组合正交设计并非全面实验。每个正交表都有一个表头符号LN(mk)表示有N行k列每一列由,,…,m个整数组成。用LN(mk)安排实验N表示实验次数k表示最多可安排的因素个数m表示各因素的水平数。方差分析:Tk表示第k列水平数为的实验结果合计。嵌套设计资料的方差分析以两因素的嵌套设计为例假定A因素有I个水平在A因素i个水平下B因素有Ji个水平则二级处理因素共有个水平所有实验单位应随机等分为g组每组有n例。方差分析变异来源自由度SSMSFP总变异nIJ   A(一级实验因素)I   B(二级实验因素)I(J)   误差(n)IJ         裂区设计资料的方差分析重复测量设计资料的方差分析重复测量资料的数据特征当前后测量设计的重复测量次数m>=时称重复测量设计或重复测量数据。重复测量数据的两个因素两个水平分析将重复测量设计的干预因素作为A因素共两个水平:水平位“对照”水平为“干预”前后两次测量时间作为B因素共两个水平:水平位“第次测量时间”水平为“第次测量时间”。共有个处理组各组观察值合计分别为T,T,T,T表示。干预分组作用的方差分析表变异来源自由度SSMSFP组间合计(观察对象)n   干预分组(A)   组间误差(n)SS组间SSA         测量前后与交互作用的方差分析表变异来源自由度SSMSFP组内合计(观察对象)n   测量前后(B)   ABSSAB=SS处理SSASSB   组间误差(n)SS组内SSBSSAB         其中Mj为每个观察对象前后两次观察的合计值。重复测量数据的两因素多水平分析两因素是指干预(因素A)和测量时间(B因素)多水平是指干预(A因素)有g个水平测量时间(B因素)有m个水平即每个观察对象有m个重复测量数据。多个干预的重复测量数据方差分析表变异来源自由度SSMSFP组间合计(观察对象)gn   干预分组(A) FA 组间误差g(n)SS组间SSA         多个时间点测量前后与交叉作用的方差分析表变异来源自由度SSMSFP组内合计(观察对象)gn(m)   测量前后(B)m FB AB(g)(m)SSAB=SS处理SSASSB FAB 组间误差g(n)(m)SS组内SSBSSAB         多变量数据的统计描述与统计推断每个观察对象记录的结果通常有多个反应变量这种有多个反应变量的数据成为多变量数据。例如:血压记录有收缩压、舒张压、脉压等。组间差别比较()单组资料采用t检验():整理得:当有多个反应变量时样本均数改为样本均数向量总体均数改为总体均数向量样本方差改为样本协方差矩阵上式推广为HotellingT得:()两组比较采用t检验():整理得:当有多个反应变量时样本均数改为样本均数向量总体均数改为总体均数向量样本方差改为样本协方差矩阵上式推广为HotellingT得:()多组比较多变量方差分析表变异来源自由度离均差平方和矩阵总变异HE组间g组内   统计量与F值统计量是一种广义方差比又称WilksLambda统计量当很小时说明组间差异H大于随机效应E应怀疑零假设。与F值关系反应变量数组数转化关系F分布自由度m=g>=m=g>=m>=g=m>=g=    重复测量资料的多变量分析轮廓分析二、回归与相关分析双变量回归与相关直线回归直线回归方程:残差:实测值Y与假定回归线上的估计值的纵向距离称为残差。各点残差要尽可能小一般采用各点残差平方和最小的直线。这就是“最小二乘”原则。其中。()回归方程的假设检验SS总=SS回SS残即:v总=v回v残v总=nv回=v残=n计算F统计量如下:对于这一假设是否成立可以进行t检验:()总体回归系数的可信区间直线相关()相关系数()相关系数的假设检验式中分母为相关系数的标准误。()决定系数数值大小反映了回归贡献的相对程度也就是在Y的总变异中回归关系所能解释的百分比。对直线回归拟合优度检验就等价于对总体回归系数的假设检验。统计量F为:注意:a直线相关用于说明两变量之间直线关系的方向和密切程度直线回归更进一步用于定量刻画应变量Y对自变量X在数值上的依存关系。b进行相关、回归分析前应先回执散点图。直线相关分析要求X与Y服从双变量正态分布直线回归要求至少对于每个X值相应的Y值要服从正态分布。c用残差图考查数据是否符合模型假设条件。残差图一般是将现有模型求出的各点残差作为纵坐标相应预测值或自变量取值作为横坐标。秩相关又称等级相关。属于非参数统计方法。Spearman秩相关基本思想:将n对观察值XiYi(i=,,…,n)分别由小到大编秩Pi表示Xi的秩Qi表示Yi的秩d=PiQi计算Spearman等级相关系数:值为正表示正相关为负表示负相关等于零表示零相关。样本等级相关系数rs是总体等级相关系数的估计值。检验是否不为可用查表法当n>计算u统计量得p值:相同秩较多时rs的校正式中t为X或Y中相同秩的个数。加权直线回归求解回归方程就要使得以下加权后的残差平方和最小:这样得到回归系数和常数项的计算公式为:假设检验:方差分析统计量其中两条回归直线的比较()两个回归系数的比较如果两条回归直线本身都是成立的考察在总体中它们是否平行。可以用F检验也可用等价t检验。()两个截距的比较当认为两条总体回归直线平行时如果能进一步认为其总体截距是相等的在两组数据的自变量取值范围接近时便可认为两条总体回归直线基本重合。曲线拟合当散点图中应变量Y和自变量X间表现出非线性趋势时可以通过曲线拟合的方法来刻画两变量间数量上的依存关系。常用:计算决定系数:协方差分析如何在比较两组或多组均数的同时扣除或均衡这些不可控制因素的影响可以考虑采用协方差分析的方法。协方差是用来度量两个变量之间“协同变异”大小的总体参数即二个变量相互影响大小的参数协方差的绝对值越大二个变量相互影响越大。基本思想:将那些定量变量X(指未加或难以控制的因素)对Y的影响看做协变量建立应变量Y随协变量X变化的线性回归关系并利用这种回归关系把X值化为相等后再进行各组Y的修正均数的比较其实质就是从Y的总平方和中扣除协变量X对Y的回归平方和对残差平方和作进一步分解后再进行方差分析以更好地评价处理因素效应。应用条件:正态分布方差齐性客观存在应变量对协变量的线性回归关系且斜率相同。首先需要对样本资料进行方差齐性检验和回归系数假设检验。完全随机设计资料的协方差分析随机区组设计资料的协方差分析详见“协方差分析ppt”多元线性回归分析分析一个因变量与多个自变量之间的线性关系。(连续数据)logistic回归分析因变量是分类变量(二分类、有序、无序多分类)分析因变量与多个自变量之间的线性关系。典型相关分析两组变量间的相关关系生存分析判别分析聚类分析主成分分析统计预测综合评价法多水平统计模型结构方程模型三医学科学研究设计量表资料分析的统计方法量表的信度分析()重测信度:指相同量表前后两次测量同一批被访者量表得分的简单相关系数r一般要求达到以上。()分半信度:相同量表的调查项目分成两半如分前后两个部分、按提问项目号的奇数和偶数分为两个部分计算两个部分得分的简单相关系数r分半信度为:()克朗巴赫系数:式中k为调查项目数为第i个调查项目得分的方差为量表总得分的方差一般认为系数应达到以上。实验研究设计样本含量的估计()样本均数与已知总体均数比较(或配对设计均数比较)n为所需样本含量配对设计时是对子数为总体标准差为研究者提出的差值为已知的总体均数为实验结果的总体均数和分别为与检验水准和Ⅱ型错误概率相对应的值。有单双侧之分只取单侧。实际工作中在未指定情况下可对进行适当假定来估算样本含量n如假定值为在假定的情况下用样本标准差代替。()两样本均数比较n和n分别为两样本所需样本含量为总体标准差(假设两总体标准差相等)为两总体均数之差值和分别为与检验水准和Ⅱ型错误概率相对应的值。有单双侧之分只取单侧。实际工作中在未指定情况下可对进行适当假定来估算样本含量n如假定值为在假定的情况下用样本标准差代替。

用户评价(0)

关闭

新课改视野下建构高中语文教学实验成果报告(32KB)

抱歉,积分不足下载失败,请稍后再试!

提示

试读已结束,如需要继续阅读或者下载,敬请购买!

文档小程序码

使用微信“扫一扫”扫码寻找文档

1

打开微信

2

扫描小程序码

3

发布寻找信息

4

等待寻找结果

我知道了
评分:

/34

医学统计学

VIP

在线
客服

免费
邮箱

爱问共享资料服务号

扫描关注领取更多福利