首页 卫生统计学6版重点总结

卫生统计学6版重点总结

举报
开通vip

卫生统计学6版重点总结第一章 绪论 一,名词解释 参数:根据总体分布的特征而计算的总体统计指标。 总体:研究目的确定的同质观察单位的全体。 同质:总体中个体具有相同的性质。 变异:同质基础上的个体差异。 样本:从总体中随机抽取的有代表性的一部分观察单位,其实测值的集合。 统计量:由总体中随机抽取样本而计算的相应样本指标。 抽样误差:由个体变异的存在和抽样引起样本统计量与相应的总体参数间以及各样本统计量之间的差别。 二,问答题。 1.统计学的基本步骤有哪些? 答:统计学是一门处理数据中变异性的科学与艺术,它包括收集数据、分析数据、解释数...

卫生统计学6版重点总结
第一章 绪论 一,名词解释 参数:根据总体分布的特征而计算的总体统计指标。 总体:研究目的确定的同质观察单位的全体。 同质:总体中个体具有相同的性质。 变异:同质基础上的个体差异。 样本:从总体中随机抽取的有代表性的一部分观察单位,其实测值的集合。 统计量:由总体中随机抽取样本而计算的相应样本指标。 抽样误差:由个体变异的存在和抽样引起样本统计量与相应的总体参数间以及各样本统计量之间的差别。 二,问答题。 1.统计学的基本步骤有哪些? 答:统计学是一门处理数据中变异性的科学与艺术,它包括收集数据、 分析 定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析 数据、解释数据,以及表达数据。 2.抽样误差产生的原因有哪些?可以避免抽样误差吗? 答:一,个体差异引起;二,抽样方法引起。抽样误差不能避免,但可以随着样本含量的增大而减小。 3.何为概率及小概率事件? 答:概率是指在一定条件下,重复做n次试验,nA为n次试验中事件A发生的次数,如果随着n逐渐增大,频率nA/n逐渐稳定在某一数值p附件,则数值p称为事件A在该条件下发生的概率。小概率事件是指习惯上将P<=0.05或P<=0.01称为小概率事件,表示某事件发生的可能性很小。 第二章 定量资料的统计描述 一、名词解释 频数:对一个随机事件进行反复观察,其中某变量值出现的次数被称为频数。 正偏态分布:偏态分布是相对于正态分布而言的,如果频数分布的高峰向左偏移,长尾向右侧延伸为正偏态分布也叫右偏态分布。 变异系数:是衡量资料中各观测值变异程度的一个统计量,用 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 差与平均数的比值来表示。 二、问答题。 1.描述数值变量资料集中趋势的指标有哪些?其适用范围有哪些? 答:常见的包括算术均数、几何均数、中位数。相同点:算数均数和中位数都适用于正态分布的资料。不同点:几何均数适用于可经对数转换为对称分布的资料;中位数适用于各种分布的资料,常用于描述偏峰分布的资料。 2.描述数值变量资料离散趋势的指标有哪些?其适用范围有何异同? 答:常见的包括:极差、四分位数间距、方差、标准差和变异系数。适用范围相同点:极差和四分位数间距可用于各种资料的分布;方差和标准差适用于对称分布,特别是正态分布的资料。不同点:极差易受样本含量的影响,很不稳定;四分位数间距特别适用偏峰分布资料;变异系数适用于量纲不同的变量间,或均数差别较大的变量间变异程度的比较。 3.统计表的列表原则是什么? 答:一是重点突出,简单明了;二是主谓分明,层次清楚,符合逻辑。 第三章 定性资料的统计描述 一,名词解释 率:指某现象实际发生观察单位数与可能发生该现象的观察单位总数之比,用以说明某现象发生的频率或强度。 构成比:是指事物内部某一组成部分观察单位数与该事物内部各组成部分观察单位总数之比,用以说明某一事物内部各组成部分所占的比重或分布,常用百分数表示。 相对比:是指两个有关联的指标之比,用以说明一个指标是另一个指标的几倍或几分之几。 标准化率:寻找一个统一的分布作为标准组,然后每个比较组均按该分布标准计算相应的率,所得到的率是相对于标准组的,故称为标准化率。 动态数列:按时间顺序将一系列统计指标(可以为绝对数,相对数或平均数)排列起来,用以观察和比较该事物在时间上的变化和发展趋势。 二、问答题 1.频率型指标与强度型指标的主要区别? 答:主要区别:指标的解释不同,频率型指标是表示事物内部某个组成部分所占的比重或分布,或指某现象发生的频率。强度型指标是指单位时间内某现象发生的频率。 2.标准化法的基本思想? 答:采用统一的标准,以消除重要因素的构成不同对粗率的影响,使通过标准化后的标准化率具有可比性。 3.应用相对数应注意的事项。 答:1.分析时不能以构成比代替率;2.应用相对数对比分析时,要考虑资料是否具有可比性;3.计算相对数时分母应有足够数量;4.对观察单位数不等的几个率,不能直接相加求其平均;5.样本率要检验。 4.应用标准化的注意事项。 答:1.标准化的应用范围很广,适用于“某事件的发生率”可以是治愈率,也可以是患病率,还可以是发病率、病死率等。当某个分类变量在两组中分布不同时,这个分类变量就成为两组频率比较的混杂因素,标准化法的目的就是消除这个混杂因素的影响。2.标准化后的标准化率,已经不再反映当时当地的实际水平,它只是表示相互比较的资料间的相对水平。3.标准化法的实质是找一个“标准“,使两组得以在一个共同的”平台“上进行比较。4.两样本标准化率是样本值,存在抽样误差。比较两样本的标准化率,当样本含量较小时,还应作假设检验。 第四章 常用概率分布 一、名词解释 正态分布:是一种很重要的连续型分布,以均数为中心,左右两侧对称,靠均数两侧的频数较多,离均数越远,频数越少,形成钟形分布。 Poisson分布:是一种离散型分布,用以在单位时间、空间、面积等的罕见时间发生次数的概率分布。 二项分布:对只有两种互斥结果的离散型随机事件的规律性进行描述的一种概率分布。 医学参考值范围:是指特定的“正常”人群(排除了对所研究指标有影响的疾病和有关因素的特定人群)的解剖、生理、生化指标及组织代谢产物含量等数据中大多数个体的取值所在的范围。人们习惯用该人群中95%的个体某项医学指标的取值范围作为该指标的医学参考值范围。 二、问答题 1.医学参考值范围确定的方法是什么? 答:百分位数法和正态分布法。 2.简述二项分布、Poisson分布、正态分布的区别与联系。 答:区别:二项分布、Poisson分布是离散型概率分布,用概率函数描述其分布状况,而正态分布是连续型概率分布,用密度函数和分布函数描述其分布状况。联系:Poisson分布可以视为n很大而π很小的二项分布。当n很大而π和1—π都不是很小的时候二项分布渐近正态分布,当λ》=20的时候Poisson分布渐近正态分布。 3.二项分布的特征? 答:二项分布图的高峰在μ=nπ处或附近;π为0.5时,图形是对称的;当π不等于0.5时,分布不对称,且对同一n,π离0.5愈远,对称性愈差。对同一π,随着n的增大,分布趋于对称。当n→∞时,只要π不太靠近0或1,二项分布趋于对称。 4.Poisson分布的特征? 答:(1)Poisson分布的总体均数与总体方差相等,均为λ。(2)当λ较小时,图形呈偏态分布;当λ较大时,图形呈正态分布。(3)Poisson分布的观察结果具有可加性。 5.正态分布曲线的位置与形状的特点? 答:(1)关于χ=μ对称。(2)在χ=μ处取得该概率密度函数最大值,在χ=μ±σ处有拐点。(3)曲线下面积为1。(4)μ决定曲线在横轴上的位置,μ增大,曲线沿横轴向右移;反之,μ减小,曲线沿横轴向左移。(5)σ决定曲线的形状,当μ恒定时,σ越大,数据越分散,曲线越“矮胖”; σ越小,数据越集中,曲线越“瘦高”。 第六章 参数估计基础 一、名词解释 抽样误差:从同一总体中反复多次地随机抽取样本量相同的若干份样本,由于受个体差异和偶然性的影响,样本统计量与总体参数之间可存在差异,称为抽样误差。 统计推断:抽样研究的目的是用样本信息来推断相应总体的特征,这一过程称为统计推断。 标准误SEM:样本均数的标准差,即均数的标准误。 置信区间CI:将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为总体参数的置信区间。 t分布:在实际的工作中,往往σ是未知的,常用s作为σ的估计值,为了与μ变换区别,称为t变换,统计量t值的分布称为t分布。 二、问答题 1.t分布图形的特征? 答:(1)单峰分布,以0为中心,左右对称;(2)ν越小,t值越分散,曲线的峰部越矮,尾部越高;(3)随着ν逐渐增大,t分布逐渐接近标准正态分布;当ν趋向∞时,t分布趋近标准正态分布。 2.样本均数的标准误的意义是什么?与原变量的标准差有何区别与联系? 答:样本均数的标准误可以反映样本均数之间的离散程度及抽样误差的大小。标准误与标准差的区别:(1)概念不同,标准差表示样本个体间的变异程度,标准误表示样本均数间的变异程度。(2)用途不同,标准差常用于表示变量值对均数波动的大小;标准误常用于表示样本统计值对总体参数的波动情况。(3)它们与样本含量n的关系不同,当样本含量n增大时,标准差趋近于σ,而标准误随n的增大而减小,趋近于0。 联系:(1)均是变异指标;(2)当样本量n一定时,标准误与标准差呈正比。 3.用同一个样本统计量分别估计总体参数的95%置信区间和99%置信区间,哪一个估计的精度更好?为什么? 答:95%置信区间的精度要好于99%置信区间。因为置信度或置信水平有95%提高到99%时,置信区间由窄变宽,估计的精度下降。 4.满足什么条件时可以采取正态近似法估计总体概率的置信区间? 答:当n足够大,且np与n(1—p)均大于5时,可用正态近似法求总体概率的置信区间。 5.参考值范围与置信区间有何区别? 答:区别:(1)意义不同:参考值范围是指通知总体中包括一定数量(如95%或99%)个体值的估计范围。可信区间是指按一定的可信度来估计总体参数所在范围。(2)计算方法不同。 第六章 假设检验基础 一、名词解释 检验效能:当所研究的总体与H0确有差别时,按检验水平α能够发现它(拒绝H0)的概率。(当两总体确有差异,按规定检验水准α所能发现该差异的能力。) 变量变换:对资料数据进行数学变换,使得变换后的资料符合参数方法条件的一种方法。 第Ⅰ型错误:如果实际情况与H0一致,仅仅由于抽样的原因,使得统计量的观察值落到拒绝域,拒绝原本正确的H0,导致推断结论错误,称为第Ⅰ型错误。 第Ⅱ型错误:如果实际情况与H0不一致,仅仅由于抽样的原因,使得统计量的观察值落到接受域,不能拒绝原本错误的H0,导致推断结论错误,称为第Ⅱ型错误。 二、问答题 1.假设检验的基本原理 答:采用逻辑上的反证法,利用“小概率思想”。小概率思想是是指概率事件(p<0.05或p<0.01)在一次试验中基本上不会发生。反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立;如可能性大,则还不能认为假设不成立。 2.假设检验的两类错误之间的区别与联系是什么? 答:假设检验时,拒绝实际上成立的H0,犯第Ⅰ类错误,俗称“弃真”错误;不拒绝实际上并不成立的H0,范第Ⅱ类错误,俗称“存伪”错误。犯第Ⅰ类错误错误的概率用α表示,假设检验时,根据研究者的要求来确定;犯第Ⅱ类错误的概率用β表示,它只有与特定的H1结合起来才有意义。对于某一具体的检验来说,当样本含量n一定时,α越小,β越大;α越大,β越小。 3.检验假设中P值的意义是什么? 答:如果总体状况与H0一致,统计量获得现有数值以及更不利于H0的数值的概率。 4.如何确定检验水准? 答:检验水准确定需根据研究 设计 领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计 的类型、研究目的、变量类型及变异水平、样本大小等诸多因素。 5.单双侧检验的选择依据 答:单侧与双侧检验的应用首先应考虑所要解决问题的目的,根据专业知识来确定。若从专业知识判断一种方法的结果不可能低于或高于另一种方法的结果时,可用单侧检验;在尚不能从专业知识判断两种结果谁高谁低时,则用双侧检验。一般认为双侧检验较保守和稳妥。 6.t检验的应用条件是什么? 答:(1)随机样本(2)来自正态分布总体(3)均数比较时,要求两总体方差相等。 7.应用假设检验的注意事项 答:1.要有严密的研究设计2.应用检验方法必须符合其适用条件3.适当选择检验水准α 4.正确理解P值的意义5.统计“显著性”与专业“显著性”。 第八章 方差分析 一、名词解释 方差分析:又称F检验,是通过对数据变异的分解来判断不同样本所代表的总体均值是否相同,用于比较两个或两个以上均数的差别。 二、问答题 1.方差分析的基本思想是什么? 答:方差分析的基本思想是把全部观察值间的变异按设计和需要分解成两个或多个组成部分,然后将各个部分的变异与随机误差进行比较,以判断各部分的变异是否具有统计学意义。 2.方差分析的应用条件是什么? 答:(1)各样本是相互独立的随机样本(2)都来自正态分布总体(3)相互比较的各样本的总体方差相等 3.完全随机设计和随机区组设计 (1)完全随机设计属单因素研究设计,它是将随机抽取的受试对象,随机地分配到两个或多个水平(处理)组中,观察和比较不同处理所产生的效应。分组时可采用简单随机化来实现,即将随机抽取的足够量的受试对象,按某种标识进行编号,采用随机数字表或随机函数法等,将受试对象分配到各组中。(2)随机区组设计也称配伍组设计,它是将受试对象按一定条件划分为若干个区组(配伍组),并将各区组内的受试对象随机地分配到各个处理组中的一种设计类型。与配对设计原理相同。随机区组设计的多个样本均数的比较可用无重复数据的两因素的方差分析。两个因素是指主要的研究因素(处理因素)和区组因素。按这两个因素纵横排列时,每个格子中仅有一个数据,故称无重复数据。 第八章 卡方检验 1.卡方检验的应用条件有哪些? 答:使用卡方检验在任何情况下都要注意理论频数T不能太小。一般要求各格的理论频数应大于1,且T<5的格子数不宜多于格子总数的1/5。如果理论频数太小,最好的办法是增加观察例数以增大理论频数。对于2×2列联表资料,若理论频数过小,而增加样本含量有困难,卡方检验不再适合,可以借助确切概率法比较两个频率。 2.卡方检验的用途。 答:χ2检验常用于分类变量资料的统计阶段。主要包括单样本分布的拟合优度;比较两个或多个独立样本频率或独立样本频率分布;比较配对设计两样本频率和两频率分布。 3.如果实验效应应用等级资料表示,欲比较两组总体效应间差别是否有统计学意义,为什么不能用χ2检验? 答:关键在于此时χ2检验差别有统计意义,只能推断两频率分布不同,而频率分布不同不能说明两总体平均水平不同。 第九章 基于秩次的非参数检验 一、名词解释 参数检验:凡是以特定的总体分布为前提,对未知的总体参数做推断的假设检验方法。 非参数检验:非参数检验对总体分布不作严格限定,不受总体分布的限制,又称任意分布检验,它直接对总体分布作检验。 二、问答题 1.非参数检验适用条件? 答:①等级资料。②总体分布类型不明的资料。③分布不对称且无法转化为正态分布的资料。④对比组间方差不齐,又无适当变换方法达到方差齐性的资料。⑤一端或两端观察值不确切的资料或个别数据偏离过大。 2.秩和检验有哪些优缺点? 答:其主要的优点:①对样本所来自的总体分布没有要求②收集资料方便③简便易于理解和掌握。主要缺点:损失部分信息,降低检验功效。 3.两组或多组有序分类资料的比较,为什么宜用秩和检验而不是χ2检验? 答:指标为等级资料,宜用多组有序变量资料的秩和检验;若采用列联表χ2检验进行分析,其比较的就不再是实验效应,而是几组资料的间的分布有无差别,即比较几类资料构成比总体上有无不同,所以不能用χ2检验。 4.两独立样本比较的Wilcoxon秩和检验,当n1>10或n2—n1>10时用Z检验,这时检验是属于参数检验还是非参数检验,为什么? 答:属于非参数检验,因为这时的Z检验是比较例数较小组秩和与其总体均数n(N+1)/2的差别。 第十章 两变量关联性分析 线性相关系数:又称Pearson积距相关系数,是定量描述两个变量间线性关系密切程度和相关方向的统计指标。 二、问答题 1.线性相关中应注意的问题? 答:(1)散点图(2)线性相关分析要求两变量都是随机变量,且仅适用于二元正态分布资料(3)出现异常值时慎用相关(4)相关关系不一定是因果关系(5)分层资料盲目合并易出假象。 2.Pearson积距相关与Spearman等级相关有何异同? 答:Pearson积距相关与Spearman等级相关的应用条件不同,前者要求数据服从二元正态分布,属于参数方法;而后者可不满足正态分布条件,为非参数法;相同点都是用来解决两变量间的线性相关程度的大小,相关系数的含义、单位、取值范围一致,且计算公式相同,不过一个直接用原始的定量数据,另一个则要用等级数据。 第十一章  简单回归分析 一,名词解释 线性回归:是利用数理统计中的回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法之一。 决定系数:回归平方和与总离均差平方和之比称为决定系数。 二,问答题 1.  线性回归模型的适用条件 答:(1)因变量Y与自变量X呈线性关系(2)每个个体观察值之间相互独立(3)在一定范围内,任意给定X值,其对应的随机变量Y均服从正态分布(4)在一定范围内,不同的X值所对应的随机变量Y的方差相等 2. Ⅰ型回归和Ⅱ型回归的区别与联系? 答:前者要求Y为随机变量,服从正态分布,X可人为取值;后者X,Y均为随机变量,均服从正态分布。 3.  置信带的意义是什么? 答:在满足线性回归的假设条件下,可以认为真实的回归直线落在两条弧形曲线所形成的区带内,其置信度为1—α。 4.  线性回归分析中应该注意哪些问题? 答:(1)作简单线性回归分析要有实际意义,不要把豪无关联的两种现象强加在一起作回归分析。在理论上,任何成对的两组数据都可以获得一个唯一的线性回归方程,并有可能作回归系数的假设检验有统计学意义。(2)在作线性回归分析前,一定要绘制散点图,观察全部数据点的分布趋势,只有存在线性趋势时,才可以进行线性回归分析。(3)线性回归方程的适用范围一般以自变量的取值范围为限,若无充分理由证明超过自变量取值范围仍是直线,应该避免外延。(4)作线性回归分析有统计学意义不等于有实际意义,考察线性回归方程的实际效果用决定系数R2的大小,而不是线性回归分析的假设检验的概率P值。 5.  简述线性相关与线性回归的区别与联系? 答:联系:①r(相关系数)与b(回归系数)可相互换算;②r与b的假设检验等价;③r与b正负号一致;④回归可解释相关,相关系数的平方r(对称决定系数)是回归平方与总的离均差平方和之比,故回归平方和是引入相关变量后总平方和减少的部分tr=tb= 。区别:①资料要求上相关X,Y正态分布,回归Y正态分布;②应用上:相关说明相关关系,回归说明依存关系。③意义上:r说明两变量关系程度与方向b表示x增或改变,使Y改变b个单位;㈣计算上:b=Lαy/Lαx, r=Lxy/ ;⑤取值范围:-∞<b>+∞,-1≤r≤1;⑥单位:b有单位,r无单位。 第十四章  实验设计 1.实验研究和调查研究的根本目的在于研究者是否人为地设置处理因素,即是否对研究对象施加了干预 措施 《全国民用建筑工程设计技术措施》规划•建筑•景观全国民用建筑工程设计技术措施》规划•建筑•景观软件质量保证措施下载工地伤害及预防措施下载关于贯彻落实的具体措施 。试验研究中研究者可以主动施加干预措施,控制非试验因素的干扰,而调查研究则知识客观地放映事物的实际情况,未给予任何的干预措施。 2. 实验设计的基本要素:研究假说,研究对象,研究因素,结局指标,调查表 3.使用安慰剂的目的在于消除受试对象和试验观察者由于主观因素造成的偏倚,以及对试验结果的人为干扰,保证试验的可靠性。一般在临床双盲试验中使用。 4. 随机化使非处理因素在实验组和对照组中的影响相当,因此提高了对比组间的可比性,使试验结论的外推具有科学性和可靠性。随机化是对资料进行统计推断的前提。 5. 实验研究样本含量估计的四要素是:欲比较的两总体参数的差值δ、有关总体变异性的信息、第Ⅰ类错误概率的大小α以及第Ⅱ类错误概率的大小β或检验功效1—β。
本文档为【卫生统计学6版重点总结】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_482581
暂无简介~
格式:doc
大小:35KB
软件:Word
页数:0
分类:小学体育
上传时间:2019-07-23
浏览量:58