null第六章 抽样分布与参数估计第六章 抽样分布与参数估计第一节 频率、概率与概率分布
第二节 抽样分布
第三节 总体参数估计
第一节 频率、概率与概率分布第一节 频率、概率与概率分布一、随机事件与概率
(一)随机试验与事件
随机现象的特点是:在条件不变的情况下,一系列的试验或观测会得到不同的结果,并且在试验或观测前不能预见何种结果将出现。对随机现象的试验或观测称为随机试验,它必须满足以下的性质:
(1)每次试验的可能结果不是唯一的;
(2)每次试验之前不能确定何种结果会出现;
(3)试验可在相同条件下重复进行。null在随机试验中,可能出现也可能不出现的结果,称之为随机事件,简称事件。试验的结果可能是一个简单事件,也可能是一个复杂事件。简单事件就是不可以再分解的事件,又称为基本事件。复杂事件是由简单事件组合而成的事件。基本事件还可称为样本点,设试验有n个基本事件,分别记为 (i=1,2,…,n)。集合Ω={ω1 ,ω2 , … ,ωn}称为样本空间,Ω中的元素就是样本点。null 例:投掷一粒均匀的六面体骰子,出现的点数有可能是1、2、3、4、5、6共六种。这六种结果是基本结果,不可以再分解成更简单的结果了,所以Ω={1,2,3,4,5,6}为该试验的样本空间。“出现点数是奇数”这一事件就不是简单事件,它是由基本事件{1},{3}和{5}组合而成的。我们通常用大写字母A,B,C,…来
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
示随机事件,例如,设A表示“出现点数是奇数”,则A={1,3,5};设B表示“出现点数是偶数”,则B={2,4,6}。null(二)概率
1. 概率的定义
概率就是指随机事件发生的可能性,或称为机率,是对随机事件发生可能性的度量。 进行n次重复试验,随机事件A发生的次数是m次,发生的频率是m/n,当试验的次数n很大时,如果频率在某一数值p附近摆动,而且随着试验次数n的不断增加,频率的摆动幅度越来越小,则称p为事件A发生的概率,记为:P(A)=p。在古典概型场合, 即基本事件发生的概率都一样的场合:null例:设一个袋子中装有白球2个,黑球3个。(1) 从中随机摸出1只球,问刚好是白球的概率有多大? (2) 从中随机摸出2只球,一问2只球都是白球的概率有多大? 二问2只球一白一黑的概率有多大? 三问2只球都是黑球的概率有多大?
解:(1) 由于摸出的任何1只球都形成一个基本事件,所以样本点总数为n=5。用A表示摸出的是白球事件,则A由两个基本点组成,即A={白球,白球},有利场合数m=2。因此,刚好摸出白球的概率为P(A)=m/n=2/5=0.4null (2) 由于摸出2只球才成一个基本事件,所以样本点总数为 故
P(A)=P(2只球都是白球)=1/ =1/10
P(B)=P(2只球一白一黑)=2×3/10=6/10
P(C)=P(2只球都是黑球)=3/10
NOTE: P(A+B+C)=1
null 2. 概率的基本性质
性质1 1≥P(A)≥0。
性质2 P(Ω)=1。
性质3 若事件A与事件B互不相容,即AB=Ф,则P(A∪B)=P(A)+P(B)。
推论1 不可能事件的概率为0,即:P(Ф)=0。
推论2 P( )=1-P(A), 表示A的对立事件,即它们二者必有一事件发生但又不能同时发生。null例:袋中装有4只黑球和1只白球,每次从袋中随机地摸出1只球,并换入1只黑球。连续进行,问第三次摸到黑球的概率是多少?
解: 记A为“第三次摸到黑球”,则 为“第三次摸到白球”。先计算P( )。
由于袋中只有1只白球,如果某一次摸到了白球,换入了黑球,则袋中只有黑球了。所以相当于第一、第二次都是摸到黑球,第三次摸到白球。注意这是一种有放回的摸球,样本点总数为53,有利场合数是42×1。故:
P( )= ,
所以 null3. 事件的独立性
定义 对事件A与B,若p(AB)=p(B)p(A),则称它们是统计独立的,简称相互独立。
例:已知袋中有6只红球, 4只白球。从袋中有放回地取两次球,每次都取1球。设 表示第i次取到红球。那么,
因此, ,
也就是说,B1,B2相互独立。从
题
快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题
目条件看,这一结论是显然的。二、随机变量二、随机变量随机变量X是定义在样本空间 Ω={ω1,ω2,…,ωn}上的一个函数,这个函数的取值随试验的结果不同而变化。这个函数还要求满足条件:对任意的实数x,X
表格
关于规范使用各类表格的通知入职表格免费下载关于主播时间做一个表格详细英语字母大小写表格下载简历表格模板下载
统一表示出来是:null X x1 x2 … xn …
P p(x1) p(x2) … p(xn) …
这称为离散型随机变量X的概率分布。
性质:(1) 0≤p(xi)≤1 (i=1,2, …);
(2)
定义: 离散型随机变量X的期望值为
性质:
其中X1,X2都是随机变量,α,β是任意常数。 null定义: 离散型随机变量X的方差为
方差的平方根σ称为
标准
excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载
差。
方差σ2或标准差σ反映随机变量X相对其期望值的
离散程度,σ2或σ越小, 说明期望值的代表性越好;σ2或σ越大,说明期望值的代表性越差。
性质:对于任意的α,D(αX)=α2 D(X) 成立null贝努里试验 与二项分布
有时我们只对试验中某事件A是否出现感兴趣,如果A发生,我们称“成功”,否则称“失败”。像这样只有两种结果的试验称为贝努里试验。设A出现的概率为p,我们独立地重复进行n次贝努里试验,称为n重贝努里试验.以Bk表示n重贝努里试验中事件A正好出现k次这一事件,则
(k=0,1,2,…,n)
该分布称为二项分布( q= 1- p ).
NOTE:
null2. 连续型随机变量的概率分布
设X是R.V., x 是一实数. 记
F(x)=P(X例1:英语六级未通过率<1>假设某大学的学生在毕业时尚未通过六级的比率为,现从中随机抽取100人调查其档案,发现其中有10人六级没过,试用极大似然法估计总体参数。例1:英语六级未通过率<2>例1:英语六级未通过率<2>解:若六级通过用“0”表示,未通过用“1”表示,则总体X的分布为 则样本观察值的联合分布(似然函数)为两边取对数得对数似然函数为:解得:(2)矩估计法(2)矩估计法矩估计法的基本思路
用样本的矩作为相应(同类、同阶)总体矩的估计,通过原点矩法和中心矩法来实现对矩估计量的求解。
null矩估计法的求解过程
—写出总体K阶原点距和总体K阶中心距
—写出样本K阶原点距和样本K阶中心距
—利用样本原点矩去估计总体原点矩,利用样本中心矩去估计总体中心矩,进而根据总体中参数的个数(假设为k个)来确定需要构造方程的个数(即最高阶数为k,每阶可构造一个方程)进行求解 优良估计量标准优良估计量标准优良估计标准:
无偏性:要求样本统计量的平均数等于被估计的总体参数本身。
一致性:当样本容量充分大时,样本统计量充分靠近总体参数本身。
有效性:
总体方差的无偏估计量为样本方差点估计完全正确的概率通常为0。因此,我们更多的是考虑用样本统计量去估计总体参数的范围 区间估计。 三、参数区间估计三、参数区间估计参数区间估计的含义:估计总体参数的区间范围,并给出区间估计成立的概率值。
其中: 1-α(0<α<1)称为置信度;α是区间估计的显著性水平,其取值大小由实际问题确定,经常取1%、5%和10%。注间对上式的理解:
例如抽取了1000个样本,根据每一个样本均构造了一个置信区间,,这样,由1000个样本构造的总体参数的1000个置信区间中,有95%的区间包含了总体参数的真值,而5%的置信区间则没有包含。这里,95%这个值被称为置信水平(或置信度)。
一般地,将构造置区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平。null我们用95%的置信水平得到某班学生考试成绩的置信区间为60-80分,如何理解?
错误的理解:60-80区间以95%的概率包含全班同学平均成绩的真值;或以95%的概率保证全班同学平均成绩的真值落在60-80分之间。
正确的理解:如果做了多次抽样(如100次),大概有95次找到的区间包含真值,有5次找到的区间不包括真值。
真值只有一个,一个特定的区间“总是包含”或“绝对不包含”该真值。但是,用概率可以知道在多次抽样得到的区间中大概有多少个区间包含了参数的真值。
如果大家还是不能理解,那你们最好这样回答有关区间估计的结果:
该班同学平均成绩的置信区间是60-80分,置信度为95%。区间估计的基本要素区间估计的基本要素包括:样本点估计值、抽样极限误差、估计的可靠程度
样本点估计值
抽样极限误差:可允许的误差范围。
抽样估计的可靠程度(置信度、概率保证程度)及概率度
注意:本教材所进行的区间估计仅指对总体平均数或成数的区间估计,并且在际计算过程中使用下面的式子。式中Δ是极限误差。区间估计的内容区间估计的内容平均数的区间估计 平均数的区间估计 对总体平均数或成数的区间估计时,使用下面的式子
(式中Δ是极限误差)
有两种模式:
1、根据置信度1-α,求出极限误差Δ,并指出总体平均数的估计区间。
2、给定极限误差,求置信度。平均数区间估计—第1种模式(求置信区间)平均数区间估计—第1种模式(求置信区间)
当σ已知时,根据相关的抽样分布定理, 服从标准正态分布 N(0,1)。查正态分布概率表, 可得 (一般记为 ),则 ,根据重复抽样与不重复抽样的 求法的不同,进一步可得总体平均数的估计区间:
重复抽样时,区间的上下限为:
不重复抽样时,区间的上下限为:null平均数区间估计—第1种模式(求置信区间)平均数区间估计—第1种模式(求置信区间)
若总体方差未知,则在计算 时,使用样本方差代替总体方差,此时 服从自由度为n-1的t分布。查t分布表可得 ,并记为
于是:
重复抽样时,区间的上下限为:
不重复抽样时,区间的上下限为:大样本时,t分布与标准正态分布非常接近,可直接从标准正态分布表查临界值例:总体平均数的区间估计1例:总体平均数的区间估计1对某型号的电子元件进行耐用性能检查,抽查资料分组如下表,要求估计该批电子元件的平均耐用时数的置信区间(置信度95%)。对总体均值区间估计的进一步理解对总体均值区间估计的进一步理解68.27%的样本表示样本均值落在…区间的概率是1-α,例平均数区间估计—第2种模式(求置信度)平均数区间估计—第2种模式(求置信度)给定极限误差,求置信度例:总体平均数的区间估计2例:总体平均数的区间估计2例:经抽样调查计算样本亩产粮食600公斤,并求得抽样平均误差为3公斤,现给定允许极限误差为6公斤,求置信区间包含总体平均亩产的概率,即求置信水平。
结果表明,如果多次反复抽样,每次都可以由样本值确定一个估计区间,每个区间或者包含总体参数的真值,或者不包含总体参数的真值,包含真值的区间占F(z),即每一万次抽样,就有9545个样本区间包括总体亩产,其余455个样本区间不包括总体平均数,即若接受估计区间的判断要冒4.55%的机会犯错误的风险。成数的区间估计成数的区间估计由于总体的分布是(0,1)分布,只有在大样本的情况下,才服从正态分布。总体成数可以看成是一种特殊的平均数,类似于总体平均数的区间估计,总体成数的区间估计的上下限是:
注意:在实践中,由于总体成数常常未知,这时,抽样平均误差公式中的总体成数用样本成数代替。
大样本的条件:np≥5且n(1-p) ≥5,由于总体成数p通常未知,可以用样本成数来近似判断。例:总体平均数的区间估计3例:总体平均数的区间估计3对某型号的电子元件进行耐用性能检查,抽查资料分组如下表, 设该厂的产品质量检验标准规定,元件耐用时数达到1000小时以上为合格品。要求估计该批电子元件的合格率,置信水平95%。总体均值区间估计总结总体均值区间估计总结如果是正态总体null 如果不是正态总体,或分布未知
此时不考虑小样本情况因此,大样本情况下,直接用标准正态分布求置信区间即可。总体成数估计区间估计总结总体成数估计区间估计总结总体成数估计区间的上下限
只考虑大样本情况(请记住大样本条件)
对总量指标的区间估计对总量指标的区间估计在对总体平均数进行区间估计的基础上,可进一步推断相应的总量指标,即用总体单位总数N分别乘以总体平均数的区间下限和区间上限,便得到相应总量(Nμ)的区间范围。例1例1某厂对一批产品的质量进行抽样检验,采用重复抽样抽取样品200只,样本优质率为85%,试计算当把握程度为90%时优质品率的区间范围。例2例2某商场从一批食品(共800袋)中随机抽取40袋(假设用重复抽样),测得每袋平均重量为791.1克,标准差为17.136克,要求以95%的把握程度,估计这批食品的平均每袋重量以及这批食品总重量的区间范围。
[800*778.84,800*803.36],即[623072,642688] 三、样本容量确定三、样本容量确定什么是样本容量确定问题?确定样本容量确定样本容量在
设计
领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计
抽样时,先确定允许的误差范围和必要的概率保证程度,然后根据历史资料或试点资料确定总体的标准差,最后来确定样本容量。确定样本容量应注意的问题确定样本容量应注意的问题计算样本容量时,一般总体的方差与成数都是未知的,可用有关资料替代:
一是用历史资料已有的方差与成数代替;
二是在进行正式抽样调查前进行几次试验性调查,用试验中方差的最大值代替总体方差;
三是成数方差在完全缺乏资料的情况下,就用成数方差的最大值0.25代替。
如果进行一次抽样调查,同时估计总体均值与成数,用上面的公式同时计算出两个样本容量,可取一个最大的结果,同时满足两方面的需要。
上面的公式计算结果如果带小数,这时样本容量不按四舍五入法则取整数,取比这个数大的最小整数代替。例如计算得到:n=56.03,那么,样本容量取57,而不是56。 例:确定样本容量1例:确定样本容量1对某批木材进行检验,根据以往经验,木材长度的标准差为0.4米,而合格率为90%。现采用重复抽样方式,要求在95.45%的概率保证程度下,木材平均长度的极限误差不超过0.08米,抽样合格率的极限误差不超过5%,问必要的样本单位数应该是多少?例:确定样本容量2例:确定样本容量2对某批木材进行检验,根据以往经验,木材的合格率为90%、92%、95%。现采用重复抽样方式,要求在95.45%的概率保证程度下,抽样合格率的极限误差不超过5%,问必要的样本单位数应该是多少?