教学单元案例: 参数估计与假设检验
北京化工大学 李志强
教学内容:统计量、抽样分布及其基本性质、点估计、区间估计、假设检验、方差分析
教学目的:统计概念及统计推断方法的引入和应用
(1)理解总体、样本和统计量等基本概念;了解常用的抽样分布;
(2)熟练掌握矩估计和极大似然估计等方法;
(3)掌握求区间估计的基本方法;
(4)掌握进行假设检验的基本方法;
(5) 掌握进行方差分析的基本方法;
(6)了解求区间估计、假设检验和方差分析的MATLAB命令
。
教学难点:区间估计、假设检验、方差分析的性质和求法
教学时间:150分钟
教学对象:大一各专业皆可用
一、统计问
题
快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题
引例
例1 已知小麦亩产服从正态分布,传统小麦品种平均亩产800斤,现有新品种产量未知,试种10块,每块一亩,产量为:
775,816,834,836,858,863,873,877,885,901
问:新产品亩产是否超过了800斤?
例2 设有一组来自正态总体
的样本0.497, 0.506, 0.518, 0.524, 0.488, 0.510, 0.510, 0.512.
(i) 已知
=0.012,求μ的95%置信区间;
(ii) 未知
,求μ的95%置信区间;
(iii) 求
的95%置信区间。
例3现有某型号的电池三批, 分别为甲乙丙3个厂生产的, 为评比其质量, 各随机抽取5只电池进行寿命测试, 数据如下表示, 这里假设第
种电池的寿命
.
工厂
寿命/h
甲
乙
丙
40
26
39
48
34
40
38
30
43
42
28
50
45
32
50
(1) 试在检验水平
下,检验电池的平均寿命有无显著差异?
(2) 利用区间估计或假设检验比较哪个寿命最短.
二 统计的基本概念: 总体、个体和样本
(1)总体与样本
总体 在数理统计中,我们将研究对象的某项数量指标的值的全体称为总体,总体中的每个元素称为个体
比如,对电子元件我们主要关心的是其使用寿命.而该厂生产的所有电子元件的使用寿命取值的全体,就构成了研究对象的全体,即总体,显然它是一个随机变量,常用X表示
为方便起见,今后我们把总体与随机变量X等同起来看,即总体就是某随机变量X可能取值的全体.它客观上存在一个分布,但我们对其分布一无所知,或部分未知,正因为如此,才有必要对总体进行研究.
简单随机样本
对总体进行研究,首先需要获取总体的有关信息. 一般采用两种方法:
一是全面调查.如人口普查,该方法常要消耗大量的人力、物力、财力.有时甚至是不可能的,如测试某厂生产的所有电子元件的使用寿命.
二是抽样调查. 抽样调查是按照一定的方法,从总体X中抽取n个个体.这是我们对总体掌握的信息.数理统计就是要利用这一信息,对总体进行分析、估计、推断.因此,要求抽取的这n个个体应具有很好的代表性.
按机会均等的原则随机地从客观存在的总体中抽取一些个体进行观察或测试的过程称为随机抽样.从总体中抽出的部分个体,叫做总体的一个样本.
从总体中抽取样本时,不仅要求每一个个体被抽到的机会均等,同时还要求每次的抽取是独立的,即每次抽样的结果不影响其他各次的抽样结果,同时也不受其他各次抽样结果的影响.这种抽样方法称为简单随机抽样.由简单随机抽样得到的样本叫做简单随机样本.往后如不作特别说明,提到“样本”总是指简单随机样本.
从总体X中抽取一个个体,就是对随机变量X进行一次试验.抽取n个个体就是对随机变量X进行n次试验,分别记为X1,X2,…,Xn.则样本就是n维随机变量(X1,X2,…,Xn).在一次抽样以后, (X1,X2,…,Xn)就有了一组确定的值(x1,x2,…,xn),称为样本观测值.样本观测值(x1,x2,…,xn)可以看着一个随机试验的一个结果,它的一切可能结果的全体构成一个样本空间,称为子样空间.
(2)样本函数与统计量
设
为总体的一个样本,称
(
)
为样本函数,其中
为一个连续函数。如果
中不包含任何未知参数,则称
(
)为一个统计量。
2、统计量
(1)常用统计量
样本均值
样本方差
(与概率论中的方差定义不同)
样本标准差
样本k阶原点矩
样本k阶中心矩
(二阶中心矩
与概率论中的方差定义相同)
例6.2:用测温仪对一物体的温度测量5次,其结果为(℃):1250,1265,1245,1260,1275,求统计计量
,S2和S的观察值
(2)统计量的期望和方差
,
,
,
,
其中
,为二阶中心矩。
,i.i.d,独立同分布。无限总体抽样。
(3) 随机数生成
在Matlab中各种随机数可以认为是独立同分布的,即简单随机样本。以下罗列在Matlab中的实现方法。
,均匀分布样本
n=10;x=rand(1,n)
n=10;a=-1;b=3;x=rand(1,n);x=(b-a)*x+a
,正态分布样本
n=10;x=randn(1,n)
mu=80.2;sigma=7.6;m=1;n=10;
x=normrnd(mu,sigma,m,n)
上面首先对总体均值赋值mu=80.2;再对标准差赋值sigma=7.6; m=1;n=10;分别对生成的随机阵对的行数和列数进行赋值,然后可直接利用Matlab自带的函数normrnd生成正态分布的随机数。
类似地可生成m行n列的随机矩阵,服从指定的分布。生成随机数的函数后缀都是rnd,前缀为分布的名称。常用分布的随机数产生方法罗列如下,注意使用前先要对参数赋值。
x=betarnd(a,b,m,n) 参数为a,b的beta分布;
x=binornd(N,p,m,n) 参数为N,p的二项分布;
x=chi2rnd(N,m,n) 自由度为N的
分布;
x=exprnd(mu,m,n) 总体期望为mu的指数分布;
x=frnd(n1,n2,m,n) 自由度为n1与n2的F分布;
x=gamrnd(a,b,m,n) 参数为a,b的
分布;
x=lognrnd(mu,sigma,m,n) 参数为mu与sigma的对数正态分布;
x=poissrnd(mu,m,n) 总体均值为mu的Poisson分布;
x=trnd(N,m,n) 自由度为N的T分布;
Matlab统计工具箱中还有一些其它分布,不再一一列举。
3、三个抽样分布(χ2、t、F分布)
1.3 三个常用分布
以下罗列出数理统计中三个重要分布的概念与性质。
1.3.1
分布
定义1.2 设一维连续型随机变量
的密度函数为
(1-2)
则称
服从自由度为
的
分布,记为
。
图1-2
分布密度函数示意图
(1)期望与方差:
,
(2)来源:若
独立同分布,则
(3)可加性:若
,
,且两者独立,则有
(4)重要结论:若
,则
以下给出了自由度为5,10,20的
分布的密度函数,如图1-2所示。
1.3.2 t分布
定义1.3 设一维连续型随机变量
的密度函数为
(1-3)
则称
服从自由度为
的
分布,记为
。
图1-3 t分布密度函数与标准正态分布密度函数
(1)密度函数特点:与标准正态分布类似,方差较大。
时,
(标准正态分布密度函数)
(2)来源:设
,
,且两者独立,则
(3)重要结论:设
,则
1.3.3 F分布
定义1.4 设一维连续型随机变量
的密度函数为
(1-4)
其中常数
则称
服从第一自由度
,第二自由度
的F分布,记为
。
(1)密度函数特点:在
附近密度函数取值较大,为单峰非对称的。当两个自由度都很大时,
取值以较大概率集中在
附近。以下画出了
的密度函数
图1-4 F分布密度函数
(2)来源:设
,
,且两者独立,则
(3)重要结论:设
为来自总体
的简单随机样本,
为来自总体
的简单随机样本,且两者独立。又设两个样本方差分别为
与
,则
三、点估计的两种方法
(1)矩法
所谓矩法就是利用样本各阶原点矩代替相应的总体矩,来建立估计量应满足的方程,从而求得未知参数估计量的方法。
设总体X的分布中包含有未知数
,则其分布函数可以表成
显示它的k阶原点矩
中也包含了未知参数
,即
。又设
为总体X的n个样本值,其样本的k阶原点矩为
这样,我们按照“当参数等于其估计量时,总体矩等于相应的样本矩”的原则建立方程,即有
由上面的m个方程中,解出的m个未知参数
即为参数(
)的矩估计量。
例7.1:设总体
,求对
的矩估计量。
(2)最大似然法
所谓最大似然法就是当我们用样本的函数值估计总体参数时,应使得当参数取这些值时,所观测到的样本出现的概率为最大。
当总体X为连续型随机变量时,设其分布密度为
,其中
为未知参数。又设
为总体的一个样本,称
为样本的似然函数,简记为Ln.
当总体X为离型随机变量时,设其分布律为
,则称
为样本的似然函数。
若似然函数
在
处取到最大值,则称
分别为
的最大似然估计值,相应的统计量称为最大似然估计量。我们把使Ln达到最大的
分别作为
的估计量的方法称为最大似然估计法。
由于lnx是一个递增函数,所以Ln与lnLn同时达到最大值。我们称
为似然方程。由多元微分学可知,由似然方程可以求出
为
的最大似然估计量。
容易看出,使得Ln达到最大的
也可以使这组样本值出现的可能性最大。
2、估计量的评选标准
(1)无偏性
定义1.5 设总体
含有未知参数
,
为来自总体的简单随机样本,又设
为
的一个估计量。若在给定范围内无论
如何取值,总有
,则称
为
的一个无偏估计量;若
,则称
为
的一个有偏估计量。
注意无偏估计的含义是:由于样本的随机性,估计值有时候偏大,有时候偏小,多次估计的平均值才能靠近真实的未知参数值。
若总体X的均值E(X)和方差D(X)存在,则样本均值
和样本方差S2分别为E(X)和 D(X)的无偏估计,即
E(
)=E(X), E(S2)=D(X)。
无论无偏估计还是有偏估计,可以统一使用“均方误差”MSE评价:
(2-1)
对于无偏估计,
,但
可能很大,果真如此,它就不是一个好的估计量。反之,对于有偏估计,虽然
,但如果与
相加之后
仍然较小,则它就是一个较好的估计量。
例2.1 设总体
,
为来自总体的简单随机样本,欲估计总体均值
(注意
未知),比较以下三个点估计量的好坏:
,
,
解 本例题给出了利用MSE评价点估计量的随机模拟方法。由于
的总体均值为
,因此我们可以先取定一个固定值,例如
,然后在这个参数已知且固定的总体中抽取容量为20的样本,分别用样本值依照三种方法分别计算估计值(注意谁也别偷看底牌
),看看哪种方法误差大,哪种方法误差小。一次估计的比较一般不能说明问题,正如低手射击也可能命中10环,高手射击也可能命中9环。如果连续射击1万次,比较总环数(或平均环数),多者一定是高手。同理,如果抽取容量为20的样本
次,分别计算
小者为好。
N=10000; m=5; n=20;
mse1=0; mse2=0; mse3=0;
for k=1:N
x=chi2rnd(m,1,n);
m1=101*x(1)-100*x(2);
m2=median(x);
m3=mean(x);
mes1=mse1+(m1-m)^2;
mes2=mse2+(m2-m)^2;
mes3=mse3+(m3-m)^2;
end
mse1=mes1/N
mse2=mes2/N
mse3=mes3/N
以上程序保存为ex21.m,命令窗口中键入ex21,运算结果为
mse1 =
58.1581
mse2 =
7.8351e-005
mse3 =
9.4469e-006
可见第一个虽为无偏估计量,但MSE极大,表现很差。第二个虽为有偏估计,但表现与第三个相差不多,也是较好的估计量。另外,重复运行ex21,每次的结果是不同的,但优劣表现几乎是一致的。
例2.2 设
为来自
上服从均匀分布的总体的简单随机样本,容易得到未知参数的矩估计量
,最大似然估计量
,试用随机模拟的方法比较两者的优劣。
解 不妨设
,以下程序给出了两者的评价。
s=5;
N=10000;
mse1=0; mse2=0;
for k=1:N
x=5.*rand(1,50);
s1=2*mean(x);
s2=max(x);
mse1=mse1+(s1-s)^2;
mse2=mse2+(s2-s)^2;
end
mse1=mse1/N; mse2=mse2/N;
[mse1,mse2]
参考运行结果: 0.1655 0.0186
本例中,最大似然估计精度较高。注意矩法估计量是无偏估计,本例中最大似然估计量显然是有偏估计,且一定是偏小的。
(2)有效性
设
和
是未知参数
的两个无偏估计量。若
,则称
有效。
例7.2:设
是总体的一个样本,试证下列式子并比较有效性。
(1)
(2)
(3)
(3)一致性(相合性)
设
是
的一串估计量,如果对于任意的正数
,都有
则称
为
的一致估计量(或相合估计量)。
3、 区间估计
所谓区间估计,就是用两个估计量
与
估计未知参数
,使得随机区间
能够包含未知参数的概率为指定的
。即:
称满足上述条件的区间
为
的置信区间,称
为置信水平。
称为置信下限,
称为置信上限。
3.1 单正态总体均值的置信区间
(1)方差
已知情形
查表求
满足:对于
,
。(上分位数 )
对于总体
中的样本
,
的置信区间为:
(2-4)
其中
可以用norminv(1-a /2)计算。
例2.3 设
1.1, 2.2, 3,3, 4.4, 5.5
为来自正态总体
的简单随机样本,求
的置信水平为95%的置信区间。
解 以下用Matlab命令计算:
x=[1.1,2.2,3.3,4.4,5.5];
n=length(x);
m=mean(x);
c=2.3/sqrt(n);
d=c*norminv(0.975);
a=m-d; b=m+d;
[a,b]
计算结果为 1.2840 5.3160
(2)方差
未知情形
对于总体
中的样本
,
的置信区间为:
(2-4)
其中
为自由度
的
分布临界值。
数据同上,继续利用Matlab计算
S=std(x); dd=S*tinv(0.975,4)/sqrt(n);
aa=m-dd; bb=m+dd; [aa,bb]
结果为 1.1404 5.4596
3.2 单正态总体方差的置信区间
由于
,查表求临界值
与
,使得
则
的置信区间为
(2-5)
其中查表可用chi2inv进行。数据同上,以下求
的置信区间。
c1=chi2inv(0.025,4);
c2=chi2inv(0.975,4);
T=(n-1)*var(x);
aaa=T/c2; bbb=T/c1;
[aaa,bbb]
计算结果为 1.0859 24.9784
3.3 两正态总体均值差的置信区间
(1)方差已知情形
设
,
,两样本独立,此时
的置信区间为
(2-6)
这里我们已经知道
可用norminv(0.975)求得,Matlab计算很容易。
(2)方差未知但相等:
此时
的置信区间为
(2-7)
其中
,而
依照自由度
计算。
3.4 两正态总体方差比的置信区间
此时,查自由度为
的
分布临界值表,使得
则
的置信区间为:
(2-7)
例2.4 设两台车床加工同一零件,各加工8件,长度的误差为:
A:-0.12 -0.80 -0.05 -0.04 -0.01 0.05 0.07 0.21
B:-1.50 -0.80 -0.40 -0.10 0.20 0.61 0.82 1.24
求方差比的置信区间。
解 用Matlab计算如下:
x=[-0.12,-0.80,-0.05,-0.04,-0.01,0.05,0.07,0.21];
y=[-1.50,-0.80,-0.40,-0.10,0.20,0.61, 0.82,1.24];
v1=var(x); v2=var(y);
c1=finv(0.025,7,7); c2=finv(0.975,7,7);
a=(v1/v2)/c2; b=(v1/v2)/c1; [a,b]
计算结果为: 0.0229 0.5720
方差比小于1的概率至少达到了95%,说明车床A的精度明显高。
三 假设检验(换令一个讲)
3.1 假设检验的基本概念
例3.1 已知小麦亩产服从正态分布,传统小麦品种平均亩产800斤,现有新品种产量未知,试种10块,每块一亩,产量为:
775,816,834,836,858,863,873,877,885,901
问:新产品亩产是否超过了800斤?
假设检验就是概率意义上的反证法。要证明命题H1:
,可以首先假设H0:
。本体中容易计算样本均值超过800了,有没有可能超过800的原因是由于抽样的随机性引起的?是否总体均值根本没有变化?我们看如下的统计量:
容易看出,如果新品种确有增产效应,
应偏大,不利于H0,取
,查表求临界值
,使得
,即构造不利于H0,有利于H1的小概率事件,如果在一次试验中该小概率事件发生了,就有理由拒绝H0,认为H1成立。
严格逻辑意义上的反证法思路如下:欲证H1成立,先假设其否命题H0成立,然后找出逻辑意义上的矛盾,从而推翻H0成立,严格证明H1成立。假设检验的思路类似,只不过引出的不是矛盾,而是小概率事件在一次实验中发生。
我们称想要证明的命题H1为备择假设,对立的命题H0称为原假设,面对样本,我们必须表态是接受原假设还是拒绝原假设,这有可能出现两类错误。如果客观上原假设的确成立,面对样本的异常我们拒绝了原假设,这种“以真为假”的错误我们称为第一类错误,发生的概率用
表示;如果客观上备择假设成立,我们却接受了原假设,这种“以假为真”的错误我们称为第二类错误,用发生的概率用
表示。假设假设检验一般首先控制第一类错误,即:当我们拒绝原假设时有比较充足的理由,犯错误的概率不超过预设的
,称
为显著性水平。常用的显著性水平有
这种预设显著性水平
的假设检验也称为显著性检验,以后我们提到的假设检验都是显著性检验。对于显著性检验,当接受原假设时,可以认为是拒绝的证据不足。
3.2 正态总体参数的假设检验
3.2.1 单正态总体均值的假设检验
设
为来自正态总体
简单随机样本,
为我们关心的已知的值,原假设为:
H0:
(1)方差已知情形
此时,检验统计量为
,H0成立时
,依据备择假设的不同提法,分三种情况分别给出拒绝域。
1)双侧检验 备择假设H1:
拒绝域:
这种情形我们关心的是总体均值是否发生了变化,增多减少都是我们同等关注的。例如要研究某种药物的副作用,是否引起血压的变化,变大变小都是副作用,如果实验证明了确有副作用,就该停产或慎用。
2)单侧检验(右侧) 备择假设H1:
拒绝域:
这种情形我们关心的是总体均值是否有增加效应,例如小麦亩产。无增产效应或者减产都是我们不希望看到的,我们希望证明的是增产了。
3)单侧检验(左侧) 备择假设H1:
拒绝域:
这种情形我们希望看到总体均值变小了。每匹布上疵点的个数。新工艺后是否有减少。
(2)方差未知情形
原假设H0:
此时,检验统计量为
,H0成立时
,依据备择假设的不同提法,分三种情况分别给出拒绝域。
1)双侧检验 备择假设H1:
拒绝域:
2)单侧检验(右侧) 备择假设H1:
拒绝域:
3)单侧检验(左侧) 备择假设H1:
拒绝域:
其实,上一章中区间估计与这里的双侧检验本质上是相同的:区间套中
接受原假设,没套中则拒绝原假设。只不过检验统计量的计算更简单些。类似于单侧检验,也可以有单侧区间估计。
3.2.2 单正态总体方差的假设检验
设
为来自正态总体
简单随机样本,
为我们关心的已知的值,原假设为H0:
,检验统计量为
当H0成立时,
,由此可查
临界值表,构造拒绝域。
(1)双侧检验 此时备择假设为H1:
,也就是说,我们希望通过样本找到总体方差比较
有明显变化的证据,无论变大变小都是我们希望证明的。
此时取临界值
与
,使得
,
,拒绝域为:
(方差变小了),或者
(方差变大了)。
当
已经赋值的时候,执行如下Matlab命令可得到临界值。
a=0.05, n=20, c1=chi2inv(a/2,n-1), c2=chi2inv(1-a/2,n-1),
(2)单侧检验(右侧) 此时备择假设为H1:
,也就是说,我们关心的是方差是否变大了。此时临界值为
满足
,可用
c=chi2inv(1-a,n-1)
(3)单侧检验(左侧) 此时备择假设为H1:
,也就是说,我们关心的是方差是否变小了。此时临界值为
满足
,可用
c=chi2inv(a,n-1)
3.2.3 两正态总体均值的假设检验
设
为来自正态总体
的简单随机样本,
为来自正态总体
的简单随机样本,且两样本独立。为比较两个总体的期望,提出如下原假设:
H0:
与前面类似,备择假设有双侧、单侧(左侧、右侧)等提法。
(1)方差已知情形
此时检验统计量为
,当H0成立时
服从标准正态分布,临界值
,
含义及计算方法同前。
1)双侧检验 H1:
,拒绝域:
2)右侧检验 H1:
,拒绝域:
3)左侧检验 H1:
,拒绝域:
(2)方差未知但相等情形
此时原假设仍为H0:
,备择假设同样有三种提法。检验统计量为:
当H0成立时
,由此得临界值
,
。
1)双侧检验 H1:
,拒绝域:
2)右侧检验 H1:
,拒绝域:
3)左侧检验 H1:
,拒绝域:
3.2.4 两正态总体方差的假设检验
设
为来自正态总体
的简单随机样本,
为来自正态总体
的简单随机样本,且两样本独立。为比较两个总体的方差,提出如下原假设:
H0:
与前面类似,备择假设有双侧、单侧(左侧、右侧)等提法。此时检验统计量为
,当H0成立时,
,在Matlab中,如果m,n已经赋值,例如m=8,n=10则
c1=finv(0.025,7,9),c2=finv(0.975,7,9)
分别给出了
时的两个临界值,双侧检验的拒绝域为
或
。
c3=finv(0.05,7,9)
给出了左侧检验临界值,
时拒绝原假设,认为备择假设H1:
成立。
c4=finv(0.95,7,9)
给出了右侧检验临界值,
时拒绝原假设,认为备择假设H1:
成立。
3.2.5 大样本非正态总体均值的假设检验
设
为来自非正态总体的简单随机样本,设总体均值
与总体方差
有限,原假设
H0:
此时可以将
作为近似的检验统计量,当样本容量很大时(例如100),由中心极限定理知H0成立时
近似服从标准正态分布,可以仿照3.2.1小节中的算法检验如下三个备择假设:
H1:
; H1:
; H1:
设
为来自非正态总体的简单随机样本,
为来自非正态总体的简单随机样本,且两样本独立。两个总体有有限的均值与方差,均值为
与
,为比较两个总体的期望,提出如下原假设:
H0:
与前面类似,备择假设有双侧、单侧(左侧、右侧)等提法。此时可以将
近似作为检验统计量,当两个样本容量都很大时(例如100),由中心极限定理知H0成立时
近似服从标准正态分布,可以仿照3.2.3小节中的算法检验如下三个备择假设:
H1:
; H1:
; H1:
3.5 总体分布的假设检验
设
为来自总体
的简单随机样本,
为已知的一个固定的分布函数,要进行如下的检验:
H0:
H1:
对此检验问题,有两种常用的方法。
对总体分布进行假设检验,一般要求样本容量较大,例如至少100。
3.5.1
检验
取正整数
,将样本排序为
,将区间
等分,分点为
,
这
个分点将
分割为
个小区间,
,
,
,
,
记
为落入
的样本点的个数,显然
,称
为
落入
的频率。
表示H0成立时
落入
的概率,即
,
,
,
,
检验统计量取为:
可以证明,当H0成立时
近似服从自由度为
的
分布,对于显著性水平
,取临界值
v0=chi2inv(1-alpha,m)
当V>v0时,拒绝H0。
四单因素方差分析
5.1.1 方差分析的基本概念
在实际问题中,人们常常需要在不同的条件下对所研究的对象进行对比试验,从而得到若干组数据(样本)。方差分析就是一种分析、处理多组实验数据间均值差异的显著性的统计方法。其主要任务是,通过对数据的分析处理,搞清楚各实验条件对实验结果的影响,以便更有效地指导实践,提高经济效益或者科研水平。
在统计中,人们称受控制的条件为因素,因素所处的状态称为水平。
如果只让一个因素变动,取该因素的多个不同水平进行试验,而其他因素保持不变,称该试验为单因素试验。例如小麦种植产量,只考虑“品种”这一因素,研究4个不同品种产量的差异,其它诸如施肥
方案
气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载
、灌溉方案等因素保持一致,就是一个4水平单因素试验。
如果同时考虑两个因素,例如4个小麦品种在3种不同施肥方案下的产量,就是一个双因素试验。
对于
组实验数据,我们假定都来自正态总体,并且具有相同的方差(称为方差齐性),要检验这相互独立的
个正态总体
均值间有无差异,即:
H0:
; H1:诸
不全相同
前面我们讲过两正态总体均值的假设检验,有T检验的方法。自然有一个想法,对于
,分别检验
是否成立,若所有搭配均不拒绝,则接受H0,只要有一种搭配拒绝原假设认为
,那就拒绝H0,看起来也不算麻烦。不妨称上述想法为“两两T检验法”。
回忆前面内容,设
为来自正态总体
的简单随机样本,
为来自正态总体
的简单随机样本,且两样本独立。为比较两个总体的期望,提出如下原假设:
H0:
当H0成立时,检验统计量
我们给出函数t12test.m,解决上述计算问题。
function T=t2test(x,y)
m=length(x);
n=length(y);
vx=var(x);
vy=var(y);
a=(mean(x)-mean(y));
b=m+n-2;
c=(m-1)*vx+(n-1)*vy;
d=sqrt(m*n/(m+n));
T=a*d*sqrt(b/c);
以下给出m=10,n=10,且两总体皆服从标准正态分布的情形下,万次模拟的拒绝频率。以下命令文件保存为PnT2.m
N=10000;
m=10; n=10;
alpha=0.05;
t0=tinv(1-alpha/2,m+n-2);
P=0;
for k=1:N
x=randn(1,10); y=randn(1,10);
T=t2test(x,y);
if abs(T)>t0
P=P+1;
end
end
P=P/N
执行上述程序,发现每次频率都在0.05附近,说明上述两个正态总体均值的T检验的确是水平为
的检验。
我们设想有8组数据,客观上都是来自标准正态分布,没有差异,每组样本容量都是10。现在用前述“两两T检验法”进行检验,下述程序计算出了万次模拟中拒绝的频率。
N=10000;
n=10; r=8;
alpha=0.05;
t0=tinv(1-alpha/2,n+n-2);
P=0;
for k=1:N
x=randn(8,10);
E=mean(x,2);
[EE,I]=sort(E);
X=x(I,:);
T=t2test(X(1,:),X(8,:));
if abs(T)>t0
P=P+1;
end
end
P=P/N;
上述程序模拟发现,拒绝频率大约在0.45左右,严重偏离0.05,说明依照“两两T检验”犯第一类错误的概率严重增大,判定结果很不可靠。
对于8组数据,两两比较共
种组合,若每种组合接受原假设的概率为0.95,则28种组合都接受原假设的概率大致估计为
,拒绝概率大致估计为0.76。由于相关性,拒绝概率没有达到0.76,但0.45也相当大了。
为了避免上述问题的出现,1923年,波兰
数学
数学高考答题卡模板高考数学答题卡模板三年级数学混合运算测试卷数学作业设计案例新人教版八年级上数学教学计划
家R.A.Fisher提出了方差分析(Analysis of Variance简称ANOVA) 法,可以同时判定多组数据均值间差异的显著性检验问题。其检验统计量在H0成立时服从F分布,这里F分布就是以Fisher姓氏的第一个字母命名的。
5.1.2 单因素方差分析的计算
设有
组数据,表示因素A的
个水平,每组有
个观测值。我们已知实际结果具有以下结构:
(
;
)
表示水平Ai下的理论均值,
为实验误差,诸
相互独立且服从正态分布
。
为了看出因素A个水平影响的大小,将
进行分解,令
,
表示水平Ai对试验结果的影响,称为Ai的水平效应。显然
这时数据有如下结构:
(
;
) (5-1)
于是,我们需要进行的假设检验为:
H0:
; H1:诸
不全为零 (5-2)
记
,(
) ,
(5-3)
称
为总离差平方和,它反映了样本观测值之间的总的变异程度。以下我们将
分解为两部分,以便区别水平效应与随机误差的影响。
其中
记
,
(5-4)
称
为组内平方和,它反映了每组的组内随机误差。称
为组间平方和,反应的是组与组之间的差异。上述推导说明,总离差平方可以分解为
(5-5)
一个自然的想法是:如果在总离差平方和中,
所占比例很大,则拒绝原假设,认为客观上存在水平效应。
容易计算
;
(5-6)
因此,当H0成立时,有
,
(5-7)
(5-8)
对于自由度
,求临界值
,当
时拒绝H0即可。
表5-1 单因素方差分析表
方差来源
平方和
自由度
均方
F值
临界值
显著性
组间
SA
误差
SE
总和
ST
实际计算时常采用方差分析表,如表5-1所示。当
时,称为不显著,即认为各组均值之间没有显著差异,在显著性一栏不做任何标记。当
时,称为较显著,即认为各组均值之间有较显著差异,在显著性一栏用(*)标记。当
时,称为显著,即认为各组均值之间有显著差异,在显著性一栏用*标记。当
时,称为极显著,即认为各组均值之间有极显著差异,在显著性一栏用**标记。
上述传统的方差计算表,在计算机普及后稍有变动,表中最后两列可以变动为直接计算H0成立时F分布大于此F值的概率,是否显著一看自明。
5.1.3 单因素方差分析的多重比较
经过方差分析之后,如果拒绝原假设,认为各组之间的均值有显著差异,那么,这个判断是对整体而言的,并不是说每两个不同的组之间均值都存在显著差异。那么,如何确定哪两个组之间有显著差异、无显著差异呢?这就要对每种搭配做一对一的比较,即多重比较。(即区间估计或假设检验)
小结:
主要内容:统计量、抽样分布及其基本性质
点估计、区间估计
假设检验
方差分析
求点估计、区间估计、假设检验、方差分析的MATLAB命令