第四章 第四章 极限定理
§1 依分布收敛与中心极限定理
一、 一、分布函数弱收敛
二、性质
三、中心极限定理
概率论早期发展的目的在于揭示由于大量随机因素产生影响而呈现的规律性. 贝努里首先认识到研究无穷随机试验序列的重要性,并建立了概率论的第一个极限定理——大数定律,清楚地刻画了事件的概率与它发生的频率之间的关系. 棣莫佛和拉普拉斯提出将观察的误差看作大量独立微小误差的累加,证明了观察误差的分布一定渐近正态——中心极限定理. 随后,出现了许多各种意义下的极限定理. 这些结果和研究方法对概率论与数理统计及其应用的许多领域有着重大影响. 本章着重介绍上述大数定律和中心极限定理等有关内容.
§1 依分布收敛与中心极限定理
我们知道,如果ξ是概率空间 (Ω, F, P)上的随机变量,那么它的分布函数F(x)=P(ξ
)刻画了它的全部概率性质. 因此,对随机变量序列的研究就必须首先对相应的分布函数序列作深入研究.
一、分布函数弱收敛
定义1 设F是一分布函数,{
}是一列分布函数,如果对F的每个连续点x
R,都有
(x)→F(x) (n→∞),则称
弱收敛(weak convergence)于F,记作
F.
设ξ是一随机变量,{
}是一列随机变量,如果
的分布函数列弱收敛于ξ的分布函数,则称
依分布收敛(convergence in distribution)于ξ,记作
ξ.
注1 注1 分布函数逐点收敛的极限函数未必是分布函数.
例如,
(x)=
该分布函数列处处收敛于0, 但G(x)
0不是分布函数. 因此对一般的分布函数列,要它们逐点收敛于分布函数,
要求
对教师党员的评价套管和固井爆破片与爆破装置仓库管理基本要求三甲医院都需要复审吗
是过高了,不得不如定义1加上限制.
注2 定义1中的限制条件“对F的每个连续点x,
(x) →F(x)”是足够宽的,例如,
(x)=
F(x)=
除在0点以外(
(0)=0
F(0)=1),逐点收敛于F(x),而0点刚好是F(x) 的唯一不连续点,因此按定义1,
F.
*注3 由于分布函数F的不连续点最多有可数个,
F 意味着
在R的一个稠密子集上处处收敛于F(D在R上稠密,是指对任意
R, 在
的任意小邻域内,一定有x
D).
下面给出海莱(Helly)定理,它们对分布函数列弱收敛性的研究起着重要作用.
定理1(海莱第一定理) 设{
}是一列分布函数,那么存在一个单调不减右连续的函数F (不一定是分布函数),0
, x
R, 和一子列{
},使得对F的每个连续点x,
(x)
F(x) (k→+∞).
证 令
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
示全体有理数. 0
意味着{
}是有界数列,因此可以找到一个收敛子列{
}, 记
.
接着考虑有界数列{
},存在它的一个收敛子列{
},记
. 如此继续,得到
{
}
{
},
, k
.
现在考虑对角线序列{
}. 显然,
=
对所有正整数k都成立. 另外,由于
单调不减,如果
,有
. 因此G(r)是定义在有理数上的有界不减函数. 定义
x∈R. (1)
这个函数在有理数上与G(x)相等,它显然也是有界不减的. 下面证明,对F的每个连续点x,
=F(x). (2)
任意给定
>0和F的连续点x,选取h >0,使得
F(x+h)--F(x--h) <
/2.
根据有理数的稠密性,存在有理数
满足
x-h <
< x+h,
从而
F(x-h)
. (3)
另外,存在N (
) 使得当n
时,
,
. (4)
进而由
和F的单调性,当n
时,
,
.
综合得到
|
. (5)
(2)式得证. 由F的定义(1),在它的不连续点上是右连续的. 定理1证毕.
定理2 (海莱第二定理) 设F是一分布函数,{
}是一列分布函数,
F. 如果g(x)是R上的有界连续函数,则
. (6)
证 因为g是有界函数,必存在c >0使得 |g (x) | < c, x∈R. 因为F的所有连续点构成R上的稠密集,又由F(
)=0, F(
)=1,故对于任意给定的
>0, 可以选取a>0使得±a是F的连续点,并且
F(-a)<
/12c, 1-F(a)<
/12c. (7)
由于
F,存在
, 使得当n
时,
|
(-a)-F(-a)|<
/12c, |1-
(a)-(1-F(a))|<
/12c, (8)
这样我们有
|
[ |
(-a)-F(-a)|+2F(-a)+|1-
(a)-(1-F(a))|+2(1-F(a))]<
/2. (9)
下面考虑
|. 由于g(x)在闭区间[-a, a]上一致连续,可以选取
, 使得所有
是F的连续点,且
|g(x)--g(
)|<
/8. 于是
|=
|
+
+
|
=
. (10)
由于
,
, 再选择
使得当n
时,
, i = 0,1,2,…,m. (11)
故(10)式不超过
/2. 因此,当n
时,
| <
. (12)
定理证毕.
定理3 (勒维(Levy)连续性定理(continuity theorem)) 设F是一分布函数,{
}是一列分布函数. 如果
F ,则相应的特征函数列{
}关于t在任何有限区间内一致收敛于F的特征函数
.
对任何b >0, 仅考虑 | t |
. 令
, x∈R. 注意到下列事实:
|
|=1,
,
则该定理的证明完全类似于定理2,不再重复.
由前面一章知道,特征函数与分布函数相互唯一确定. 同样,勒维连续性定理的逆命
题
快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题
也成立.
定理4(逆极限定理) 设
是分布函数
的特征函数,如果对每一个t,
→
, 且
在t=0处连续,则
一定是某个分布函数F的特征函数, 且
F.
本定理的证明比较繁复,从略. 但定理的作用是很大的,它使得特征函数成为研究某些极限定理的重要工具. 这里先举个例子来说明这个定理的应用.
例1 用特征函数法证明二项分布的泊松逼近定理.
证 设
服从二项分布B (n,
),且
. 它的特征函数为
=
, 其中
. 当n
时,它的极限为
,
这正是泊松分布的特征函数. 由逆极限定理,二项分布B (n,
)依分布收敛于泊松分布P(
).
二、性质
除连续性定理外,分布函数弱收敛还有下列性质.
性质1 设{
}是一列分布函数,如果
F, F是一连续的分布函数,则
(x)在R上一致收敛于F(x).
证明留给读者.
性质2 设
是一随机变量,{
}是一列随机变量,
(x)是R上的连续函数,如果
,则
.
证 假设
和
的分布函数分别为F和
. 如果
,即
F,由定理2,
的特征函数
收敛于
, 该极限正是
的特征函数. 再类似定理4,
的分布函数弱收敛于
的分布函数,即
.
性质3 设{
和{
是两列常数,F是一分布函数, {
}是一列分布函数. 如果
→a,
→b,
F, 则
(
)→F(a x +b ),其中x使得a x +b是F的连续点.
证 设x使得a x +b是F的连续点. 令
>0使得F在a x +b±
处连续(这是可能的,因为F的连续点在R上稠密). 显然
→a x +b, 故对充分大的n,
(13)
因此
由于
F ,则
让
→0,由于F在a x+b处连续,即可完成证明.
推论 如果
,则
, (
).
这是因为
与
的分布函数分别为
(
)与F(
),再应用性质3即可.
三、中心极限定理
设一次贝努里试验中成功的概率为p (0
标准
excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载
正态分布的分布函数. 对-∞1-25 / n, 只当n
250时才满足要求. 通过比较可以看出正态逼近比切比雪夫不等式要精确得多.
德莫佛—拉普拉斯定理的意义远不限于这些数值计算. 该定理及其推广形式实际上是概率论早期研究的中心问题.
定义2 设{
}是一列随机变量. 如果存在常数列
与
,使
N (0,1), (18)
就称{
}满足中心极限定理(central limit theorem).
定理6(林德贝格(Lindeberg)—勒维定理) 设{
}是一列独立同分布的随机变量. 记
=
, E
=a, Var
=
, 则中心极限定理成立,即
N (0,1).
证 我们用特征函数法. 令
与
分别为
-a与
的特征函数,由于
独立同分布,故
=
. 另外,已知E
=a, Var
=
, 所以特征函数有二阶连续导数,并且由泰勒 (Taylor) 展开式得
, x→0.
对给定的t∈R,
=1-
, n→∞,
从而
, 后者是标准正态分布的特征函数,由定理4即得定理6的结论.
中心极限定理有着广泛的应用,在实际工作中,只要n足够大,便可以把独立同分布的随机变量和的标准化当作正态变量. 下面再看两个例子.
例4 近似计算时,原始数据
四舍五入到小数第m位,这时舍入误差
可以看作在[-0.5
,0.5
]上均匀分布,而据此得n个
的和
,按四舍五入所得的误差是多少呢?
习惯上人们总是以各
误差上限的和来估计
的误差限,即0.5×n×
. 当n很大时,这个数自然很大.
事实上,误差不太可能这么大. 因为{
}独立同分布,E
=0, Var
=
=
/12. 由定理6,
P(|
)≈2Φ(x)-1.
若取x=3,上述概率为0.997. 和的误差超过
的可能性仅为0.003. 显然,对较大的n,这一误差界限远小于习惯上的保守估计0.5
.
*例5 正态随机数的产生有各种方法. 除第二章§5介绍的以外,下面这种方法也是常用的:设{
}独立同分布,都服从[0,1 ]上的均匀分布,则E
=0.5,
,由中心极限定理,n很大时,η=
近似服从标准正态分布,事实上取n=12就够了. 于是取区间 [0, 1]上12个均匀随机数,则
即近似为标准正态随机数.
定理6要求各
同分布,这要求有时还是高了一点. 更一般地,林德贝格证明了在各独立随机变量
组成的和式
中,只要各被加项
依概率“均匀地小”,中心极限定理就仍然成立. 即
定理7(林德贝格—费勒(Lindeberg-Feller)定理)设{
}为独立随机变量序列,则
=0 (费勒条件)
与
成立的充要条件是林德贝格条件被满足 :
>0,
→0.
特别地有
定理8(李雅普诺夫(Lyapunov)定理) 若对独立随机变量序列{
},存在常数δ>0, 使当n→∞时有
,
则中心极限定理成立.
这些结果解释了正态随机变量在自然界中普遍存在的原因.
例6 设
是相互独立的随机变量序列,
的分布列是
. 易知
,
,
. 因此,当
时,
也就是说满足李雅普洛夫条件,所以
满足中心极限定理.
对数理统计学的许多分支,如参数(区间)估计、假设检验、抽样调查等,中心极限定理都有着重要的作用. 事实上,它也是保险精算等学科的理论基础之一. 假定某保险公司为某险种推出保险业务,现有
个顾客投保,第
份保单遭受风险后损失索赔量记为
. 对该保险公司而言,随机理赔量应该是所有保单索赔量之和,记为S,即
S
弄清S的概率分布对保险公司进行保费定价至关重要. 在实际问题中,通常假定所有保单索赔相互独立. 这样,当保单总数
充分大时,我们并不需要计算S 的精确分布(一般情况下这是困难甚至不可能的). 此时,可应用中心极限定理,对S进行正态逼近:
渐近具有正态分布
,并以此来估计一些保险参数.
例7 某保险公司发行一年期的保险索赔金分别为1万元与2万元的两种人身意外险. 索赔概率
及投保人数
如下表所示(金额单位:万元).
类别k
索赔概率
索赔额
投保数
1
2
3
4
0.02
0.02
0.10
0.10
1
2
1
2
500
500
300
500
保险公司希望只有0.05的可能使索赔金额超过所收取的保费总额. 设该保险公司按期望值原理进行保费定价,即保单
的保费
. 要求估计
.
解:计算
的均值与方差
=
=
由此得保费总额
依题意, 我们有
,也即
将
近似看作标准正态随机变量,查表可得
,故
.