粒子物理与核物理实验中的
数据
分析
定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析
陈少敏
清华大学
第一讲:基本概念
http://hep.tsinghua.edu.cn/~chensm/lectures/lecture_1.
ppt
关于艾滋病ppt课件精益管理ppt下载地图下载ppt可编辑假如ppt教学课件下载triz基础知识ppt
本次讲座的要点
概率
随机变量与函数
期待值
误差传递
实验的目的是什么?
+e −e
q
q
观察某一过程
的 n个事例
实验测量出每个事例的特征量(能动量,末态粒子数…)。
理论预言出上述各特征量的分布,而且可能还会包含某些
如相互作用耦合常数等自由参数。
收集数据
统计分析
估计参数值与相应的误差
围,检验在何种程度上理
与实验数据相符。
问题:如何
评价
LEC评价法下载LEC评价法下载评价量规免费下载学院评价表文档下载学院评价表文档下载
这种检验? 使用概率来量化结论!
随机事例
在一定的实验条件下,现象A可能发生,也
可能不发生,并且只有发生或不发生这样两
种可能性,这是偶然现象中一种比较简单的
形态,我们把发生了现象A的事例称为随机
事例A,简称事例A。
随机事例之间的相互关系
A与B之并事例
A与B之积(交)事例
BA∪
A之逆事例
BA∩
指事例A与B中至少有一个出现的事例
指事例A与B中同时出现的事例
A
指事例A不出现的事例 A A
BA∪
BA∩
如果A与B互斥,则 BABA +=∪
概率的定义
柯尓莫哥洛夫公理:考虑一全集S具有子集A,B,…
P(B)P(A)B)P(A0BA
1P(S)
0P(A)S,A
+=∪⇒=∩
=
≥⊂
B)P(AP(B)P(A)B)P(A
P(B)P(A)BA
1)AP(A
P(A)1)AP(
∩−+=∪
≤⇒⊂
=∪
−=
从该公理可以导出下列概率公式
A
B
C
S
P(A)称为事
例A的概率
条件概率
假设B出现的概率不为零,在给定B的情况下出现A的条件概
率定义为
P(B)
B)P(AB)|P(A ∩=
如果 则
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
明A与B相互独立。P(A)P(B)B)P(A =∩
如果A与B相互独立,则有
P(A)
P(B)
P(A)P(B)B)|P(A ==
注意: 与不相交的子集定义不同 BA∩
结果与B无关
概率的含义
¾相对频率
假设A,B,…是一可重复实验的结果,则概率就是
次实验nn
A结果为limP(A) ∞→=
¾主观概率
如果A,B,…是假设(是真或是假的各种陈述),那么概率
对A为真的信心程度P(A) =
9两种解释皆与柯尔莫哥洛夫公理相符。
9概率的频率解释在数据分析中用起来比较自然,但是…
9两种解释皆与柯尔莫哥洛夫公理相符。
9概率的频率解释在数据分析中用起来比较自然,但是…
频率概率中的问题
实际问题中,统计量总是有限的。P(A)完全
取决于A的划分与总统计量的大小。
概率大小会出现波动。概率大小会出现波动。
例如:我们可以说“明天有雨”。但是,如果我们根
据概率频率定义说“明天可能有雨”,却是一个毫无
科学意义的预报。
该定义不适用于某些特殊情况
需要解决好
•A的定义
•适当的误差
主观概率中的问题
主观性:在对同一随机现象的描述中,我的
P(理论)与你的P(理论)可能不同
理论家甲
之理论A
理论家乙
之理论B
•出于绝望 9
•出于无知 ²
•出于懒惰 V
使用主观概率的原因
主观概率的一些特点
主观概率有一些吸引人的地方,例如对于不可重复现象的
处理中,显得比较自然
¾系统误差(重复实验时仍保持不变);
¾在该事例出现的粒子是正电子;
¾自然界是超对称的;
¾明天将下雨(将来事件的不确定性);
¾公元1500年元月一日北京下雨(过去事件的不确定性)。
结论中包含了主观上对事件为真的信念!
频率论者与主观概率
质子质量的不确定性与从100只球中有68只白球的球
筐里能拿出白球的不确定性一样。
¾频率论者:质子或非质子 (不知道是哪个)
¾主观主义者(贝叶斯论者):68%是质子(对知识的陈述)
P(938.27195<质子质量<938.27211MeV)是什么?
对主观概率而言,意味着
当以质量来判断一实际为质子的粒子类别时
频率论者与主观概率(续)
能否在频率定义中将质子质量在938.27195-938.27211MeV内
理解成:在整个宇宙中,自然界给出了各种不同的质子质量,
而它们中有68%在938.27195与938.27211MeV之间?
没问题…只不过这是对信心程度的一种表达。没问题…只不过这是对信心程度的一种表达。
那么上述论断的68%就应该理解为结果为真的概率。
如果大多数贝叶斯论者说
¾巴西赢得2006年世界杯冠军的概率为68%
¾质子质量在938.27195-938.27211MeV内的概率为68%
¾希拉里.克林顿2009年入主白宫的概率为68%
贝叶斯定理
根据条件概率的定义
P(A)
A)P(BA)|P(B与
P(B)
B)P(AB)|P(A ∩=∩=
而 ,故A)P(BB)P(A ∩=∩
P(B)
A)P(A)|P(BB)|P(A =
贝叶斯定理由 Reverend Thomas
Bayes (1702-1761) 首先提出。
贝叶斯理论与主观概率
)理论P()实验| 理论( )实验P( )理论 | 实验P(=P
如果实验证明P(实验|理论)=0,则表明理论不能接受。
大的P(实验|理论)会增加对理论的信任度。
通过实验结果可以改进P(理论)。
改进的P(理论)可应用于对重复实验结果的预测。
P(实验|理论)对先验理论的依赖将最终消失。
贝叶斯理论通常用于主观概率问题
通过实验结果改进基于某一理论的信念(后验性的)
全概率事例
考虑在样本空间S中有一子集B。将样本空间分为互斥的子
集Ai,使得 B
1A
2A
3A
iA
SAA
i iii
==∪ ∑
因此,
)A(B)A(BSBB iiii ∩∪=∪∩=∩=
表示成概率的形式为
∑ ∩=∩∪= i iii )AP(B))A(BP(P(B) iAB∩
得到全概率事例公式
∑= i ii ))P(AA|P(BP(B) ∑= i ii ))P(AA|P(B
A)P(A)|P(BB)|P(A
贝叶斯定理
S
例子:如何利用贝叶斯定理
假设对任意一个人而言,感染上AIDS的概率为
AIDS noP
AIDSP
999.0)(
前之验检何任即,率概前验001.0)(
=
=
考虑任何一次AIDS检查的结果只有阴性(-)或阳性(+)两种
率概性的阴者患染感AIDS02.0)(
率概性的阳者患染感AIDS98.0)|(
AIDS|P
AIDSP
=−
=+
率概的性阴者染感未AIDS97.0)(
率概的性阳者染感未AIDS03.0)|(
AIDS no|P
AIDS noP
=−
=+
如果你的检查结果为阳性(+),而你却觉得自己无明显感染
渠道。那么你是否应担心自己真的感染上了AIDS?
例子:如何利用贝叶斯定理(续)
利用贝叶斯定理,阳性结果条件下是AIDS患者的概率为
)率概后验(032.0
999.003.0001.098.0
001.098.0
)()|()()|(
)()|()(
AIDS noPAIDS noPAIDSPAIDSP
AIDSPAIDSPAIDSP
=
×+×
×=
+++
+=+
也就是说,你可能没什么问题!
从你的观点上看:对自己染上AIDS结果的可信度为3.2%。
从医生角度上看:象你这样的人有3.2%感染上了AIDS。
从你的观点上看:对自己染上AIDS结果的可信度为3.2%。
从医生角度上看:象你这样的人有3.2%感染上了AIDS。
AIDS患者阳性
所有为阳性结果的人
随机变量与概率密度函数
假设实验结果为x (记作样本空间中元素)
dxxf dxxx xP )()内围范],[在到测(观 =+
那么概率密度函数 p.d.f. 定义为 ,它满足)(xf
∫+∞∞− =1)( dxxf
定义累积分布函数为
∫ ∞− ′′= x xdxfxF )()(
对于离散型随机变量
∑∑
≤=
===
xx
i
n
i
iii
i
xPxF f xPf )()(,1),(
1
)(xf )(xF
x x
直方图与概率密度函数
概率密度函数 p.d.f. 就是拥有无穷大样本,区间宽度为零,
而且归一化到单位面积的直方图。
度宽的间区
数例事总的图方直入添
)()(
)()(
=Δ
=
=
Δ=
x
n
xN
xn
xNxf
频数数例事的间区个每
)(xN )(xN
)(xN )(xf
x x
x x
直方图在统计分析中非常重
要,应准确理解它的含义。
直方图在统计分析中非常重
要,应准确理解它的含义。
多变量情形
如果观测量大于一个,例如 与 y x
∫∫ =
=
=∩
1),(
.f.d.p的合联),(
),()(
dxdyyxf
yxf
dxdyyxfBAP
投影分布
将联合概率密度函数 p.d.f. 投影到 轴(如图所示)yx,
.f.d.p的)(),(义定
),()(
),()(
投影=
=
=
∫
∫
yfxf
dxyxfyf
dyyxfxf
yx
y
x
y )(yf y
x)(xfx y
x
条件概率密度函数
利用条件概率的定义,可得到
dxxf
dxdyyxf
AP
BAPABP
x )(
),(
)(
)()|( =∩=
定义条件概率的密度函数 p.d.f. 为
)(
),()|(,
)(
),()|(
yf
yxfyxg
xf
yxfxyh
yx
==
则贝叶斯定理可写为
)(
)()|()|(
yf
xfxyhyxg
y
x=
若 相互独立,则yx,
)()(),( yfxfyxf yx=
h
(
y
|
x
)
y
x
y
dx dx
随机变量的函数*
随机变量的函数自身也是一个随机变量。随机变量的函数自身也是一个随机变量。
假设 服从 p.d.f. ,对于函数 ,其p.d.f. 为何?x )(xf )(xa )(ag
da
dxaxfag
xdxf
xdxfdaag
xdaaaadS
dxxfdaag
da
da
dxax
ax
daax
ax
dS
))(()(
)(
)()(
围范间空的内],[在
)()(
)(
)(
)(
)(
=⇒
′′=
′′=
+=
=
∫
∫
∫
+
+
θθ cos
:
与
例如
函数的逆不唯一情况*
假如 的逆不唯一,则函数的 p.d.f. 应将 中对应于
的所有 的区间包括进来
)(xa dS
dx
da
a
af
a
afag
a
a
daa
a
daaadS
dxxfdaag
a
dadxaxxa
dS
2
)(
2
)()(
,
22
,
)()(
2
, ,:如例 2
−+=
⎥⎦
⎤⎢⎣
⎡ −−−∪⎥⎦
⎤⎢⎣
⎡ +=
=
±=±==
∫
多个随机变量的函数*
考虑随机矢量 与函数 ,对应的 p.d.f.),...,( 1 nxxx =r )(xa r
围范间空面曲的义定)()(在
...),...,()( 11
xadaxaaxadS
dxdxxxfadag
dS nn rrr
L
′+′=′==
=′′ ∫∫
与
例如随机变量 服从联合的
p.d.f. ,考虑函数 ,
其 应是何种形式
0, >yx
),( yxf xyz =
)(zg
y
dyy
y
zf
x
dx
x
zxfzg
dyyxfdx
dxdyyxfdzzg
xdzz
xz
dS
),(),()(
),(
),(...)(
00
/)(
/0
∫∫
∫∫
∫∫
∞∞
+∞
==
=
=
多个随机变量的函数(续)*
考虑具有联合的 p.d.f. 的随机矢量 ,构造
个线性独立的函数: ,而且其逆函
数 存在。那么 的联合 p.d.f. 为
),...,( 1 nxxx =r
n ))(),...,(()( 1 xyxyxy n
rrrr =
)(),...,(1 yxyx n
rr yr
)()( xfJyg rr =
这里 是雅可比行列式J
n
n
n
n
y
x
y
x
y
x
y
x
y
x
y
x
y
x
J
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
=
L
MM
L
L
2
2
2
1
2
1
2
1
1
1
任意一个函数
均可通过对函数
积分掉其它不用的变
量而得到。
)( ii yg
)(yg r
期待值
考虑具有 p.d.f. 的随机变量 ,定义期待(平均)值为)(xf x
∫= dxxfxxE )(][
注意: 它不是 的函数,而是 的一个参数。x )(xf
通常记为: μ=][xE
对离散型变量,有 ∑
=
=
n
i
ii xPxxE
1
)(][
对具有 p.d.f. 的函数 ,有)(xy)(yg
∫ ∫== dxxfxydyyygyE )()()(][
方差定义为
222 ][]])[[(][ μ−=−= xExExExV 通常记为: 2][ σ=xV
标准
excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载
偏差: 2σσ ≡
协方差与相关系数
定义协方差 (也可用矩阵表示 )为],cov[ yx xyV
yxyx xyEyxEyx μμμμ −=−−= ][)])([(],cov[
相关系数定义为
11
,],cov[
≤≤−
=
xy
yx
xy
yx
ρ
σσρ
如果 独立,即yx,
)()(),( yfxfyxf yx=
则
0],cov[ =yx
误差传递
),...,( 1 nxxx =r假设 服从某一联合 p.d.f. ,我们也许并不
全部知道该函数形式 ,但假设我们有协方差
)(xf r
],cov[ jiij xxV =
和平均值 ][xE rr =μ
现考虑一函数 ,方差 是什么?)(xy r 22 ])[(][][ yEyEyV −=
将 在 附近按泰勒展开到第一级)(xy r μr
)()()(
1
ii
x
n
i i
x
x
yyxy μμ
μ
−⎥⎦
⎤⎢⎣
⎡
∂
∂+≈
==
∑
rr
rr
然后,计算 与 …][yE ][ 2yE
误差传递(续一)
由于 0][ =− iixE μ 所以
)()]([ μrr yxyE ≈
ij
x
n
ji ji
n
j
jj
xj
n
i
ii
xi
ii
x
n
i i
V
x
y
x
yy
x
x
yx
x
yE
xE
x
yyyxyE
μ
μμ
μ
μ
μμ
μμμ
rr
rrrr
rr
r
rrr
==
= == =
==
∑
∑∑
∑
⎥⎥⎦
⎤
⎢⎢⎣
⎡
∂
∂
∂
∂+=
⎥⎥⎦
⎤
⎢⎢⎣
⎡
⎟⎟⎠
⎞
⎜⎜⎝
⎛
−⎥⎥⎦
⎤
⎢⎢⎣
⎡
∂
∂
⎟⎟⎠
⎞
⎜⎜⎝
⎛ −⎥⎦
⎤⎢⎣
⎡
∂
∂+
−⎥⎦
⎤⎢⎣
⎡
∂
∂⋅+≈
1,
2
11
1
22
)(
)()(
][)(2)()]([
误差传递(续二)
两项合起来给出 的方差)(xy r
ij
n
ji xji
y Vx
y
x
y∑
= =⎥
⎥
⎦
⎤
⎢⎢⎣
⎡
∂
∂
∂
∂≈
1,
2
μ
σ
rr
如果 之间是无关的,则 ,那么上式变为ix ijiijV δσ 2=
2
2
1
2
i
x
n
i i
y x
y σσ
μrr==
∑ ⎥⎦
⎤⎢⎣
⎡
∂
∂≈
类似地,对于 组函数m
))(),...,(()( 1 xyxyxy m
rrrr =
误差传递(续三)
ij
x
n
ji j
l
i
k
lkkl Vx
y
x
yyyU
μrr==
∑ ⎥⎥⎦
⎤
⎢⎢⎣
⎡
∂
∂
∂
∂≈=
1,
],cov[
或者记为矩阵形式
μrr=⎥
⎥
⎦
⎤
⎢⎢⎣
⎡
∂
∂==
xj
i
ij
T
x
yAAVAU ,
)(xy rr注意:上式只对 为线性时是精确的,近似程度在函数非
线性区变化比 要大时遭到很大的破坏。另外,上式并不需
要知道 的 p.d.f. 具体形式,例如,它可以不是高斯的。
iσ
ix
误差传递的一些特殊情况
],cov[2 21
2
2
2
1
2
21 xxxxy y ++=+= σσσ
21
21
2
2
2
2
2
1
2
1
2
2
21
],cov[2
xx
xx
xxy
xxy y ++== σσσ
注意在相关的情况下,最终的误差会有很大的改变,例如当
1 ,10 , 212121 ====−= σσμμxxy
0 ,0211][ ,0][ :1
4.1 ,211][ ,0][ :0
22
21
22
21
==−+==−==
==+==−==
y
y
yVyE
yVyE
σμμρ
σμμρ
这种特征有时候是有益的:将公共的或难以估计的误差,
通过适当的数学处理将它们消掉,达到减小误差的目的。
这种特征有时候是有益的:将公共的或难以估计的误差,
通过适当的数学处理将它们消掉,达到减小误差的目的。
小结
1. 概率
2. 随机变量
3. 随机变量函数
4. 误差传递
a) 定义:柯尔莫哥洛夫公理+条件概率
b) 解释:频率或信心程度
c) 贝叶斯定理
a) 概率密度函数 p.d.f.
b) 累积分布函数
c) 联合,投影与条件的 p.d.f.
a) 函数自身也是随机变量
b) 几种方法找出 p.d.f.
函数方差的计算方法是基于一阶泰勒展开,只对线性方程精确。
习题
习题1.1:一束光子束流含有10-4的电子.当它们通过一双层
的探测器会给出无击中,单层击中或双层击中的信号.对于
可能是电子和光子的概率为
(a)求在只观测到一层击中的情况下,是光子的概率;
(b)求在观测到两层都击中的情况下,是电子的概率.
510)|2(989.0)|2(
001.0)|1(01.0)|1(
99899.0)|0(001.0)|0(
−==
==
==
γ
γ
γ
PeP
PeP
PeP
习题(续)
习题1.2:证明对于一个随机变量 x 和常数 α与 β有下式
习题1.3:对于两个变量x与y的情况
(a)证明变量 αx+y 存在
这里α是任意常数,
(b)利用结果(a),证明相关系数总是在[-1,1]之间.(利用变量
V[αx+y]总是大于或等于零并考虑 )
yxyVxV
yxyVxVyxV
σαρσα
ααα
2][][
],cov[2][][][
2
2
++=
++=+
][][
][][
2 xVxV
xExE
αβα
βαβα
=+
+=+
xy σσα /±=
粒子物理与核物理实验中的数据分析
本次讲座的要点
实验的目的是什么?
随机事例
随机事例之间的相互关系
概率的定义
条件概率
概率的含义
频率概率中的问题
主观概率中的问题
主观概率的一些特点
频率论者与主观概率
频率论者与主观概率(续)
贝叶斯定理
贝叶斯理论与主观概率
全概率事例
例子:如何利用贝叶斯定理
例子:如何利用贝叶斯定理(续)
随机变量与概率密度函数
直方图与概率密度函数
多变量情形
投影分布
条件概率密度函数
随机变量的函数*
函数的逆不唯一情况*
多个随机变量的函数*
多个随机变量的函数(续)*
期待值
协方差与相关系数
误差传递
误差传递(续一)
误差传递(续二)
误差传递(续三)
误差传递的一些特殊情况
小结
习题
习题(续)