1
1
抽樣方法與抽樣分配
2
抽樣方法
• 隨機抽樣
¾ 所抽出的樣本具有隨機性(每組樣本被 抽出
的機率皆相同)
¾ 所抽出的樣本是互相獨立的
¾ 隨機抽樣所抽出的樣本,稱之為隨機樣本
• 非隨機抽樣
2
3
抽樣誤差
• 抽樣誤差
抽樣誤差是樣本統計量與相對應的母體參數間的
差異。此種差異來自抽樣過程的機遇(chance)、
抽樣方法及推論方法的不同
• 非抽樣誤差
非抽樣誤差主要來自調查時的執行與事後在記
錄、整理資料時所發生的錯誤。
4
抽樣誤差
估計誤差
樣本統計量 母體參數
抽樣誤差
樣
本
數
推
論
方
法
抽
樣
方
法
資
料
整
理
時
的
疏
失
非抽樣誤差
3
5
抽樣成本
樣本數
成
本
最
小
成
本
最適樣本數
E
0
蒐集樣本成本
抽樣誤差成本
抽樣總成本
(
)
6
抽樣底冊
抽樣單位與
抽樣單位是抽樣之母體中一個元素或一
組母體元素。
抽樣底冊
抽樣底冊是抽樣單位的名冊或一覽表。
4
7
隨機抽樣方法
• 簡單隨機抽樣法(Simple Random
Sampling)
• 分層抽樣法(Stratified Random Sampling)
• 部落抽樣法(Cluster Sampling)
• 系統抽樣法(Systematic Sampling)
8
簡單隨機抽樣法
從含有N 個元素的母體中,隨機抽取 n個為
一組樣本,而每一個樣本被抽出的機會均相
同(抽籤、電腦亂數、亂數表)
• 抽樣放回:每組樣本出現的機率為(1/N)n
• 抽樣不放回:每組樣本出現的機率為 N
nC
1
5
9
分層抽樣法
• 將整個母體分成若干個不重疊之部份母體,此部份母
體稱之為層,每個層與層之間互相排斥,每一層中各
別抽取一簡單隨機樣本
• 層內的變異較小,層與層之間的變異則較大
• 每一層內之樣本數=?(比例配置法)
第一層 第二層 第K層
樣 本
n 1 n kn 2
… . . .
比例配置法:
在隨機抽樣前,先將母體依
其所需的標準分成k層,各層
內分別有N1,N2,…,Nk個元
素,則母體總元數為
N=∑Ni。若欲抽出的總樣本
數為n,依其比例配置,第i
層的樣本數為 ni = n(Ni /N)
10
77.581.384.7 82.6 學業成績平均
16,00018,00021,00025,000學生人數
大四大三大二大一年級
例:已知全省大學各年級之總人數及其學業平均成績的
資料如下。欲選取1200名大學生作為樣本,則各年級應
該抽取多少名學生?
分層抽樣法
N=25,000+21,000+18,000+16,000=80,000
n1 = 1,200x(25,000/80,000) = 375
n2 = 1,200x(21,000/80,000) = 315
n3 = 1,200x(18,000/80,000) = 270
n4 = 1,200x(16,000/80,000) = 240
6
11
部落(Cluster)抽樣法
• 將整個母體依某標準分成若干個部落(部落內的每個元
素彼此間的差異較大,而部落與部落間的差異較小)
• 任取數個部落為隨機樣本,而被抽中之部落內的每個元
素皆為調查的對象
分層抽樣法 部落抽樣法
1.層內的元素間變異較小,而層與層之
間的變異較大。
1.部落內的元素間變異較大,而部落與
部落之間的變異較小。
2.對每一層皆抽取一組隨機樣本,對每
層的樣本加總起來便為總樣本。
2.在所有的部落中,只抽出幾個部落當
成樣本。
3.在每一層內皆進行抽查。 3.對於被選中的部落,進行普查,亦即
部落內的全部元素皆為樣本。
4.使用此方法可以降低誤差,提高準確
度。
4.使用此方法可以省下不少時間及抽
樣的費用。
12
部落抽樣法(如農家所得調查)
第一
部落
母 體
第K
部落
第二
部落
樣 本 隨 機 抽 取
7
13
系統抽樣法
• 將母體所有的元素(N)依次排列
• 每隔一定間隔選取一個樣本,直至抽滿n個樣本
為止:
• 將母體分為n個相等的區間,每一區間之元素個數為
k=N/n,若k不為整數則取最接近之整數)
• 從第一區間的k個元素中以簡單隨機抽樣法抽出一個
元素作為起始點
• 由起始點算起,每隔k元素抽取一個,共抽取n個組成
一樣本
• 系統抽樣法使用非常方便,但避免用於具週期性
之資料
14
系統抽樣法(如電話抽樣)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 ...k (k+1) (k+2) ...N
樣 本
母 體
186 12
8
15
抽樣分配 (Sampling Distribution)
• 統計量為樣本內隨機變數的函數
• 從一母體中隨機抽出一組樣本(樣本內每個觀測值所
對應的隨機變數為X1, X2, …, Xn),則
3
2 21
1
XXY += ),,min( 212 nXXXY L=
等皆可稱為統計量(統計量亦為隨機變數)
•在統計學上較常使用到的統計量包含有樣本平均
數 、樣本變異數S2、樣本比例 等。
•由於統計量為樣本內隨機變數的函數,故統計量
亦為一隨機變數,其機率分配稱為抽樣分配。
X p
16
抽樣分配 (Sampling Distribution)
• 若將所有可能的樣本都考慮進去,則每一樣本的統
計量的組合便形成一個機率分配(即抽樣分配)。
• 抽樣分配的主要功用:
•測量統計推論中不確定性程度的大小,說明統計推論結
果的可靠性如何。
• 統計量的抽樣分配取決於母體的分配以及所抽出的
樣本大小。
9
17
範例:中泰汽車接待小姐之月薪
X = 中太汽車接待小姐之月薪
x if
22 1
25 2
28 1
30 1
N = 5
母體的機率分配
x f x( )
22 1 5 0 2/ .=
25 2 5 0 4/ .=
28 1 5 0 2/ .=
30 1 5 0 2/ .=
f x( ) =∑ 1
母體平均
數:
26
5
3028252522 =++++=µ
母體變異數:
6.7)26(6.683
)]([)(
2
222
=−=
−= XEXEσ
母體標準
差:
757.22 == σσ
0
0.1
0.2
0.3
0.4
0.5
22 25 28 30 x
f (x)
//
18
若從一個平均數為 µ、標準差 σ 的母體,隨機抽
出一組樣本,其觀測值為 x1, x2, …, xn,則此組樣
本的平均數為
樣本平均數 的抽樣分配X
∑
=
=+++=
n
i
i
n x
nn
xxxx
1
21 1L
此樣本平均數通常不會恰好等於母體平均數
:
:
抽樣
母體
N
1 =
n
Ν =
n
n
n
2 =
C
S
S
S
1
2
CΝn
所有可能樣本 所有樣本平均數
:
1
n
x
x
:
1
n
x
x
:
1
n
x
x
x x
x x
x x
10
19
x f x( )
x1 1 / Cn
N
x 2 1 / Cn
N
M M
xCnN 1 / Cn
N
X 的平均數與變異數 )( ),( XVXE
樣本平均數 的抽樣分配X
20
範例:中泰汽車接待小姐之月薪(N=5)
以簡單隨機抽樣,抽出不放回方式抽取n=3為一組
樣本,則所有可能的樣本共有 組1053 =C
假設母體的5位接待小姐的月薪分別為 A=22, B=25,
C=25, D=28, E=30,則共有10組可能的樣本:
ABC, ABD, ABE, ACD, ACE, ADE, BCD, BCE,
BDE, CDE母 體
A = 22
B = 25
C = 25
D = 28
E = 30
(ABC) (ABD)
(ABE) (ACD)
(ACE) (ADE)
(BCD) (BCE)
(BDE) (CDE)
樣本空間
定義
:樣本組的平均數
3
+ += X X1 2 X3
X
X
11
21
樣本 樣本平均數
x
( ) ( , , )A B C = 2 2 2 5 2 5 2 4 .0 0
( ) ( , , )A B D = 2 2 2 5 2 8 2 5 .0 0
( ) ( , , )A B E = 2 2 2 5 3 0 2 5 .6 7
( ) ( , , )A C D = 2 2 2 5 2 8 2 5 .0 0
( ) ( , , )A C E = 2 2 2 5 3 0 2 5 .6 7
( ) ( , , )A D E = 2 2 2 8 3 0 2 6 .6 7
( ) ( , , )B C D = 2 5 2 5 2 8 2 6 .0 0
( ) ( , , )B C E = 2 5 2 5 3 0 2 6 .6 7
( ) ( , , )B D E = 2 5 2 8 3 0 2 7 .6 7
( ) ( , , )C D E = 2 5 2 8 3 0 2 7 .6 7
範例:中泰汽車接待小姐之月薪(N=5)
樣本平均數之分配
x f x( )
24.00 1 10 0 10/ .=
25.00 2 10 0 20/ .=
25.67 2 10 0 20/ .=
26.00 1 10 0 10/ .=
26.67 2 10 0 20/ .=
27.67 2 10 0 20/ .=
f x( ) .=∑ 1 00
22
樣本平均數 的平均數(期望值):X
)(26)2.0(67.27...)2.0(25)1.0(24)(][ µ==+++==∑ xfxXE
7.6)( 267.1676267.677)26()(
])[(][)(
222
22
=<=−=−=
−=
∑ σxfx
XEXEXV
範例:中泰汽車接待小姐之月薪(N=5)
X樣本平均數 的變異數:
12
23
0
0.1
0.2
0.3
24.00 25.00 25.67 26.00 26.67 27.67 x
µ ﹦26; σ 2 ﹦1.373
f (x )
x x
_ _
_
_
//
範例:中泰汽車接待小姐之月薪(N=5)
樣本平均數之分配
24
對所有無限母體或有限母體且抽出放回,使用簡
單隨機抽樣,則樣本平均數 的抽樣分配之期望值
與變異數如下:
X
樣本平均數 的抽樣分配--抽出放回X
µ=][ XE期望值:
nXV /)( 2σ=變異數:
( ) ( )
µµ ==+++=
+++=⎟⎠
⎞⎜⎝
⎛ +++=Ε
][1)]()()([1
1
21
21
21
n
n
XEXEXE
n
XXXΕ
nn
XXXΕX
n
n
n
L
LL
( ) ( )
[ ] nn
n
XVXVXV
n
XXXV
nn
XXXVXV
n
n
n
/][1)()()(1
1
22
21
21
21
σσ ==+++=
+++=⎟⎠
⎞⎜⎝
⎛ +++=
22
2
L
LL
13
25
【例7.2】設一個母體,其元素包含1, 2, 3, 4, 5 共
N=5個數值,若以抽出放回的方式由此母體抽出
n=2之隨機樣本(X1, X2),試求樣本平均數的抽樣
分配、平均數與變異數
母體平均數: ( ) ( ) 35/)54321( =++++==Ε= ∑ xxpXµ
母體變異數:
[ ] 23531
5
1
1
22
5
1
222
=−++−=
−=−== ∑∑
=
)(...)(
)x(
N
)x(p)x()X(V
i
i µµσ
範例:樣本平均數的抽樣分配--抽出放回
26
範例:樣本平均數的抽樣分配--抽出放回
所 有 可 能 的 不 同 樣 本 組 合 :
編 號 樣 本 x 編 號 樣 本 x 編 號 樣 本 x
1
2
3
4
5
6
7
8
9
1 0
( 1 , 1 )
( 1 , 2 )
( 1 , 3 )
( 1 , 4 )
( 1 , 5 )
( 2 , 1 )
( 2 , 2 )
( 2 , 3 )
( 2 , 4 )
( 2 , 5 )
1
1 . 5
2
2 . 5
3
1 . 5
2
2 . 5
3
3 . 5
1 1
1 2
1 3
1 4
1 5
1 6
1 7
1 8
1 9
2 0
( 3 , 1 )
( 3 , 2 )
( 3 , 3 )
( 3 , 4 )
( 3 , 5 )
( 4 , 1 )
( 4 , 2 )
( 4 , 3 )
( 4 , 4 )
( 4 , 5 )
2
2 . 5
3
3 . 5
4
2 . 5
3
3 . 5
4
4 . 5
2 1
2 2
2 3
2 4
2 5
( 5 , 1 )
( 5 , 2 )
( 5 , 3 )
( 5 , 4 )
( 5 , 5 )
3
3 . 5
4
4 . 5
5
x 1 1.5 2 2.5 3 3.5 4 4.5 5
)(xf 1/25 2/25 3/25 4/25 5/25 4/25 3/25 2/25 1/25
的抽樣分配X
14
27
範例:樣本平均數的抽樣分配--抽出放回
3
25
75
25
15
25
25.1
25
11)()(
9
1
==×++×+×=⋅=Ε= ∑
=
L
i
iiX xfxXµ
[ ] 19103]
25
1)5(...
25
2)5.1(
25
1)1[()()( 22222
9
1
22 =−=−+++=Ε−⋅=∑
=
Xxfx
i
iiXσ
所有可能組合之樣本平均數的期望值與母體平
均數相等 3== µµX
2
2
1
2
2
Xn
σσ ===
樣本平均數的變異數等於母體變異數的 1/n 倍,
28
對有限母體且抽出不放回,使用簡單隨機抽樣,
則樣本平均數 的抽樣分配之期望值與變異數如
下:
X
µ=)(XE期望值:
⎟⎠
⎞⎜⎝
⎛
−
−=
1
)(
2
N
nN
n
XV σ變異數:
樣本平均數 的抽樣分配--抽出不放回X
1−
−
N
nN
• 由於樣本數固定,所以當母體數愈大時, 愈趨近1。
• 當 n/N < 5%可將有限母體校正因子 忽略不計(可以
將之視為無限母體)
• 當樣本數趨近於母體個數N 時,有限母體校正因子便趨近
於0,亦即表示 亦將趨近於0。Χσ
1−
−
N
nN
15
29
• 中泰汽車接待小姐之月薪(N=5)之例
範例:樣本平均數的抽樣分配--抽出不放回
267.1)
15
35(
3
7.6)
1
(267.1
2
2 =−
−=−
−⇔=
N
nN
nX
σσ
• 同例7.2,若採用抽出不放回的方式,試求樣本平
均數的抽樣分配,期望值與變異數。
所 有 可 能 的 不 同 樣 本 組 合 :
編 號 樣 本 x 編 號 樣 本 x
1
2
3
4
5
( 1 , 2 )
( 1 , 3 )
( 1 , 4 )
( 1 , 5 )
( 2 , 3 )
1 . 5
2
2 . 5
3
2 . 5
6
7
8
9
1 0
( 2 , 4 )
( 2 , 5 )
( 3 , 4 )
( 3 , 5 )
( 4 , 5 )
3
3 . 5
3 . 5
4
4 . 5
x 1.5 2 2.5 3 3.5 4 4.5
)(xf 0.1 0.1 0.2 0.2 0.2 0.1 0.1
的抽樣分配X
30
3
10
30
10
15.4
10
12
10
15.1)()(
7
1
==×++×+×=⋅=Ε= ∑
=
L
i
iiX xfxXµ
範例:樣本平均數的抽樣分配--抽出不放回
[ ]27
1
22 )()( Xxfx
i
iiX Ε−⋅=∑
=
σ
( ) ( ) ( ) ( ) 75.0975.93
10
15.4
10
12
10
15.1 2222 =−=−⎥⎦
⎤⎢⎣
⎡ ×++×+×= L
•所有可能組合之樣本平均數的期望值與母體
平均數相等 3== µµX
•樣本平均數的變異數等於母體變異數除以 1/n
再乘上有限母體校正因子 ,即
1−
−
N
nN
2
2
75.0
15
25
2
2
1 XN
nN
n
σσ ==−
−×=−
−⋅
16
31
抽樣分配之型態X
母體
常態分配
非常態
分配
小樣本
(n<30)
)(
n
,N~X
2σµ
)(
n
,N~X
2σµ
)1(~ −− nt
n
S
X µ
)(
n
,N~X
2σµ
σ已知
σ未知
大樣本
)( 30>n
大樣本
)( 30>n
小樣本
(n<30)
X之抽樣分配
須視母體分
配而定
32
中央極限定理
(Central Limit Theorem--C.L.T)
X
從一個母體(平均數µ;變異數σ2)中抽取樣本數
為n的一組隨機樣本,其樣本平均數為 ,則當n趨
近無限大時, 或)/ ,(~ 2 nNX σµ )1 ,0(~ N
n
X
σ
µ−
母體分配 母體分配
xµ xµ
17
33
中央極限定理
(Central Limit Theorem--C.L.T)
抽樣分配 抽樣分配
n =5
xµ
n =5
xµ
n =10
xµ
n =10
xµ
34
中央極限定理
(Central Limit Theorem--C.L.T)
抽樣分配 抽樣分配
n =30
xµ
n =30
xµ
n =50
xµ
n =50
x
.
u
18
35
範例
【例7.6】一個在全省各地開了3000家分店的大企
業,想要以抽樣估計去年每家分店發生物品損壞的平
均損失金額。假設已知母體平均數µ = 1630元,而母
體標準差σ = 400元,試求(a) 倘若抽取n=100家分店
當成隨機樣本,則樣本平均數與母體平均數之差在60
元以內的機率是多少?(b) 倘若將抽取的分店家數增
加到n=256家,則樣本平均數與母體平均數之差在60
元以內的機率又是多少?
36
範例
Xσ
µ = 1630,σ = 400元,令X代表該企業去年的損失
金額,則X~N(1630,4002)
(a) 由於母體總數N=3000,而樣本數 n=100,二者
比例相當小,因此在求 時,可以將有限母體
校正因子省略不計,因此 40
100
400 ===
nX
σσ
樣本平均數 的抽樣分配為 ~ N(1630,4002)X X
( ) ( )
8664.00668.09332.0
)5.1()5.1()5.15.1(
40
60
40
60606060
=−=
−≤−≤=≤≤−=
⎟⎟⎠
⎞
⎜⎜⎝
⎛ ≤−≤−=≤−≤−=≤−
ZPZPZP
XPXΡXΡ
Xσ
µµµ
由以上的結果,我們有約87%的信心,斷定
估計µ的誤差不會超過60元。
X
19
37
範例
(b) 倘若將樣本數增加到n=256時,其
25256400 ===
=
/n/X
X
σσ
µµ
樣本平均數的抽樣分配為 ),(N~X 225 1630
( ) ( )
98360008209918042424242
25
60
25
60606060
...).Z(P).Z(P).Z.(P
)X(PXΡXΡ
X
=−=−≤−≤=≤≤−=
≤−≤−=≤−≤−=≤− σ
µµµ
• 當樣本數增加到256家分店時,其估計誤差
不超過60元的機率也增加到了98%
• 當樣本數愈大時,估計值將愈精確,其樣
本平均數 愈趨近於母體的平均數。X
38
樣本比例 的抽樣分配pˆ
• 推估某種特性(如性別)在整個母體中所佔的比例。
• 樣本比例 用來估計母體比例 p。
• Y 代表具有某種結果或特性之觀測值所發生的次
數,例如成功的次數或者男性的人數等,而n 則表
示樣本的大小,此時 Y 的機率分配為二項分配。
n
Yp =ˆ
• 期望值 ( ) ppˆ =Ε
• 變異數 ( )n
pp
pˆ
−= 12σ
( ) ( ) p
n
npY
nn
Ypˆ ===⎟⎠
⎞⎜⎝
⎛= ΕΕΕ 1
( ) ( ) ( ) ( )
n
pp
n
pnpYV
nn
YVpˆV −=−==⎟⎠
⎞⎜⎝
⎛= 111 22
20
39
範例
【例7.8】假設一家製造公司在生產線上有10%的不良品,
但公司的管理者並沒有發現此一狀況,如今品管部門想
要了解生產的品質優劣,因此隨機抽取了100個產品來檢
測。令 表示產品在檢測中被發現試不良品的樣本比例,
試求:(a) 的抽樣分配。(b)不良品的樣本比例在母體比
例的 ±0.05 之內的機率為何?
pˆ
pˆ
(a) 由題意可知,母體比例 p=0.1
np = 100(0.1) = 10 > 5, nq = 100(0.9) = 90 > 5
1.0)ˆ( == ppΕ 030
100
90101 ...
n
)p(p
pˆ =×=−=σ
).,.(N~pˆ 2030 10∴
(b) ( ) ⎟⎠
⎞⎜⎝
⎛ ≤−≤−=≤−≤−
030
050
030030
050050050
.
.
.
ppˆ
.
..ppˆ. ΡΡ
( ) 90500475095240671671 ..... =−=≤Ζ≤−Ρ≈
40
卡方分配、t分配、F分配
與常態分配有關之抽樣分配
21
41
卡方分配
定義:設X為一個隨機變數,若其機率分配函數為
( )
⎟⎠
⎞⎜⎝
⎛
⎟⎠
⎞⎜⎝
⎛
=
−−
2
22
1 122
r
x
xf
rx
Γ
e
x≥0, n為正整數
則稱X為具有自由度r 的卡方分配,記為X ~ χ 2(r)。
定理:設X1, X2, …, Xn是n 個獨立的隨機變數且皆為標準常態
分配[以X1, X2, …, Xn ~ ind. N(0,1)表示],若Y =
X12+X22+…+Xn2,則Y屬於自由度為 r 的卡方分配。
定理:
若Z ~ N(0,1),則Z2 ~ χ 2(1)
42
卡方分配
定理:
若 Yi ~ χ2(ri), i = 1,2,…, k,且Y1,Y2,…,Yk ~ ind. R.V.,則
•由“標準常態”平方和所組成
•主要是用來作適合度檢定(goodness-of-fit test),亦即檢定
資料是否符合某種機率分配
•也用來估計與檢定單一母體的變異數。
⎟⎠
⎞⎜⎝
⎛∑∑
==
kk
1
2
1 i
i
i
i r~Y χ
22
43
卡方分配的性質
1.若R.V. X ~ χ 2(r),則
(1) 期望值E(X) = r; (2) 變異數V(X) = 2r
2.卡方分配之加法性:
設X, Y ~ ind. R.V. 且X ~ χ 2(r1) , Y ~ χ 2(r2),
若統計量 Z = X + Y,則Z ~ χ 2(r1+r2)。
3.卡方分配是右偏曲線,自由度愈大,變異數也愈大。
2χ
1.0=α
987.15)10(2 1.0 =χ
• P[χ 2 >χα2(r)] = α代表在χα2(r)之右的面積為α。
例:χ 0.12(10) = 15.987 表
示自由度為10之卡方分
配中,比15.987大的機率
為10%,而比15.987小的
機率則為90%。
44
卡方分配
定理:
若x1, x2, …, xn是從常態分配N(µ, σ2)抽出一組樣本數為n
之隨機樣本,且 , ,則∑
=
=
n
i
iXn
X
1
1 ∑
=
−−=
n
i
i XXn
S
1
22 )(
1
1
( )
)(~ 21 n
X
n
i
i
χσ
µ
2
2∑
=
−若µ已知時,
( ) ( ) )1(~1 21 −−=−∑= nSnXX
n
i
i
χσσ 2
2
2
2
若µ未知時,
23
45
範例
【例7.11】
由一個平均數未知,而變異數σ 2 = 16的常態母體中抽出一
組樣本數為20的隨機樣本,試求:
(a) 其樣本變異數會超過27.67的機率為多少?
(b) 其樣本變異數會介於8.52與25.384之間的機率為多少?
(a) 由題意可知母體的變異數σ 2 = 16,樣本數n =20,則樣本
變異數超過27.67的機率為
查表χ 0.0252(19) =32.85,因此P(S2=27.67) = P(χ 2=32.85)
= 0.025,故樣本變異數超過27.67的機率為0.025。
)85.32()
16
67.27)120(
16
)120(()67.27( 2
2
2 >=×−>−=> χPSΡSΡ
46
範例
(b) 樣本變異數會介於8.52與25.384間的機率為
)1435.30117.10(
)
16
384.25)120(
16
)120(
16
52.8)120(()384.2552.8(
2
2
2
<<=
×−<−<×−Ρ=<<Ρ
χP
SS
查表χ 0.952(19) =10.117,χ 0.052(19) =30.1415,因此
P(8.52 < S2 < 25.384) = P(10.117 <χ 2 < 30.1435)
= 0.95 - 0.05 = 0.90
24
47
t分配
定義
若隨機變數T的機率密度函數為
( )
( )
∞<<∞−⎟⎟⎠
⎞
⎜⎜⎝
⎛ +⋅⋅
⎟⎠
⎞⎜⎝
⎛Γ
⎥⎦
⎤⎢⎣
⎡ +Γ
=
+−
t
r
t
rr
r
tf
r
,11
2
2
1
2
1
2
π
則稱此機率分配是自由度為 r 的t分配,記為T~t(r)
定義
設Z, W ~ ind. R.V.,且Z~N(0,1),W~χ 2(r),令
則稱隨機變數T的機率分配屬於自由度為 r 的t分
配。
rW
ZT
/
=
48
t 分配的性質
1. 當自由度 ∞→r 時,t分配近似於標準常態分配(r大於30)
2. t分配與Z分配相似,皆為以0為中心的對稱分配,所以
( ) ( )tTtT ≥=−≤ ΡΡ 。
3. )()(1 rtrt αα −=−
4. ( ) ( )rFrt ,12 =
5. P[T ≥ tα(r)] = α 表示自由度為 r的t分配,tα(r)
之右尾面積為α。
α
0 tα(r)
25
49
t 分配
定理
若X1, X2, …, Xn是從常態分配N(µ, σ2)抽出一組樣本數為
n之隨機樣本,且σ2未知,若樣本平均數為 ,
樣本變異數為
則統計量
∑
=
=
n
i
iXn
X
1
1
∑
=
−−=
n
i
i XXn
S
1
22 )(
1
1
)1(~
)1()1(
/
/ /2
2
−
−⎟⎟⎠
⎞
⎜⎜⎝
⎛ −
−
=−= nt
nSn
n
X
nS
XT
σ
σ
µ
µ
50
範例
【例7.13】假設X表示某國中之男生的體重,已知其為常態
分配(平均數 µ=63而標準差σ未知),亦即X~N(63,σ2)。倘
若今從此班級中隨機抽出n =16位男學生當成樣本,其樣本標
準差S =3.5,則這16位男同學之平均體重( )在某一數值k
以下的機率為0.975,試求此k值為多少?
X
由於樣本為小樣本,且母體標準差未知,樣本標準差S=3.5,
故統計量T = ( - 63)/( 3.5/√16) ~ t (15)X
P( < k) = 0.975 ⇔
P[( - 63)/( 3.5/√16) < (k - 63)/( 3.5/√16)] = 0.975 ⇔
P[t < (k - 63)/( 3.5/√16)] = 0.975 ⇔
P[t > (k - 63)/( 3.5/√16)] = 0.025
由t分配表中查得 t0.025(15) = 2.131,故(k - 63)/( 3.5/√16) =2.131
k = 64.86,即這16位男同學之平均體重小於64.86之機率為0.975
X
X
26
51
F分配
定義
若隨機變數X之機率密度函數為
( ) 0 ,
122
2
2
2
1
1
22
2
1
21
21
21
11
≥
⎥⎦
⎤⎢⎣
⎡
⎟⎟⎠
⎞
⎜⎜⎝
⎛+
⋅⎟⎟⎠
⎞
⎜⎜⎝
⎛⋅
⎟⎠
⎞⎜⎝
⎛Γ⎟⎠
⎞⎜⎝
⎛Γ
⎟⎠
⎞⎜⎝
⎛ +Γ
= +
−
x
x
r
r
x
r
r
rr
rr
xf rr
rr
則X屬於自由度為r1, r2的F分配,簡記為X ~ F(r1, r2)式
中 r1 > 0 ,r2 > 0。
52
F分配的性質
α
( )21, rrFα
1. P[F > Fα (r1, r2)] = α
2. Fα (r1, r2) = 1/F1-α (r2, r1) or F1-α (r1, r2) = 1/ Fα (r2, r1)
3. 假如F~F(r1, r2),則 1/F ~ F(r2, r1)
4. F分配在統計學上應用相當廣,尤其在檢定兩母體變異
數是否相等,以及變異數分析之檢定上均會使用到
27
53
定理
若U表自由度為r1的卡方分配,V表自由度為r2的卡方分
配,亦即U ~ χ2(r1),V ~ χ2(r2),且U與V互為獨立,則
),(~
/
/
21
2
1 rrF
rV
rUF =
F分配
定理
若兩個獨立隨機樣本:X1, X2, …, Xn1 ~N(µ1, σ12) ,
Y1, Y2, …, Yn2 ~ N(µ2, σ22),樣本平均數分別為
與 ,樣本變異數分別為 與
,則
∑
=
= 1
11
1 n
i
iXn
X
∑
=
= 2
12
1 n
i
iYn
Y ∑
=
−−=
1
1
2
1
2
1 )(1
1 n
i
i XXn
S
∑
=
−−=
2
1
2
2
2
2 )(1
1 n
i
i YYn
S )1,1(~
/
/
212
2
2
2
2
1
2
1 −−= nnF
S
SF σ
σ
54
歸納
統計量 定義公式
χ2
t
F
∑=
−=
n
i
iXn
1
22 )()( σ
µχ
r
rt
2
)( χ
Ζ=
2
2
2
1
2
1
21 ),( r
rrrF χ
χ=
當母體平均數µ與變異數σ2已知時
28
55
歸納:
當母體平均數µ與變異數σ2未知時
統計量 公式χ2
t
F
2
2
2 )1()1( σχ
Snn −=−
nS
Xnt µ−=− )1(
2
2
2
121 /)1,1( SSnnF =−−
本文档为【抽样方法与抽样分配】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑,
图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。