首页 抽样方法与抽样分配

抽样方法与抽样分配

举报
开通vip

抽样方法与抽样分配 1 1 抽樣方法與抽樣分配 2 抽樣方法 • 隨機抽樣 ¾ 所抽出的樣本具有隨機性(每組樣本被 抽出 的機率皆相同) ¾ 所抽出的樣本是互相獨立的 ¾ 隨機抽樣所抽出的樣本,稱之為隨機樣本 • 非隨機抽樣 2 3 抽樣誤差 • 抽樣誤差 抽樣誤差是樣本統計量與相對應的母體參數間的 差異。此種差異來自抽樣過程的機遇(chance)、 抽樣方法及推論方法的不同 • 非抽樣誤差 非抽樣誤差主要來自調查時的執行與事後在記 錄、整理資料時所發生的錯誤。 4 抽樣誤差 估計誤差 樣本統計量 母...

抽样方法与抽样分配
1 1 抽樣方法與抽樣分配 2 抽樣方法 • 隨機抽樣 ¾ 所抽出的樣本具有隨機性(每組樣本被 抽出 的機率皆相同) ¾ 所抽出的樣本是互相獨立的 ¾ 隨機抽樣所抽出的樣本,稱之為隨機樣本 • 非隨機抽樣 2 3 抽樣誤差 • 抽樣誤差 抽樣誤差是樣本統計量與相對應的母體參數間的 差異。此種差異來自抽樣過程的機遇(chance)、 抽樣方法及推論方法的不同 • 非抽樣誤差 非抽樣誤差主要來自調查時的執行與事後在記 錄、整理資料時所發生的錯誤。 4 抽樣誤差 估計誤差 樣本統計量 母體參數 抽樣誤差 樣 本 數 推 論 方 法 抽 樣 方 法 資 料 整 理 時 的 疏 失 非抽樣誤差 3 5 抽樣成本 樣本數 成 本 最 小 成 本 最適樣本數 E 0 蒐集樣本成本 抽樣誤差成本 抽樣總成本 ( ) 6 抽樣底冊 抽樣單位與 抽樣單位是抽樣之母體中一個元素或一 組母體元素。 抽樣底冊 抽樣底冊是抽樣單位的名冊或一覽表。 4 7 隨機抽樣方法 • 簡單隨機抽樣法(Simple Random Sampling) • 分層抽樣法(Stratified Random Sampling) • 部落抽樣法(Cluster Sampling) • 系統抽樣法(Systematic Sampling) 8 簡單隨機抽樣法 從含有N 個元素的母體中,隨機抽取 n個為 一組樣本,而每一個樣本被抽出的機會均相 同(抽籤、電腦亂數、亂數表) • 抽樣放回:每組樣本出現的機率為(1/N)n • 抽樣不放回:每組樣本出現的機率為 N nC 1 5 9 分層抽樣法 • 將整個母體分成若干個不重疊之部份母體,此部份母 體稱之為層,每個層與層之間互相排斥,每一層中各 別抽取一簡單隨機樣本 • 層內的變異較小,層與層之間的變異則較大 • 每一層內之樣本數=?(比例配置法) 第一層 第二層 第K層 樣 本 n 1 n kn 2 … . . . 比例配置法: 在隨機抽樣前,先將母體依 其所需的標準分成k層,各層 內分別有N1,N2,…,Nk個元 素,則母體總元數為 N=∑Ni。若欲抽出的總樣本 數為n,依其比例配置,第i 層的樣本數為 ni = n(Ni /N) 10 77.581.384.7 82.6 學業成績平均 16,00018,00021,00025,000學生人數 大四大三大二大一年級 例:已知全省大學各年級之總人數及其學業平均成績的 資料如下。欲選取1200名大學生作為樣本,則各年級應 該抽取多少名學生? 分層抽樣法 N=25,000+21,000+18,000+16,000=80,000 n1 = 1,200x(25,000/80,000) = 375 n2 = 1,200x(21,000/80,000) = 315 n3 = 1,200x(18,000/80,000) = 270 n4 = 1,200x(16,000/80,000) = 240 6 11 部落(Cluster)抽樣法 • 將整個母體依某標準分成若干個部落(部落內的每個元 素彼此間的差異較大,而部落與部落間的差異較小) • 任取數個部落為隨機樣本,而被抽中之部落內的每個元 素皆為調查的對象 分層抽樣法 部落抽樣法 1.層內的元素間變異較小,而層與層之 間的變異較大。 1.部落內的元素間變異較大,而部落與 部落之間的變異較小。 2.對每一層皆抽取一組隨機樣本,對每 層的樣本加總起來便為總樣本。 2.在所有的部落中,只抽出幾個部落當 成樣本。 3.在每一層內皆進行抽查。 3.對於被選中的部落,進行普查,亦即 部落內的全部元素皆為樣本。 4.使用此方法可以降低誤差,提高準確 度。 4.使用此方法可以省下不少時間及抽 樣的費用。 12 部落抽樣法(如農家所得調查) 第一 部落 母 體 第K 部落 第二 部落 樣 本 隨 機 抽 取 7 13 系統抽樣法 • 將母體所有的元素(N)依次排列 • 每隔一定間隔選取一個樣本,直至抽滿n個樣本 為止: • 將母體分為n個相等的區間,每一區間之元素個數為 k=N/n,若k不為整數則取最接近之整數) • 從第一區間的k個元素中以簡單隨機抽樣法抽出一個 元素作為起始點 • 由起始點算起,每隔k元素抽取一個,共抽取n個組成 一樣本 • 系統抽樣法使用非常方便,但避免用於具週期性 之資料 14 系統抽樣法(如電話抽樣) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 ...k (k+1) (k+2) ...N 樣 本 母 體 186 12 8 15 抽樣分配 (Sampling Distribution) • 統計量為樣本內隨機變數的函數 • 從一母體中隨機抽出一組樣本(樣本內每個觀測值所 對應的隨機變數為X1, X2, …, Xn),則 3 2 21 1 XXY += ),,min( 212 nXXXY L= 等皆可稱為統計量(統計量亦為隨機變數) •在統計學上較常使用到的統計量包含有樣本平均 數 、樣本變異數S2、樣本比例 等。 •由於統計量為樣本內隨機變數的函數,故統計量 亦為一隨機變數,其機率分配稱為抽樣分配。 X p 16 抽樣分配 (Sampling Distribution) • 若將所有可能的樣本都考慮進去,則每一樣本的統 計量的組合便形成一個機率分配(即抽樣分配)。 • 抽樣分配的主要功用: •測量統計推論中不確定性程度的大小,說明統計推論結 果的可靠性如何。 • 統計量的抽樣分配取決於母體的分配以及所抽出的 樣本大小。 9 17 範例:中泰汽車接待小姐之月薪 X = 中太汽車接待小姐之月薪 x if 22 1 25 2 28 1 30 1 N = 5 母體的機率分配 x f x( ) 22 1 5 0 2/ .= 25 2 5 0 4/ .= 28 1 5 0 2/ .= 30 1 5 0 2/ .= f x( ) =∑ 1 母體平均 數: 26 5 3028252522 =++++=µ 母體變異數: 6.7)26(6.683 )]([)( 2 222 =−= −= XEXEσ 母體標準 差: 757.22 == σσ 0 0.1 0.2 0.3 0.4 0.5 22 25 28 30 x f (x) // 18 若從一個平均數為 µ、標準差 σ 的母體,隨機抽 出一組樣本,其觀測值為 x1, x2, …, xn,則此組樣 本的平均數為 樣本平均數 的抽樣分配X ∑ = =+++= n i i n x nn xxxx 1 21 1L 此樣本平均數通常不會恰好等於母體平均數 : : 抽樣 母體 N 1 = n Ν = n n n 2 = C S S S 1 2 CΝn 所有可能樣本 所有樣本平均數 : 1 n x x : 1 n x x : 1 n x x x x x x x x 10 19 x f x( ) x1 1 / Cn N x 2 1 / Cn N M M xCnN 1 / Cn N X 的平均數與變異數 )( ),( XVXE 樣本平均數 的抽樣分配X 20 範例:中泰汽車接待小姐之月薪(N=5) 以簡單隨機抽樣,抽出不放回方式抽取n=3為一組 樣本,則所有可能的樣本共有 組1053 =C 假設母體的5位接待小姐的月薪分別為 A=22, B=25, C=25, D=28, E=30,則共有10組可能的樣本: ABC, ABD, ABE, ACD, ACE, ADE, BCD, BCE, BDE, CDE母 體 A = 22 B = 25 C = 25 D = 28 E = 30 (ABC) (ABD) (ABE) (ACD) (ACE) (ADE) (BCD) (BCE) (BDE) (CDE) 樣本空間 定義 :樣本組的平均數 3 + += X X1 2 X3 X X 11 21 樣本 樣本平均數 x ( ) ( , , )A B C = 2 2 2 5 2 5 2 4 .0 0 ( ) ( , , )A B D = 2 2 2 5 2 8 2 5 .0 0 ( ) ( , , )A B E = 2 2 2 5 3 0 2 5 .6 7 ( ) ( , , )A C D = 2 2 2 5 2 8 2 5 .0 0 ( ) ( , , )A C E = 2 2 2 5 3 0 2 5 .6 7 ( ) ( , , )A D E = 2 2 2 8 3 0 2 6 .6 7 ( ) ( , , )B C D = 2 5 2 5 2 8 2 6 .0 0 ( ) ( , , )B C E = 2 5 2 5 3 0 2 6 .6 7 ( ) ( , , )B D E = 2 5 2 8 3 0 2 7 .6 7 ( ) ( , , )C D E = 2 5 2 8 3 0 2 7 .6 7 範例:中泰汽車接待小姐之月薪(N=5) 樣本平均數之分配 x f x( ) 24.00 1 10 0 10/ .= 25.00 2 10 0 20/ .= 25.67 2 10 0 20/ .= 26.00 1 10 0 10/ .= 26.67 2 10 0 20/ .= 27.67 2 10 0 20/ .= f x( ) .=∑ 1 00 22 樣本平均數 的平均數(期望值):X )(26)2.0(67.27...)2.0(25)1.0(24)(][ µ==+++==∑ xfxXE 7.6)( 267.1676267.677)26()( ])[(][)( 222 22 =<=−=−= −= ∑ σxfx XEXEXV 範例:中泰汽車接待小姐之月薪(N=5) X樣本平均數 的變異數: 12 23 0 0.1 0.2 0.3 24.00 25.00 25.67 26.00 26.67 27.67 x µ ﹦26; σ 2 ﹦1.373 f (x ) x x _ _ _ _ // 範例:中泰汽車接待小姐之月薪(N=5) 樣本平均數之分配 24 對所有無限母體或有限母體且抽出放回,使用簡 單隨機抽樣,則樣本平均數 的抽樣分配之期望值 與變異數如下: X 樣本平均數 的抽樣分配--抽出放回X µ=][ XE期望值: nXV /)( 2σ=變異數: ( ) ( ) µµ ==+++= +++=⎟⎠ ⎞⎜⎝ ⎛ +++=Ε ][1)]()()([1 1 21 21 21 n n XEXEXE n XXXΕ nn XXXΕX n n n L LL ( ) ( ) [ ] nn n XVXVXV n XXXV nn XXXVXV n n n /][1)()()(1 1 22 21 21 21 σσ ==+++= +++=⎟⎠ ⎞⎜⎝ ⎛ +++= 22 2 L LL 13 25 【例7.2】設一個母體,其元素包含1, 2, 3, 4, 5 共 N=5個數值,若以抽出放回的方式由此母體抽出 n=2之隨機樣本(X1, X2),試求樣本平均數的抽樣 分配、平均數與變異數 母體平均數: ( ) ( ) 35/)54321( =++++==Ε= ∑ xxpXµ 母體變異數: [ ] 23531 5 1 1 22 5 1 222 =−++−= −=−== ∑∑ = )(...)( )x( N )x(p)x()X(V i i µµσ 範例:樣本平均數的抽樣分配--抽出放回 26 範例:樣本平均數的抽樣分配--抽出放回 所 有 可 能 的 不 同 樣 本 組 合 : 編 號 樣 本 x 編 號 樣 本 x 編 號 樣 本 x 1 2 3 4 5 6 7 8 9 1 0 ( 1 , 1 ) ( 1 , 2 ) ( 1 , 3 ) ( 1 , 4 ) ( 1 , 5 ) ( 2 , 1 ) ( 2 , 2 ) ( 2 , 3 ) ( 2 , 4 ) ( 2 , 5 ) 1 1 . 5 2 2 . 5 3 1 . 5 2 2 . 5 3 3 . 5 1 1 1 2 1 3 1 4 1 5 1 6 1 7 1 8 1 9 2 0 ( 3 , 1 ) ( 3 , 2 ) ( 3 , 3 ) ( 3 , 4 ) ( 3 , 5 ) ( 4 , 1 ) ( 4 , 2 ) ( 4 , 3 ) ( 4 , 4 ) ( 4 , 5 ) 2 2 . 5 3 3 . 5 4 2 . 5 3 3 . 5 4 4 . 5 2 1 2 2 2 3 2 4 2 5 ( 5 , 1 ) ( 5 , 2 ) ( 5 , 3 ) ( 5 , 4 ) ( 5 , 5 ) 3 3 . 5 4 4 . 5 5 x 1 1.5 2 2.5 3 3.5 4 4.5 5 )(xf 1/25 2/25 3/25 4/25 5/25 4/25 3/25 2/25 1/25 的抽樣分配X 14 27 範例:樣本平均數的抽樣分配--抽出放回 3 25 75 25 15 25 25.1 25 11)()( 9 1 ==×++×+×=⋅=Ε= ∑ = L i iiX xfxXµ [ ] 19103] 25 1)5(... 25 2)5.1( 25 1)1[()()( 22222 9 1 22 =−=−+++=Ε−⋅=∑ = Xxfx i iiXσ 所有可能組合之樣本平均數的期望值與母體平 均數相等 3== µµX 2 2 1 2 2 Xn σσ === 樣本平均數的變異數等於母體變異數的 1/n 倍, 28 對有限母體且抽出不放回,使用簡單隨機抽樣, 則樣本平均數 的抽樣分配之期望值與變異數如 下: X µ=)(XE期望值: ⎟⎠ ⎞⎜⎝ ⎛ − −= 1 )( 2 N nN n XV σ變異數: 樣本平均數 的抽樣分配--抽出不放回X 1− − N nN • 由於樣本數固定,所以當母體數愈大時, 愈趨近1。 • 當 n/N < 5%可將有限母體校正因子 忽略不計(可以 將之視為無限母體) • 當樣本數趨近於母體個數N 時,有限母體校正因子便趨近 於0,亦即表示 亦將趨近於0。Χσ 1− − N nN 15 29 • 中泰汽車接待小姐之月薪(N=5)之例 範例:樣本平均數的抽樣分配--抽出不放回 267.1) 15 35( 3 7.6) 1 (267.1 2 2 =− −=− −⇔= N nN nX σσ • 同例7.2,若採用抽出不放回的方式,試求樣本平 均數的抽樣分配,期望值與變異數。 所 有 可 能 的 不 同 樣 本 組 合 : 編 號 樣 本 x 編 號 樣 本 x 1 2 3 4 5 ( 1 , 2 ) ( 1 , 3 ) ( 1 , 4 ) ( 1 , 5 ) ( 2 , 3 ) 1 . 5 2 2 . 5 3 2 . 5 6 7 8 9 1 0 ( 2 , 4 ) ( 2 , 5 ) ( 3 , 4 ) ( 3 , 5 ) ( 4 , 5 ) 3 3 . 5 3 . 5 4 4 . 5 x 1.5 2 2.5 3 3.5 4 4.5 )(xf 0.1 0.1 0.2 0.2 0.2 0.1 0.1 的抽樣分配X 30 3 10 30 10 15.4 10 12 10 15.1)()( 7 1 ==×++×+×=⋅=Ε= ∑ = L i iiX xfxXµ 範例:樣本平均數的抽樣分配--抽出不放回 [ ]27 1 22 )()( Xxfx i iiX Ε−⋅=∑ = σ ( ) ( ) ( ) ( ) 75.0975.93 10 15.4 10 12 10 15.1 2222 =−=−⎥⎦ ⎤⎢⎣ ⎡ ×++×+×= L •所有可能組合之樣本平均數的期望值與母體 平均數相等 3== µµX •樣本平均數的變異數等於母體變異數除以 1/n 再乘上有限母體校正因子 ,即 1− − N nN 2 2 75.0 15 25 2 2 1 XN nN n σσ ==− −×=− −⋅ 16 31 抽樣分配之型態X 母體 常態分配 非常態 分配 小樣本 (n<30) )( n ,N~X 2σµ )( n ,N~X 2σµ )1(~ −− nt n S X µ )( n ,N~X 2σµ σ已知 σ未知 大樣本 )( 30>n 大樣本 )( 30>n 小樣本 (n<30) X之抽樣分配 須視母體分 配而定 32 中央極限定理 (Central Limit Theorem--C.L.T) X 從一個母體(平均數µ;變異數σ2)中抽取樣本數 為n的一組隨機樣本,其樣本平均數為 ,則當n趨 近無限大時, 或)/ ,(~ 2 nNX σµ )1 ,0(~ N n X σ µ− 母體分配 母體分配 xµ xµ 17 33 中央極限定理 (Central Limit Theorem--C.L.T) 抽樣分配 抽樣分配 n =5 xµ n =5 xµ n =10 xµ n =10 xµ 34 中央極限定理 (Central Limit Theorem--C.L.T) 抽樣分配 抽樣分配 n =30 xµ n =30 xµ n =50 xµ n =50 x . u 18 35 範例 【例7.6】一個在全省各地開了3000家分店的大企 業,想要以抽樣估計去年每家分店發生物品損壞的平 均損失金額。假設已知母體平均數µ = 1630元,而母 體標準差σ = 400元,試求(a) 倘若抽取n=100家分店 當成隨機樣本,則樣本平均數與母體平均數之差在60 元以內的機率是多少?(b) 倘若將抽取的分店家數增 加到n=256家,則樣本平均數與母體平均數之差在60 元以內的機率又是多少? 36 範例 Xσ µ = 1630,σ = 400元,令X代表該企業去年的損失 金額,則X~N(1630,4002) (a) 由於母體總數N=3000,而樣本數 n=100,二者 比例相當小,因此在求 時,可以將有限母體 校正因子省略不計,因此 40 100 400 === nX σσ 樣本平均數 的抽樣分配為 ~ N(1630,4002)X X ( ) ( ) 8664.00668.09332.0 )5.1()5.1()5.15.1( 40 60 40 60606060 =−= −≤−≤=≤≤−= ⎟⎟⎠ ⎞ ⎜⎜⎝ ⎛ ≤−≤−=≤−≤−=≤− ZPZPZP XPXΡXΡ Xσ µµµ 由以上的結果,我們有約87%的信心,斷定 估計µ的誤差不會超過60元。 X 19 37 範例 (b) 倘若將樣本數增加到n=256時,其 25256400 === = /n/X X σσ µµ 樣本平均數的抽樣分配為 ),(N~X 225 1630 ( ) ( ) 98360008209918042424242 25 60 25 60606060 ...).Z(P).Z(P).Z.(P )X(PXΡXΡ X =−=−≤−≤=≤≤−= ≤−≤−=≤−≤−=≤− σ µµµ • 當樣本數增加到256家分店時,其估計誤差 不超過60元的機率也增加到了98% • 當樣本數愈大時,估計值將愈精確,其樣 本平均數 愈趨近於母體的平均數。X 38 樣本比例 的抽樣分配pˆ • 推估某種特性(如性別)在整個母體中所佔的比例。 • 樣本比例 用來估計母體比例 p。 • Y 代表具有某種結果或特性之觀測值所發生的次 數,例如成功的次數或者男性的人數等,而n 則表 示樣本的大小,此時 Y 的機率分配為二項分配。 n Yp =ˆ • 期望值 ( ) ppˆ =Ε • 變異數 ( )n pp pˆ −= 12σ ( ) ( ) p n npY nn Ypˆ ===⎟⎠ ⎞⎜⎝ ⎛= ΕΕΕ 1 ( ) ( ) ( ) ( ) n pp n pnpYV nn YVpˆV −=−==⎟⎠ ⎞⎜⎝ ⎛= 111 22 20 39 範例 【例7.8】假設一家製造公司在生產線上有10%的不良品, 但公司的管理者並沒有發現此一狀況,如今品管部門想 要了解生產的品質優劣,因此隨機抽取了100個產品來檢 測。令 表示產品在檢測中被發現試不良品的樣本比例, 試求:(a) 的抽樣分配。(b)不良品的樣本比例在母體比 例的 ±0.05 之內的機率為何? pˆ pˆ (a) 由題意可知,母體比例 p=0.1 np = 100(0.1) = 10 > 5, nq = 100(0.9) = 90 > 5 1.0)ˆ( == ppΕ 030 100 90101 ... n )p(p pˆ =×=−=σ ).,.(N~pˆ 2030 10∴ (b) ( ) ⎟⎠ ⎞⎜⎝ ⎛ ≤−≤−=≤−≤− 030 050 030030 050050050 . . . ppˆ . ..ppˆ. ΡΡ ( ) 90500475095240671671 ..... =−=≤Ζ≤−Ρ≈ 40 卡方分配、t分配、F分配 與常態分配有關之抽樣分配 21 41 卡方分配 定義:設X為一個隨機變數,若其機率分配函數為 ( ) ⎟⎠ ⎞⎜⎝ ⎛ ⎟⎠ ⎞⎜⎝ ⎛ = −− 2 22 1 122 r x xf rx Γ e x≥0, n為正整數 則稱X為具有自由度r 的卡方分配,記為X ~ χ 2(r)。 定理:設X1, X2, …, Xn是n 個獨立的隨機變數且皆為標準常態 分配[以X1, X2, …, Xn ~ ind. N(0,1)表示],若Y = X12+X22+…+Xn2,則Y屬於自由度為 r 的卡方分配。 定理: 若Z ~ N(0,1),則Z2 ~ χ 2(1) 42 卡方分配 定理: 若 Yi ~ χ2(ri), i = 1,2,…, k,且Y1,Y2,…,Yk ~ ind. R.V.,則 •由“標準常態”平方和所組成 •主要是用來作適合度檢定(goodness-of-fit test),亦即檢定 資料是否符合某種機率分配 •也用來估計與檢定單一母體的變異數。 ⎟⎠ ⎞⎜⎝ ⎛∑∑ == kk 1 2 1 i i i i r~Y χ 22 43 卡方分配的性質 1.若R.V. X ~ χ 2(r),則 (1) 期望值E(X) = r; (2) 變異數V(X) = 2r 2.卡方分配之加法性: 設X, Y ~ ind. R.V. 且X ~ χ 2(r1) , Y ~ χ 2(r2), 若統計量 Z = X + Y,則Z ~ χ 2(r1+r2)。 3.卡方分配是右偏曲線,自由度愈大,變異數也愈大。 2χ 1.0=α 987.15)10(2 1.0 =χ • P[χ 2 >χα2(r)] = α代表在χα2(r)之右的面積為α。 例:χ 0.12(10) = 15.987 表 示自由度為10之卡方分 配中,比15.987大的機率 為10%,而比15.987小的 機率則為90%。 44 卡方分配 定理: 若x1, x2, …, xn是從常態分配N(µ, σ2)抽出一組樣本數為n 之隨機樣本,且 , ,則∑ = = n i iXn X 1 1 ∑ = −−= n i i XXn S 1 22 )( 1 1 ( ) )(~ 21 n X n i i χσ µ 2 2∑ = −若µ已知時, ( ) ( ) )1(~1 21 −−=−∑= nSnXX n i i χσσ 2 2 2 2 若µ未知時, 23 45 範例 【例7.11】 由一個平均數未知,而變異數σ 2 = 16的常態母體中抽出一 組樣本數為20的隨機樣本,試求: (a) 其樣本變異數會超過27.67的機率為多少? (b) 其樣本變異數會介於8.52與25.384之間的機率為多少? (a) 由題意可知母體的變異數σ 2 = 16,樣本數n =20,則樣本 變異數超過27.67的機率為 查表χ 0.0252(19) =32.85,因此P(S2=27.67) = P(χ 2=32.85) = 0.025,故樣本變異數超過27.67的機率為0.025。 )85.32() 16 67.27)120( 16 )120(()67.27( 2 2 2 >=×−>−=> χPSΡSΡ 46 範例 (b) 樣本變異數會介於8.52與25.384間的機率為 )1435.30117.10( ) 16 384.25)120( 16 )120( 16 52.8)120(()384.2552.8( 2 2 2 <<= ×−<−<×−Ρ=<<Ρ χP SS 查表χ 0.952(19) =10.117,χ 0.052(19) =30.1415,因此 P(8.52 < S2 < 25.384) = P(10.117 <χ 2 < 30.1435) = 0.95 - 0.05 = 0.90 24 47 t分配 定義 若隨機變數T的機率密度函數為 ( ) ( ) ∞<<∞−⎟⎟⎠ ⎞ ⎜⎜⎝ ⎛ +⋅⋅ ⎟⎠ ⎞⎜⎝ ⎛Γ ⎥⎦ ⎤⎢⎣ ⎡ +Γ = +− t r t rr r tf r ,11 2 2 1 2 1 2 π 則稱此機率分配是自由度為 r 的t分配,記為T~t(r) 定義 設Z, W ~ ind. R.V.,且Z~N(0,1),W~χ 2(r),令 則稱隨機變數T的機率分配屬於自由度為 r 的t分 配。 rW ZT / = 48 t 分配的性質 1. 當自由度 ∞→r 時,t分配近似於標準常態分配(r大於30) 2. t分配與Z分配相似,皆為以0為中心的對稱分配,所以 ( ) ( )tTtT ≥=−≤ ΡΡ 。 3. )()(1 rtrt αα −=− 4. ( ) ( )rFrt ,12 = 5. P[T ≥ tα(r)] = α 表示自由度為 r的t分配,tα(r) 之右尾面積為α。 α 0 tα(r) 25 49 t 分配 定理 若X1, X2, …, Xn是從常態分配N(µ, σ2)抽出一組樣本數為 n之隨機樣本,且σ2未知,若樣本平均數為 , 樣本變異數為 則統計量 ∑ = = n i iXn X 1 1 ∑ = −−= n i i XXn S 1 22 )( 1 1 )1(~ )1()1( / / /2 2 − −⎟⎟⎠ ⎞ ⎜⎜⎝ ⎛ − − =−= nt nSn n X nS XT σ σ µ µ 50 範例 【例7.13】假設X表示某國中之男生的體重,已知其為常態 分配(平均數 µ=63而標準差σ未知),亦即X~N(63,σ2)。倘 若今從此班級中隨機抽出n =16位男學生當成樣本,其樣本標 準差S =3.5,則這16位男同學之平均體重( )在某一數值k 以下的機率為0.975,試求此k值為多少? X 由於樣本為小樣本,且母體標準差未知,樣本標準差S=3.5, 故統計量T = ( - 63)/( 3.5/√16) ~ t (15)X P( < k) = 0.975 ⇔ P[( - 63)/( 3.5/√16) < (k - 63)/( 3.5/√16)] = 0.975 ⇔ P[t < (k - 63)/( 3.5/√16)] = 0.975 ⇔ P[t > (k - 63)/( 3.5/√16)] = 0.025 由t分配表中查得 t0.025(15) = 2.131,故(k - 63)/( 3.5/√16) =2.131 k = 64.86,即這16位男同學之平均體重小於64.86之機率為0.975 X X 26 51 F分配 定義 若隨機變數X之機率密度函數為 ( ) 0 , 122 2 2 2 1 1 22 2 1 21 21 21 11 ≥ ⎥⎦ ⎤⎢⎣ ⎡ ⎟⎟⎠ ⎞ ⎜⎜⎝ ⎛+ ⋅⎟⎟⎠ ⎞ ⎜⎜⎝ ⎛⋅ ⎟⎠ ⎞⎜⎝ ⎛Γ⎟⎠ ⎞⎜⎝ ⎛Γ ⎟⎠ ⎞⎜⎝ ⎛ +Γ = + − x x r r x r r rr rr xf rr rr 則X屬於自由度為r1, r2的F分配,簡記為X ~ F(r1, r2)式 中 r1 > 0 ,r2 > 0。 52 F分配的性質 α ( )21, rrFα 1. P[F > Fα (r1, r2)] = α 2. Fα (r1, r2) = 1/F1-α (r2, r1) or F1-α (r1, r2) = 1/ Fα (r2, r1) 3. 假如F~F(r1, r2),則 1/F ~ F(r2, r1) 4. F分配在統計學上應用相當廣,尤其在檢定兩母體變異 數是否相等,以及變異數分析之檢定上均會使用到 27 53 定理 若U表自由度為r1的卡方分配,V表自由度為r2的卡方分 配,亦即U ~ χ2(r1),V ~ χ2(r2),且U與V互為獨立,則 ),(~ / / 21 2 1 rrF rV rUF = F分配 定理 若兩個獨立隨機樣本:X1, X2, …, Xn1 ~N(µ1, σ12) , Y1, Y2, …, Yn2 ~ N(µ2, σ22),樣本平均數分別為 與 ,樣本變異數分別為 與 ,則 ∑ = = 1 11 1 n i iXn X ∑ = = 2 12 1 n i iYn Y ∑ = −−= 1 1 2 1 2 1 )(1 1 n i i XXn S ∑ = −−= 2 1 2 2 2 2 )(1 1 n i i YYn S )1,1(~ / / 212 2 2 2 2 1 2 1 −−= nnF S SF σ σ 54 歸納 統計量 定義公式 χ2 t F ∑= −= n i iXn 1 22 )()( σ µχ r rt 2 )( χ Ζ= 2 2 2 1 2 1 21 ),( r rrrF χ χ= 當母體平均數µ與變異數σ2已知時 28 55 歸納: 當母體平均數µ與變異數σ2未知時 統計量 公式χ2 t F 2 2 2 )1()1( σχ Snn −=− nS Xnt µ−=− )1( 2 2 2 121 /)1,1( SSnnF =−−
本文档为【抽样方法与抽样分配】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_282198
暂无简介~
格式:pdf
大小:439KB
软件:PDF阅读器
页数:28
分类:
上传时间:2010-02-03
浏览量:84