首页 二项分布参数的Bayes区间估计问题研究

二项分布参数的Bayes区间估计问题研究

举报
开通vip

二项分布参数的Bayes区间估计问题研究二项分布参数的Bayes区间估计问题研究 二项分布参数的 Bayes 区间估计问题研究 张 静 (兰州商学院 统计学院 ,兰州 730030) + 摘 要:在区间估计中,当给定置信概率时,区间长度越短精度就越高。在 R上取值的参数 θ HPD 区间估计已被很多人研究。文章给出了二项分布中成功概率 的常用后验区间估计和最短后 验区间估计,并对两者进行了对比,得出结论:在小样本情况下,最短可信区间计算方法值得采用。 关键词:二项分布;贝塔分布;先验分布;后验密度函数;区间估计 中图分类号:O212 文献标...

二项分布参数的Bayes区间估计问题研究
二项分布参数的Bayes区间估计问题研究 二项分布参数的 Bayes 区间估计问题研究 张 静 (兰州商学院 统计学院 ,兰州 730030) + 摘 要:在区间估计中,当给定置信概率时,区间长度越短精度就越高。在 R上取值的参数 θ HPD 区间估计已被很多人研究。文章给出了二项分布中成功概率 的常用后验区间估计和最短后 验区间估计,并对两者进行了对比,得出结论:在小样本情况下,最短可信区间计算方法值得采用。 关键词:二项分布;贝塔分布;先验分布;后验密度函数;区间估计 中图分类号:O212 文献标识码:A 文章编号:1002-6487(2011)18-0037-02 θ 位数来获得 的常用可信区间,但常用可信区间常常不是最 短的。当参数的后验密度函数为单峰对称时,此时的常用可 0引言 信区间即为最短区间,当后验密度函数为单峰非对称时,可 利用条件极值的方法,给出参数的最短后验区间估计。本文 对于区间估计问题,贝叶斯方法具有处理方便和含义清 θ 晰的优点,而经典方法寻求的置信区间常受到批评。当参数 拟利用条件极值方法给出二项分布成功概率 的最短可信 θ θθ α x的后验分布 π() 获得以后,若给定概率 1 ,要找一个 /- 区间,并将其与 的常用可信区间进行比较。 θ xα 区间 [a, b] ,使 P(a b/ ) = 1 - 成立,这样求得的区 θ 1 二项分布参数的常用后验可信区间 间 就是 的贝叶斯区间估计。 可信水平和区间长度是评价贝叶斯区间估计的两个指 标,在可信水平给定的情况下,可信区间的长度越短越好。 定义 密度函数为 θα x对给定的可信水平 1 ,从后验分布 π() 获得的可信区 - /Γ(a b) + a - 1b - 1 xxxx p() = (1 )(0 1) - α α α 间不止一个,常用的方法是把 平分,用 2 和 1- 2 的分 Γ(a)Γ(b) 作者简介:张 静(1965-),女,山东滕州人,副教授,研究方向:应用数理统计。 2010.社,素占主导地位,而正常衰老死亡因素影响很小,几乎可以忽[2]魏华林,林宝清.保险学[M]. 北京:高等教育出版社,2006. [3]卢仿略不计。在 70,90 岁,在这一阶段中漂移率和波动率开始 先,张琳.寿险精算数学[M]. 北京:中国财政经济出版社, 上升,说明这一阶段中人的生命力开始较快下降,在死亡原 2006,(12). [4]R.卡尔斯,M.胡法兹,J.达呐,M.狄尼特.现代精算因中非正常衰老死亡因素和正常衰老死亡因素各占一部 风险理论[M].北 分。90 岁以后,在这一阶段中漂移率和波动率急剧上升,波 京:科学出版社,2005. 动率甚至达到无法计算的地步,说明这一阶段中人的生命力 [5]M Bladt,TH Ryberg.An Actuarial Approach to Option Pricing under 几乎耗尽,在死亡原因中正常衰老死亡因素占据绝对主导地 the Physical Measure and without Market Assumptions[J].Insurance: 位而非正常衰老死亡因素影响较小。 Mathematics and Economics,1998,(22). (2)由所计算出来的隐含波动率可以看出在 0 岁到 70 岁 [6]Paul Embrechts. Summer Acturial Versus Financial Pricing of Insur- 之间,波动率比较小,相对稳定,因此在这个时间段用几何布 nace[J]. The Journal of Risk Finance, 2000,1(4). 朗运动来描述人数 S是合理的。70 岁以后波动率较高,在 t [7]Shaun S.Wang. A Universal Framework for Pricing Financial and In- 几何布朗运动中把波动率假设为常数就不太合理,可以考虑 surance Risks[J]. Astin Bulletin, 2002,32(2). 用其它过程来描述。 [8]Anna Rita Bacinello, Enrico Biffs,Pietro Millossovich. Pricing Life In- surance Contracts with Early Exercise Features[J]. Journal of Compu- 参考文献: tational and Applied Mathematics, 2009,233(1). [1]约翰.赫尔.期权、期货及其他衍生产品[M].北京:机械工业出版 (责任编辑/亦 民) 统计与决策,,1 1 年第 18 期(总第 342 期) 37 xxxxx的概率分布(在其它 x 处,P(x)=0)称为贝塔分布,记为求导得:dd= f ()f () ,又 对(1)式两边关于 //1 21 12Be(a, b) ,其中 a与b 都是形状参数,且都为正。 xxx L= ,对 其 两 边 关 于 求 导 并 令 dL- /2 1 1 [3] 定理若 ξ , Be(a, b) ,则 η = bξ/a(1 - ξ) , F(2a, 2b) ,xxxxxxx d= d d1 = 0 得 d d= 1 ,则有 f () = f ( ) ,将/- /1 21 21 12 x 其中 2a ,2b 为自然数。函数 f () 带入并化简得: b + n T 1a + T 1b + n T 1- - - - - a + T - 1推 论 设 二 项 分 布 中 成 功 概 率 p 的 先 验 分 布 为xxxx (1 )(1 )(3)- = - 1 12 2α (3)式的解即是满足(2)式的解。下面只需证明(2)、(3) Be(a, b) ,对给定可信水平 1 - ,参数 p 的常用区间估计为 有解且解唯一。 é (a + ) TF(a + T )F α ùα 1 - 22 úê ,0 T ? n 时,可保证 a + T >1, b + n T >1,此 因为在 T ? ,- êú(b + n ) + (a + ) (b + n ) + (a + )F - TTF- TTαα1 - 2 2û xë Be(a + T b + n T ) 分布的密度函数 f () 为单峰曲线,且 时 ,- 其中,为 n 次实验中成功出现的次数。Ta + T 1 - xx xx在 = 处达到最大值,当 时 f () 单调0 0 证明:设总体 X 服从两点分布 b(1, p) ,从中获得样本观 2T + a b n- - nx xxx 递增,当 时 f () 单调递减,而当 趋向于 1 或 0 时 0 xxxxx测值 , , ?, ,则每个 不是 0 便是 1,令 T = 为 n12n i ? i xxxx < 和(3)式成立,应有 f () 趋向于零。为保证<1 2 1 i = 1 a + T -1 a + T -1 次独立实验中成功的次数,T 服从二项分布 B(n,p),即xx且 > 。这样对任意 可唯2 2 a b n 2T + a b n 2T + - - - - T n T n - æ ö L(T/p) = p(1 - p)( T = 1, 2, ?, n ;0? p ?1)xxxxèT ø = u() 。另外,当 趋于 1 时,从大于 0 的一的解出 21 2 1 选取 p 的先验分布为 Be(a b) ,则 p 的后验分布为,xxxx 一侧趋于零;而 从大于 的一侧趋于 时,从小于2 0 0 1 a 1b 1 T n T- - - xxπ( pT ) ? π( p)L(Tp) ? p(1 p)p(1 p)//- - 的一侧趋于,因此,有0 0 a + T 1b + n T 1 - - - x x x x = p(1 - p),(0? p ?1)lim [F() - F(u())] = 1 ,lim [F() - F(u())] = 02 2 2 2 xxx? 1? 2 2 0 这是后验分布的核,故此后验分布为* * xx 由中值定理可知,存在唯一的( ,u())使(1)式成立。 2 2π( pT ) , Be(a + T b + n T ) /,- 而由上述定理可知: 3 举例 (b + n - T ) p, F(2(a + T ) 2(b + n T )) ,- (a + T )(1 p) - θ 设 是一批产品的不合格品率,从中抽取 8 个产品进行 查F分布表,得 θ检查,发现 3 个不合格品,假如先验分布为 π() , Be(1 1) , , (b + n - T ) pθ 求不合格品率 的 90%的置信区间。 P{F F α α} = 1 - α (a + T )(1 p)1 - - 2 2 在 本 例 中 ,a = 1 b = 1 ,n = 8 T = 3 查 F 分 布 表 得,,α 由此可得 p 的可信水平为 1 - 的可信区间为 θ (8 12) =0.3049 F ,(8 12) =2.85,故由上可得 的可信 ,F 0.050.95 é (a + T )F (a + T )F α ùα 90的常用可信区间为[0.1689,0.6552],该区间不是最水平为 %1 - 2 2úê , ê短区间。为此,寻找最短的可信区间。利用贝塔分布与二项ú(b + n - T ) + (a + T )F (b + n - T ) + (a + T )F αα1 - 2 2û ë 分布之间的关系,满足(2)式的解等价于 xx min L = - ì2 1 ï NN 2二项分布参数的最短后验区间估计í k k N - k xxxxα1 - = (1 - )C(1 - )- ?2 2 N 1 1 N k = a + T k = a + T î 由于 F 分布为单峰非对称分布,故上述区间并非最短可 其中:N = a + b + n - 1 由上可信区间,下面我们寻求参数 p 的最短后验区间估计。 可应用软件 或 LINGO 求解,如上式求得最短 MATLAB知在 p 的先验分布为 Be(a b) 时,其后验分布: ,可信区间为[0.1721,0.5996],比常用的区间短。可见,对于容 α π( p/T ) , Be(a + T, b + n - T ) ,对给定的可信水平 1 - ,选 量较小样本,得到的最短后验可信区间比常用的 Bayes 可信 xxxx取 , (< ) ? (0, 1) ,使 121 2区间有较好的改进。 x 2xxα xxP{ p T } = π( pT )dp = F() F() = 1 (1)//- - 1 221? x1 参考文献: xx 其中,F() 、f () 分别为 Be(a + T, b + n - T ) 的分布函[1]杨兴琼,张德然,周伟萍.一类非正态总体未知参数的 Bayes 假设 α 数与密度函数。于是,得到 p 的可信水平为 1 - 的可信区 检验[J].绵阳师范学院学报,2007(, 8). xxxx间 [, ] ,其区间长度为 L= - ,欲求最短区间,只需求 122 1 [2]李中恢,任海平.泊松分布参数的最高后验概率密度区间的估计 * *xx出满足如下条件的 与 方法[J].统计与决策,2009(, 19). 1 2 [3]茆诗松.贝叶斯统计[M].北京:中国统计出版社,1999.xx min L = - ì2 1 ï x [4]韦博成.参数统计教程[M].北京:高等教育出版社,2006.2 (2)í xïx p/T )dp = F() - F() π(21 ? (责任编辑/亦 民) xî 1 统计与决策,,1 1 年第 18 期(总第 342 期) 38
本文档为【二项分布参数的Bayes区间估计问题研究】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_624976
暂无简介~
格式:doc
大小:34KB
软件:Word
页数:5
分类:生活休闲
上传时间:2017-09-20
浏览量:32