下载

1下载券

加入VIP
  • 专属下载特权
  • 现金文档折扣购买
  • VIP免费专区
  • 千万文档免费下载

上传资料

关闭

关闭

关闭

封号提示

内容

首页 第5章不完全信息动态博弈

第5章不完全信息动态博弈.ppt

第5章不完全信息动态博弈

yulu19891029
2012-03-29 0人阅读 举报 0 0 暂无简介

简介:本文档为《第5章不完全信息动态博弈ppt》,可适用于财会税务领域

第五章不完全信息动态博弈精练贝叶斯纳什均衡一精练贝叶斯纳什均衡基本思路贝叶斯法则精练贝叶斯纳什均衡不完美信息博弈的精练贝叶斯均衡二信号传递博弈及其应用举例三博弈论概念简要总结基本思路不完全信息动态博弈基本思路不完全信息动态博弈类型:自然首先选择参与人的类型参与人自己知道其他参与人不知道。不完全信息行动:行动有先有后后行动者能观测到先行动者的行动但不能观测到其类型。动态博弈但是参与人是类型依存型的每个参与人的行动都传递有关自己类型的信息后行动者可以通过观察先行动者的行动来推断自己的最优行动。先行动者预测到自己的行动被后行动者利用就会设法传递对自己最有利的信息。不完全信息动态博弈过程不仅是参与人选择行动的过程而且是参与人不断修正信念的过程。精练贝叶斯均衡是泽尔腾不完全信息动态博弈子博弈精练纳什均衡与海萨尼不完全信息静态博弈贝叶斯均衡的结合。基本思路不完全信息动态博弈基本思路不完全信息动态博弈成语故事:黔之驴驴虎博弈老虎通过不断试探来修正对毛驴的看法每一步行动都是给定它的信念下最优的毛驴也是如此。最终老虎将毛驴吃掉。基本思路不完全信息动态博弈基本思路不完全信息动态博弈市场进入博弈:参与人:在位者进入者T=市场上只有一个垄断企业在位者一个潜在进入者考虑是否进入如果进入者进入两个企业进行库挪特博弈在位者获得垄断利润。类型:在位和有两种类型高成本或低成本进入者在博弈开始时只知道在位者高成本的概率是x低成本概率是x。称为先验概率。对于在位者:基本思路不完全信息动态博弈基本思路不完全信息动态博弈进入者只有一种类型:进入成本为如果进入生产成本函数与在位者高成本函数相同。T=如果进入者已进入在位者成本函数为共同知识若在位者为高成本企业企业成本函数相同对称库诺特均衡产量下的价格p=时每个企业利润为扣除进入成本进入者利润为。若在位者为低成本两个企业成本函数不同非对称库诺特均衡产量下的价格p=,在位者利润是进入者成本为扣除进入成本其利润为。N高低在位者P=P=进入不进入进入不进入进入不进入进入不进入(,)(,)(,)(,)(,)(,)(,)(,)P=进入者进入不进入(,)(,)进入不进入(,)(,)xx在位者P=P=P=第一阶段第二阶段(,)(,)(,)(,)(,)(,)(,)(,)(,)(,)(,)(,)市场进入博弈阶段不完全信息动态博弈进入者只有一种类型:进入成本为如果进入生产成本函数与在位者高成本函数相同。T=如果进入者已进入在位者成本函数为共同知识若在位者为高成本p=时每个企业利润为扣除进入成本进入者利润为。若在位者为低成本p=,在位者利润是进入者成本为扣除进入成本其利润为。基本思路不完全信息动态博弈基本思路不完全信息动态博弈T=,企业的行动选择是一个简单的静态博弈决策问题但在第一阶段情况要复杂得多:进入者是否进入依赖于它对在位者成本函数的判断:给定在位者是高成本时进入者进入的净利润是低成本时进入者的利润是当只当进入者认为在位者是高成本的概率大于时进入者才选择进入。但与静态博弈不同的是在观测到在位者第一阶段的价格选择后进入者可以修正对在位者成本函数的先验概率x因为在位者的价格可能包含其成本函数的信息。N高低在位者P=P=进入不进入进入不进入进入不进入进入不进入(,)(,)(,)(,)(,)(,)(,)P=进入者进入不进入(,)(,)进入不进入(,)(,)xx在位者P=P=P=第一阶段第二阶段(,)(,)(,)(,)(,)(,)(,)(,)(,)(,)(,)(,)市场进入博弈阶段不完全信息动态博弈进入者只有一种类型:进入成本为如果进入生产成本函数与在位者高成本函数相同。T=如果进入者已进入在位者成本函数为共同知识若在位者为高成本p=时每个企业利润为扣除进入成本进入者利润为。若在位者为低成本p=,在位者利润是进入者成本为扣除进入成本其利润为。基本思路不完全信息动态博弈基本思路不完全信息动态博弈如:低成本的在位者不会选择p=因此如果进入者观察到在位者选择了p=,就可以推断在位者一定是高成本选择进入是有利可图的。预测到p=会招致进入者进入即使高成本的在位者也可能不会选择p=,而招致进入者的进入。相反低成本在位者也不会选择p=如果p=会招致进入者进入的话。问题的核心是:不同的价格如何影响进入者的后验概率从而影响进入者的进入决策。基本思路不完全信息动态博弈基本思路不完全信息动态博弈一个非单阶段最优价格会减少现期利润但如果它能阻止进入者进入从而使在位者在第二阶段得到的是垄断利润而不是库诺特均衡利润如果垄断利润与库诺特均衡利润的差距足够大如果在位者有足够的信心选择一个非单阶段最优价格可能是最优的。在均衡情况下在位者究竟选择什么价格不仅与成本函数有关而且与进入者的先验概率x有关。而不关x为多少单阶段最优垄断价格不构成均衡。基本思路不完全信息动态博弈基本思路不完全信息动态博弈在静态贝叶斯均衡中参与人的信念是事前给定的均衡该概念没有规定参与人如何修正自己的信念。但是如果进入者可以任意修订自己有关在位者成本函数的信念上述不完全信息动态博弈可以有任意均衡。如假定x<下列战略组合是一个贝叶斯均衡:不论在位者选择什么价格进入者总认为在位者是低成本的概率为x*<总是选择不进入搞成本在位者选择p=,低成本在位者选择p=。但显然这个均衡是不合理的因为它包含了一个不可置信威胁:进入者不会修正对在位者成本函数的信念。给定p=不可能是低成本在位者的最优选择如果在位者选择了p=,进入者为什么仍然认为在位者是高成本的概率小于呢?基本思路不完全信息动态博弈基本思路不完全信息动态博弈完全信息动态博弈中引入了子博弈精练纳什均衡的概念概念剔除那些不可置信的威胁但是不完全信息动态博弈中只有一个子博弈不能将上述方法直接用于求不完全信息动态博弈的均衡解但可以借用这一方法逻辑。将每个信息集开始的博弈的剩余部分称为一个“后续博弈”一个“合理”的均衡应该满足如下要求:给定每一个参与人有关其他参与人类型的后验信念参与人的战略组合在每一个后续博弈上构成贝叶斯均衡。剔除这种不可信行为的方式是:假定参与人(在所有可能情况下)根据贝叶斯规则修正先验概念并且每个参与人都假定其他参与人选择的是均衡战略。基本思路不完全信息动态博弈基本思路不完全信息动态博弈精练贝叶斯均衡是贝叶斯均衡、子博弈精练均衡和贝叶斯推断的结合。它要求:、在每个信息集上决策者必须有一个定义在属于该信息集的所有决策结上的一个概率分布(信念)、给定该信息集上的概率分布和其他参与人的后续战略参与人的行动必须是最优的、每一个参与人根据贝叶斯法则和均衡战略修正后验概率。第五章不完全信息动态博弈精练贝叶斯纳什均衡一精练贝叶斯纳什均衡基本思路贝叶斯法则精练贝叶斯纳什均衡不完美信息博弈的精练贝叶斯均衡二信号传递博弈及其应用举例三博弈论概念简要总结贝叶斯法则贝叶斯法则在日常生活中当面临不确定时我们对某事件发生的可能性有一个判断然后会根据新的信息来修正这个判断。统计学上修正之前的判断称为“先验概率”修正后的判断称为“后验概率”贝叶斯法则就是人们根据新的信息从先验概率得到后验概率的基本方法。贝叶斯法则贝叶斯法则假定参与人的类型是独立分布的参与人i有K个类型有H个可能的行动өk和ah分别代表一个特定的类型和一个特定的行动。如果我们观察到i选择了ahi属于өk的后验概率是多少?贝叶斯法则贝叶斯法则人:好人(GP)坏人(BP)事:好事(GT)坏事(BP)一个好人干好事的概率等于他是好人的概率p(GP)乘以好人干好事的概率p(GT|GP)加上他是坏人的概率p(BP)乘以坏人干好事的概率p(GT|BP):Prob{GT}=p(GT|GP)*p(GP)p(GT|BP)*p(GT|BP)假定观测到一个人干了一件好事那么这个人的是好人的后验概率是:贝叶斯法则贝叶斯法则假定我们认为这个人是好人的先验概率是观测到他干了好事之后如何修正他的先验概率依赖于他干的好事好到什么程度:、是一件非常好的好事坏人绝对不可能干则p(GT|GP)=p(GT|BP)=、这是一个非常一般的好事好人会干坏人也会干:p(GT|GP)=p(GT|BP)=、介于上述两种情况之间:好人肯定会干但坏人可能会干也可能不会干:p(GT|GP)=p(GT|BP)=贝叶斯法则假定我们观测到他干了一件坏事我们相信好人绝对不会干坏事那么可以肯定他绝对不是一个好人。假定我们原来认为他是个好人大突然发现他干了一件好事我们如何看待呢?第五章不完全信息动态博弈精练贝叶斯纳什均衡一精练贝叶斯纳什均衡基本思路贝叶斯法则精练贝叶斯纳什均衡不完美信息博弈的精练贝叶斯均衡二信号传递博弈及其应用举例三博弈论概念简要总结精练贝叶斯纳什均衡精练贝叶斯纳什均衡精练贝叶斯均衡是均衡战略和均衡信念的结合给定信念:是使用贝叶斯法则从均衡战略和所观测到的行动得到的。因此精练贝叶斯均衡是一个对应的不动点:N高低在位者P=P=进入不进入进入不进入进入不进入进入不进入(,)(,)(,)(,)(,)(,)(,)(,)P=进入者进入不进入(,)(,)进入不进入(,)(,)xx在位者P=P=P=第一阶段第二阶段(,)(,)(,)(,)(,)(,)(,)(,)(,)(,)(,)(,)市场进入博弈阶段不完全信息动态博弈x<时精练贝叶斯均衡为:不论高成本还是低成本在位者选择p=进入者进入当只当进入者观察到p=时。混同均衡X>=时精练贝叶斯均衡为:低成本在位者选择p=,高成本在位者选择p=进入者选择不进入如果观测到p=进入者选择进入如果观测到p=分离均衡精练贝叶斯纳什均衡精练贝叶斯纳什均衡高在位者P=进入者进入在位者利润:X<在位者P=进入者不进入在位者利润:牺牲单位换取单位利润是合算的在位者P=给定在位者的后验概率和战略低在位者P=进入者不进入在位者利润:最优选择给定两类在位者都选p=进入者不能从观测到价格中得到任何信息x()=(*x)(*x*(x))=x<,进入的期望利润x()(x)*()=x<,不进入的期望利润为因此不进入是最优的。混同均衡精练贝叶斯纳什均衡精练贝叶斯纳什均衡混同均衡因为两类在位者选择同样的价格直观地讲因为x<,如果进入者不能从在位者的价格选择中得到新的信息她选择不进入。因此高成本在位者可以通过选择与低成本在位者相同的价格隐藏自己是高成本的事实低成本在位者也没有必要批露自己是低成本的事实。低在位者P=进入者不进入在位者利润:X>=低在位者P=进入者进入在位者利润:最优选择在位者P=给定在位者的后验概率和战略高在位者P=进入者不进入在位者利润:给定在位者的战略x()=和x()=是正确的因此进入者的最优战略是:如果观测到p=,选择进入如果观测到p=,选择不进入。分离均衡高在位者P=进入者进入在位者利润:最优选择在位者P=精练贝叶斯纳什均衡精练贝叶斯纳什均衡分离均衡因为不同类型的在位者选择了不同的价格。低成本在位者选择了非单阶段最优价格p=高成本在位者选择了单阶段最优垄断价格p=如果低成本在位者选择p=,无法将自己与高成本在位者分开进入者将进入但如果他选择p=,高成本在位者不会模仿进入者不进入因此低成本在位者宁愿放弃单位的现期利润换取单位的下期利润。高成本在位者之所以不选择p=,是因为成本太高下阶段的单位例如不足以弥补现期单位的损失。不完全信息带来的唯一后果是低成本在位者损失单位的利润这也可以说是他为了证明自己是低成本而支付的“认证”费用。精练贝叶斯纳什均衡精练贝叶斯纳什均衡啤酒蛋糕博弈参与人是一个善于打架的强者的概率是是一个不善于打架的弱者的概率是但是即使参与人知道自己能打赢也不想和别人打架。如果参与人是弱者参与人就想和他打架。参与人不知道参与人的类型但他能够观察参与人早餐吃什么如。参与人知道若者喜欢以蛋糕为早餐而强者喜欢以啤酒为早餐。两个均衡:无论参与人是什么类型都选择啤酒做早餐参与人选择不打架无论参与人是什么类型都选择蛋糕作为早餐参与人选择不打架。被排除第五章不完全信息动态博弈精练贝叶斯纳什均衡一精练贝叶斯纳什均衡基本思路贝叶斯法则精练贝叶斯纳什均衡不完美信息博弈的精练贝叶斯均衡二信号传递博弈及其应用举例三博弈论概念简要总结信号传递博弈及其应用举例信号传递博弈及其应用举例信号传递博弈是一种比较简单的但有广泛应用意义的不完全信息动态博弈。参与人:两个信号发送者和信号接收者的类型是私人信息的类型是公共信息(即只有一个类型)。博弈顺序:、“自然”首先选择参与人的类型参与人知道但参与人不知道。只知道属于该类型x的先验概率。、参与人观测到类型x后发出信号、参与人观测到参与人发出的信号使用贝叶斯法则从先验概率得到后验概率然后选择行动。N高低在位者P=P=进入不进入进入不进入进入不进入进入不进入(,)(,)(,)(,)(,)(,)(,)(,)P=进入者进入不进入(,)(,)进入不进入(,)(,)xx在位者P=P=P=第一阶段第二阶段(,)(,)(,)(,)(,)(,)(,)(,)(,)(,)(,)(,)参与人?博弈顺序?博弈结果?市场进入博弈精练贝叶斯纳什均衡精练贝叶斯纳什均衡信号传递博弈的所有可能的精练贝叶斯均衡可以划分为类:分离均衡:不同类型的发送者(参与人)以的概率选择不同的信号或者说没有任何类型选择与其他类型相同的信号在分离均衡下信号准确地揭示出类型。混同均衡:不同类型的发送者选择相同的信号或者说没有任何类型选择与其他类型不同的信号因此接收者不修正先验概率。准分离均衡:一些类型的发送者随机地选择信号另一些类型的发送者选择特定的信号。练习练习下图是一个信号传递博弈:自然首先选择参与人的类型参与人知道自然的选择参与人不知道只知道参与人属于类型t和t的可能性相等参与人然后选择信号L或R参与人选择行动U或D博弈结束支付向量如图所示给出这个博弈所有纯战略分离均衡和混同均衡。NttLRUDUDUDUD(,)(,)(,)(,)(,)(,)(,)(,)RL参与人?博弈顺序?博弈结果?第五章不完全信息动态博弈精练贝叶斯纳什均衡一精练贝叶斯纳什均衡基本思路贝叶斯法则精练贝叶斯纳什均衡不完美信息博弈的精练贝叶斯均衡二信号传递博弈及其应用举例三博弈论概念简要总结占优均衡DSE重复剔除占优均衡IEDE纯战略纳什均衡PNE混合战略纳什均衡MNE请各对每种均衡举个例子完全信息静态博弈纳什均衡占优战略均衡占优战略均衡案例囚徒困境囚徒A囚徒B坦白抵赖坦白抵赖重复剔除的占优均衡重复剔除的占优均衡等待小猪大猪按等待按案例智猪博弈“按”是大猪的占优战略纳什均衡:大猪按小猪等待纳什均衡纳什均衡寻找纳什均衡CRRCCR参与人B参与人A(RC)是纳什均衡混合战略纳什均衡社会福利博弈流浪流浪汉政府救济不救济寻找工作设:政府救济的概率:不救济的概率:。流浪汉:寻找工作的概率:流浪的概率:每个参与人的战略都是给定对方混合战略时的最优战略完全信息动态搏弈子博弈精炼纳什均衡完全信息动态搏弈子博弈精炼纳什均衡强盗分金UDL()RU’()(,)D’子博弈精练纳什均衡((UU’)L)U’和L分别是参与人和参与人在非均衡路径上的选择。逆向归纳法求解子博弈精练纳什均衡的过程实质上是重复剔除劣战略的过程:从最后一个决策结依次剔除每个子博弈的劣战略最后生存下来的战略构成精练纳什均衡。不完全信息静态博弈贝叶斯纳什均衡不完全信息静态博弈贝叶斯纳什均衡贝叶斯纳什均衡:n人不完全信息静态博弈的纯战略均衡是一个类型依存战略组合其中每个参与人i在给定自己的类型θi和其他参与人类型依存战略的情况下最大化自己的期望效用。空城计不完全信息动态博弈精练贝叶斯纳什均衡不完全信息动态博弈精练贝叶斯纳什均衡精练贝叶斯均衡是贝叶斯均衡、子博弈精练均衡和贝叶斯推断的结合。它要求:、在每个信息集上决策者必须有一个定义在属于该信息集的所有决策结上的一个概率分布(信念)、给定该信息集上的概率分布和其他参与人的后续战略参与人的行动必须是最优的、每一个参与人根据贝叶斯法则和均衡战略修正后验概率。黔之驴

用户评价(0)

关闭

新课改视野下建构高中语文教学实验成果报告(32KB)

抱歉,积分不足下载失败,请稍后再试!

提示

试读已结束,如需要继续阅读或者下载,敬请购买!

文档小程序码

使用微信“扫一扫”扫码寻找文档

1

打开微信

2

扫描小程序码

3

发布寻找信息

4

等待寻找结果

我知道了
评分:

/41

第5章不完全信息动态博弈

VIP

在线
客服

免费
邮箱

爱问共享资料服务号

扫描关注领取更多福利