下载

1下载券

加入VIP
  • 专属下载特权
  • 现金文档折扣购买
  • VIP免费专区
  • 千万文档免费下载

上传资料

关闭

关闭

关闭

封号提示

内容

首页 博弈论期末大礼包博弈论论述题

博弈论期末大礼包博弈论论述题.doc

博弈论期末大礼包博弈论论述题

沫沫的__
2018-09-10 0人阅读 举报 0 0 暂无简介

简介:本文档为《博弈论期末大礼包博弈论论述题doc》,可适用于高等教育领域

一、什么是子博弈精炼纳什均衡?答:将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的。由于剔除了不可置信的威胁在许多情况下精炼纳什均衡也就缩小了纳什均衡的个数。只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。二、参与人的理性问题对动态博弈分析的影响是否比静态博弈的影响更大?为什么?答:正确博弈论要求个体具有始终追求自身利益最大化的理性意识和理性能力的“自我”个体理性这是静态博弈的范畴。除此之外还要求相关的参与者具有层次较高的“交互理性”要求不同个体之间在理性和行为方面具有一种“默契”。即人们的自身利益的最大化不仅取决于自己的选择还取决于与之相关的其他人的选择与行为那么为了实现自己的最大利益个体的理性决策就必须考虑他人的理性选择与行为。作为博弈论的基础交互理性是其基本的理性要求。博弈论还要求有关博弈的结构、各个博弈参与者的得益函数以及各个博弈参与者的理性等“知识”是所有博弈参与者之间的“共同知识”。也就是每个博弈参与者不仅要首先明确自己和其他参与者所有可选的策略还需知晓各种情况下自己最终的收益或其概率分布并且每个博弈参与者都知道各个参与者掌握这些信息更为重要的是每个博弈参与者都知道所有参与者都是理性的都知道其他博弈参与者知道所有参与者都是理性的都知道其他博弈参与者知道其他博弈参与者知道所有博弈参与者都是理性的。理性的共同知识假设是非合作博弈理论的一个非常重要和关键的假设是实现交互理性和理性主义的纳什均衡的基本前提这些都是动态博弈的范畴。因此说参与者理性问题对动态博弈的分析影响更大。三、纳什均衡和精炼纳什均衡存在哪些问题?答:纳什均衡存在的问题:()不是所有博弈都存在纳什均衡如纯策略就不存在混合策略则一定会存在纳什均衡它是通过概率来计算纳什均衡在这种均衡下给定其他参与人的策略选择概率每个参与人都可以为自己确定选择每一种策略的最优概率。()在论及纳什均衡时我们假设参与人是完全理性的而且是假定参与人之间不允许达成任何协议的非合作博弈的均衡解。而现实并非如此。精炼纳什均衡存在的问题:有限重复博弈的子博弈精炼纳什均衡有如下定理∶令G是阶段博弈G(T)是重复T次的重复博弈。那么如果G有唯一的纳什均衡重复博弈G(T)的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次。这个定理成立的条件是单阶段纳什均衡的“唯一性”若纳什均衡不是唯一的上述定理的结论就不一定成立。四、有限次重复博弈和无限次重复博弈有什么区别?这些区别对我们有什么启发?答:有限次重复博弈与无限次重复博弈都属于动态博弈对于有限次博弈收益是每次收益的简单相加可以采取子博弈纳什均衡的方法求解即逆推法但无限次博弈却不能采取此外有限次博弈中博弈的双方都还是关注的是自己短期的利益而无限次博弈中博弈的双方可能针对某项事情达成协议达到共谋为共同的利益而选择自己的行动达到整体的最优供应链契约即类似。五、有限次重复博弈的精炼纳什均衡的最后一次重复必定是第一阶段博弈的一个纳什均衡?答:博弈重复次数有限意味着存在所有参与人都可以预测到的“最后一次”。在最后的阶段博弈中如果某一参与人选择了自己的占优战略给其他参与人造成损失则其他参与人不可能报复。所有的参与人都明白这一点因而在最后一次阶段博弈中都会选择占优战略换句话说在给定最后阶段所有参与人都会选择占优战略的前提下所有的参与人在倒数第二阶段的博弈中也都会选择占优战略。由此从最后的阶段开始逐个阶段进行推理可以得出以下结论:在阶段博弈有唯一的纳什均衡时有限次重复博弈的唯一子博弈精炼纳什均衡结果是阶段博弈的纳什均衡重复。这就是说每个阶段博弈出现的都是一次性博弈的均衡结果。六、无限次重复博弈均衡解的得益一定会优于原博弈均衡解的得益吗?答:不一定。例如:无限次重复博弈的古诺博弈此博弈是相同博弈重复无限次当冷酷战略是整个博弈的纳什均衡时当然也就是每个阶段的纳什均衡。此时无限次重复古诺博弈的冷酷战略已意味着是两厂商在两种战略间进行选择的囚徒困境博弈一是选择生产垄断产量的一半Q另一是选择生产背叛产量时冷酷战略是无限次重复古诺博弈的一个子博弈精炼纳什均衡。贴现因子较大说明未来的利益较大对两厂商都有较大的吸引力一般情况下两厂商不会为了短期利益而背叛对方而失去较大的长远利益即两厂商都有坚持冷酷战略的积极性。而当时意味着冷酷战略不再是一个子博弈精炼纳什均衡。贴现因子较小说明未来的利益对两厂商都不具有吸引力选择背叛才是两厂商的最优选择。这种条件下博弈无限次重复也不能提高一次性博弈的得益。七、触发战略所构成的均衡都是子博弈精炼纳什均衡吗?答:“触发战略”是这样一种战略∶首先试探合作如果对方合作则给予奖励如果对方不合作则给以惩罚。在原博弈有多个纳什均衡的条件下在重复博弈时通过触发战略提高了双方的收益。首先在第二次博弈时意味着该博弈结束而均衡结果是原博弈的纳什均衡双方都没有偏离的意愿其次第一次选的策略虽不是原博弈的纳什均衡如果某一方偏离会增加收益但这样会遭到对方第二次选另外的策略的惩罚而损失收益使总得益减少。预见到这一点只顾眼前不顾长远的偏离是得不偿失的事因此双方会坚持选使总收益最大的策略。所以触发战略构成的均衡都是子博弈精炼纳什均衡。八、什么是冷酷战略?什么是针锋相对战略?什么是最小最大战略?答:冷酷战略也称为触发战略这种战略做法是∶、参与人在博弈开始时均选择合作、只要对方一直选择合作则继续合作下去但当某一时刻对方选择了不合作则一直永远选择不合作来惩罚对方的背叛行为。针锋相对战略:参与人在博弈开始时选择合作在时期t选择对方在时期t期所采用的战略即如果对方在t期背叛(不合作)则自己在t期也选择背叛。最小最大战略:最小最大战略是指当违规者不采取合作行为而对他进行惩罚时违规者可能得到的最严厉的制裁的战略(相应的违规者为了减少惩罚对自己的影响而使自己得益最大的战略。一、判断、纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。错只要任一博弈方单独改变策略不会增加得益策略组合就是纳什均衡了。本题说的是严格纳什均衡。、若一博弈有两个纯战略纳什均衡则一定还存在一个混合战略纳什均衡。对的NE的基本性质之一奇数性所保证的。、博弈中混合策略纳什均衡一定存在纯战略的不一定存在。对、上策均衡一定是帕累托最优的均衡。错囚徒困境(坦白坦白)是上策均衡但不是帕累托最优。、在动态博弈中因为后行为的博弈方可以先观察到对方行为后再做选择因此总是有利的。错先动优势、动态博弈本身也是自己的子博弈之一。错根据子博弈的定义整个博弈本身不是自己的子博弈。、如果动态博弈的一个策略组合不仅在均衡路径上是纳什均衡而且在非均衡路径上也是纳什均衡就是该动态博弈的一个子博弈完美纳什均衡。对逆推归纳法并不能排除所有不可置信的威胁、错逆推归纳法最基本的特征就是能排除动态博弈中所有不可信行为包括不可信威胁和不可信承诺。、颤抖手均衡与第二章的风险上策均衡都是在有风险和不确定情况下的稳定策略组合因为她们本质上是一样的。错区别很大。前者是针对很小的犯错误导致的偏离概率的均衡概念对博弈方的理性假设与完全理性假设基本接近且本身是纳什均衡。、有限次重复博弈的子博弈完美纳什均衡每次重复均采用的都是原博弈的纳什均衡。错对于有两个以上纯策略纳什均衡博弈的有限次重复博弈SPNE在前面某些次重复时采用的可以不是原博弈的NE例如许多出发策略。、有限次重复博弈的子博弈完美纳什均衡的最后一次重复必定是原博弈的一个纳什均衡。对因为最后一次重复就是动态博弈对的最后一个阶段根据SPNE的要求博弈方在该阶段的选择必须构成纳什均衡。最后一次博弈就是原博弈本身、无限次重复博弈的均衡解一定优于原博弈均衡解的得益。错对于严格竞争的零和博弈或者不满足合作条件的其他博弈来说无限次重复博弈并不意味着效率的提高得益不一定高。、无限次重复古诺产量博弈不一定会出现和谋生产垄断产量的现象。对出现这个现象是有条件的主要是厂商的长远利益要有足够的重要性由远期利益的贴现率反映。、如果博弈重复无限次或每次结束的概率足够小而得益的时间贴现率A充分接近于那么任何个体理性的可实现得益都可以作为子博弈完美纳什均衡的结果出现。对是无限次重复博弈民间定理的结论。、触发策略所构成均衡都是子博弈完美纳什均衡。错误触发策略本身并不能排除重复博弈中不可信的威胁或承诺因此由触发策略构成的均衡不一定是SPNE、所有博弈方都有关于得益的信息至少部分博弈方缺乏博弈进程信息的动态博弈称为完全但不完美信息动态博弈。对定义、不完美信息动态博弈中的信息不完美性都是客观因素造成的。错有些事故意隐瞒自己的行为。、在完全但不完美信息博弈中若不存在混合策略并且各博弈方都是主动选择并且行为是理性的则不完美信息从本质上说是“假的”。对、子博弈可以从一个多节点信息集开始。错在一个子博弈中出现的必须是完整的信息集由于多节点信息集开始的博弈必然分割一个信息集一次不可能是个子博弈。、不完美信息是指至少某个博弈方在一个阶段完全没有博弈进程的信息。错不完美信息是指没有完美信息而非完全没有信息。、海萨尼转换可以把不完全信息静态博弈转换为不完美信息动态博弈说明有了还萨尼转换不完全信息静态博弈和一般的不完美信息动态博弈是完全等同的。错、完全信息静态博弈中的混合战略可以被解释成不完全信息博弈的纯策略贝叶斯纳什均衡。对、证券交易所的集合竞价交易本质上就是一种双方报价交易。对、静态贝斯博弈中之所以博弈方需要针对自己的所有可能类型都设定行为选择而不是只针对实际类型设定行为选择是因为能够迷惑其他交易方从而可以获得对自己更有利的均衡。错误是因为其他博弈方必然会考虑这些行为选择并作为他们自己选择行为的依据。即使博弈方自己不设定针对自己所有类型的行为选择其他博弈方也会替他考虑弄清楚其他博弈方对自己策略的判断。、鼓励响应的直接机制能保证博弈方都按照他们的真实类型行为并获得理想结果。错只保证博弈方说出自己的真是类型博弈方不直接选择行为也不保证根据真是类型行为更谈不上一定能实现最理想的结果。因为直接机制的结果常常是带随机选择机制的并不一定理想。、古玩市场的交易中买卖双方的后悔都来自于自己对古玩价值判断的失误若预先对价值的判断是正确的那么交易者肯定不会后悔。错误仍然可能后悔因为古玩交易的价格和利益不仅取决于古玩的实际价值和自己的估价还取决于对方的估价和愿意接受的成交价格因此仅仅自己做出正确的估价并不等于实现了最大的潜在利益。、只要声明方和行为方的利益不是对立的那么口头声明肯定能传递一些信息。错不一定因为可能声明方的类型对行为方利益无关或者行为方的行为对声明方的利益无关。、教育程度在劳动力市场招聘员工时受到重视的理由是经济学已经证明教育对于提高劳动力素质有不可替代的作用。错经济学并没有证明。教育还有重要的信号机制的作用可以反映劳动力的素质。、不完全信息动态博弈分析的基本方法也是逆向归纳法。错误这种博弈的基本均衡概念是完美贝叶斯均衡其中的判断与博弈方的策略选择有关与策略的确定常常是交叉的无法从最后一阶段开始直接确定博弈方的策略选择。、运用海萨尼转换后不完全信息动态博弈与完全但不完美信息动态博弈基本上是相同的。对本质上是相同的是一种问题的不同理解方法。判断题(每小题分共分)囚徒困境说明个人的理性选择不一定是集体的理性选择。(√)子博弈精炼纳什均衡不是一个纳什均衡。(×)若一个博弈出现了皆大欢喜的结局说明该博弈是一个合作的正和博弈。()博弈中知道越多的一方越有利。(×)纳什均衡一定是上策均衡。(×)上策均衡一定是纳什均衡。(√)在一个博弈中只可能存在一个纳什均衡。(×)在一个博弈中博弈方可以有很多个。(√)在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√)在博弈中纳什均衡是博弈双方能获得的最好结果。(×)在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。(×)因为零和博弈中博弈方之间关系都是竞争性的、对立的因此零和博弈就是非合作博弈。(×)在动态博弈中因为后行动的博弈方可以先观察对方行为后再选择行为因此总是有利的。(×)在博弈中存在着先动优势和后动优势所以后行动的人不一定总有利例如:在斯塔克伯格模型中企业就可能具有先动优势。囚徒的困境博弈中两个囚徒之所以会处于困境无法得到较理想的结果是因为两囚徒都不在乎坐牢时间长短本身只在乎不能比对方坐牢的时间更长。(×)纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡作为原博弈构成的有限次重复博弈共同特点是重复博弈本质上不过是原博弈的简单重复重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√)多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡或者轮流采用不同纯战略纳什均衡或者两次都采用混合战略纳什均衡或者混合战略和纯战略轮流采用。(√)如果阶段博弈G={A,A,…,Anu,u,…,un)具有多重Nash均衡那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局其中对于任意的t<T在t阶段的结局并不是G的Nash均衡。(√)(或:如果阶段博弈G={A,A,…,Anu,u,…,un)具有多重Nash均衡那么该重复博弈G(T)的子博弈完美均衡结局对于任意的t<T在t阶段的结局一定是G的Nash均衡。)零和博弈的无限次重复博弈中所有阶段都不可能发生合作局中人会一直重复原博弈的混合战略纳什均衡。(√)(或:零和博弈的无限次重复博弈中可能发生合作局中人不一定会一直重复原博弈的混合战略纳什均衡。(×))原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合符合各局中人最大利益:采用原博弈的纯战略纳什均衡本身是各局中人能实现的最好结果符合所有局中人的利益因此不管是重复有限次还是无限次不会和一次性博弈有区别。(√)原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合符合各局中人最大利益但惟一的纳什均衡不是效率最高的战略组合存在潜在合作利益的囚徒困境博弈。(√)(或:原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合符合各局中人最大利益不存在潜在合作利益的囚徒困境博弈。(×))根据参与人行动的先后顺序博弈可以划分为静态博弈(staticgame)和动态博弈(dynamicgame)。如果阶段博弈G有唯一的Nash均衡那么对任意有限次T重复博弈G(T)有唯一的子博弈完美结局:在每一阶段取G的Nash均衡策略。(√)判断下列说法正确:()斯塔克博格产量领导者所获得的利润的下限是古诺均衡下它得到的利润。()由于两个罪犯只打算犯罪一次所以被捕后才出现了不合作的问题即囚徒困境。但如果他们打算重复合伙多次比如说次那么对策论预测他们将采取彼此合作的态度即谁都不招供。答:()正确。在斯塔克博格模型中领导者可以根据跟随者的反应曲线来制定自己的最优产量。其利润一定不会小于古诺均衡下的利润否则领导者将采取古诺博弈中双方同时行动的策略而获得古诺均衡的利润。()错误。只要两囚犯只打算合作有限次其最优策略均为招供。比如最后一次合谋两小偷被抓住了因为将来没有合作机会了最优策略均为招供。回退到倒数第二次既然已经知道下次不会合作这次为什么要合作呢。依此类推对于有限次内的任何一次两小偷均不可能合作。

用户评价(0)

关闭

新课改视野下建构高中语文教学实验成果报告(32KB)

抱歉,积分不足下载失败,请稍后再试!

提示

试读已结束,如需要继续阅读或者下载,敬请购买!

文档小程序码

使用微信“扫一扫”扫码寻找文档

1

打开微信

2

扫描小程序码

3

发布寻找信息

4

等待寻找结果

我知道了
评分:

/6

博弈论期末大礼包博弈论论述题

VIP

在线
客服

免费
邮箱

爱问共享资料服务号

扫描关注领取更多福利