首页 博弈论ppt

博弈论ppt

博弈论ppt博弈论简介第一节博弈论的基本概念一、市场竞争中的博弈二、现代经济学与博弈论三、博弈论的基本概念一、市场竞争中的博弈在现实经济生活中，许多产业市场是寡头断市场。寡头垄断市场是指少数几家大厂商生产一个产业中的全部或大部分产品，从而形成对一个产业的控制的产业市场。在分析寡头垄断市场中的企业决策行为时，就必须把各种决策者之间的策略相互作用纳入到经济模型中，这就是一种博弈分析。二、现代经济学与博弈论从现代的观点来看，经济学是研究人的决策行为的学问。理性人是指有一个很好定义的偏好，在面临给定的约束条件下能最大化自己偏好的人，不...

博弈论简介第一节博弈论的基本概念一、市场竞争中的博弈二、现代经济学与博弈论三、博弈论的基本概念一、市场竞争中的博弈在现实经济生活中，许多产业市场是寡头断市场。寡头垄断市场是指少数几家大厂商生产一个产业中的全部或大部分产品，从而形成对一个产业的控制的产业市场。在分析寡头垄断市场中的企业决策行为时，就必须把各种决策者之间的策略相互作用纳入到经济模型中，这就是一种博弈分析。二、现代经济学与博弈论从现代的观点来看，经济学是研究人的决策行为的学问。理性人是指有一个很好定义的偏好，在面临给定的约束条件下能最大化自己偏好的人，不考虑竞争对手的决策。价格理论有两个基本假定：1、市场参与人的数量足够多，从而市场是竞争性的；2、参与人之间不存在信息不对称问题（完全竞争、完全信息）。然而在现实生活中，这两个假设在许多情况下是不能被满足。1994年诺贝尔经济学奖授予了三位博弈论专家纳什、泽尔腾和海萨尼。1996年诺奖授予两位博弈论与信息经济学研究专家莫里斯、维克瑞；2001年诺奖授予阿克洛夫、斯彭斯、斯蒂格利茨，表彰他们在柠檬市场、信号传递和信号甄别等非对称信息理论研究中的开创性贡献。2005年诺奖授予有以色列和美国双重国籍的罗伯特·奥曼和美国人托马斯·谢林，以表彰他们在博弈论领域作出的贡献。三、博弈论的基本概念(一)博弈论的定义博弈论，英文为Gametheory，是研究相互依赖、相互影响的决策主体的理性决策行为以及这些决策的均衡结果的理论。一些相互依赖、相互影响的决策行为及其结果的组合称为博弈(Game)。(二)博弈的组成要素一个博弈一般由以下几个要素组成，包括：参与人、行动、信息、策略、得益、结果、均衡等。1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人，也可以是团体)；2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策；3、策略是指参与人选择行动的规则，即在博弈进程中，什么情况下选择什么行动的预先安排；4、信息指的是参与人在博弈中所知道的关于自己以及其他参与人的行动、策略及其得益函数等知识；5、得益是参与人在博弈结束后从博弈中获得的效用，一般是所有参与人的策略或行动的函数，这是每个参与人最关心的东西；6、均衡是所有参与人的最优策略或行动的组合；均衡结果是指博弈结束后博弈分析者感兴趣的一些要素的集合，如在各参与人的均衡策略作用下，各参与人最终的行动或效用集合。上述要素中，参与人、行动、结果统称为博弈规则，博弈分析的目的就是使用博弈规则来决定均衡。(三)博弈的分类根据参与人的多少，可将博弈分为两人博弈或多人博弈；根据参与人是否合作，可将博弈分为合作博弈或非合作博弈；根据博弈结果的不同，又可分为零和博弈、常和博弈与变和博弈。1、从行动的先后次序来分，博弈可以分为静态博弈和动态博弈。静态博弈指在博弈中，参与人同时选择行动，或虽非同时但后行动者并不知道前行动者采取了什么具体行动；动态博弈指的是参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动的博弈。2、从参与人对其他参与人的各种特征信息的获得差异来分，博弈可分为完全信息博弈和不完全信息博弈。完全信息指的是每一个参与人对所有其他参与人的特征，如策略集合及得益函数都有准确完备的知识；否则就是不完全信息。将上述两个角度的划分结合起来，我们就得到四种不同类型的博弈，这就是：完全信息静态博弈，完全信息动态博弈，不完全信息静态博弈和不完全信息动态博弈。博弈的分类和均衡行动次序信息静态动态完全信息纳什均衡纳什子博弈精练纳什均衡泽尔腾不完全信息贝叶斯均衡海萨尼精炼贝叶斯均衡泽尔腾等第二节博弈的种类一、完全信息静态博弈(一)完全信息静态博弈定义所谓完全信息静态博弈指的是各博弈方同时决策，或者决策行动虽有先后，但后行动者不知道先行动者的具体行动是什么且各博弈方对博弈中各种策略组合情况下所有参与人相应的得益都完全了解的博弈。(二)博弈的策略式表达在博弈论中,一个博弈可以用两种不同的方式来表达：一种是策略式表达:另一种是扩展式表达.策略式表达更适合于静态博弈，而扩展式表达更适合于讨论动态博弈。策略式表达又称为标准式表达，在这种表达中，所有参人同时选择自己的策略，所有参与人选择的策略一起决定每个参与人的得益。值得强调的是，这里参与人同时选择的是“策略”,而不是“行动”。在静态博弈中,于参与人只选择一次,所以策略就等同于行动了。而在动态博弈中，策略是参与人在各个阶段的行动的全面计划。更为准确地讲，战略式表述给出：1、博弈的参与人集合：i∈Γ，Γ=(1,2,…，n)；2、每个参与人的战略空间：Si i＝1,2,3,…,n；3、每个参与人的得益函数：ui(s1,…，si…，sn)，i＝1,2,3,…，n。用G＝｛S1，…，Sn；u1,…，un｝代表战略式表述博弈。(三)博弈的得益矩阵表示一个博弈被称为有限博弈，如果：第一，参与人的个数是有限的；第二，每个参人可选择的策略个数是有限的。有限博弈的策略式表达及其求解可以方便地用得益矩阵直观地给出。著名的“囚徒困境”的例子警察抓住了两个罪犯，但是警察局却缺乏足够的证据指证他们所犯的罪行。如果罪犯中至少有一人供认犯罪，就能确认罪名成立。为了得到所需的口供，警察将这两名罪犯分别关押防止他们串供或结成攻守同盟，并分别跟他们讲清了他们的处境和面临的选择：如果他们两人都拒不认罪，则他们会被以较轻的妨碍公务罪各判一年徒刑；如果两人中有一人坦白认罪，则坦白者立即释放而另一人将重判10年徒刑；果两人都坦白认罪，则他们将被各判8年监禁。问：两个罪犯会如何选择（即是坦白还是抵赖）？(四)纳什均衡1、占优策略均衡。一般来说，由于每个参与人的得益是博弈中所有参与人的策略的函数，因此每个参与人的最优策略选择依赖于所有其他参与人的策略选择。但在一些特殊的博弈中，一个参与人的最优策略可能可以不依赖于其他参与人的策略选择，就是说，不论其他参与人选择什么策略，他的最优策略是唯一的，这样的最优策略被称为“占优策略”。如果一个博弈中，某个参与人有占优策略，那么该参与人的其他可选择策略就被称为“劣策略”。在一个博弈里,如果所有参与人都有占优策略存在，那么占优策略均衡是可以预测到的唯一的均衡，因为没有一个理性的参与人会选择劣策略。所以在囚徒困境博弈里，{坦白，坦白}是占优策略均衡。囚徒困境反映了一个深刻的问题,即个人理性与团体理性的冲突。这给我们一个启示,我们学习博弈论，也许更应该研究的是怎样设计一种制度 ,在满足个人理性的同时,去争取达到“集体理性”。2、严格劣策略的重复剔除重复剔除严格劣策略”的思路如下：首先找出某个参与人的严格劣策略(假定其存在)，把这个劣策略剔除掉，重新构造一个不包含已剔除策略的新的博弈；重复这个过程，一直到只剩下一个唯一的策略组合为止。这个唯一剩下的策略组合就是这个博弈的均衡解，称为”重复剔除的占优均衡”。注意，上述表述中强调了“唯一”这个词。也就是说，如果重复剔除后剩下的策略组合不唯一，那么该博弈就不是可通过重复剔除劣策略求解的。3．纳什均衡纳什均衡是完全信息静态博弈解的一般概念，构成纳什均衡的策略一定是重复剔除严格劣策略过程中不能被剔除的策略，即没有任何一个策略严格优于纳什均衡策略。当然，逆定理是不存在的。更为重要的是，许多不存在占优策略均衡或重复剔除的占优策略均衡的博弈,也存在纳什均衡。下面，我们给出纳什均衡的正式定义。纳什均衡的正式定义纳什均衡：有n个参与人的战略式表述博弈G＝｛S1，…，Sn；u1,…，un｝，战略组合S*＝（S1*，…，Sn*）是一个纳什均衡，如果对于每一个i，Si*是给定其他参与人S－i*＝（S1*,…，S-1*，Si+1*…，Sn*）的情况下第i个参与人的最优战略，即：ui(si*,s-i*)≥ui(siα,s-i*) 对任意Siα∈Si,和任意的I都成立。指一组给定对手行为前提下对各博弈方存在的最佳选择；在纳什均衡状态下，只要其它参与者不变换策略选择，任何单个参与者不可能单方面通过变换策略来提高他的所获支付。(五)纳什均衡的多重性在两人的有限策略博弈中,我们还可以简单地用划线法来找出纳什均衡从这个例子中我们知道一个博弈可能有多个纳什均衡，而具体哪个均衡会实现，纳什均衡本身不能给出回答,任何有限博弈都存在至少一个纳什均衡，若是无限博弈则不一定。在位者进入者默许打击进入 40,50 -10,0 不进入 0,300 0,300几个博弈案例1.智猪博弈（占优战略均衡）2.性别之争（多重纳什均衡）3.斗鸡博弈；4.市场阻挠博弈第二节完全信息动态博弈一、完全信息动态博弈定义完全信息动态博弈指的是各博弈方先后行动，后行动者知道先行动者的具体行动是什么且各博弈方对博弈中各种策略组合情况下所有参与人相应的得益都完全了解的博弈.二、动态博弈的构成要素(1)参与人集合:I:1，…，n;此外我们以后将用"代表虚拟的参与人——“自然”；(2)参与人的行动顺序:谁在什么时候行动；(3)参与人的行动空间:在每次行动时,参与人有些什么行动可供选择；(4)参与人的信息集:每次行动时,参与人知道些什么；(5)参与人的得益函数:在博弈结束后,每个参与人得到些什么；(6)外生事件(即“自然”的选择)的概率分布。三、动态博弈的表现形式——“博弈树”①结：结包括决策结和终点结。②枝：博弈树上，枝是从一个决策结到其直接后续结的连线，每一个枝代表参与人的一个行动选择。在每一个枝旁标注该具体行动的代号。一般地，每个决策结下有多个枝，给出每次行动时参与人的行动空间，即此时有哪些行动可供选择。③信息集：将博弈树中某一决策者在某一行动阶段具有相同信息的所有决策结称为一个信息集。四、动态博弈的特点1.动态博弈的策略特征：博弈方决策的内容也是决定博弈结果的关键，不是博弈方在单个阶段的行为，而是各博弈方在整个博弈中轮到选择的每个阶段，针对前面阶段的各种情况作出的相应选择和行为的完整计划，以及由不同博弈方的这种计划所构成的组合。这种计划就是博弈方的策略。2.博弈方的非对策性在信息的占有上，后行动者往往比先行动者更占优势。但所获得的收益不一定比先行动者多。这与单人决策是不同的。3.策略的可置信性问题：策略是博弈方自己预先设定的，在各个博弈阶段针对各种情况所作的相应行为选择的计划，本身没有强制力，且实施起来有一个过程。在该过程中，根据自己的利益需要，他完全可以改变这个计划，从而存在“相机选择”，产生策略的可置信性问题。四、子博弈精炼纳什均衡——动态博弈的纳什均衡1.意义：“子博弈精炼纳什均衡”，用于区分动态博弈中的“合理纳什均衡”与“不合理纳什均衡”，将纳什均衡中包含有不可置信威胁策略的均衡剔除出去，就是说，使最后的均衡中不再包含有不可置信威胁策略的存在。2.子博弈精炼纳什均衡的定义子博弈：一个扩展式表示博弈的子博弈G是由一个单结信息集x开始的与所有该决策结的后续结(包括终点结)组成的能自成一个博弈的原博弈的一部分。子博弈精炼纳什均衡定义：对于扩展式博弈的策略组合S*=(S1*，…，Si*,…，Sn*)，如果它是原博弈的纳什均衡；它在每一个子博弈上也都构成纳什均衡，则它是一个子博弈精炼纳什均衡。3.子博弈精炼纳什均衡求法——逆向归纳法求解对于我们现在所讨论的有限完全信息动态博弈，逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。在求解子博弈精炼纳什均衡时，从最后一个子博弈开始逆推上去，这就是逆向归纳法。所以逆向归纳法就是从动态博弈的最后一个阶段或最后一个子博弈开始，逐步向前倒推以求解动态博弈均衡的方法第二节寡头垄断企业的博弈行为一、寡头垄断企业的静态博弈行为1.博弈论（GameTheory）:它是研究行为决策主体的行为发生直接相互作用时的决策，以及这种决策的均衡问题的经济学分支，也就是说，当一个行为主体的选择受到其他行为主体选择影响，而且反过来影响到其他行为主体选择时的决策问题和均衡问题。2.博弈论与寡头垄断企业竞争行为：在博弈过程中，行为主体决策的效用函数不仅依赖于他自己的选择，而且依赖于与其具有博弈关系的其他行为方的选择：个人的最优选择及其得益是其他人选择的函数。根据上述分析，寡头垄断企业的竞争行为与博弈论关于竞争主体的行为假定是一致的，由此决定了寡头垄断企业的竞争行为成为博弈论原理的重要应用领域，可以说所有的寡头垄断竞争模型都是博弈论有关原理的具体应用。3.寡头垄断企业竞争的早期研究：完全信息的静态博弈寡头垄断企业竞争的早期研究主要集中于其静态的或单时期的市场竞争模型，适用于仅持续一个较短期限的市场，竞争对手同时作出决策并只竞争一次。彼此之间没有机会事先观察竞争对手的行动，从而选择相应的决策。在博弈论上，对于这样一种竞争行为主要是用完全信息的静态博弈来分析的。二、完全信息动态博弈与寡头垄断企业竞争行为1.寡头垄断企业的现实竞争行为多为动态博弈静态竞争的情况在现实经济中往往是很少存在的，现实中存在较多的是参与竞争的企业在行动顺序上有先后之分，且后行动者一般能够在自己行动之前或多或少地观察到竞争对手在此之前行动的有关信息，并以此为依据来制定自己的竞争决策。这种竞争是一种动态竞争，需要用动态博弈理论进行分析。三、重复博弈与寡头垄断企业竞争行为1.定义：同样结构的博弈重复多次，其中每次博弈称为“阶段博弈”。2.特征：A.阶段博弈之间无物质上的联系，也就是说，前一阶段的博弈不改变后一阶段博弈的结构；B.所有参与人都观察到博弈过去的历史；C.参与人关心的是整个博弈的总得益，总得益是所有阶段博弈得益的贴现值之和。3.有限次重复博弈给定一个博弈G，重复进行T次G，并且在每次重复之前各博弈方都能观察到以前博弈的结果，这样的博弈过程称为G的一个“T次重复博弈”，记为G(T)。而G则称为G(T)的原博弈。G(T)的每次重复称为G(T)的一个阶段。关于有限次重复博弈结果定理：令G是阶段博弈，G(T)是G重复T次的重复博弈。那么，如果G有唯一的纳什均衡，重复博弈G(T)的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次(即每个阶段博弈出现的都是一次性博弈的均衡结果)。4.无限次重复博弈与有限次重复博弈的差别：当博弈重复无穷多次时，会存在着完全不同于一次性博弈的子博弈精炼均衡。在无限次重复博弈中，因为博弈没有最后阶段,故不能用逆向归纳法求解。触发机制发挥重要的作用长远利益与眼前利益的权衡合作的实现四、不完全信息博弈基本概念不完全信息博弈是指博弈的各参与人对其他参与人的得益函数不完全了解的博弈。在不完全信息情况下的博弈参与人的最优策略不仅仅依赖于其他参与人的策略，更依赖于对其他参与人情况的判断。（一）海萨尼转换1967年，海萨尼提出了“海萨尼转换”来处理这种不完全信息的博弈。其基本思路是引入一个虚拟的参与人——“自然”，“自然”首先行动选定参与人的某种类型，各参与人知道自己是哪种类型的(是高成本的，还是低成本的)，但其他参与人不知道。以对参与人类型的概率的分析代替对参与人确切行动的分析，这样的转换就是“海萨尼转换”。“不完美信息”指的是，“自然”作出了它的选择，但其他参与人并不知道它的具体选择是什么，仅知道各种选择的概率分布。图7－6(40,50)(-10,0)(30,80)(-10,100)(0,400)(0,300)不进[P]N[1-P]不进进在位者进在位者打击打击海萨尼转换是处理不完全信息博弈的标准方法。一般地，“自然”在博弈开始的时候选择参与人的类型，参与人的某个类型包括表征类型的各个特征如策略空间、信息集、得益函数等，这些又称为该类型参与人所拥有的个人信息。不完全信息意味着，博弈各方中至少有一个参与人有多个类型。通过海萨尼转换，博弈开始时，所有参与人有关“自然”的行动有一致的信念，即都知道所有参与人类型的概率分布函数P(t1，t2，…，tn)，此即“海萨尼公理”。（二）精炼贝叶斯纳什均衡不完美信息博弈的均衡必须满足三个要求，即：1、在每一个信息集上，决策者必须有一个定义在属于该信息集的所有决策结上的一个概率分布(信念)；2、给定该信息集上的概率分布和其他参与人的后续策略，参与人在该信息集处的行动必须是最优的(这里后续策略指的是从给定信息集开始的后续博弈上的行动规则)；3、每一个参与人根据均衡策略和贝叶斯法则作出判断和修正，得到后验概率。满足上述要求的博弈均衡就称为“精炼贝叶斯均衡”

                    本文档为【博弈论ppt】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，
                    图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。 
 该文档来自用户分享，如有侵权行为请发邮件ishare@vip.sina.com联系网站客服，我们会及时删除。

                    [版权声明] 本站所有资料为用户分享产生，若发现您的权利被侵害，请联系客服邮件isharekefu@iask.cn，我们尽快处理。

                    本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用。

                    网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
                

下载需要：免费已有0 人下载

立即下载

博弈论ppt

你可能还喜欢