经济博弈论(硕士)第04章

经济博弈论(硕士)第04章主讲人：肖会敏河南(hénán)财经学院经济(jīngjì)博弈论第一页，共35页。4.3子博弈精炼(jīngliàn)纳什均衡第四章完全信息(xìnxī)动态博弈4.2扩展型博弈的策略(cèlüè)及均衡4.1扩展型博弈表述4.4子博弈精炼纳什均衡应用举例第二页，共35页。河南财经学院授课教师：肖会敏4.1扩展(kuòzhǎn)型博弈表述在静态博弈中，所有参与人同时行动（或行动虽有先后(xiānhòu)，但没有人在自己行动之前观测到别人的行动）。在动态博弈中，参与人的行动有先后(xiānhòu)顺序，且后行动者...

主讲人：肖会敏河南(hénán)财经学院经济(jīngjì)博弈论第一页，共35页。4.3子博弈精炼(jīngliàn)纳什均衡第四章完全信息(xìnxī)动态博弈4.2扩展型博弈的策略(cèlüè)及均衡4.1扩展型博弈表述4.4子博弈精炼纳什均衡应用举例第二页，共35页。河南财经学院授课教师：肖会敏4.1扩展(kuòzhǎn)型博弈表述在静态博弈中，所有参与人同时行动（或行动虽有先后(xiānhòu)，但没有人在自己行动之前观测到别人的行动）。在动态博弈中，参与人的行动有先后(xiānhòu)顺序，且后行动者在自己行动之前能观测到先行动者的行动。扩展(kuòzhǎn)型表述的引入博弈专家习惯于用战略式表述描述和分析静态博弈，而用扩展式表述（extensiveformrepresentation）来描述和分析动态博弈。第三页，共35页。4.1扩展(kuòzhǎn)型博弈表述扩展型表述所“扩展”的主要是参与人的战略空间(kōngjiān)。战略式表述简单地给出参与人有些什么战略可以选择，而扩展式表述要给出每个战略地动态描述：谁在什么时候行动，每次行动时有些什么具体行动可供选择，以及知道些什么。简单地说，在扩展式表述中，战略对应于参与人的相机行动规则（contingentactionplan），即什么情况下选择什么行动，而不是简单的、与环境无关的行动选择。扩展(kuòzhǎn)型表述的引入第四页，共35页。4.1扩展型博弈(bóyì)表述参与人集合：，此外，我们将用N代表虚拟参与人“自然”；参与人的行动顺序（theorderofmoves）:谁在什么时候行动；参与人的行动空间（actionset）：在每次行动时，参与人有些什么选择。参与人的信息集（informationset）：每次行动时，参与人知道些什么；参与人的支付函数：在行动结束之后，每个参与人得到些什么（支付是所有(suǒyǒu)行动的函数）；外生事件（即自然的选择）的概率分布扩展型表述(biǎoshù)的要素第五页，共35页。4.1扩展(kuòzhǎn)型博弈表述n个人有限战略博弈的扩展式表述可以用博弈树来表示。为了说明这一点，我们(wǒmen)考虑房地产开发博弈的例子，我们(wǒmen)假定该博弈的行动顺序如下：开发商A首先行动，选择开发或不开发；在A决策后，自然选择市场需求的大小；开发商B在观测到A的决策和市场需求后，决定开发或不开发。扩展型表述的表示(biǎoshì)方式第六页，共35页。4.1扩展型博弈(bóyì)表述房地产开发(kāifā)博弈树：注意：支付向量的顺序与博弈树上行动顺序是对应的！第七页，共35页。4.1扩展型博弈(bóyì)表述博弈(bóyì)树基本构造：结（nodes）：包括决策结（decisionnodes）和终点结（terminalnodes）两类。决策结是参与人采取行动的时点，终点结时博弈行动路径(lùjìng)的终点。在上例中，决策结包括空心圆和所有六个实心圆，终点结包括对应八个支付向量的点。枝（branches）：枝是从一个决策结到它的直接后续结的连线（有时用箭头表述），每一个枝代表参与人的一个行动选择。比如，在上图中，开发商A有两个选择，分别用标有“开发”和“不开发”的两个枝表示。第八页，共35页。4.1扩展型博弈(bóyì)表述博弈(bóyì)树基本构造：3.信息集（informationset）：博弈树上的所有决策结分割成不同的信息集。每一个信息集是决策结集合的一个子集，该子集包括所有满足下列条件的决策结：每一个决策结都是同一参与人的决策结；该参与人知道博弈进入该集合的某个决策结，但不知道自己究竟处于哪一个决策结。我们(wǒmen)引入信息集的目的是描述下列情况：当一个参与人要作出决策时他可能并不知道“之前”发生的所有事情。一个信息集可能包含多个决策结，也可能只包含一个决策结（称为单结信息集（singletons））。可以用虚线将属于同一信息集的两个决策结连起来第九页，共35页。4.1扩展型博弈(bóyì)表述囚徒(qiútú)困境博弈的扩展式表述：一般假定博弈满足“完美回忆”（perfectrecall）的要求。完美回忆指没有参与(cānyù)人会忘记自己以前知道的事情，所有参与(cānyù)人都只到自己以前的选择。第十页，共35页。4.2扩展型博弈的策略(cèlüè)与均衡纯战略(zhànlüè)：同样的纯战略，既可以解释为扩展式的，也可以解释为战略式的。不同之处在于：在扩展式表述博弈，参与人式相机行事，即“等待”博弈到达自己的信息集（包含(bāohán)一个或多个决策结）后再决定如何行动；在战略式表述博弈，参与人似乎是在博弈开始之前就制定出了一个完全的相机行动计划，即“如果…发生，我们将选择…”。第十一页，共35页。4.2扩展(kuòzhǎn)型博弈的策略与均衡如何从扩展式表述构造(gòuzào)战略式表述为了说明这个问题(wèntí)，我们考虑房地产开发博弈的例子第十二页，共35页。4.2扩展型博弈的策略(cèlüè)与均衡如何从扩展(kuòzhǎn)式表述构造战略式表述开发商B（－3，－3）（－3，－3）（1，0）（1，0）（0，1）（0，0）（0，1）（0，0）（开发，开发）（开发，不开发）（不开发，开发）（不开发，不开发）开发商A开发不开发战略式表述第十三页，共35页。4.2扩展型博弈的策略(cèlüè)与均衡逆向(nìxiànɡ)归纳法：逆向归纳法实际上是重复剔除(tīchú)劣战略方法在扩展式博弈中地应用。我们从最后一个决策结开始往回倒推，每一步剔除(tīchú)在该决策结上参与人的劣选择，因此，在均衡路径，每一个参与人在每一个信息集上的选择都是占优选择。上述逆向归纳法的过程不适用于无限博弈和不完美信息博弈。逆向归纳法也不适用于无限博弈并不意味着无限博弈没有纳什均衡存在。第十四页，共35页。4.3子博弈(bóyì)精炼纳什均衡4.3.1引言(yǐnyán)在纳什均衡中，存在一个很严重的缺陷：纳什均衡假定每一个参与人在选择自己的最优战略时假定所有其他参与人的战略选择是给定的，就是说，参与人并不考虑自己的选择对其他人选择的影响。本节将要讨论的泽尔腾（Selten）的“子博弈精炼纳什均衡”是纳什均衡概念的第一个最重要的改进，它的目的是把动态博弈中的“合理纳什均衡”与“不合理纳什均衡”分开。正如纳什均衡是完全信息静态(jìngtài)博弈解的基本概念一样，子博弈精炼纳什均衡是完全信息动态博弈解的基本概念。第十五页，共35页。4.3子博弈(bóyì)精炼纳什均衡4.3.1不可置信(zhìxìn)的存在为了说明上述(shàngshù)论点，我们考虑上一节讨论过的房地产开发博弈的例子。第十六页，共35页。4.3子博弈精炼(jīngliàn)纳什均衡分析结果：这个博弈有三个纳什均衡，分别为：（不开发，『开发，开发』），（开发，『不开发，开发』）和（开发，『不开发，不开发』）用博弈论的语言来说，纳什均衡（不开发，『开发，开发』）是不可(bùkě)置信的（notcredible），因为它依赖于B的一个不可(bùkě)置信的威胁战略；B的战略是不可(bùkě)置信的，因为给定A选择开发，B不会实施这个威胁。（开发，『不开发，开发』）是这个博弈的唯一子博弈精炼纳什均衡。第十七页，共35页。4.3子博弈精炼(jīngliàn)纳什均衡4.3.2子博弈精炼(jīngliàn)纳什均衡泽尔腾（Selten，1965）引入“子博弈精炼纳什均衡”（subgameperfectNashequilibrium）概念的目的是将那些包含不可置信威胁战略的纳什均衡从均衡中剔除，从而给出动态博弈结果的一个合理预测。简单地说，子博弈精炼纳什均衡要求均衡战略地行为规则在每一个信息集上都是最优地。我们首先给出子博弈的概念，粗略的说，子博弈是愿博弈的一部分，它本身可以作为一个独立的博弈进行分析(fēnxī)。正式地，我们有下述定义：第十八页，共35页。4.3子博弈(bóyì)精炼纳什均衡4.3.2子博弈精炼(jīngliàn)纳什均衡定义：一个扩展式博弈的子博弈G由一个决策结x和所有该决策结的后续结（包括终点结）组成，它满足下列条件：（1）x是一个单结信息集，即；（2）对于所有的，如果，那么解释：条件（1）说的是一个子博弈必须从一个单结信息集开始。条件（2）说的是，子博弈的信息集和支付向量都直接继承自原博弈。要求子博弈满足上述两个条件的目的是保证子博弈对应于原博弈中可能出现的情况。第十九页，共35页。4.3子博弈(bóyì)精炼纳什均衡例如(lìrú)：第二十页，共35页。4.3子博弈(bóyì)精炼纳什均衡4.3.2子博弈(bóyì)精炼纳什均衡定义：扩展式博弈的战略组合是一个子博弈精炼纳什均衡(jūnhéng)，如果（1）它是原博弈的纳什均衡(jūnhéng)；（2）它在每一个子博弈上给出纳什均衡(jūnhéng)。另外：简单地说，一个战略组合是子博弈精炼纳什均衡(jūnhéng)，当只当它在每一个子博弈（包括原博弈）上都构成一个纳什均衡(jūnhéng)。如果整个博弈是唯一的子博弈，纳什均衡(jūnhéng)与子博弈精炼纳什均衡(jūnhéng)是相同的；如果有其他子博弈存在，有些纳什均衡(jūnhéng)可能不构成子博弈精炼纳什均衡(jūnhéng)。第二十一页，共35页。4.3子博弈(bóyì)精炼纳什均衡第二十二页，共35页。4.3子博弈精炼(jīngliàn)纳什均衡4.3.2子博弈(bóyì)精炼纳什均衡这里还需强调一下上述(shàngshù)定义中的“在每一个子博弈上给出纳什均衡”这句话。如果一个博弈有几个子博弈，一个特定的纳什均衡决定了原博弈树上唯一的一条路径，这条路径称为“均衡路径”（equilibriumpath），博弈树上的其他路径称为非均衡路径（out-of–equilibriumpath）。纳什均衡只要求均衡战略在均衡路径的决策结上是最优的。“在每一个子博弈上给出纳什均衡”意味着，构成子博弈精炼纳什均衡的战略不仅在均衡路径的决策结上是最优的，而且在非均衡路径的决策结上也是最优的。子博弈精炼纳什均衡就是要剔除掉那些只在特定情况下是合理的而在其他情况下并不合理的行动规则。第二十三页，共35页。4.3子博弈精炼(jīngliàn)纳什均衡4.3.3用逆向(nìxiànɡ)归纳发求解子博弈精炼纳什均衡对于有限完美信息博弈，逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。因为有限完美信息博弈的每一个决策结都是一个单独的信息集，每一个决策结都开始一个子博弈。给定(ɡěidìnɡ)博弈到达最后一个决策结，该决策结上行动的参与人有一个最优选择，这个最优选择就是该决策结开始的子博弈的纳什均衡（如果该决策结上的最优行动多于一个，那么我们允许参与人选择其中的任何一个；如果最后一个决策者有多个决策结，那么每一个决策结开始的子博弈都有一个纳什均衡）。然后倒回到倒数第二个决策结（最后决策结的直接前列结），找出倒数第二个决策者的最优选择（假定最后一个决策者的选择是最优的），这个最优选择与我们在第一步找出的最后决策者的最优选择构成从倒数第二个决策结开始的子博弈的一个纳什均衡。第二十四页，共35页。4.3子博弈精炼(jīngliàn)纳什均衡4.3.3用逆向归纳发求解(qiújiě)子博弈精炼纳什均衡3、如此不断直到初始结，每一步都得到对应子博弈的一个纳什均衡，在这个过程的最后一步得到的整个博弈的纳什均衡也就是这个博弈的子博弈精炼纳什均衡例如：房地产开发(kāifā)博弈就是这样一个两阶段完美信息博弈。用逆向归纳法求解这个博弈的精炼均衡的步骤如下：第二十五页，共35页。4.3子博弈精炼(jīngliàn)纳什均衡4.3.3用逆向归纳发求解子博弈精炼(jīngliàn)纳什均衡在第二阶段，B的最优行动规则是：{不开发，开发}，即，如果A在第一阶段选择了开发，B在第二阶段选择不开发；如果A在第一阶段选择了不开发，B在第二阶段选择开发。因为A在第一阶段预测到B在第二阶段会按这个规则行动，A在第一阶段的最优选择是开发。用逆向(nìxiànɡ)归纳法得到的精炼均衡是（开发，{不开发，开发}）。第二十六页，共35页。4.3子博弈精炼(jīngliàn)纳什均衡4.3.3用逆向归纳发求解子博弈(bóyì)精炼纳什均衡上述分析表明，用逆向回归法求解子博弈精炼纳什均衡的过程，实质是重复剔除劣战略过程在扩展式博弈上的扩展：从最后一个决策(juécè)结开始依次剔除掉每个子博弈的劣战略，最后生存下来的战略构成精炼纳什均衡。根据定义，逆向归纳法只适用于完美信息博弈。但是，有些非完美信息博弈也可以运用逆向归纳法的逻辑求解。第二十七页，共35页。4.3子博弈精炼(jīngliàn)纳什均衡4.3.4承诺行动与子博弈精炼(jīngliàn)纳什均衡我们已经看到，有些纳什均衡之所以不是精炼均衡，是因为它们包含了不可置信的威胁战略。这一点意味着，如果(rúguǒ)参与人能在博弈之前采取某种措施改变自己的行动空间或支付函数，原来不可置信的威胁就可能变得可置信，博弈的精炼均衡就会相应改变。我们将这些为改变博弈结果而采取的措施称为“承诺行动”（commitment）。在许多情况下，承诺行动对当事人是很有价值的。特别地，有些情况下，一个参与人可以通过减少自己地选择机会使自己受益，原因在于保证自己不选择某些行动可以改变对手的选择第二十八页，共35页。4.3子博弈(bóyì)精炼纳什均衡4.3.4承诺行动(xíngdòng)与子博弈精炼纳什均衡承诺行动的一个古典例子使战争中将军(jiāngjūn)过河将桥炸掉以表示绝不撤退的决心。完全承诺（totalcommitment）：桥一旦被炸，撤退就没有可能（或者说撤退成本为无穷大）。不完全承诺：如果一个承诺只是增加某个行动的成本而不是使该行动完全没有可能。将承诺行动纳入模型的一个方法是明确地将承诺行动作为初始阶段的“行动”包括在博弈中（从而得到一个新的博弈）。第二十九页，共35页。4.3子博弈精炼(jīngliàn)纳什均衡4.3.4承诺行动(xíngdòng)与子博弈精炼纳什均衡考虑我们前面讨论过的房地产开发博弈的例子：如果在A决策之前，B与某个客户签订一个合同，规定B在一个特定(tèdìng)的时刻交付客户若干面积的写字楼办公室，如果B不能履约，将赔偿客户3500万。这个合同就是一个承诺行动。有了这个承诺行动，B的{开发，开发}就不再是一个不可置信的威胁，而是可置信的威胁，因为此时，不论A是否开发，开发是B的最优选择（如果A开发，B不开发时选择损失3500万，开发时损失3千万）。给定A知道B一定会选择开发，A的最优选择就是不开发，因此，子博弈精炼纳什均衡时（开发，{不开发，开发}）。注意：3500万的赔偿承诺不仅没有使B所示什么，反而使B得利1千万。第三十页，共35页。4.4子博弈(bóyì)精炼纳什均衡应用举例斯坦克尔伯格寡头竞争模型工会与雇主之间的博弈轮流出价(chūjià)的讨价还价模型第三十一页，共35页。4.4子博弈精炼纳什均衡(jūnhéng)应用举例4.4.1斯坦克尔博格（Stackelberg）寡头竞争(jìngzhēng)模型第三十二页，共35页。4.4子博弈精炼纳什均衡应用(yìngyòng)举例4.4.2工会与雇主(ɡùzhǔ)之间的博弈第三十三页，共35页。三阶段(jiēduàn)讨价还价博弈112不接受，出S接受不接受，出S2接受出S1第三十四页，共35页。三阶段讨价还价(tǎojiàhuánjià)博弈三回合(huíhé)讨价还价博弈结果的讨论第三十五页，共35页。

                    本文档为【经济博弈论(硕士)第04章】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，
                    图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。 
 该文档来自用户分享，如有侵权行为请发邮件ishare@vip.sina.com联系网站客服，我们会及时删除。

                    [版权声明] 本站所有资料为用户分享产生，若发现您的权利被侵害，请联系客服邮件isharekefu@iask.cn，我们尽快处理。

                    本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用。

                    网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
                

下载需要：免费已有0 人下载

立即下载

经济博弈论(硕士)第04章

你可能还喜欢