首页 博弈论课件

博弈论课件

举报
开通vip

博弈论课件一、什么是博弈论博弈论(GameTheory),又称对策论,是指一些个人、队组、或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行动或策略中进行选择并加以实施,从中各自取得相应的结果的过程。第一页张维迎的定义“博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的”也就是说,当一个主体,好比说一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题。所以在这个意义上说,博弃论又称为“对策论”.第二页...

博弈论课件
一、什么是博弈论博弈论(GameTheory),又称对策论,是指一些个人、队组、或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行动或策略中进行选择并加以实施,从中各自取得相应的结果的过程。第一页张维迎的定义“博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的”也就是说,当一个主体,好比说一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题。所以在这个意义上说,博弃论又称为“对策论”.第二页产生与发展一般认为,1944年冯·诺依曼和摩根斯坦合作出版的《博弈论和经济行为》,标志着系统的博弈理论的形成。20世纪50年代以来,纳什、泽尔腾、海萨尼等人使博弈论最终成熟并进入实用。到20世纪70年代,博弈论正式成为主流经济学。第三页三位大师主要的贡献1950年和1951年纳什的两篇关于非合作博弈论的重要 论文 政研论文下载论文大学下载论文大学下载关于长拳的论文浙大论文封面下载 ,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。因为在现实世界中,非合作博弈要比合作博弈普遍得多。第四页SeltenandHarsanyi泽尔腾(1965)将纳什均衡的概念引入了动态分析,提出了“精炼纳什均衡”概念;以及进一步刻画不完全信息动态博弈的“完备贝叶斯纳什均衡”而海萨尼则发展了刻画不完全信息静态博弈的“贝叶斯纳什均衡”(1967-1968)。总之,他俩进一步将纳什均衡动态化,加入了接近实际的不完全信息条件。他们的工作为后人继续发展博弈论,提供了基本思路和模型第五页博弈论与诺贝尔奖1994年诺贝尔经济学奖授予了三位博弈论专家纳什、泽尔腾和海萨尼。1996年诺奖授予两位博弈论与信息经济学研究专家莫里斯、维克瑞;2001年诺奖授予阿克洛夫、斯彭斯、斯蒂格利茨,表彰他们在柠檬市场、信号传递和信号甄别等非对称信息理论研究中的开创性贡献。2005年诺奖授予有以色列和美国双重国籍的罗伯特·奥曼和美国人托马斯·谢林,以表彰他们在博弈论领域作出的贡献。第六页主要思想博弈论并不是经济学的一个分支,它只是一种方法,这也是为什么许多人将其看成数学的一个分支的缘故。在对参与者行为研究这一点上,博弈论和经济学家的研究模式是完全一样的。经济学越来越转向人与人关系的研究,特别是人与人之间行为的相互影响和相互作用,人与人之间利益和冲突、竞争与合作,而这正是博弈论的研究对象。第七页博弈论是一个强有力的分析工具。现在,它不仅在经济学领域、在军事、政治、商业征战、社会科学领域以及生物学等自然科学领域都有非常重大的影响, 工程 路基工程安全技术交底工程项目施工成本控制工程量增项单年度零星工程技术标正投影法基本原理 学中如控制论工程也少不了它。帮助大家形成博弈论的基本概念,实际上它是非常精深的。现在与它紧密联系的经济学分支是信息经济学。信号游戏、拍卖形式、激励机制、委托人--代理人理论和公共财政学是博弈论和信息经济学研究的重要课题。著名经济学家保罗.萨缪尔森说:“要想在现代社会做一个有文化的人,您必须对博弈论有一个大致了解。”第八页我们从博弈中学习什么博弈论告诉人们,要学会理解他人都有自己的思想,每个个体都是理性的,所以必须了解竞争对手的思想。商业关系被认为是一种相互作用。但博弈论并不是疗法,并不是处方,它并不告诉你该付多少钱买东西,这是计算机或者字典的任务。博弈论只是提供一些关系的例证,一些有用的解决问题的方法。这种思维方法也许是企业家应该学习的。对于经济学家,也许需要学习它的理论模型,它的实验方式。第九页博弈论的组成要素1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人,也可以是团体,如企业,国家等);2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策(坦白,抵赖);3、策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排;第十页4、信息指的是参与人在博弈中所知道的关于自己以及其他参与人的行动、策略及其得益函数等知识;5、得益是参与人在博弈结束后从博弈中获得的效用,一般是所有参与人的策略或行动的函数,这是每个参与人最关心的东西;6、均衡是所有参与人的最优策略或行动的组合;均衡结果是指博弈结束后博弈分析者感兴趣的一些要素的集合,如在各参与人的均衡策略作用下,各参与人最终的行动或效用集合。第十一页两种均衡占优策略是无论其他局中人采取什么策略对于自己来说都是最好的策略。占优均衡所有局中人都有占优策略而形成的均衡。纳什均衡是指某一局中人在其他局中人的策略给定时选择最好策略而形成的均衡。第十二页占优均衡“不管你做什么,我所做的都是最佳选择。”“不管我做什么,你所做的都是最佳选择。”纳什均衡“给定你的行为,我所做的是最佳选择。”“给定我做什么,你所做的是最佳选择。”占优均衡一定是纳什均衡,但纳什均衡不一定是占优均衡。第十三页博弈的分类1)根据参与人的多少,可将博弈分为两人博弈和多人博弈;2)根据博弈结果的不同,又可分为零和博弈、常和博弈和变和博弈;3)根据博弈方策略的数量,可分为有限博弈和无限博弈;第十四页4)根据参与人是否合作,可将博弈分为合作博弈或非合作博弈;合作博弈是指参与人之间有着一个对各方具有约束力的 协议 离婚协议模板下载合伙人协议 下载渠道分销协议免费下载敬业协议下载授课协议下载 ,参与人在协议范围内进行的博弈。合作博弈强调的是集体主义,团体理性是效率、公平、公正;非合作博弈主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果是有时有效率,有时则不然。第十五页例子比如两家企业A、B合作建设一条VCD的生产线,协议由A方提供生产VCD的技术,B方则提供厂房和设备。在对技术和设备进行资产评估时就形成非合作博弈,因为每一方都试图最大化己方的评估值,这时B方如果能够获得A方关于技术的真实估价或参考报价这类竞争情报,则可以使自己在评估中获得优势;同理,A方也是一样。至于自己的资产评估是否会影响合作企业的总体运行效率这样的"集体利益",则不会非常重视。这就是非合作博弈,参与人在选择自己的行动时,优先考虑的是如何维护自己的利益。第十六页5)从行动的先后次序来分,博弈可以分为静态博弈和动态博弈。静态博弈指在博弈中,参与人同时选择行动,或虽非同时但后行动者并不知道前行动者采取了什么具体行动;动态博弈指的是参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动的博弈。第十七页6)从参与人对其他参与人的各种特征信息的获得差异来分,博弈可分为完全信息博弈和不完全信息博弈。完全信息指的是每一个参与人对所有其他参与人的特征,如策略集合及得益函数都有准确完备的知识;否则就是不完全信息。将上述5)和6)两个角度的划分结合起来,我们就得到四种不同类型的博弈,这就是:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈和不完全信息动态博弈。第十八页博弈的分类及对应的均衡行动次序信息静态动态完全信息纳什均衡纳什(1950)子博弈精练纳什均衡泽尔腾(1965)不完全信息贝叶斯均衡海萨尼(1967-1968)精炼贝叶斯均衡泽尔腾等(1975-1991)第十九页完全信息静态博弈囚犯困境(Prisoner‘sDilemma):警察抓住了两个罪犯,但是警察局却缺乏足够的证据指证他们所犯的罪行。如果罪犯中至少有一人供认犯罪,就能确认罪名成立。为了得到所需的口供,警察将这两名罪犯分别关押防止他们串供或结成攻守同盟,并分别跟他们讲清了他们的处境和面临的选择:如果他们两人都拒不认罪,则他们会被以较轻的妨碍公务罪各判一年徒刑;如果两人中有一人坦白认罪,则坦白者立即释放而另一人将重判10年徒刑;如果两人都坦白认罪,则他们将被各判8年监禁。问:两个罪犯会如何选择(即是坦白还是抵赖)?第二十页得益矩阵表示为囚徒B-8,-80,-10-10,0-1,-1囚徒A坦白抵赖坦白抵赖第二十一页囚徒困境说明了什么在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡,也叫非合作均衡。囚徒困境反映了个人理性和集体理性的矛盾。如果A和B都选择抵赖,各判刑1年,显然比都选择坦白各判刑8年好得多。当然,A和B可以在被警察抓到之前订立一个"攻守同盟",但是这可能不会有用,因为它不构成纳什均衡,没有人有积极性遵守这个协定,显然最好的策略是双方都抵赖.第二十二页囚徒困境的意义“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。第二十三页对经典经济学的冲击“纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。《国富论》:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。第二十四页怎么看待这个问题二者是对立统一的,范围不同,在非竞争环境中效率会受到损失;在完全竞争条件下,边际利润等于边际成本,达到效率纳什均衡条件下的行为规则。合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。所谓“己所不欲勿施于人”。但前提是人所不欲勿施于我。第二十五页囚徒困境在经济学上的应用1、两个寡头企业选择产量的博弈如两企业联合起来形成卡特尔,选择垄断利润最大化的产量,每个企业都可以得到更多的利润,但卡特尔协定不是一个纳什均衡,因为给定对方遵守协议的情况下,每个企业都想增加产量,结果是,每个企业都只得到纳什均衡产量的利润,它小于卡特尔产量下的利润。有些情况下,个人理性与集体理性的冲突对整个社会来说也许是一件好事。第二十六页2、公共产品的供给博弈大家都出钱兴办公用事业,所有人的福利都会增加。问题是,如果我出钱你不出钱,我得不偿失,而如果你出钱我不出钱,我就可以占你的便宜。所以,每个人的最优选择都是“不出钱”,这种纳什均衡使得所有人的福利都得不到提高。3、军备竞赛博弈纳什均衡是两国都大量增加军费预算,两国的社会福利都变得更糟。4、企业改革在许多改革中,改革者要付出成本,而改革的成果大家分享,结果是,尽管人人都认为改革好,却没有人真正去改革,大家只好在都不满意的体制下继续生活下去。第二十七页价格战从这个案例中我们可以引伸出两个问题:一是竞争削价的结果或“纳什均衡”可能导致一个有效率的零利润结局。二是如果不采取价格战,作为一种敌对博弈论(rivalrygame)其结果会如何呢?每一个企业,都会考虑采取正常价格策略,还是采取高价格策略形成垄断价格,并尽力获取垄断利润。如果垄断可以形成,则博弈双方的共同利润最大。这种情况就是垄断经营所做的,通常会抬高价格。另一个极端的情况是厂商用正常的价格,双方都可以获得利润。第二十八页有趣的联系我们又引出一条基本准则:“把你自己的战略建立在假定对手会按其最佳利益行动的基础上”。事实上,完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下,每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。在这种均衡中,每一企业要使利润最大化,消费者要使效用最大化,结果导致了零利润,也就是说价格等于边际成本。在完全竞争的情况下,非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格,那么社会的经济效率就会遭到破坏。这就是为什么WTO和各国政府要加强反垄断的意义所在。第二十九页智猪博弈猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。那么,两只猪各会采取什么策略?第三十页答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。在这个例子中,对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲历亲为了。故事中的游戏规则导致了“小猪躺着大猪跑”的现象,如果改变一下核心指标:每次落下的食物数量和踏板与投食口之间的距离。猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗?我们假设以下三种新的游戏规则。第三十一页我们假设以下三种新的游戏规则:新规则一:减量 方案 气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载 。投食仅原来的一半分量。谁去踩踏板,就意味着为对方贡献食物。结果是小猪大猪都不去踩踏板了。也就不会有踩踏板的动力。如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。新规则二:增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板,反正对方不会一次把食物吃完。所以竞争意识却不会很强。对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。新规则三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。第三十二页原版的“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。而能否完全杜绝“搭便车”现象,就要看游戏规则的核心指标设置是否合适了。 第三十三页所以在企业人力资源管理中,进行激励 制度 关于办公室下班关闭电源制度矿山事故隐患举报和奖励制度制度下载人事管理制度doc盘点制度下载 设计时,如果奖励力度太大,又是持股,又是期权,公司职员个个都成了百万富翁,成本高不说,重要的是激励因素转变成了保健因素,员工的积极性并没有提高。这相当于“智猪博弈”增量方案所描述的情形。但是如果奖励力度不大,而且见者有份,一度十分努力的大猪也不会有动力了,企业将会没有生命力,就出现“智猪博弈”减量方案所产生的结果。最好的激励机制设计就像改变方案三----减量加移位的办法,奖励并非人人有份,而是直接针对个人(如业务按比例提成),既节约了成本(对公司而言),又消除了“搭便车”现象,能实现有效的激励。 第三十四页智猪博弈的应用1、股份公司中大股东和小股东监督经理的博弈纳什均衡是大股东担当收集信息、监督经理的责任,而小股东则搭大股东的便车。2、股票市场上大户、小户炒股票对小户而言,“跟大户”是最优选择,而大户口、必须自己收集信息,进行分析。第三十五页龟兔赛跑与运行机制设计在现实的企业里面,类似龟兔赛跑的情形很多。例如,企业一方面感觉人才匮乏,另一方面又在大量浪费人才。本该放在“高端”的人才却长期放在“低端”,高端人才在低端环境里找不到兴奋点,找不到挑战,就象兔子撒开腿跑就找不着龟,此时它还有什么心情再跑下去,睡吧,长睡的结果失去了斗志,也失去了善跑的能力。又例如决策层和执行层,执行层和作业层之间的脱节,造成决策层(执行层)就象“龟”四平八稳的在蠕动;而执行层(作业层)就好象兔在前方睡觉,这是企业老化的真实写照。第三十六页怎样避免类似上述两个例子的情形发生呢?企业应在组织、经营、生产的运行机制设计上跳出龟兔赛跑的思维定式,应用博弈的观点,理智的科学的设计出符合本企业实际的运行机制。这里有两条原则,一是机制要有充分的竞争性及竞争平台,二是对竞争要有评价系统及评价的权威性、公正性程序设计。第三十七页掩耳盗铃故事中盗铃者与护铃者构成博弈双方,但盗铃者错误地将决定博弈利益的信息因素阻断——把自己的耳朵捂住,盗铃的失败是必然的,故事非常可笑。但经过几千年的文明净化和发展,在我们的现实生活中,这样的故事还在不断的演义着。决策失误经常见诸报端,其实现实中的决策失误报纸是盛不下的,究其原因除制度外就是决策者们通过各种形式阻断了决策所必须的信息,单凭个人喜好,听不进去半点不同意见,这种失误实属必然。第三十八页博弈论是决策的科学工具,在使用这个工具的过程中,信息是否完全是决策正确与否的基础,因此企业的各级决策者应在工作中疏通信息的通道。这里有三条建议:一是从文山会海中脱出身来,改变开会就是工作的单一思维;二是少听汇报,多下去搞些调查研究,了解真实情况;三是把对报喜者的灿烂笑脸分些给报扰者吧!第三十九页性别战(battleofsexes)一男一女谈恋爱,男的偏好足球,女的喜欢芭蕾,但他们宁愿在一起,不愿分开。下表所列为收益。2,10,00,01,2女足球芭蕾足球芭蕾男第四十页双均衡的性别战在此情况下,给定一方看足球,另一方也会去;给定一方看芭蕾,另一方也会去。所以在这个博弈里有两个纳什均衡:{足球,足球},{芭蕾,芭蕾}。究竟哪种结果会发生?不能确定。可能取决于偶然因素,但先动优势会起作用。第四十一页纯战略与混合战略如果一个战略规定参与人在每一个给定的信息情况下只选择一种特定的行动,称为纯战略。如果一个战略规定参与人在给定的信息情况下以某种概率分布随机地选择不同的行动,称为混合战略。第四十二页监督博弈的纳税检查A为应纳税款,C为检查成本,F是偷税罚款。假定C-C-P,只要胜诉的可能大于0,原告将起诉。如果SC+P,原告提起诉讼;即使TXC+P仍有可能。(TX+D/2-C-P,-TX-D/2)案件私了。第五十一页不完全信息静态博弈不了解对方的偏好、战略空间及各种战略组合下的利润水平。市场进入博弈40,5030,100-10,0-10,1400,3000,4000,3000,400在位者默许斗争进入进入者不进入高成本低成本第五十二页海萨尼转换引入虚拟参与人“自然”在所有后果间是无差异的。自然的选择提供了被选择的参与人真实类型的概率分布。分布函数是共同知识。“不完全信息”转换为“完全但不完美信息”第五十三页贝叶斯纳什均衡Bayesianequilibrium给定自己的类型和对方类型的概率分布的情况下,每个参与者的期望效用达到了最大化,没有人有积极性选择其他战略的类型战略依存组合。期望利润=40x+(-10)(1-x)第五十四页不完全信息动态博弈-----精炼贝叶斯纳什均衡垄断限价模型(低成本价格与高成本价格透露的信息)信号传递模型成本的信息含量第五十五页求爱博弈如果男人是柳下惠,女人穿少的时候他会看的概率是20%;如果男人是登徒子,女人穿少的时候他会看的概率是100%。女人根据现有的信息判断男人是柳下惠的概率为70%,因此女人估计自己穿少的时候,男人看的概率为:0.7*0.2+0.3*1=0.44这是女人给定男人所属类型的先验概率下,男人可能采取看的概率。第五十六页当男人的确看了的时候,使用贝叶斯法则,根据男人看的这一行动,女人认为男人是柳下惠的概率变为:0.7*0.2/0.44=0.32根据这一新的概念,女人估计自己穿少的时候男人会看的概率为:0.32*0.2+0.68*1=0.744第五十七页如果女人将这种行为再重复一次,男人又看了,则女人认为男人是柳下惠的概率变为:0.32*0.2/0.744=0.086这样女人通过男人一次次的看的行为,越来越认为男人是登徒子而不是柳下惠。这就是参与人行为传递信息的作用。第五十八页谢谢大家第五十九页
本文档为【博弈论课件】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: ¥17.6 已有0 人下载
最新资料
资料动态
专题动态
is_769254
暂无简介~
格式:ppt
大小:687KB
软件:PowerPoint
页数:59
分类:
上传时间:2021-11-18
浏览量:197