第一节 博弈论的基本概念
与战略式
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
述
博弈论的基本概念与战略式表述
博弈论(game theory)是研究决策主体的行为 发生直接相互作用时候的决策以及这种决策的均衡问
题
快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题
。
博弈的战略式表述:G={N,(Si)iN,(Ui)iN}
有三个基本要素:
(1)参与人(players)iN={1,2,…,n} ;
(2)战略(strategies),siSi(战略空间);
(3)支付(payoffs),ui=ui(si,s-i)。
博弈中的参与人(局中人)
独立决策、独立承担博弈结果的个人或组织
博弈规则面前局中人之间平等,不因局中人之间权利、地位的差异而改变。
局中人数量对博弈结果和
分析
定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析
有影响。
根据局中人数量分单人博弈、两人博弈、多人博弈等。最常见的是两人博弈,单人博弈是退化的博弈。
单人博弈:只有一个局中人的博弈
例一:单人迷宫
单人博弈:只有一个局中人的博弈
例一:运输路线
单人博弈实质
个体最优化问题
两人博弈
两人博弈即有两个博弈方的博弈。
两人博弈最常见,研究最多,是最基本和有用的博弈类型。
囚徒困境、猜硬币、齐威王田忌赛马等都是两人博弈。
两人博弈有多种可能性,博弈方的利益方向可能一致,也可以不一致。
多人博弈
三个博弈方之间的博弈。
可能存在“破坏者”:其策略选择对自身的利益并没有影响,但却会对其他博弈方的利益产生很大的,有时甚至是决定性的影响。
多人博弈的表示有时与两人博弈不同,需要多个得益矩阵,或者只能用描述法。
博弈中的策略
策略:博弈中各局中人的选择内容
策略有定性定量、简单复杂之分。
不同局中人之间不仅可选策略不同,而且可选策略数量也可不同。
有限博弈:每个博弈方的策略数都是有限的。
无限博弈:至少有某些博弈方的策略有无限多个。
博弈中的得益
得益(支付):各博弈方从博弈中所获得(花费)的利益(支付)。
得益对应博弈的结果,也就是各博弈方策略的组合。
得益是各博弈方追求的根本目标及行为和判断的主要依据。
根据得益的博弈分类:零和博弈、常和博弈、变和博弈。
囚徒的困境是图克(Tucker)1950年提出的。
该博弈是博弈论最经典、著名的博弈。
该博弈本身讲的是一个法律刑侦或犯罪学方面的问题,但可以扩展到许多经济问题,以及各种社会问题,可以揭示市场经济的根本缺陷。
案例1:囚犯困境
案例1:囚犯困境
支付
嫌疑人B
嫌疑人A
抵赖
坦白
抵赖
-1,-1
-9,0
坦白
0,-9
-6,-6
均衡战略与均衡支付
均衡战略(坦白,坦白)
均衡支付(-6,-6)
第二节 占优战略均衡
第二节 占优战略均衡
第二节 占优战略均衡
第二节 占优战略均衡
第二节 占优战略均衡
完全信息静态博弈即各局中人同时决策,且所有局中人对各方得益都了解的博弈。囚徒的困境、齐威王田忌赛马、猜硬币、石头剪子布、古诺产量决策都属于这种博弈。完全信息静态博弈属于非合作博弈最基本的类型。
第二节 占优战略均衡
完全信息静态博弈的几点特性
同时出招,出招一次;
知道博弈结构与游戏规则(共同知识);
不管是否沟通过,无法做出有约束力的
承诺(非合作)
第二节 占优战略均衡
占优战略
占优战略:不管对手战略为何,该参与人可找到一最佳战略。或不管其它局中人选择什么战略,一局中人的某个战略给他带来的支付始终高于其它的战略.
囚徒的困境中的“坦白”。
占优战略均衡
在博弈G={N,(Si)iN,(Ui)iN}中,如果对所有的参与人i,si*是它的占优战略,那么所有参与人选择的战略组合(s1*,…,sn*)成为该对策的占优战略均衡。
或一个博弈的某个战略组合中的所有战略都是各个局中人各自的占有战略,必然是该博弈比较稳定的结果。
占优策略均衡反映了所有局中人的绝对偏 好,因此非常稳定,根据占优策略均衡可以对博弈结果作出最肯定的预测。
占优战略均衡不是普遍存在的
一个博弈中所有参与者存在严格优策略,那么严格优策略组合一定是该博弈的唯一均衡解。(P34)
占优战略均衡
案例1:囚犯困境
支付
嫌疑人B
嫌疑人A
抵赖
坦白
抵赖
-1,-1
-9,0
坦白
0,-9
-6,-6
价格大战
支付
百事可乐
可口可乐
低价
高价
低价
3,3
6,1
高价
1,6
5,5
案例2:智猪博弈
猪圈里圈两头猪,一头大猪,一头小猪。猪圈的一头有一个猪食槽,另一头安装一个按钮,控制着猪食的供应。按一下按钮会有10个单位的猪食进槽,但谁按按钮谁就要付出2个单位的成本。若大猪先到,大猪吃到9个单位,小猪只能吃1个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位。支付如表。
案例2:智猪博弈
支付
小猪
大猪
按
等待
按
5,1
4,4
等待
9,-1
0,0
智猪博弈的扩展
股份公司承担监督经理职能的大股东与小股东
股票市场上炒股票的大户与小户
市场中大企业与小企业在研发、广告上的博弈
公共产品的提供(富户与穷户)
改革中不同利益分配对改革的推动
第三节 重复剔除的占优战略均衡
第三节 重复剔除的占优战略均衡
绝对劣势战略:si是一绝对劣势战略当且仅当存在另一战略si’Si使得ui(si,s-i)< ui(si’,s-i) 对所有s-iS-i均成立。( si’ 未必是优势战略)
或不管其它局中人的战略如何变化,给一个局中人带来的收益总是比另一种战略给他带来的收益小的战略。
重复剔除的占优战略均衡:逐次删去绝对劣势战略得到唯一的占优战略。
例:重复剔除的占优战略均衡
参与人2
L M R
参与人1
U
D
2,3
0,2
3,4
1,1
2,7
4,5
例 重复剔除的占优战略均衡
参与人2
L M R
参与人1
U
D
M
4,3
5,1
6,2
2,1
8,4
3,6
3,0
9,6
2,8
例 重复剔除的占优战略均衡
参与人2
L M R
参与人1
U
D
M
1,0
1,3
3,0
0,2
0,1
3,0
0,2
2,4
5,3
注意:
如果每次剔除的是严格劣战略,均衡结果与剔除的顺序无关;如果剔除的是弱劣势战略,均衡结果可能与剔除顺序有关。
存在严格优势策略必然存在严格劣势策略,反之不然。
甲和乙分别会选择什么战略?
乙
L M R
U
甲
D
1,1 4,2 1,3
2,3 1,2 2,1
当甲选“U”时,乙会选“R”;而当乙选“R”时,甲应该选“D”而不是“U”;但当甲选“D”时,乙会选“L”;给定乙选“L”,甲选“D”是最好的选择,他不会改变选择“D”;给定甲不改变选“D”,乙也不会改变其选择“L”。所以,可以预期(D,L)是甲乙最终完成的稳定的选择。
第四节 纳什均衡
第四节 纳什均衡
定义:指一战略组合有以下特性:当参与人持此战略后,任一参与人均无诱因偏离这一均衡;s*=(s1*,…,sn*)=(si*,s-i*)是一纳什均衡,当且仅当对所有参与人而言,ui (si*,s-i*) ui (si’,s-i*)对所有si’Si 均成立。简单而言,当s1*是对s2*的最适反应,s2*也是s1*的最适反应时,(s1*,s2*)就是二人博弈的纳什均衡。
纳什均衡是局中人战略选择上构成的一种“僵局”,给定其他局中人的选择不变,任何一个局中人的选择是最好的,他也不会改变其战略选择。
命题1:纳什均衡在占优战略重复剔除解法中不会被剔除
即:没有任何一个战略优于纳什均衡战略
命题2:重复剔除的严格占优战略均衡一定是纳什均衡。
占优策略均衡肯定是纳什均衡,但纳什均衡不一定是占优策略均衡。
两个重要命题
两个重要关系
每一个占优战略均衡、重复剔除的占优战略均衡一定是纳什均衡,但并非每一个纳什均衡都是占优战略均衡或重复剔除的占优战略均衡。
纳什均衡一定是在重复剔除劣战略过程中没有被剔除掉的战略组合,但反之不成立,除非他是唯一的。
例 纳什均衡求解
参与人2
L M R
参与人1
U
D
M
0,4
4,0
5,3
4,0
0,4
5,3
3,5
3,5
6,6
第五节 纳什均衡应用举例
古诺(Cournot)寡头模型
沙滩卖冰
公共地的悲剧
斗鸡博弈
萨缪尔森:“你可以将一只鹦鹉训练成经济学家,因为它所需要学习的只有两个词——供给与需求。”
坎多瑞(博弈论专家):“要成为现代经济学家,这只鹦鹉必须再多学一个词,这个词就是纳什均衡。”
一、古诺寡头模型(P56)
特点:存在两家厂商;同时行动确定产量。
通过预测另一家厂商的产量来选择自己的利润最大化产量,寻求预测均衡。
厂商1表示为:max p(q1+q2e)q1-c(q1),得出q1=f1(q2e),同理得出q2=f2(q1e),称为反应函数,两条曲线的交点为古诺模型的解。
古诺寡头模型的纳什均衡
反应函数
q1=f1(q2)
q2=f2(q1)
(q1*,q2*)
是该对策的
纳什均衡解。
例题:古诺模型的解
假设p=1-(q1+q2),MC=0,
则根据利润最大化的一阶条件分别得到反应函数
q1=f1(q2)=(1-q2)/2,
q2=f2(q1)=(1-q1)/2,
求出均衡时产量为(1/3,1/3),为纳什均衡
0 ¼ ½ ¾ 1
二、沙滩卖冰
假设游客沿沙滩{0,1}间均匀分布,现有两位卖冰者,他们会将摊位选在哪个位置?假设游客就近购买。
生活中还有哪些类似的例子?
商业位置博弈
在城市街道上,我们常见到一些地段上的商店十分拥挤,构成一个繁荣的商业中心区,但另一些地段却十分冷僻,没什么商店。对于这种现象,我们可以运用纳什均衡的概念来加以解释。
甲乙
1/2
·
·
当乙在甲的右边紧靠甲设店时,其右边街道上的顾客都是乙的顾客;如果乙不是紧靠甲而是远离甲设店,则其顾客只是其右边街道的居民,不如它紧靠甲设店时多,因而在远离甲的位置设店是劣战略。所以给定甲在1/2处设店,乙在紧靠甲的左边或右边设店是最优的。反过来,给定乙在接近1/2处设店,甲的最优选择也是在1/2附近设店。这样,甲和乙挤在1/2处设店就是纳什均衡,这就是商业中心区的形成原理。
三、公共地的悲剧(哈丁悲剧,P87)
资源没有排他性产权:草地放牧、公海捕鱼、小煤窑的过度开发
草地放牧:n个农民,每个拥有羊的数量为gi,G=gi,v(G)代表每只羊的价值,与草地上放牧的总数G相关,饲养量增加到一定程度,随着数量继续增加,羊的价值会下降,即v’(G)<0
农民的利润函数i=giv(gj)-gic
最优化的一阶条件:i/gi=v(G)+giv’(G)-c=0
增加一只羊有正效应(羊的价值)、负效应(新增羊使之前所有羊的价值下降)
个人边际成本小于社会边际成本,个人最优决定的饲养总量大于社会最优决定的饲养总量
公共资源经常被过度利用的原因
在18世纪以前,英国苏格兰地区有大量的草地,其产权没有界定,属公共资源,大家都可以自由地在那里放牧。草地属于“可再生资源”,如果限制放牧的数量,没有被牛羊吃掉的剩余草皮还会重新长出大面积草场,但如果不限制放牧规模,过多的牛羊将草吃得一光二净,则今后不会再有新草生长出来,草场就会消失。
苏格兰的草地为什么消失了?
由于草地的产权没有界定,政府也没有对放牧作出规模限制,每家牧民都会如此盘算:如果其他牧民不约束自己的放牧规模,让自己的牛羊过多地到草地上吃草,那么,我自己一家约束自己的放牧规模对保护草场的贡献是微乎其微的,不会使草场免于破坏;相反,我也加入过度放牧的行列,至少在草场消失之前还会获得一部分短期的收益。
如果其他牧民约束放牧规模,我单独一家人过度放牧不会破坏广褒的牧场,但自己却获得了高额的收益。因此,任何一位牧民的结论都会是:无论其他牧民是否过度放牧,我选择“约束自己的放牧规模”都是劣战略,从而被剔除。大家最终都会选择过度放牧,结果导致草地消失,生态破坏。
多人的“囚徒困境”
渤海中的鱼愈来愈少了,工业化中的大气及河流污染,森林植被的破坏等。解决公共资源过度利用的出路是政府制订相应的规制政策加强管理,如我国政府规定海洋捕鱼中,每年有一段时间的“休渔期”,此时禁止捕鱼,让小鱼苗安安静静地生长,大鱼好好地产卵,并对鱼网的网眼大小作出规定,禁用过小网眼的捕网打鱼,保护幼鱼的生存。又如在三峡库区,为了保护库区水体环境,关闭了前些年泛滥成灾的许多小造纸厂等。
类似的例子
公共地悲剧的解决办法:
第一,
制度
关于办公室下班关闭电源制度矿山事故隐患举报和奖励制度制度下载人事管理制度doc盘点制度下载
上建立中心化权利机构;
第二,道德约束与非中心化奖惩联系。
五、斗鸡博弈
1
2
支付
“斗鸡博弈”的扩展
夫妻间吵架
警察与游行队伍
公共产品的供给(两富户修路)
作业一
乙
左 中 右
上
中
下
甲
一个两人同时博弈的支付竞争如下所示,试求纳什均衡。是否存在重复剔除占优战略均衡?
7,7 6,6 7,6
5,7 5,8 8,5
6,6 5,8 4,8
作业二
春节前夕,某小镇上两个商铺主甲和乙同时看到一个赚钱机会:去城里贩一批鞭炮回来零售,购货款加上运输费用共5000元,如果没有竞争对手,这批货在小镇上能卖6000元;但如果另一家商铺同时在小镇上卖鞭炮,价格下跌使得这批鞭炮只能卖4000元。请用战略式表示支付矩阵;请找出纳什均衡。
*
生活中的实例
看电视剧 看体育频道
看电视剧 1,5 -1,-1
看体育频道 -1,-1 5,1
详细信息请参考:http://www.syzone.cn
*