第 14 卷第 2 期 (总第 74 期 ) 系 统 工 程 1 9 9 6 年 3 月
非 合 作 博 弈
〔美〕约翰 · 纳什著 ’ , 贝兴亚译
引 言
冯 . 诺伊曼 (V o n Neu m a n) 和莫根施特思(M or -
g e n s te r n )已在他们的《博弈论与经济行为 )(T he o ry
o f G a m e s a n d E eo n o m ie Be l
、a v io r )一书中发展T 一
个所谓二人零和 博弈 (rw o p e r s o n z e r o s u m g a m e s )
的十分富有成效的理论 . 该书也包含了 n 一人博弈理
论 , 我们将这类博弈称为合作的博弈 , 这一理论的基
础 , 是对由博弈的局 中人可能形成的各式各样 的联
盟的相互关系的分析 。
与之截然不同 , 我们的理论则莫基于非联盟局
势 , 即在这里我们假 设 , 每一个 局中人都独立地行
动 . 与任何别的局 中人都不合作或沟通 .
对均衡点 的解释 , 在 我们的理论中是一个基本
的组成部分 。 这种解释是由二人零和博弈解的一般
概念引生出来的 . 即类似于二人零和博弈 的均衡点
的集合 . 我们这里对 “均衡点 ”的理解不过是所有各
对相对的 “好策略 ” 的集合而已 ’ . ( ‘ , 意指 N as h
平衡(译者注 )) .
在紧接下来的几节中 , 我们将定义诸均衡点 , 并
且证明有限非合作博弈总是至少有一个均衡点 . 我
们还将介绍有关非合作博弈的可解性与强可解性的
概念 , 并证明一条有关可解博弈的均衡点集合及其
几何结构的定理 。
作为我们理论的一个应用实例 , 我 们将求解一
个简化了的三人扑克博弈问题 .
规范化的定义与术语
介
在本节中我们定义本文的基本概念 , 并提出标
准 的术语和记号一些重要的定义将提前介绍 , 并以
副标的形式加强对其所定义的概念的描述 . 下文中
涉及的均是非合作情形 , 而不再处处强调和重申这
一 问题 。
有限博弈 :
对找们来说 , n 一 人博弈 , 就是 二 个局中人或位
盆的一种集合 , 每个局 中人或位置都有一个与之相
关联的有限纯策略 (p u r e s t ra t e g ie s ) 集合 ;与每一个
局 中 人 i 相 对 应 , 都有 一个 报 酬 函 数 (Pa yo “
fu nc
t io n)
, 即 p ‘, 此函数把诸纯策略的所有 n 一 要素
组合(n 一 tuP le) 射影到实数集上 . 当我 们使用 n 一
要素组合这一术语时 , 我们总是意指 n 个元素的一
种集合 , 每个元素分别对应一个不同的局中人 .
混合策略 , S ; :
局 中人 ‘的一个混合策略 (m ix e d s t r a t eg y ) , 是
一组具有单位和 的非负数组 ‘ ’ . , 并且该数组与该
局中人的所有纯策略一一对应 。 ( , , , 单位和是
指该组数的代数和等于 1( 译者注”
我们记为 S ‘~ 艺C * 几。 , 基中C 二 ) O且乏℃‘. ~ 1 ,
以
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
示这样一种混合策略 。在这里 , 诸 及。 都是局中
少、 i的纯策略 。我们把诸 S ‘视为一个其顶点是诸 瓦.
的单纯形 (si , 对。 ) 中的点 。这个单纯形可以看作是
一个实数向量空间上的 一个凸子集 , 所有的混合策
略 , 其实都是一种线性组合过程 , 并且都由凸子集给
定 。
我们将下标 i , j , R 用于诸局中人 , 而 用下标 么
夕、 7 来表示一个局中人的种种纯策略 。符号S ‘、t ; 和 斤
等表示混合策略 ; 几. 则指第 i个局 中人的第 口个纯策
略 。如此等等 。
报酬函数 , 户, :
在上面的有限博弈定义中所使用的报酬 函数的
概念 , 可同样定义 (扩展 ) 到诸混合策略的诸 n 一 要
素组合上 , 这一扩展在每个局中人的混合策略中都
收稿 日期 : 19 9 5一11 一 18 . 译者单 位 : 湖南省国际信托投资公司 .
, 约翰 · 纳什教授是 1 99 4 年诺 贝尔经济学奖的得 主 . 我衷心感谢纳什教授慷棍地允许把他的这篇重要论文译成中
文发表 。 同样感谢易宪容博士 , , 是他与纳 什教授联系后获得授权的—译者 .
2 1
是线性 的〔n 一 线性〕. 我 们也用 P ‘来表 示 , 记作
P
‘
(s l
,儿 , ⋯ , s , ) .
我们将记 S 或 : , 以表示诸混合策略的一个 n 一
要素组合 , 并且如果 吕 二 (: L , s : , ⋯ , 5 . ) , 那么 , P‘(S )
就是指 P ‘(s : , s : , ⋯ , , . ) 。这样一 种 n 一 要素组合 , 即
S
, 亦将被视为向量空间上的一个点 , 这个向量空间
是诸混合策略的向量空间的叉积 空间 . 所有这样的 n
一 要素组合的集合 , 便形成了一个凸多面体 , 该凸多
面体即为诸混合策略构成的所有单纯形的叉积 .
为方便起见 , 我们引人替换记号 (S ;ti) , 代表
(s :
, s : , ⋯ , 凡一 : , t‘; s‘+ : , ⋯ , 5 . ) , 这 里 , S = (s : , , : , 一 ,
5 . )
. 连续置换 ((S ; t‘) , 几 ) , 其结果我们以 (S ; ‘ ; ‘ ) 来
表示 , 依此类推 。
均衡点 :
一个 n 一 要素组合 S , 是一个均 衡点 , 当且仅当
对于所有的 i :
(1 ) P
‘
(S ) ~ n、。 x 〔P‘(S ; r ‘)〕
这样 , 一个均衡点就是这样 一个 n 一 要素组合
S
, 以致每一个 局中人的混合策略都使他的报酬最大
化 , 如果其他局 中人 的策略 固定不变的话 。从而 , 每
一个 局中 人的策略相对他人的策略来说都是最佳策
略 。我们于是把均衡点缩 写为 门 . Pt 二
我 们说 , 如果一个 棍合策略 S 、 ~ 二C 抽几。 , 并且
C
‘。
> 。 , 那 么该混合策略 S ‘就 应用了纯策略 且。 . 如
果 S 一 (s : , s : , , 二 , 5 . ) , 井且 S ‘应用了 11, . , 那么我们也
说 S 应用了 H 。 。
根据 S ‘中 P‘(: : , ‘: , ⋯ ,‘ ) 的这种线性 ,
(2 ) n ia x 〔P , (S ; r ‘)〕= m a x 〔P (S ; H ‘。 )〕。
我们定义 P , . (S ) = P‘(S ; IT 、. ) , 那么我们就有 T
下述 使 S 成为一个均衡点的充分必要条件 :
(3 ) P
‘
(S ) ~ n l a x P
、.
(S )
。
如果 S ~ (s , , s : , 一 , ‘. ) , 并且 S ‘ 一 乏C 沁几. , 那 么
P
,
(s ) 一 £ ‘. p 、. (S ) , 相 应地 . 要 使 (3 ) 成 立 , 每 当
Pi. (s) >
“黔粉(s) ·我 们就必须有 C一 0, 这就是
说 , S 不应 用仄 . , 除非对于局中人 i来说 , 它是一个最
优纯策略 。所以我们记 :
(4 ) 如果 几 . 被应 用 于 S , 那 么 丸 . (s ) =
m a x 丸, (S ) 就是一个均衡点的又 一充分必要条件 .口
由于对一个均衡点来说 ,
标准
excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载
(3) 可 以用诸 n 一
要素组 合S 的空间上的 n 对连续函数的相等来表述 ,
所以 均衡点便显而易 见地构成了该空间的一个闭子
2 2
集 。实际上 , 这个子集乃形成于若干个代数变 t , 并
为其它的代数变t 所切分 .
2 均衡点的存在性
对这 一 存 在 定 理 的 证 明 , 以 卡 库 坦 尼
(ka k ut
a ni ) 的广义不动点定理为基础 , 发表于《美国
国家科学院
记录
混凝土 养护记录下载土方回填监理旁站记录免费下载集备记录下载集备记录下载集备记录下载
汇编》第 38 期第 48 一 49 页 . 这里所
给出的证明 , 对那个较早期的证明作了相当大的改
进 , 并且直接莫基于布劳威尔(B ro u w er ) 定理 , 我们
开始便建立 n 要素组合空间的连续变换 T , 使得 T 的
诸不动点成为博弈的均衡点 。
定理 1 任一有限博弈都有一个均衡点 。
证明 设 S 是诸混合策略的一个 n 一 要素组
合 , 户‘(S )是对应于局 中人 i的报酬 , 而 丸 . (S )则是局
中人 i转到他的第 a 个纯策略几. 而其他局中人却继
续应 用他们各自的 S 中的混合策略的报酬 . 现在我
们把 S 的一个连续函数集定义为 :
价· (s ) ~ m a x (o , 户‘。 (S ) 一 户、(S ))并且对于 s 中
的每一分量 s , 我们定义一个修正 S’‘为 :
s ‘ + 万供. (S )H ‘.
S
‘ ,
-一1 十 万价。 (S )现在我们必须说明 , 射影 T : S ~ S, 的诸不动点就是均衡点 。首先考虑任意的 n 一 要 素组合 5 . 在S 中 , 第 i 个
局中人 的混合策略 S ‘将应 用他的某一个纯策略 . 这
些纯策略 中的某一个 , 比如说 IT, 。 , 必须是 “效用极小
的 ” , 以便 丸. (s ) 簇 P‘(S ) 。这样将使 价. (S ) = 0 .
现在 , 如果这一 n 一 要素组合S 恰好是变换 T 的
不动点 , 那么在 S ‘中所使 用的 IT, 。 的 (系数 ) 比例便不
应随变换 T 的作用所减小 。因此 , 对于所有 夕.物 (s)
必定为 。, 以免定义式 S’、 的分母不等于 l 。
这样 , 如果 S 是变换 T 的一个 不动点 . 那么 , 对
于任何的 i和 夕, 物 (S ) ~ 0 . 这意味着 , 任何局中人都
不能通过转移到一个纯策略 几 , 来改善他的报酬 . 但
这恰好就是均衡点 的一个标准〔参见(2 )〕。
相 反 , 如果 S 是一个平衡点 . 那么所有的 ? 均为
零 , 即 S 是变换 T 下的一个不动 点 。
既 然诸 n 一 要素组合的空 间是一个紧 凸子集 ,
根据布劳威尔不动 点定理 , 映射 T 必 定至少有一个
不动点 5 , 这个不动点定理必定就是一个均衡点 。
3 博弈的对称性
博弈的自同构性或对称性 , 将是它的纯策歼的
翻
一种排列 , 此一排列满足下面给出的一定条件 .
如果两个策略都属于某一个局中人 , 那么 , 这两
个策略也将对应于 (属于 ) 另一个局 中人的两个策
略 。这样 , 如果 护是诸纯策略的排列 , 那么 , 它就导致
局中人的一种排列 砰.
诸纯策略的每一个 。 一 要素组合因此都被排列
成诸纯策略的另一种 。 一 要素组合 。 我们可以把这
些个 n 一 组合的诱导排列称作 二 。设 右指诸纯策略的
一种 。 一 要素组合 , 并且 P‘(匀 是指在这种要素组合
石被使用时给予局 中人 i 的报酬 。我们要求 , 如果 :
j = i气那么 P‘(宁 ) = P‘(右)
对称的定义由此完成 。
对于混合策略而言 , 排列价有一个唯一的线性拓
展 。如果 :
S
‘
~ 之刃‘一万二 , 我们定义 (S ‘)价 ~ 之浓‘。(几 . )户。
把笋拓展到 混合策略 , 显然导致把 x 拓展到诸混
合策略的 n 一 要素组合 。我们也将用二来表示这一拓
展 。
对于所有的 二 , 我们都用夕 ~ S 来定义博弈的
一个对称性 n 一 要素组合 5 .
定理 2 任何有限博弈都有一个对称的均衡
点 。
证明 首先我们注意到 . 及。 一 王几 ./ 到 有性质
(S
‘。
)价 ~ S , — 在这里 j = i气使得 S 、。 = (S L。 , S : 。 ,⋯ , s. 。 ) 是 x 下的不动点 , 因此任何博弈都至少有一
个对称的 ” 一 要素组合 。
把对称的诸 n 一 要素组合的集合映射到它自身二
既然这一集合是一个紧凸子集 , 那么就必定存
在一个对称的不动点 S , 这个不动点必定是一个对称
的均衡点 。
4 解
如果 S ~
称的 , 那么 :
S 十 t
2
(s ,
, : : , ⋯ , s 。 )与 t = (t , , t : , ⋯ , t. )是对
‘互土兰生
2
s : 十 t :
2
. .⋯丛土二 、
2
也是对称的 , 因为宁 一 s~ S , ~ (s ‘)户 , 在 这里 , j
‘护 , 所以 :
S , 十 t ,
2
(凡)户 + (右)户
2
_ (主土 些、,
2
所以
(旦兰卫、二 _ 旦二匕些
2 2
这表明 , 诸对称的 n 一 要 素组合 , 乃是诸 n 一 要
素组合的一个凸子集 , 因为它们显然是封闭的 。
现 在看到 , 在证明存在性定理时 用到 的射影 T :
S ~ 夕 , 是一个关于 自身的 映射 。 因 此如果 S : 二
了S : , 并且 x 是从博弈的上述 自同构性导 出的 . , 那
么我们将有义 ~ T S 二’ , 如果 S , 是对称的 , 那么 S : ’ ~
S :
, 并且因此 义 ~ T S : 一 S : 。其结果是 , 这一射影就
在这里 , 我们来定义解 、强解和子解的概念 。非
合作博弈并非总是有解 , 但是当它确实有解时 , 这个
解 就是堆一的 . 强解是具有一些特殊性质的解 . 子解
总 是存在的 , 并且具有解的许多性质 . 但不具有唯一
的 。
S
‘将表 示局中人 i的所有混合策略的集合 , 而犷
则是指混合策略的诸 n 一 要素组合集 。
可解性 :
博弈是可解的 , 如果它 的均衡点的集合 . 即 夕 , ,
满足条件 :
(5 ) (t
, : ; ) e 少和 S 任 夕 , ~ (S , r ; ) 任 夕对所
有的 i都成立 。
这叫做可互换性条件 。可解博弈的解 , 就是它的
诸均衡点的集合 , 即夕 。
强可解性 :
博 弈是强可解的 , 如果它有解 , 即 夕 , 使得对于
所有的 i
S 任 少和 P; (S ; r ; ) ~ p ;(S ) ~ (S ; ri ) 任 夕 , 于是
称 岁 是强解 (s tr o , , 9 so lu t io n ) ·
均衡策略 :
在可解博弈中 , 设 S ;是所有混合策略 S 。的集合 ,
使得对于某一个 ! 来说 , n 一 要素组合(t ; S ; )是一个
均衡点 。 [s ; 是某个均衡点的第 i个组成部分 。〕我们
称 s ‘为局中人 i的均衡策略 (e , 。 ilib r iu , n stra t叮ie s )
的集合 。
子解 :
如果少 是博弈 的诸均衡点的集合的一 个子集 ,
并且满足条件(1 ) ;或者如果 犷与这一属性最相关 ,
那么我们就称 犷 为一个子解(s u b 一 : o lu tio 。 ) .
对于任何子解 岁 , 我 们定义第 i个 因子集合 , 即
5 1
, 为所有的 s ; 的集合 , 从而使 夕对于某个 ! 来说包
含 T (t ; S ) 。
注意 , 当一个子解是唯一的时就是一个解 ; 并且
它的因子集合就是诸均衡策略的集合 。
诱导排列 (译者 注 ) .
自同构射影 (译者注 )。
2 3
定理 3 一个子解 , 即少 , 是所有的 n 一 要 素组
合 (s : , s : , ⋯ , s。 ) 的集合 , 其中 s ‘ e s : , 5 1 是 歹 的第 i
个因子集 。其几何意义是 ,少是它的诸因子集合的叉
积 。
证明 考虑 一下这样一个 n 一 要素组合(s L , s : ,
⋯ , s 。 )。 按定义 , 存在 t : , t : , ⋯ , t 。 , 使得对于每一个 i ,
(t : ; s 、) 任萝 . 同时利 用条件 (s )n 一 1次 , 我们连续得
到 (t : ; s : ) e 岁 , (t : ; s ‘, s : ) e 歹 , ⋯ , (t ; ; s : ; s : , ⋯ , 5 . )
e 歹 , 最终便是 (s , ; s : ; ⋯ , s 。 ) e 犷 . 这便是我们所
要证 明的 。
定理 4 子解的诸因子集 S : , S : , ⋯ , S 。 , 作为诸
混 合策略空间的子集 , 都是闭的和凸的 .
证明 说明两件事就够了 :
(a ) 如果 S 、和 S“e s. , 那么 5 1’ = (s‘十 s‘; ) / 2
e 5
. ;
(b ) 如果 S 、’ 是 S 、的一个极点 , 那么 S 、. e 导 .
设 ! 任 少 。利 用均衡点 准则 (l ) , 那么对于 任何
r i , 我 们有 p . (t ; S ) 奋 p ‘(t ; 5 1 ; r , ) , 且 p . (t ; S ‘, ) 多 p , (t ;
s’ . ; r , ) 。将这些 不等式相加 , 利 用 p J(s , , s : , ⋯ , s 。 ) 在 s‘
中的线性并除 以 2 , 我们就得到 p , (t ; s j’) 多 p , (t ; s ‘’ ,
r , )
, 因为 S犷一 (5 . + s“) / 2 。由此我们知道 , 对于任何
的 t e 夕、 (t ; si’ ) 都是 一个均衡点二 如果所有这样
的均 衡点 (t ; s ‘ ) 的集合被加到 夕 上 , 那么这个扩大
的集 合显然就满足条件 (5 ) , 但由于 少 将是最大 的 ,
其结 果就是 S : 任 S 。
为着手说 明 (b ) , 注 意 到 n 一 要 素 组 合 (t ;
扩 )— 在这里 t e 少— 将是形如 (t ; s ; )的诸 n 一要 素组 合集合的极点 , 这是因 为 S ” 是 5 . 的一 个极
点 , 在这里 s ; 任 S 。但这个集合是一个均衡点的集合 .
且因此在 它的闭包内的任何点都是均衡点 , 因 为所
有 均衡点的集合都 是闭的 . 所 以 (t ;扩 ) 是一 个均衡
点 , 并且根据类似于 Si’ 的论证 , 可得 Sje 任 5 1 。
值 :
设 夕 是博弈的诸均衡点的集合 . 我们定义 :
V 广 = ,,J a 二 〔p i(S )〕, V 「 = , 。 a 二 〔P. (S )〕
5 〔夕 s 七夕 广
如果 V 广 一 V 厂 . 找 们记 V ; 一 V 广一 v 「 . 称 V 广是该
博弈的局中人 i的上限值 ; V 厂是下限值 ;而 V i就是博
弈局 中人 i的值 , 如果这 个值存在的话 .
如果只有一个均衡点 , 诸值显而 易见就必定存
在 。
我 们也可 以通过把 夕 限制于 子解中的诸均衡
点 . 然后应用与上述 相同的定义等式 , 针对子解来定
2 4
义有关的诸值 。
二人零和博弈 , 在上述定义的意义上 , 总是可解
的 . 均衡策略的集合 S : 和 S : , 简单地说就是 “好的 ”
策 略 . 这样一种博弈并非总是强可解的 ;强解只有在
纯策略中有一个 “鞍点 ” 时才存在 。
5 简 例
这些例子 旨在说明本文所定义的诸概念 , 并展
示发生在这些博弈中的种种特殊现象 .
第一位局中人拥有 用罗马字母表示的策略和左
边的报酬 , 如此等等 :
例 l
一4 ·。 4 解 (矗· + 矗b ,弄· + 铎。)
一
5 “。 5 V l 一资, v : 一 + 专
卜p 一4
例 2
a 日 10 强 解 (b , 日)
b . 一 10 V : = V :
b日 一l
0O11
,
.人
例 3
a 日 一 10
不 可 解 , 均 衡 点 为 (a , Q) , (b ,印 和
(令+ 夸,号+ 普, ·在 , 后 , 形的
诸 策略具有最大 一 最小与最小 一 最大
等性 质 .
门U
11‘.五. .二11
一
例 4
强解 : 所有 各对混合策略 。
V 产 = V 才一 l
V 厂 一 V 矛 一 O
尸口QQ目.
aLIJ.11
例 5
一 l ;, p
一 4
一 4 ba 一l
不可解 , 均衡点 ( · , O ) , (。, 日) 和 (十·
+ 子。,音。 + 音, ) · 然而 , 经验的检
验显示 出一种 走向 (a ,的 的趋势 .
原文为贬t ; s 、) , 译者认 为有 误 , 应更改为 ( t ; s 、. ) (译者
注 〕
例 6 1
o a日 均衡点 : (a , 。) 与 (b . 日) . 至于 (b j ) 则
是德定性的一个例子 。
在一个较之更优越的策略 5 1 .
一个 混合策略优于另一个混合策略 , 总是会导
致其他的优势 . 如让 。 ‘; 优于 s ; , 并且 t‘使用了所有纯
策略 , 其中 s , 的系数比 sl ; 的高 , 那么对于一个足够小
的 P
r , i = r‘ + P(s
‘i 一 s ‘)
是一个混合策略 . 而且由于其线性 , t‘优于 t, ; .
可以证明有不可优势策略集合的几个性质 . 这
些案合是简单连接的 , 并且是由策略单纯形 的诸面
的某种聚合的连接所形成的 。
通 过发现对 于一个局 中人的优势而获得的信
息 , 可能与其他局中人有关 ,这里的信息在某种程度
上讲 , 是指通过各种混合策略的排除 以作为均衡点
的可能 (考虑 ) 成分而涉及的信息 。对于诸 t 而言 , 其
完 全不被超越的成分 , 就是所需要考虑的成分 , 从而
排除掉一个 局中人的诸策略中的某些策 , 就可使另
一个局中人的新一轮的策略排除成为可能 .
可以用来搜索均衡点的另外一种思路 . 是反论
型分析 。这里假定 , 一个均衡点存在着 , 并且位于策
略空间 的一定 区域范围之 内 , 并着手推导出此假设
为真时 所必须满足的一些进一步的条件 。这种推理
可以通过几 个阶段来进行 , 以便最终获得一个表明
不存在任何满足这一初始假设 的均衡点的反论 . 。
玩印
6 解的几何形态
在二人零和博弈的情形中 , 已经表明 , 一个局中
人的 “好 ” 策略的集合 , 是他的策略空 间的一个 凸多
面子集 。对于任何可解的博弈中一一局中人的均衡
策略集合来说 . 我们都将得到同样的结果 .
定理 5 在可解博弈中 , 均 衡策 略的诸集合 S : ,
S :
, ⋯ , S 。 , 都是诸混合策略空间的凸多面子集 。
证明 一个 n 一 要素组合 S 将是一个均衡点 .
当且仅当对于 每一个 i ;
(6 ) p ;(S ) =
一,, a却二 (S )
此即 条件(3 ) 。一个对等的条件是 , 对于每一个 i
和 Q :
(7 ) P ‘(S ) 一 P; 。(S ) 奋 0
现在 . 让我们考虑一下局中人 j的诸均衡策略 S ,
的集合 S , 的形态 。设 t 是一个任意均衡点 , 那 么根据
定理 2 , 当且仅当 s , 任 尽时 , (t ; sj) 将是一个均衡点 。
现在我们把条件(2 ) 应用于 (t 禹) , 得到 :
(8 ) s j任 S j~ 对于所有的 ‘. a , p ; (t ; s j) 一 p * (t ;
5 1) 争 0 。
由于 p ; 是 n 一 线性的 , 且 t 是确 定的 , 所以 上面
的式子就是具有 形如 F ‘ (Si ) 奢 。的 鱿性不等式集
合 。每一个这样的不等式或者对所有的 s , 都成立 , 或
者对依赖并且处于 某个通过这种策略单纯形的超平
面的一边的那些 s , 成立 。因此 . 诸条件的这一完全集
合 (是有限 的 ) , 都将在局中人 j的策略单纯形 的某 个
凸多面子集上得到满足 。〔半空间的交 叉 。〕
作为一个推论 , 我们可以作出结论 , S , 是诸混 合
策略(诸顶点 ) 的一个有限集合的凸闭集合 。
7 优势与反论
方法
快递客服问题件处理详细方法山木方法pdf计算方法pdf华与华方法下载八字理论方法下载
如果对于所有的 r , p , (t ; s , i) 奔 p ‘(t ; 5 1) , 那么 我
们就说 , s“优于 s : .
这等于说 , s , ; 给予 局中人 i的报酬 高于 s ‘给予
的 , 而不管其他局中人的策略如何 。要弄清楚一策略
sl ; 是否优于 s ‘ , 只要考虑其他局 中人的各种纯策 略
就够了 , 因为 p ; 具有 n 一 线性 。
根据其定义 , 显 而易见 . 任何均衡点都不可能存
8 三人扑克博弈
作为一个把我们的理论应用于一种或多或少是
现实的情形的例子 , 我们收入下面给出的简化了的
扑克博弈 。规则如下 :
(a ) 这是幅大纸牌 , 有同样多的高花色牌和纸
花色牌 , 一手由一张牌组成 。
(b ) 有两 个筹码 , 用来下注 、开牌或叫牌 。
(c ) 局中人轮流玩牌 , 而博弈则结束在 所有局
中人都已通过之后 , 或则结束在一个局 中人 已经开
叫 . 而其他局中人也 已有过一次叫牌机会之后 。
(d ) 如果没有人打赌 , 赌注就被收 回 。
(e ) 否则整个赌注就在 己经下了注的最高几
手之间均分 .
我们发现 , 根据我们称之 为 “行为参数” 的各种
量来处理这种博弈 , 比之 以《博弈论与经济行为》的
规范形式来处理它 , 更为令人满意 。规范的形式表述
从而排除这一 区域范 围 . 反论法实际上是 用来缩小
搜索 区间的方法 (译者注 ) .
2 5
中 , 一个局中人的两种混 合策略 , 在每一策略都使个
人在每一个要求他 以同样的频率行动的特殊情境中
选择各自的有效行动程序这个意义上 , 可 以是对等
的 . 此 即 , 它们代表由该个人表现 出来的同样的行为
模式 。
行为参数给出了在各种各样的会出现的可能情
况 中的每一种情形 中 , 采取多种多 样的可能 行动 中
的每一种行动的概率 。 因而它 们描述 了诸种行 为模
式 。
按照诸项行 为参数 , 局中人的策略可以表述如
下 , 同时 假定 既然不存 在以一张高花 色牌来通过一
个人的最后 的下注 机会的点 , 那么此事便不会有人
做 . 希腊字母便是各种各样的行动的概率 。
我们首先说 明大多数希腊 字母参数都必须被消
除 , 以此来搜索所有可 能的均衡点 泪 的消除主 要是
通过优势分析 , 并附加 一点反论 型分析 , 而 y 、 会和 O
也因被优于而消除 。然后 诸反论又 依次排除了 尸 、安、
。、入、 ‘ 、 u 。这 就给我 们留下了 a 、 p、。 和 刀。 反论分析表
明 , 其 中没有一个可以 为零或一 于是我们 便得到一
组联立代数方程式 。这 些方 程式恰好 只有一个在范
围 (。 , 1) 内变动的 解 。我们有 :
文 。 在那里 , 这个解是对随着预先下的赌注对总赌注
的比率的变化来加 以研究的 , 并且结成各种联盟的
可能性作了探究 。
9 应 用
丫厄厄丁2 1 一 了 3 2 1一一一一蕊一一一 , 刀 sa 十 1
、— , O -4 5 一 Za污一不万 , £4 a 一 l
a + 5
第一轮诸步 第二轮诸步
11111 。 在高花 色上开叫叫 K 在低花色上 叫牌 III
日日日在低花色上开叫叫 入在低花 色上叫牌 III
拌拌拌拌 在 低花色 上叫牌 lll
和和和和 III
IIIII 7 在 f氏花 色上 叫牌 lll 。 在 低花色上叫牌 ...
者者者在高花色上开 目LIII 之在 低花 色上 叫牌 III
吃吃吃 在低花 色上 开叫叫 和 lll
IIIII 屯在 f氏花 色上 叫牌 --- 局 中 人 皿 总得不 到第第
和和和 lll 二轮叫牌牌刀刀刀在低花 色上 开 口Llllll
00000 在 f氏花色上 口上!牌 -----
ttttt 在 低花色上叫牌 lllll
这些 方程 式的结果是 。 一 0 . 3 08 , , 一 。. 6 35 , a ~
0. 82 6. 和 仁 一 。· 。4 4 。由于 只存在一个均衡点 , 因此此
一博弈有值 ;这些值是 :
U ; ~ 一 0 . 1 4 7 - 仁l 十 1 7 a )诵又亏二不万 ’。“ 0 . 0 9 6
对干 n 一 人博弈来说 , 公认的公平竞赛伦理学
意 味着非合作的竞赛 , 对这种博弈的研究 , 当然是应
用这 一理论 的一个 显而 易见 的方向 。 扑克牌戏则是
最 明显的应 用目标 . 对一 场比 我们的非常简单的模
型更为现实的扑克牌戏的分析 , 应 当是一件十分有
趣的事 。
然而 , 为一项完 整的探究所必需 的数学工作的
复 杂性 , 随着博弈 的复杂性的增加而很快地增加 ; 所
以 , 对于 一项 比这里所给出的例子复杂得 多的博弈
的分析 , 唯一适宜的很可能就是运用近似计算的方
法 。
一种不那么显 眼的应 用 , 是把 它 应用于 对合作
性 博弈的研究 。所谓合作性的博弈 , 我 们指 的是一种
涉 及局中人 , 纯策略 以 及与往常一样 的报酬的一个
集 合的情形 , 但是假定 , 诸局 中人能够并且会进行合
作 , 就像他们在冯 · 诺伊曼和莫根施 特恩的理 论中
所作 的那样 . 这意味着诸 局中人可 以沟通并形 成将
由 一位仲裁人来执行的联 合。 然而 , 并非必须限于假
定 , 对于不同的局中的报酬 (它们应当按有效单位计
算 ) . 都有什么可变性或者 甚 至是可 比性 。 任何被期
望的可变性都可以纳入博弈本身之 中 , 而不是假定
它可能存在于博弈外的合作中 。
作者 已经发展出一种 “动力学的 ” 方法 , 来研究
那 些奠基 于向非 合作博弈 简 化的合作性博弈 。进而
建立起一个赛前谈判的模型 , 以便谈判的步骤变成
一 次大的描述总体情形 的非 合作博弈中的诸行动步
骤 (这种非合作博弈将有无限个纯策略 ) .
于是 . 这种大 的博弈便是根据本 文的理论 (被推
广到 无限 的博弈 ) 来处理的 , 并且 如果各值都被求
出 , 那么就把它们采纳为 合作性博弈的值 . 从 而 , 分
析一种合作的博弈的 问题 , 就成 了为谈判求得一个
合适 的 、令人信服的 、非合作的模型 。
依靠这样一种处理 , 作者 已 经为 所有有限的两
少、 合作博弈以及一些特殊的 n 一 人博弈求得各值 .
匕产 , 和 ·3 一 。· 2 4卜器‘粼 , 。对此一扑 克博弈 的一项更 为完整的研 究 , 发表
于《数学研究年刊 办第 2 4 期 , 即 “对博弈论的贡献” 一
2 6
致谢 塔 克尔 、盖 尔和 库恩博士给 了对于改进文 中
的材料说 明而言是有价值的批评和建 议 。 大卫 · 盖
尔建议研究对称的博弈 。 解扑克牌 (下转第 50 页 )
了一致性和不一致性的定义 。对于不一致性情况 , 我们给出了识别引起不一致性的最小不等式
集合的方法 , 确定对效用更精确的估计是否产生一致性的方法也在这部分给出 ;对于一致性情
况 , 给出了偏好估计的停止规则和
方案
气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载
排序的过程 ;最后提出了一个方案选择和权重确定的迭
代方法 。
当然 , 本文的研究建立在概率信息精确可知的假设上 ,对于不确定情况下的多 目标决策这
类复杂的问题 , 还有待我们进一步研究 .
参 考 文 献
1 D
.
P e k
e
lm
a n a n d S
.
K
. 段 n , M a t h〔 m a t ie a l P r o g r a m m in g m od e Is fo r t h e d e t e rm in a t io n o f a t t r ib u t e w e ig h t . M a n a g 卜
m e n t 段1. , V o l 2 0 , 1 97 4
Z C
·
C
·
w h it
e ,
S
·
Do zo
n o a n d W
.
T
· 段性e r e r , A n In t e r a e t iv e p r o c e d u r e fo r a id in g m u ltia t t r ib u t e a lte r n a tiv e s e lo c t io n ·
o m
e qa , V o l
,
1 1
, 19 8 3
3 Jo h n M
.
Po t te r a n d B
r ia n D
.
0
.
A n d
e r s o n , P a r t ia lP
r io r In fo
r
m
a t io n a nd Dc
c io io n m
a
k in g
.
IE E E T r a n s
.
Sy s t
. ,
M a n
. ,
C y b
e
m
. ,
V o l SM C 一 10 . 1 9 8 0
4 陈违 . 决策分析 . 科学出版社 , 1 9 8 7
5 李怀祖 . 决策理论导引 . 机减工业 出版社 , 1 9 93
M u ltia tt r ib u te D e c isio n m a k in g U n d e r U n e e r t舀in ty
Z ha n g R e iq in g Q iu W a n hu a
[ A b s tr a e t】 In t l、15 p a p e r , w e p r e s e n t a m o d e l o f s in g le s t a g e d e e is io n m a k in g a n d f r a d e
一 o ff w e ig llt d e t e r m in a t io n u n d e r u n e e r t a in t y a n d tr a d e 一 o ff w e ig ht a n d u -
t ility s e o r e im p r e e is io n
.
D e fin it io n o f e o n s is te n e y a n d in e o n s is te n ey h a
v e
b e e n g i
v e n a n d e x a m in e d in s o m e d e p t h
.
S to p p in g r u le s fo r p r efe re n e e a s
-
s e s s m e n t a n d a p
r o e e d u r e fo r r a n k in g a lte
r n a t ir e s a r e p re s e n t e d fo
r th e e o n
-
5 is te n t e a s e
.
A p
r o e e d u r e fo r id e n t ify in g th e m in im a l s e ts o f in e q u a lit ie s
e a u s in g in e o n s is te n e y
, a n d a m o th o d fo r d e te r m in in g if m o r e p r e e is e a s s e s s
-
m e n t o f tll e U
i e o u ld le a d to e o n s is t e n e y
, a re g iv e n fo r the in e o n s is te n t
e a s e
.
T he s e
r e s u lts a re e o m bin e d t o p r o d u e e a n it e r a t i
v e p r o e e d u r e fo r a l
-
te r n a t iv e s e le e tio n a n d tr a d e 一 o ff w e ig ll t d e te r m in a t io n .
[ K ey w o r d s l M u ltia tt r ib u t e D e e i
s io n rn a kin g
,
U n e e r t a in t y
,
C o n s is te n e y E x a m in a tio n
,
D o m in a t io n D ia g ra p l、
字”矛”孚”挤”护”护”护” 护”护”护”夕王勺”, 护, 护 , 护”护”护, 护, 护”护, 护”护, 护”护, 护”挤 , 护”护, 护”泳”挤”沪”护”字妙挤”字”叨 , 呀田护”矛, 渗”孚”协 ,
(上接第 2 6 页 )
模型是由罗伊德 · 5 . 沙普莱和作者所从事的一个联
合科研项 目 . 最后 , 作者 在 1 9 4 9一 1 9 50 年作此 项工
作期间 . 得到了原子能委员会的财政支持 .
参 考 文 献
冯 · 诺伊曼 , 莫根施待恩 . 博弈论与经济行 为 . 普
林斯顿大学出版社 , 19 4 9 年
小 J. F. 纳什 . “N 一 人博弈 中的均衡点 ”. 美 国国家
科学院记录汇缩第 3 6 卷 ( 1 95 0 ) , 4 8一 4 9
J
.
F
. 纳什 , L . 5 . 沙普莱 . “一种简单的三人扑克博
弈 ” . 数学 研究年刊第 24 期 , 普林斯倾大 学 出版
社 , 1 9 50
约翰 · 纳什 . “二 人合作博弈 , . 将发表于计量经济
学
H
.
w
. 库恩 . “广义博弈 ” . 美国国家科学院记录汇
编第 36 卷 , ( 19 5 0 ) , 5 70一 5 7 6
5 0