非合作博弈

非合作博弈第 14 卷第 2 期 (总第 74 期 ) 系统工程 1 9 9 6 年 3 月非合作博弈〔美〕约翰 · 纳什著 ’ , 贝兴亚译引言冯 . 诺伊曼 (V o n Neu m a n) 和莫根施特思(M or - g e n s te r n )已在他们的《博弈论与经济行为 )(T he o ry o f G a m e s a n d E eo n o m ie Be l 、a v io r )一书中发展T 一个所谓二人零和博弈 (rw o p e r s o n z e ...

第 14 卷第 2 期 (总第 74 期 ) 系统工程 1 9 9 6 年 3 月非合作博弈〔美〕约翰 · 纳什著 ’ , 贝兴亚译引言冯 . 诺伊曼 (V o n Neu m a n) 和莫根施特思(M or - g e n s te r n )已在他们的《博弈论与经济行为 )(T he o ry o f G a m e s a n d E eo n o m ie Be l 、a v io r )一书中发展T 一个所谓二人零和博弈 (rw o p e r s o n z e r o s u m g a m e s ) 的十分富有成效的理论 . 该书也包含了 n 一人博弈理论 , 我们将这类博弈称为合作的博弈 , 这一理论的基础 , 是对由博弈的局中人可能形成的各式各样的联盟的相互关系的分析。与之截然不同 , 我们的理论则莫基于非联盟局势 , 即在这里我们假设 , 每一个局中人都独立地行动 . 与任何别的局中人都不合作或沟通 . 对均衡点的解释 , 在我们的理论中是一个基本的组成部分。这种解释是由二人零和博弈解的一般概念引生出来的 . 即类似于二人零和博弈的均衡点的集合 . 我们这里对 “均衡点 ”的理解不过是所有各对相对的 “好策略 ” 的集合而已 ’ . ( ‘ , 意指 N as h 平衡(译者注 )) . 在紧接下来的几节中 , 我们将定义诸均衡点 , 并且证明有限非合作博弈总是至少有一个均衡点 . 我们还将介绍有关非合作博弈的可解性与强可解性的概念 , 并证明一条有关可解博弈的均衡点集合及其几何结构的定理。作为我们理论的一个应用实例 , 我们将求解一个简化了的三人扑克博弈问题 . 规范化的定义与术语介在本节中我们定义本文的基本概念 , 并提出标准的术语和记号一些重要的定义将提前介绍 , 并以副标的形式加强对其所定义的概念的描述 . 下文中涉及的均是非合作情形 , 而不再处处强调和重申这一问题。有限博弈 : 对找们来说 , n 一人博弈 , 就是二个局中人或位盆的一种集合 , 每个局中人或位置都有一个与之相关联的有限纯策略 (p u r e s t ra t e g ie s ) 集合 ;与每一个局中人 i 相对应 , 都有一个报酬函数 (Pa yo “ fu nc t io n) , 即 p ‘, 此函数把诸纯策略的所有 n 一要素组合(n 一 tuP le) 射影到实数集上 . 当我们使用 n 一要素组合这一术语时 , 我们总是意指 n 个元素的一种集合 , 每个元素分别对应一个不同的局中人 . 混合策略 , S ; : 局中人 ‘的一个混合策略 (m ix e d s t r a t eg y ) , 是一组具有单位和的非负数组 ‘ ’ . , 并且该数组与该局中人的所有纯策略一一对应。 ( , , , 单位和是指该组数的代数和等于 1( 译者注” 我们记为 S ‘~ 艺C * 几。 , 基中C 二 ) O且乏℃‘. ~ 1 , 以表示这样一种混合策略。在这里 , 诸及。都是局中少、 i的纯策略。我们把诸 S ‘视为一个其顶点是诸瓦. 的单纯形 (si , 对。 ) 中的点。这个单纯形可以看作是一个实数向量空间上的一个凸子集 , 所有的混合策略 , 其实都是一种线性组合过程 , 并且都由凸子集给定。我们将下标 i , j , R 用于诸局中人 , 而用下标么夕、 7 来表示一个局中人的种种纯策略。符号S ‘、t ; 和斤等表示混合策略 ; 几. 则指第 i个局中人的第口个纯策略。如此等等。报酬函数 , 户, : 在上面的有限博弈定义中所使用的报酬函数的概念 , 可同样定义 (扩展 ) 到诸混合策略的诸 n 一要素组合上 , 这一扩展在每个局中人的混合策略中都收稿日期 : 19 9 5一11 一 18 . 译者单位 : 湖南省国际信托投资公司 . , 约翰 · 纳什教授是 1 99 4 年诺贝尔经济学奖的得主 . 我衷心感谢纳什教授慷棍地允许把他的这篇重要论文译成中文发表。同样感谢易宪容博士 , , 是他与纳什教授联系后获得授权的—译者 . 2 1 是线性的〔n 一线性〕. 我们也用 P ‘来表示 , 记作 P ‘ (s l ,儿 , ⋯ , s , ) . 我们将记 S 或 : , 以表示诸混合策略的一个 n 一要素组合 , 并且如果吕二 (: L , s : , ⋯ , 5 . ) , 那么 , P‘(S ) 就是指 P ‘(s : , s : , ⋯ , , . ) 。这样一种 n 一要素组合 , 即 S , 亦将被视为向量空间上的一个点 , 这个向量空间是诸混合策略的向量空间的叉积空间 . 所有这样的 n 一要素组合的集合 , 便形成了一个凸多面体 , 该凸多面体即为诸混合策略构成的所有单纯形的叉积 . 为方便起见 , 我们引人替换记号 (S ;ti) , 代表 (s : , s : , ⋯ , 凡一 : , t‘; s‘+ : , ⋯ , 5 . ) , 这里 , S = (s : , , : , 一 , 5 . ) . 连续置换 ((S ; t‘) , 几 ) , 其结果我们以 (S ; ‘ ; ‘ ) 来表示 , 依此类推。均衡点 : 一个 n 一要素组合 S , 是一个均衡点 , 当且仅当对于所有的 i : (1 ) P ‘ (S ) ~ n、。 x 〔P‘(S ; r ‘)〕这样 , 一个均衡点就是这样一个 n 一要素组合 S , 以致每一个局中人的混合策略都使他的报酬最大化 , 如果其他局中人的策略固定不变的话。从而 , 每一个局中人的策略相对他人的策略来说都是最佳策略。我们于是把均衡点缩写为门 . Pt 二我们说 , 如果一个棍合策略 S 、 ~ 二C 抽几。 , 并且 C ‘。 > 。 , 那么该混合策略 S ‘就应用了纯策略且。 . 如果 S 一 (s : , s : , , 二 , 5 . ) , 井且 S ‘应用了 11, . , 那么我们也说 S 应用了 H 。。根据 S ‘中 P‘(: : , ‘: , ⋯ ,‘ ) 的这种线性 , (2 ) n ia x 〔P , (S ; r ‘)〕= m a x 〔P (S ; H ‘。 )〕。我们定义 P , . (S ) = P‘(S ; IT 、. ) , 那么我们就有 T 下述使 S 成为一个均衡点的充分必要条件 : (3 ) P ‘ (S ) ~ n l a x P 、. (S ) 。如果 S ~ (s , , s : , 一 , ‘. ) , 并且 S ‘ 一乏C 沁几. , 那么 P , (s ) 一￡ ‘. p 、. (S ) , 相应地 . 要使 (3 ) 成立 , 每当 Pi. (s) > “黔粉(s) ·我们就必须有 C一 0, 这就是说 , S 不应用仄 . , 除非对于局中人 i来说 , 它是一个最优纯策略。所以我们记 : (4 ) 如果几 . 被应用于 S , 那么丸 . (s ) = m a x 丸, (S ) 就是一个均衡点的又一充分必要条件 .口由于对一个均衡点来说 , 标准 (3) 可以用诸 n 一要素组合S 的空间上的 n 对连续函数的相等来表述 , 所以均衡点便显而易见地构成了该空间的一个闭子 2 2 集。实际上 , 这个子集乃形成于若干个代数变 t , 并为其它的代数变t 所切分 . 2 均衡点的存在性对这一存在定理的证明 , 以卡库坦尼 (ka k ut a ni ) 的广义不动点定理为基础 , 发表于《美国国家科学院记录汇编》第 38 期第 48 一 49 页 . 这里所给出的证明 , 对那个较早期的证明作了相当大的改进 , 并且直接莫基于布劳威尔(B ro u w er ) 定理 , 我们开始便建立 n 要素组合空间的连续变换 T , 使得 T 的诸不动点成为博弈的均衡点。定理 1 任一有限博弈都有一个均衡点。证明设 S 是诸混合策略的一个 n 一要素组合 , 户‘(S )是对应于局中人 i的报酬 , 而丸 . (S )则是局中人 i转到他的第 a 个纯策略几. 而其他局中人却继续应用他们各自的 S 中的混合策略的报酬 . 现在我们把 S 的一个连续函数集定义为 : 价· (s ) ~ m a x (o , 户‘。 (S ) 一户、(S ))并且对于 s 中的每一分量 s , 我们定义一个修正 S’‘为 : s ‘ + 万供. (S )H ‘. S ‘ , -一1 十万价。 (S )现在我们必须说明 , 射影 T : S ~ S, 的诸不动点就是均衡点。首先考虑任意的 n 一要素组合 5 . 在S 中 , 第 i 个局中人的混合策略 S ‘将应用他的某一个纯策略 . 这些纯策略中的某一个 , 比如说 IT, 。 , 必须是 “效用极小的 ” , 以便丸. (s ) 簇 P‘(S ) 。这样将使价. (S ) = 0 . 现在 , 如果这一 n 一要素组合S 恰好是变换 T 的不动点 , 那么在 S ‘中所使用的 IT, 。的 (系数 ) 比例便不应随变换 T 的作用所减小。因此 , 对于所有夕.物 (s) 必定为。, 以免定义式 S’、的分母不等于 l 。这样 , 如果 S 是变换 T 的一个不动点 . 那么 , 对于任何的 i和夕, 物 (S ) ~ 0 . 这意味着 , 任何局中人都不能通过转移到一个纯策略几 , 来改善他的报酬 . 但这恰好就是均衡点的一个标准〔参见(2 )〕。相反 , 如果 S 是一个平衡点 . 那么所有的 ? 均为零 , 即 S 是变换 T 下的一个不动点。既然诸 n 一要素组合的空间是一个紧凸子集 , 根据布劳威尔不动点定理 , 映射 T 必定至少有一个不动点 5 , 这个不动点定理必定就是一个均衡点。 3 博弈的对称性博弈的自同构性或对称性 , 将是它的纯策歼的翻一种排列 , 此一排列满足下面给出的一定条件 . 如果两个策略都属于某一个局中人 , 那么 , 这两个策略也将对应于 (属于 ) 另一个局中人的两个策略。这样 , 如果护是诸纯策略的排列 , 那么 , 它就导致局中人的一种排列砰. 诸纯策略的每一个。一要素组合因此都被排列成诸纯策略的另一种。一要素组合。我们可以把这些个 n 一组合的诱导排列称作二。设右指诸纯策略的一种。一要素组合 , 并且 P‘(匀是指在这种要素组合石被使用时给予局中人 i 的报酬。我们要求 , 如果 : j = i气那么 P‘(宁 ) = P‘(右) 对称的定义由此完成。对于混合策略而言 , 排列价有一个唯一的线性拓展。如果 : S ‘ ~ 之刃‘一万二 , 我们定义 (S ‘)价 ~ 之浓‘。(几 . )户。把笋拓展到混合策略 , 显然导致把 x 拓展到诸混合策略的 n 一要素组合。我们也将用二来表示这一拓展。对于所有的二 , 我们都用夕 ~ S 来定义博弈的一个对称性 n 一要素组合 5 . 定理 2 任何有限博弈都有一个对称的均衡点。证明首先我们注意到 . 及。一王几 ./ 到有性质 (S ‘。 )价 ~ S , — 在这里 j = i气使得 S 、。 = (S L。 , S : 。 ,⋯ , s. 。 ) 是 x 下的不动点 , 因此任何博弈都至少有一个对称的 ” 一要素组合。把对称的诸 n 一要素组合的集合映射到它自身二既然这一集合是一个紧凸子集 , 那么就必定存在一个对称的不动点 S , 这个不动点必定是一个对称的均衡点。 4 解如果 S ~ 称的 , 那么 : S 十 t 2 (s , , : : , ⋯ , s 。 )与 t = (t , , t : , ⋯ , t. )是对 ‘互土兰生 2 s : 十 t : 2 . .⋯丛土二、 2 也是对称的 , 因为宁一 s~ S , ~ (s ‘)户 , 在这里 , j ‘护 , 所以 : S , 十 t , 2 (凡)户 + (右)户 2 _ (主土些、, 2 所以 (旦兰卫、二 _ 旦二匕些 2 2 这表明 , 诸对称的 n 一要素组合 , 乃是诸 n 一要素组合的一个凸子集 , 因为它们显然是封闭的。现在看到 , 在证明存在性定理时用到的射影 T : S ~ 夕 , 是一个关于自身的映射。因此如果 S : 二了S : , 并且 x 是从博弈的上述自同构性导出的 . , 那么我们将有义 ~ T S 二’ , 如果 S , 是对称的 , 那么 S : ’ ~ S : , 并且因此义 ~ T S : 一 S : 。其结果是 , 这一射影就在这里 , 我们来定义解、强解和子解的概念。非合作博弈并非总是有解 , 但是当它确实有解时 , 这个解就是堆一的 . 强解是具有一些特殊性质的解 . 子解总是存在的 , 并且具有解的许多性质 . 但不具有唯一的。 S ‘将表示局中人 i的所有混合策略的集合 , 而犷则是指混合策略的诸 n 一要素组合集。可解性 : 博弈是可解的 , 如果它的均衡点的集合 . 即夕 , , 满足条件 : (5 ) (t , : ; ) e 少和 S 任夕 , ~ (S , r ; ) 任夕对所有的 i都成立。这叫做可互换性条件。可解博弈的解 , 就是它的诸均衡点的集合 , 即夕。强可解性 : 博弈是强可解的 , 如果它有解 , 即夕 , 使得对于所有的 i S 任少和 P; (S ; r ; ) ~ p ;(S ) ~ (S ; ri ) 任夕 , 于是称岁是强解 (s tr o , , 9 so lu t io n ) · 均衡策略 : 在可解博弈中 , 设 S ;是所有混合策略 S 。的集合 , 使得对于某一个 ! 来说 , n 一要素组合(t ; S ; )是一个均衡点。 [s ; 是某个均衡点的第 i个组成部分。〕我们称 s ‘为局中人 i的均衡策略 (e , 。 ilib r iu , n stra t叮ie s ) 的集合。子解 : 如果少是博弈的诸均衡点的集合的一个子集 , 并且满足条件(1 ) ;或者如果犷与这一属性最相关 , 那么我们就称犷为一个子解(s u b 一 : o lu tio 。 ) . 对于任何子解岁 , 我们定义第 i个因子集合 , 即 5 1 , 为所有的 s ; 的集合 , 从而使夕对于某个 ! 来说包含 T (t ; S ) 。注意 , 当一个子解是唯一的时就是一个解 ; 并且它的因子集合就是诸均衡策略的集合。诱导排列 (译者注 ) . 自同构射影 (译者注 )。 2 3 定理 3 一个子解 , 即少 , 是所有的 n 一要素组合 (s : , s : , ⋯ , s。 ) 的集合 , 其中 s ‘ e s : , 5 1 是歹的第 i 个因子集。其几何意义是 ,少是它的诸因子集合的叉积。证明考虑一下这样一个 n 一要素组合(s L , s : , ⋯ , s 。 )。按定义 , 存在 t : , t : , ⋯ , t 。 , 使得对于每一个 i , (t : ; s 、) 任萝 . 同时利用条件 (s )n 一 1次 , 我们连续得到 (t : ; s : ) e 岁 , (t : ; s ‘, s : ) e 歹 , ⋯ , (t ; ; s : ; s : , ⋯ , 5 . ) e 歹 , 最终便是 (s , ; s : ; ⋯ , s 。 ) e 犷 . 这便是我们所要证明的。定理 4 子解的诸因子集 S : , S : , ⋯ , S 。 , 作为诸混合策略空间的子集 , 都是闭的和凸的 . 证明说明两件事就够了 : (a ) 如果 S 、和 S“e s. , 那么 5 1’ = (s‘十 s‘; ) / 2 e 5 . ; (b ) 如果 S 、’ 是 S 、的一个极点 , 那么 S 、. e 导 . 设 ! 任少。利用均衡点准则 (l ) , 那么对于任何 r i , 我们有 p . (t ; S ) 奋 p ‘(t ; 5 1 ; r , ) , 且 p . (t ; S ‘, ) 多 p , (t ; s’ . ; r , ) 。将这些不等式相加 , 利用 p J(s , , s : , ⋯ , s 。 ) 在 s‘ 中的线性并除以 2 , 我们就得到 p , (t ; s j’) 多 p , (t ; s ‘’ , r , ) , 因为 S犷一 (5 . + s“) / 2 。由此我们知道 , 对于任何的 t e 夕、 (t ; si’ ) 都是一个均衡点二如果所有这样的均衡点 (t ; s ‘ ) 的集合被加到夕上 , 那么这个扩大的集合显然就满足条件 (5 ) , 但由于少将是最大的 , 其结果就是 S : 任 S 。为着手说明 (b ) , 注意到 n 一要素组合 (t ; 扩 )— 在这里 t e 少— 将是形如 (t ; s ; )的诸 n 一要素组合集合的极点 , 这是因为 S ” 是 5 . 的一个极点 , 在这里 s ; 任 S 。但这个集合是一个均衡点的集合 . 且因此在它的闭包内的任何点都是均衡点 , 因为所有均衡点的集合都是闭的 . 所以 (t ;扩 ) 是一个均衡点 , 并且根据类似于 Si’ 的论证 , 可得 Sje 任 5 1 。值 : 设夕是博弈的诸均衡点的集合 . 我们定义 : V 广 = ,,J a 二〔p i(S )〕, V 「 = , 。 a 二〔P. (S )〕 5 〔夕 s 七夕广如果 V 广一 V 厂 . 找们记 V ; 一 V 广一 v 「 . 称 V 广是该博弈的局中人 i的上限值 ; V 厂是下限值 ;而 V i就是博弈局中人 i的值 , 如果这个值存在的话 . 如果只有一个均衡点 , 诸值显而易见就必定存在。我们也可以通过把夕限制于子解中的诸均衡点 . 然后应用与上述相同的定义等式 , 针对子解来定 2 4 义有关的诸值。二人零和博弈 , 在上述定义的意义上 , 总是可解的 . 均衡策略的集合 S : 和 S : , 简单地说就是 “好的 ” 策略 . 这样一种博弈并非总是强可解的 ;强解只有在纯策略中有一个 “鞍点 ” 时才存在。 5 简例这些例子旨在说明本文所定义的诸概念 , 并展示发生在这些博弈中的种种特殊现象 . 第一位局中人拥有用罗马字母表示的策略和左边的报酬 , 如此等等 : 例 l 一4 ·。 4 解 (矗· + 矗b ,弄· + 铎。) 一 5 “。 5 V l 一资, v : 一 + 专卜p 一4 例 2 a 日 10 强解 (b , 日) b . 一 10 V : = V : b日一l 0O11 , .人例 3 a 日一 10 不可解 , 均衡点为 (a , Q) , (b ,印和 (令+ 夸,号+ 普, ·在 , 后 , 形的诸策略具有最大一最小与最小一最大等性质 . 门U 11‘.五. .二11 一例 4 强解 : 所有各对混合策略。 V 产 = V 才一 l V 厂一 V 矛一 O 尸口QQ目. aLIJ.11 例 5 一 l ;, p 一 4 一 4 ba 一l 不可解 , 均衡点 ( · , O ) , (。, 日) 和 (十· + 子。,音。 + 音, ) · 然而 , 经验的检验显示出一种走向 (a ,的的趋势 . 原文为贬t ; s 、) , 译者认为有误 , 应更改为 ( t ; s 、. ) (译者注〕例 6 1 o a日均衡点 : (a , 。) 与 (b . 日) . 至于 (b j ) 则是德定性的一个例子。在一个较之更优越的策略 5 1 . 一个混合策略优于另一个混合策略 , 总是会导致其他的优势 . 如让。 ‘; 优于 s ; , 并且 t‘使用了所有纯策略 , 其中 s , 的系数比 sl ; 的高 , 那么对于一个足够小的 P r , i = r‘ + P(s ‘i 一 s ‘) 是一个混合策略 . 而且由于其线性 , t‘优于 t, ; . 可以证明有不可优势策略集合的几个性质 . 这些案合是简单连接的 , 并且是由策略单纯形的诸面的某种聚合的连接所形成的。通过发现对于一个局中人的优势而获得的信息 , 可能与其他局中人有关 ,这里的信息在某种程度上讲 , 是指通过各种混合策略的排除以作为均衡点的可能 (考虑 ) 成分而涉及的信息。对于诸 t 而言 , 其完全不被超越的成分 , 就是所需要考虑的成分 , 从而排除掉一个局中人的诸策略中的某些策 , 就可使另一个局中人的新一轮的策略排除成为可能 . 可以用来搜索均衡点的另外一种思路 . 是反论型分析。这里假定 , 一个均衡点存在着 , 并且位于策略空间的一定区域范围之内 , 并着手推导出此假设为真时所必须满足的一些进一步的条件。这种推理可以通过几个阶段来进行 , 以便最终获得一个表明不存在任何满足这一初始假设的均衡点的反论 . 。玩印 6 解的几何形态在二人零和博弈的情形中 , 已经表明 , 一个局中人的 “好 ” 策略的集合 , 是他的策略空间的一个凸多面子集。对于任何可解的博弈中一一局中人的均衡策略集合来说 . 我们都将得到同样的结果 . 定理 5 在可解博弈中 , 均衡策略的诸集合 S : , S : , ⋯ , S 。 , 都是诸混合策略空间的凸多面子集。证明一个 n 一要素组合 S 将是一个均衡点 . 当且仅当对于每一个 i ; (6 ) p ;(S ) = 一,, a却二 (S ) 此即条件(3 ) 。一个对等的条件是 , 对于每一个 i 和 Q : (7 ) P ‘(S ) 一 P; 。(S ) 奋 0 现在 . 让我们考虑一下局中人 j的诸均衡策略 S , 的集合 S , 的形态。设 t 是一个任意均衡点 , 那么根据定理 2 , 当且仅当 s , 任尽时 , (t ; sj) 将是一个均衡点。现在我们把条件(2 ) 应用于 (t 禹) , 得到 : (8 ) s j任 S j~ 对于所有的 ‘. a , p ; (t ; s j) 一 p * (t ; 5 1) 争 0 。由于 p ; 是 n 一线性的 , 且 t 是确定的 , 所以上面的式子就是具有形如 F ‘ (Si ) 奢。的鱿性不等式集合。每一个这样的不等式或者对所有的 s , 都成立 , 或者对依赖并且处于某个通过这种策略单纯形的超平面的一边的那些 s , 成立。因此 . 诸条件的这一完全集合 (是有限的 ) , 都将在局中人 j的策略单纯形的某个凸多面子集上得到满足。〔半空间的交叉。〕作为一个推论 , 我们可以作出结论 , S , 是诸混合策略(诸顶点 ) 的一个有限集合的凸闭集合。 7 优势与反论方法如果对于所有的 r , p , (t ; s , i) 奔 p ‘(t ; 5 1) , 那么我们就说 , s“优于 s : . 这等于说 , s , ; 给予局中人 i的报酬高于 s ‘给予的 , 而不管其他局中人的策略如何。要弄清楚一策略 sl ; 是否优于 s ‘ , 只要考虑其他局中人的各种纯策略就够了 , 因为 p ; 具有 n 一线性。根据其定义 , 显而易见 . 任何均衡点都不可能存 8 三人扑克博弈作为一个把我们的理论应用于一种或多或少是现实的情形的例子 , 我们收入下面给出的简化了的扑克博弈。规则如下 : (a ) 这是幅大纸牌 , 有同样多的高花色牌和纸花色牌 , 一手由一张牌组成。 (b ) 有两个筹码 , 用来下注、开牌或叫牌。 (c ) 局中人轮流玩牌 , 而博弈则结束在所有局中人都已通过之后 , 或则结束在一个局中人已经开叫 . 而其他局中人也已有过一次叫牌机会之后。 (d ) 如果没有人打赌 , 赌注就被收回。 (e ) 否则整个赌注就在己经下了注的最高几手之间均分 . 我们发现 , 根据我们称之为 “行为参数” 的各种量来处理这种博弈 , 比之以《博弈论与经济行为》的规范形式来处理它 , 更为令人满意。规范的形式表述从而排除这一区域范围 . 反论法实际上是用来缩小搜索区间的方法 (译者注 ) . 2 5 中 , 一个局中人的两种混合策略 , 在每一策略都使个人在每一个要求他以同样的频率行动的特殊情境中选择各自的有效行动程序这个意义上 , 可以是对等的 . 此即 , 它们代表由该个人表现出来的同样的行为模式。行为参数给出了在各种各样的会出现的可能情况中的每一种情形中 , 采取多种多样的可能行动中的每一种行动的概率。因而它们描述了诸种行为模式。按照诸项行为参数 , 局中人的策略可以表述如下 , 同时假定既然不存在以一张高花色牌来通过一个人的最后的下注机会的点 , 那么此事便不会有人做 . 希腊字母便是各种各样的行动的概率。我们首先说明大多数希腊字母参数都必须被消除 , 以此来搜索所有可能的均衡点泪的消除主要是通过优势分析 , 并附加一点反论型分析 , 而 y 、会和 O 也因被优于而消除。然后诸反论又依次排除了尸、安、。、入、 ‘ 、 u 。这就给我们留下了 a 、 p、。和刀。反论分析表明 , 其中没有一个可以为零或一于是我们便得到一组联立代数方程式。这些方程式恰好只有一个在范围 (。 , 1) 内变动的解。我们有 : 文。在那里 , 这个解是对随着预先下的赌注对总赌注的比率的变化来加以研究的 , 并且结成各种联盟的可能性作了探究。 9 应用丫厄厄丁2 1 一了 3 2 1一一一一蕊一一一 , 刀 sa 十 1 、— , O -4 5 一 Za污一不万 , ￡4 a 一 l a + 5 第一轮诸步第二轮诸步 11111 。在高花色上开叫叫 K 在低花色上叫牌 III 日日日在低花色上开叫叫入在低花色上叫牌 III 拌拌拌拌在低花色上叫牌 lll 和和和和 III IIIII 7 在 f氏花色上叫牌 lll 。在低花色上叫牌 ... 者者者在高花色上开目LIII 之在低花色上叫牌 III 吃吃吃在低花色上开叫叫和 lll IIIII 屯在 f氏花色上叫牌 --- 局中人皿总得不到第第和和和 lll 二轮叫牌牌刀刀刀在低花色上开口Llllll 00000 在 f氏花色上口上!牌 ----- ttttt 在低花色上叫牌 lllll 这些方程式的结果是。一 0 . 3 08 , , 一。. 6 35 , a ~ 0. 82 6. 和仁一。· 。4 4 。由于只存在一个均衡点 , 因此此一博弈有值 ;这些值是 : U ; ~ 一 0 . 1 4 7 - 仁l 十 1 7 a )诵又亏二不万 ’。“ 0 . 0 9 6 对干 n 一人博弈来说 , 公认的公平竞赛伦理学意味着非合作的竞赛 , 对这种博弈的研究 , 当然是应用这一理论的一个显而易见的方向。扑克牌戏则是最明显的应用目标 . 对一场比我们的非常简单的模型更为现实的扑克牌戏的分析 , 应当是一件十分有趣的事。然而 , 为一项完整的探究所必需的数学工作的复杂性 , 随着博弈的复杂性的增加而很快地增加 ; 所以 , 对于一项比这里所给出的例子复杂得多的博弈的分析 , 唯一适宜的很可能就是运用近似计算的方法。一种不那么显眼的应用 , 是把它应用于对合作性博弈的研究。所谓合作性的博弈 , 我们指的是一种涉及局中人 , 纯策略以及与往常一样的报酬的一个集合的情形 , 但是假定 , 诸局中人能够并且会进行合作 , 就像他们在冯 · 诺伊曼和莫根施特恩的理论中所作的那样 . 这意味着诸局中人可以沟通并形成将由一位仲裁人来执行的联合。然而 , 并非必须限于假定 , 对于不同的局中的报酬 (它们应当按有效单位计算 ) . 都有什么可变性或者甚至是可比性。任何被期望的可变性都可以纳入博弈本身之中 , 而不是假定它可能存在于博弈外的合作中。作者已经发展出一种 “动力学的 ” 方法 , 来研究那些奠基于向非合作博弈简化的合作性博弈。进而建立起一个赛前谈判的模型 , 以便谈判的步骤变成一次大的描述总体情形的非合作博弈中的诸行动步骤 (这种非合作博弈将有无限个纯策略 ) . 于是 . 这种大的博弈便是根据本文的理论 (被推广到无限的博弈 ) 来处理的 , 并且如果各值都被求出 , 那么就把它们采纳为合作性博弈的值 . 从而 , 分析一种合作的博弈的问题 , 就成了为谈判求得一个合适的、令人信服的、非合作的模型。依靠这样一种处理 , 作者已经为所有有限的两少、合作博弈以及一些特殊的 n 一人博弈求得各值 . 匕产 , 和 ·3 一。· 2 4卜器‘粼 , 。对此一扑克博弈的一项更为完整的研究 , 发表于《数学研究年刊办第 2 4 期 , 即 “对博弈论的贡献” 一 2 6 致谢塔克尔、盖尔和库恩博士给了对于改进文中的材料说明而言是有价值的批评和建议。大卫 · 盖尔建议研究对称的博弈。解扑克牌 (下转第 50 页 ) 了一致性和不一致性的定义。对于不一致性情况 , 我们给出了识别引起不一致性的最小不等式集合的方法 , 确定对效用更精确的估计是否产生一致性的方法也在这部分给出 ;对于一致性情况 , 给出了偏好估计的停止规则和方案排序的过程 ;最后提出了一个方案选择和权重确定的迭代方法。当然 , 本文的研究建立在概率信息精确可知的假设上 ,对于不确定情况下的多目标决策这类复杂的问题 , 还有待我们进一步研究 . 参考文献 1 D . P e k e lm a n a n d S . K . 段 n , M a t h〔 m a t ie a l P r o g r a m m in g m od e Is fo r t h e d e t e rm in a t io n o f a t t r ib u t e w e ig h t . M a n a g 卜 m e n t 段1. , V o l 2 0 , 1 97 4 Z C · C · w h it e , S · Do zo n o a n d W . T · 段性e r e r , A n In t e r a e t iv e p r o c e d u r e fo r a id in g m u ltia t t r ib u t e a lte r n a tiv e s e lo c t io n · o m e qa , V o l , 1 1 , 19 8 3 3 Jo h n M . Po t te r a n d B r ia n D . 0 . A n d e r s o n , P a r t ia lP r io r In fo r m a t io n a nd Dc c io io n m a k in g . IE E E T r a n s . Sy s t . , M a n . , C y b e m . , V o l SM C 一 10 . 1 9 8 0 4 陈违 . 决策分析 . 科学出版社 , 1 9 8 7 5 李怀祖 . 决策理论导引 . 机减工业出版社 , 1 9 93 M u ltia tt r ib u te D e c isio n m a k in g U n d e r U n e e r t舀in ty Z ha n g R e iq in g Q iu W a n hu a [ A b s tr a e t】 In t l、15 p a p e r , w e p r e s e n t a m o d e l o f s in g le s t a g e d e e is io n m a k in g a n d f r a d e 一 o ff w e ig llt d e t e r m in a t io n u n d e r u n e e r t a in t y a n d tr a d e 一 o ff w e ig ht a n d u - t ility s e o r e im p r e e is io n . D e fin it io n o f e o n s is te n e y a n d in e o n s is te n ey h a v e b e e n g i v e n a n d e x a m in e d in s o m e d e p t h . S to p p in g r u le s fo r p r efe re n e e a s - s e s s m e n t a n d a p r o e e d u r e fo r r a n k in g a lte r n a t ir e s a r e p re s e n t e d fo r th e e o n - 5 is te n t e a s e . A p r o e e d u r e fo r id e n t ify in g th e m in im a l s e ts o f in e q u a lit ie s e a u s in g in e o n s is te n e y , a n d a m o th o d fo r d e te r m in in g if m o r e p r e e is e a s s e s s - m e n t o f tll e U i e o u ld le a d to e o n s is t e n e y , a re g iv e n fo r the in e o n s is te n t e a s e . T he s e r e s u lts a re e o m bin e d t o p r o d u e e a n it e r a t i v e p r o e e d u r e fo r a l - te r n a t iv e s e le e tio n a n d tr a d e 一 o ff w e ig ll t d e te r m in a t io n . [ K ey w o r d s l M u ltia tt r ib u t e D e e i s io n rn a kin g , U n e e r t a in t y , C o n s is te n e y E x a m in a tio n , D o m in a t io n D ia g ra p l、字”矛”孚”挤”护”护”护” 护”护”护”夕王勺”, 护, 护 , 护”护”护, 护, 护”护, 护”护, 护”护, 护”挤 , 护”护, 护”泳”挤”沪”护”字妙挤”字”叨 , 呀田护”矛, 渗”孚”协 , (上接第 2 6 页 ) 模型是由罗伊德 · 5 . 沙普莱和作者所从事的一个联合科研项目 . 最后 , 作者在 1 9 4 9一 1 9 50 年作此项工作期间 . 得到了原子能委员会的财政支持 . 参考文献冯 · 诺伊曼 , 莫根施待恩 . 博弈论与经济行为 . 普林斯顿大学出版社 , 19 4 9 年小 J. F. 纳什 . “N 一人博弈中的均衡点 ”. 美国国家科学院记录汇缩第 3 6 卷 ( 1 95 0 ) , 4 8一 4 9 J . F . 纳什 , L . 5 . 沙普莱 . “一种简单的三人扑克博弈 ” . 数学研究年刊第 24 期 , 普林斯倾大学出版社 , 1 9 50 约翰 · 纳什 . “二人合作博弈 , . 将发表于计量经济学 H . w . 库恩 . “广义博弈 ” . 美国国家科学院记录汇编第 36 卷 , ( 19 5 0 ) , 5 70一 5 7 6 5 0

                    本文档为【非合作博弈】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，
                    图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。 
 该文档来自用户分享，如有侵权行为请发邮件ishare@vip.sina.com联系网站客服，我们会及时删除。

                    [版权声明] 本站所有资料为用户分享产生，若发现您的权利被侵害，请联系客服邮件isharekefu@iask.cn，我们尽快处理。

                    本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用。

                    网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
                

下载需要：免费已有0 人下载

立即下载

非合作博弈

你可能还喜欢