本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 6 U0 c$ h/ d1 [* @
4 x0 A+ T: u; R' ` o0 _
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);7 y5 | L5 |2 e: A$ ~6 C$ t
以下三个定义:
! J( m7 q2 u1 j 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
- f2 K) v; h: K 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 , C, M8 T+ d2 n
所谓的双方优势策略则是指双方利益总和最大的策略。 " C- x# h/ A1 X. J
[编辑本段]严格优势策略举例分析0 A# F7 X; j8 B) g/ Z G. n
一、经典的囚徒困境 3 r% ]" Q+ L- `
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
! ?# d1 E, Y/ `( z 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
& q& o* V8 R/ r6 Y/ k9 w: X 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ) E0 ^) \! e' s( {$ b) F9 T
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 2 k9 X, G& h, v' T: @
若二人都互相检举(互相“背叛”),则二人同样判监2年。
R6 L- z' W, R7 ~0 g3 ^7 J3 ~! G ' `& j1 w J% t. h8 C
用表格概述如下:
; t9 u& {; q& {. K2 E
: S* u" W0 ]* f- T7 _1 j$ U 甲沉默(合作) 甲认罪(背叛)
! Y# R. y6 U# R* r( \6 h* {! Z1 |乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 ; T/ R+ N7 u k, Z( S- ?# B6 g' a
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 % i6 R0 X' U: Q$ |) R9 K( U
Z; C. q% h _# d7 z 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 5 _" q+ g; b+ a8 K
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
4 {5 p5 L v- K$ @1 Z7 G 若对方沉默、背叛会让我获释,所以会选择背叛。 : j, x2 b6 x" K: p
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
9 l% K5 I2 @6 p. g 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ! L" i$ n& q& |! M
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 . w# T% }8 Z( I% }- A! i
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
- `% n: {9 a: _/ v# X& x# y[编辑本段]二、智猪博弈理论5 o- b. G' ]2 x
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
/ O& F1 f2 T- y9 e# O. L 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
7 q+ I$ k# Z2 k! c 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 4 ~3 [# ~5 ]/ _4 O! I; w
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 * Y0 Q N" f8 p% n
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
7 \, K6 H+ R# L/ D( | 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
3 f6 d5 w$ d( C- A: J 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。' A0 @5 x6 u/ z% Y6 t
8 r# w- N" _& a, G F) r( [" |
三、关于企业价格策略& i" t5 c! Z8 L7 l, @
) q1 S3 Y b7 R4 K
3 }5 t1 l8 b# i$ O# k5 G 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
6 W, A( h: b! v& h$ p2 G 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);) s. `) Y! F1 Y7 ~
以下三个定义:% V1 W; P+ |* B! d: p# D9 p
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
2 y+ A8 |' |" z+ @9 A3 o 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
# B Z" M+ s; g3 V1 p& A" t8 A 所谓的双方优势策略则是指双方利益总和最大的策略。
B6 T* s: N0 W5 I; |" ^[编辑本段]严格优势策略举例分析
% e8 X1 A/ ]% F- s) N. s4 D& o9 V 一、经典的囚徒困境
. ~5 e, J: j- d" c( J |) t: V 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
2 q. w0 @9 A8 {0 J 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
2 W1 I- {9 O# Z( d! G& ^& ] 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 8 j. i/ I i3 f- m0 X0 x* M
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 9 J. j0 P- L* Z* {0 L; j
若二人都互相检举(互相“背叛”),则二人同样判监2年。9 k' F, J* C/ ^' p
% N- N1 u* I+ b4 Z( D用表格概述如下:
6 t/ F% z5 D- I9 ~) f# J
8 v/ n8 d7 ^0 T- N) W 甲沉默(合作) 甲认罪(背叛)
; H! u7 z7 P, N' n) K" v乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 ' d- t1 D9 A- A6 W2 u
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 ! P9 g- N6 v- q
: V' g3 p. K4 G R2 T0 n 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ) U* t* ^$ ?4 m7 M: B, v0 m
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
/ \; P, X% I+ k. P: j: ] 若对方沉默、背叛会让我获释,所以会选择背叛。
2 T$ _+ ~2 t/ C0 b N 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
: W2 A. @( q8 Z, d 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ! c* |/ x4 r) z- f9 D# G
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
3 w+ S S/ H y2 ?/ ]& { 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。5 Q6 y$ T7 \, y0 M# a
[编辑本段]二、智猪博弈理论) U0 q# B' d9 y% b
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
" {0 j% e4 g" m9 I 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 1 U1 t$ R1 u5 d- Q* Q. ]
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 0 Z: _0 W9 f, ?
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 2 w6 Y7 E! y' Y% U
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
8 p3 l6 o0 i% z7 v5 h 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
1 k1 S9 T3 v; G0 P' z ]7 L& k 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
a2 ?2 Y$ ~. V) S$ X
( j C2 S2 [& _! ~三、关于企业价格策略
]2 l9 B2 q2 P0 `, K- m8 L
% d' y1 ? T5 |2 [( b4 I + \5 t6 y! V3 }7 Y3 k
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
( O. R' J7 s6 i: L* ~ 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);1 g$ @9 m% Y7 p7 C* b9 ~4 g# u; P
以下三个定义:
4 s R; w6 y4 Z4 F% ]6 {7 X4 N 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
, ?0 @# C& i7 h! N1 T v8 I 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 . c# M o+ u7 S
所谓的双方优势策略则是指双方利益总和最大的策略。
8 u4 O" c6 ^% V* I6 ?8 v[编辑本段]严格优势策略举例分析
0 O S' w) e$ ?) V2 p 一、经典的囚徒困境 / {" C; j2 ^! |% J2 e0 x: w% }
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 8 ]( W- E' M5 t" z8 z7 \$ ^
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
2 j; ~6 W2 o2 d* A+ g* r: j 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 G$ f9 q+ G0 E2 y- X
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 / W2 |2 ?" H8 q Z
若二人都互相检举(互相“背叛”),则二人同样判监2年。
7 a9 l2 v0 q4 R) B, `9 F ( `/ T* b+ s' U- P3 ~' M
用表格概述如下:4 s: ?% U" P }7 u) ^0 ^4 S3 T
* v" L9 U n0 u8 F 甲沉默(合作) 甲认罪(背叛) , z3 n$ m. J! m5 h$ v- m
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
; H p1 f( Z) Q+ m A0 R+ L+ ]& O2 }) L乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
8 } y1 ]5 b1 o2 T1 ^* g
8 G1 {6 g$ [/ [ G$ I 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
/ j3 a8 C! I0 h5 P3 C# z. h2 D: I 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
6 z ^1 c x! F3 ^* d, L0 I( | e 若对方沉默、背叛会让我获释,所以会选择背叛。 / m. e6 c# k0 u. f! I* ~
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
5 n6 d: ]; K$ e; y6 }! y, o) a 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
5 f- \& l6 q6 G, X% K 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
; U; W2 c* }7 e1 M8 J3 n 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
: @# Z, B- o. v4 i- H4 |: k[编辑本段]二、智猪博弈理论; A9 P0 T/ y0 k$ w2 y! o D
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
" `# _: s) o, j. W 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
7 s7 \& e! V# L, W& S 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
. p+ U" Z- r: l" f 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
2 K- c0 R" R* B0 P! u “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 4 B% [& r8 H0 U- o% |3 Z
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 . F+ g8 B2 | E s
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
, w1 ~+ @0 O6 F2 `; \9 f5 }( c |% n1 m9 Y7 E$ V
三、关于企业价格策略
, K. X8 p; W4 e1 C1 K) I: ^* Q1 L G8 [# h5 L" R0 z4 c" g4 r
) D- a3 {5 o! U/ X$ [ 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
8 `- [% i; z5 A 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);5 G G% y& _: F8 e
以下三个定义:
' S. z6 d4 z- i: @8 ^ 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
" y4 [* S7 Y* ?6 y$ g# ~ 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 # @& [8 X: y& S2 E7 F0 k0 I' B
所谓的双方优势策略则是指双方利益总和最大的策略。 + y6 _' y$ b6 U0 |/ E
[编辑本段]严格优势策略举例分析- |) Q! F) x6 R. a* r% L! J- Y. q
一、经典的囚徒困境
0 M3 A1 t+ |0 k' d/ k# ?9 @* v, B 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
) K* t8 S+ |& l 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: : P6 _$ A9 }4 c
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
$ i( [' n; @ X) x, x- r) _* } 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ( X3 d8 Y k9 {2 o! i9 [6 }: z
若二人都互相检举(互相“背叛”),则二人同样判监2年。
7 B% L; U# k2 c
4 C. \/ o9 T2 E" w; @5 B0 t& {用表格概述如下:
; J* l* s4 C) d: z- g" D+ g, S3 H0 \3 l
甲沉默(合作) 甲认罪(背叛)
$ G; L; P+ D+ g p! \乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
; W8 Z/ z( ]3 ]% P乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
4 T! b) g) O/ I9 C; ?: {% S
/ K$ a& O5 [7 y9 V- l$ y 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 * a7 v; j( U: b; Q/ s: g. b" w9 h
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: P: u6 R, N& z) O# A& q- b- R7 c
若对方沉默、背叛会让我获释,所以会选择背叛。
1 Q6 J! @7 K0 M 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
7 j$ Q5 f; @1 O' d 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 * C/ v5 W4 w4 l
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
2 r7 k: U7 q8 w* H 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。/ |; ?6 G1 i( p7 i
[编辑本段]二、智猪博弈理论) c+ |& c* Y+ T, v% }& Y
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
" ~) n9 T. `+ K 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
9 N R3 X a. t9 w# P5 V. a6 s 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 6 `) S# {% o7 Z7 o
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 3 O( R0 Z$ G& S) l A) ~% A5 |
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 / t% T5 w( O. S: v$ l
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
/ I' `( m+ U$ f0 B 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。$ K# h, r. d1 n* b4 o4 l
: d% y% K& I: Z7 x9 \, r
三、关于企业价格策略1 Z; K, v7 g# B" L, Z0 q7 p7 S
$ U" M& f0 P7 i2 Y- }. N4 x
1 C$ `; T' R1 A3 }" T& H) e# Q 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
: Q, J; F* }4 I4 q$ u 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |