关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 6 U0 c$ h/ d1 [* @
4 x0 A+ T: u; R' `  o0 _
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);7 y5 |  L5 |2 e: A$ ~6 C$ t
  以下三个定义:
! J( m7 q2 u1 j  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
- f2 K) v; h: K  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 , C, M8 T+ d2 n
  所谓的双方优势策略则是指双方利益总和最大的策略。  " C- x# h/ A1 X. J
[编辑本段]严格优势策略举例分析0 A# F7 X; j8 B) g/ Z  G. n
  一、经典的囚徒困境 3 r% ]" Q+ L- `
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
! ?# d1 E, Y/ `( z  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
& q& o* V8 R/ r6 Y/ k9 w: X  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ) E0 ^) \! e' s( {$ b) F9 T
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 2 k9 X, G& h, v' T: @
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
  R6 L- z' W, R7 ~0 g3 ^7 J3 ~! G  ' `& j1 w  J% t. h8 C
用表格概述如下:
; t9 u& {; q& {. K2 E
: S* u" W0 ]* f- T7 _1 j$ U    甲沉默(合作)  甲认罪(背叛)  
! Y# R. y6 U# R* r( \6 h* {! Z1 |乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  ; T/ R+ N7 u  k, Z( S- ?# B6 g' a
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  % i6 R0 X' U: Q$ |) R9 K( U

  Z; C. q% h  _# d7 z  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 5 _" q+ g; b+ a8 K
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
4 {5 p5 L  v- K$ @1 Z7 G  若对方沉默、背叛会让我获释,所以会选择背叛。 : j, x2 b6 x" K: p
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
9 l% K5 I2 @6 p. g  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ! L" i$ n& q& |! M
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 . w# T% }8 Z( I% }- A! i
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
- `% n: {9 a: _/ v# X& x# y[编辑本段]二、智猪博弈理论5 o- b. G' ]2 x
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
/ O& F1 f2 T- y9 e# O. L  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
7 q+ I$ k# Z2 k! c  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 4 ~3 [# ~5 ]/ _4 O! I; w
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 * Y0 Q  N" f8 p% n
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
7 \, K6 H+ R# L/ D( |  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
3 f6 d5 w$ d( C- A: J  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。' A0 @5 x6 u/ z% Y6 t
  8 r# w- N" _& a, G  F) r( [" |
三、关于企业价格策略& i" t5 c! Z8 L7 l, @
) q1 S3 Y  b7 R4 K
  
3 }5 t1 l8 b# i$ O# k5 G  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
6 W, A( h: b! v& h$ p2 G  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);) s. `) Y! F1 Y7 ~
  以下三个定义:% V1 W; P+ |* B! d: p# D9 p
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
2 y+ A8 |' |" z+ @9 A3 o  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
# B  Z" M+ s; g3 V1 p& A" t8 A  所谓的双方优势策略则是指双方利益总和最大的策略。  
  B6 T* s: N0 W5 I; |" ^[编辑本段]严格优势策略举例分析
% e8 X1 A/ ]% F- s) N. s4 D& o9 V  一、经典的囚徒困境
. ~5 e, J: j- d" c( J  |) t: V  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
2 q. w0 @9 A8 {0 J  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
2 W1 I- {9 O# Z( d! G& ^& ]  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 8 j. i/ I  i3 f- m0 X0 x* M
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 9 J. j0 P- L* Z* {0 L; j
  若二人都互相检举(互相“背叛”),则二人同样判监2年。9 k' F, J* C/ ^' p
  
% N- N1 u* I+ b4 Z( D用表格概述如下:
6 t/ F% z5 D- I9 ~) f# J
8 v/ n8 d7 ^0 T- N) W    甲沉默(合作)  甲认罪(背叛)  
; H! u7 z7 P, N' n) K" v乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  ' d- t1 D9 A- A6 W2 u
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  ! P9 g- N6 v- q

: V' g3 p. K4 G  R2 T0 n  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ) U* t* ^$ ?4 m7 M: B, v0 m
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
/ \; P, X% I+ k. P: j: ]  若对方沉默、背叛会让我获释,所以会选择背叛。
2 T$ _+ ~2 t/ C0 b  N  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
: W2 A. @( q8 Z, d  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ! c* |/ x4 r) z- f9 D# G
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
3 w+ S  S/ H  y2 ?/ ]& {  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。5 Q6 y$ T7 \, y0 M# a
[编辑本段]二、智猪博弈理论) U0 q# B' d9 y% b
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
" {0 j% e4 g" m9 I  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 1 U1 t$ R1 u5 d- Q* Q. ]
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 0 Z: _0 W9 f, ?
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 2 w6 Y7 E! y' Y% U
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
8 p3 l6 o0 i% z7 v5 h  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
1 k1 S9 T3 v; G0 P' z  ]7 L& k  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
  a2 ?2 Y$ ~. V) S$ X  
( j  C2 S2 [& _! ~三、关于企业价格策略
  ]2 l9 B2 q2 P0 `, K- m8 L
% d' y1 ?  T5 |2 [( b4 I  + \5 t6 y! V3 }7 Y3 k
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
( O. R' J7 s6 i: L* ~  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);1 g$ @9 m% Y7 p7 C* b9 ~4 g# u; P
  以下三个定义:
4 s  R; w6 y4 Z4 F% ]6 {7 X4 N  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
, ?0 @# C& i7 h! N1 T  v8 I  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 . c# M  o+ u7 S
  所谓的双方优势策略则是指双方利益总和最大的策略。  
8 u4 O" c6 ^% V* I6 ?8 v[编辑本段]严格优势策略举例分析
0 O  S' w) e$ ?) V2 p  一、经典的囚徒困境 / {" C; j2 ^! |% J2 e0 x: w% }
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 8 ]( W- E' M5 t" z8 z7 \$ ^
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
2 j; ~6 W2 o2 d* A+ g* r: j  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。   G$ f9 q+ G0 E2 y- X
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 / W2 |2 ?" H8 q  Z
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
7 a9 l2 v0 q4 R) B, `9 F  ( `/ T* b+ s' U- P3 ~' M
用表格概述如下:4 s: ?% U" P  }7 u) ^0 ^4 S3 T

* v" L9 U  n0 u8 F    甲沉默(合作)  甲认罪(背叛)  , z3 n$ m. J! m5 h$ v- m
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
; H  p1 f( Z) Q+ m  A0 R+ L+ ]& O2 }) L乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
8 }  y1 ]5 b1 o2 T1 ^* g
8 G1 {6 g$ [/ [  G$ I  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
/ j3 a8 C! I0 h5 P3 C# z. h2 D: I  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
6 z  ^1 c  x! F3 ^* d, L0 I( |  e  若对方沉默、背叛会让我获释,所以会选择背叛。 / m. e6 c# k0 u. f! I* ~
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
5 n6 d: ]; K$ e; y6 }! y, o) a  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
5 f- \& l6 q6 G, X% K  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
; U; W2 c* }7 e1 M8 J3 n  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
: @# Z, B- o. v4 i- H4 |: k[编辑本段]二、智猪博弈理论; A9 P0 T/ y0 k$ w2 y! o  D
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
" `# _: s) o, j. W  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
7 s7 \& e! V# L, W& S  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
. p+ U" Z- r: l" f  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
2 K- c0 R" R* B0 P! u  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 4 B% [& r8 H0 U- o% |3 Z
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 . F+ g8 B2 |  E  s
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
, w1 ~+ @0 O6 F2 `; \9 f5 }( c    |% n1 m9 Y7 E$ V
三、关于企业价格策略
, K. X8 p; W4 e1 C1 K) I: ^* Q1 L  G8 [# h5 L" R0 z4 c" g4 r
  
) D- a3 {5 o! U/ X$ [  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
8 `- [% i; z5 A  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);5 G  G% y& _: F8 e
  以下三个定义:
' S. z6 d4 z- i: @8 ^  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
" y4 [* S7 Y* ?6 y$ g# ~  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 # @& [8 X: y& S2 E7 F0 k0 I' B
  所谓的双方优势策略则是指双方利益总和最大的策略。  + y6 _' y$ b6 U0 |/ E
[编辑本段]严格优势策略举例分析- |) Q! F) x6 R. a* r% L! J- Y. q
  一、经典的囚徒困境
0 M3 A1 t+ |0 k' d/ k# ?9 @* v, B  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
) K* t8 S+ |& l  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: : P6 _$ A9 }4 c
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
$ i( [' n; @  X) x, x- r) _* }  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ( X3 d8 Y  k9 {2 o! i9 [6 }: z
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
7 B% L; U# k2 c  
4 C. \/ o9 T2 E" w; @5 B0 t& {用表格概述如下:
; J* l* s4 C) d: z- g" D+ g, S3 H0 \3 l
    甲沉默(合作)  甲认罪(背叛)  
$ G; L; P+ D+ g  p! \乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
; W8 Z/ z( ]3 ]% P乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
4 T! b) g) O/ I9 C; ?: {% S
/ K$ a& O5 [7 y9 V- l$ y  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 * a7 v; j( U: b; Q/ s: g. b" w9 h
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:   P: u6 R, N& z) O# A& q- b- R7 c
  若对方沉默、背叛会让我获释,所以会选择背叛。
1 Q6 J! @7 K0 M  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
7 j$ Q5 f; @1 O' d  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 * C/ v5 W4 w4 l
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
2 r7 k: U7 q8 w* H  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。/ |; ?6 G1 i( p7 i
[编辑本段]二、智猪博弈理论) c+ |& c* Y+ T, v% }& Y
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
" ~) n9 T. `+ K  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
9 N  R3 X  a. t9 w# P5 V. a6 s  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 6 `) S# {% o7 Z7 o
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 3 O( R0 Z$ G& S) l  A) ~% A5 |
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 / t% T5 w( O. S: v$ l
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
/ I' `( m+ U$ f0 B  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。$ K# h, r. d1 n* b4 o4 l
  : d% y% K& I: Z7 x9 \, r
三、关于企业价格策略1 Z; K, v7 g# B" L, Z0 q7 p7 S
$ U" M& f0 P7 i2 Y- }. N4 x
  
1 C$ `; T' R1 A3 }" T& H) e# Q  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
: Q, J; F* }4 I4 q$ u  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )