(博弈摘要——《管理经济学》第十七章概摘)。敬请关注经济科学出版社近两三月推出《管理经济学》!海外书籍有的经典,该书份量不遗缺,专业性更为综合;海外书籍没有的,该书本着发展与未来思维,尽量提供最新的前沿解决思维体系与最新案例解读。敬请关注经济科学出版社近两三月推出!)
昨日与两位学生会面交谈,涉及中美贸易博弈中的一些问题。中美博弈主线发生的路径远远比我们所能预想的范围要狭窄很多。但是,关联于全球环节及隐性环节的意外情况却往往会显得凸出,需要关注。
我们可以将所有现存、隐性及隐藏等及可能性等因素隐患,作出最全的博弈规划覆盖,安排不同的线路,建立不同目标下博弈得益矩阵与子链决策的博弈均衡。事实上,也许很多都未有发生的可能,但很可能在子链或对抗反制及协同等策略环节中发挥作用,即便它的存在形态并不发生潜在直接的潜在影响。该短文从拟近两月出版的《管理经济学》第十七章概摘一段。
正文:
鬼谷子(公元前400-320年)曰:“是以圣人居天地之间,立身、御击、施教、扬声、明名也,必因事物之会,观天象之宜。”鬼谷子认为:一个高明的人,在瞬息万变的事物中,应及时抓住事物转化的时机,去调整或执行自己的计划。鬼谷子曰:“圣人所贵道微妙者,诚以其可以转危为安,救亡使存也。”世人说话随口而发,一言错出,遗祸无穷。
鬼谷子认为:“天地所变换,既有变换,岂能长久乎?”,天地之间,理本一贯,没有不变之天气,没有不变之人事,一个人只知一味地因循守旧即成的习惯(甚至是足以堕身的习惯及行为方法),而不知道进步与革新,他就必然被时代所淘汰。
一、博弈策略与均衡
(一)博弈论基本原理
1 博弈论(game theory)
(1)内涵:
博弈指个人或组织在一定的环境中,按照一定的规则,选择策略或行为,并加以实施,获得相应结果的过程。
博弈论是研究理性的决策主体在其行为发生直接的相互作用时的策略选择及策略均衡的理论。博弈分析的关键步骤是找出在别人选择既定的情况下自己的最优反应策略,即给参与人自己带来最大收益的策略。
它是冲突、竞争现象的定量分析理论。 参加竞争的各方为了获胜而需研究出一组对付对方的策略。
博弈是企业竞争中广为应用的分析方法,它比较适用于研究少数垄断市场上的企业行为。
(2)来源
第一,在我国的起源。博弈论思维较相对复杂的发展,应该在我国古代围棋、国际象棋(印度)等活动中的对弈行为。博弈一词最早见于《论语孟子·阳货第十七篇》,子曰:“饱食终日,无所用心,难矣哉!不有博弈者乎?为之,犹贤乎已。” 朱熹《论语集注》:“博,局戏也。弈,围棋也。”
博弈又称博戏,是一门古老的游戏。《世本》说,“乌曹作博”,乌曹乃是夏代著名之能工巧匠。千百年来,博弈更是与人们的生活紧紧相连,从博棋到牌戏,从斗戏到彩票,中华民族的历史长河中就这样形成了别具风情的博弈文化。
如:《学弈》(《孟子•告子》):弈秋,通国之善弈也。使弈秋侮二人弈,其一人专心致志,惟弈秋之为听;一人虽听之,一心以为有鸿鹄将至,思援弓缴而射之。虽与之俱学,弗若之矣。为是其智弗若与?吾曰:非然也。
第二,发展了历史智慧。我国的博弈思想从孙子兵法到三十六计,再从田忌赛马到孙庞斗智,以及从运筹帷幄到韬光养晦,再到从曹刿论战到论持久战,处处显示出博弈论的思维与智慧。
第三,博弈理论的发展与应用。1912年,数学家翟墨罗把对策从模拟模型抽象为数学模型,而在第一次、第二次世界大战,军事对策应用于战役和战略研究。 1944年,冯·诺意曼、摩根斯特合写了“博弈论和经济行为”,推动了博弈论在经济管理中的应用。
近些年,博弈论获得巨大发展与应用。主要代表任人物如,由于约翰 纳什、泽尔腾、海萨尼、任哈特·塞尔顿等对此做出重要贡献,并于1994年博弈论获得诺贝尔奖。后来,罗伯特·奥曼和托马斯·谢林在合作博弈论方面于2005年获诺贝尔经济学奖。
(二)博弈策略与均衡
1.博弈的要素及要点
博弈的三个基本要素:参与人或者局中人(players)、可选择的行动(actions)或策略(strategies)。
博弈程序中涉及的几项要点:
第一,局中人或参与者(Players)
第二,规则(rules):规定博弈各方的行动顺序、方式、以及最终的结果等。
第三,策略(Strategy):一整套的行动方案,规定了各种情况下的行动。比如:敌进我退,敌退我追,敌驻我扰,敌疲我打。
第四,相机策略(contingent strategy):仅在不确定事件发生时才会采取的策略。如:人不犯我,我不犯人;人若犯我,我必犯人。
第五,行动:局中人在特定条件下的行为
第六,支付( Pay-off ):博弈结束时,各方得到的收益。
第七,策略均衡:参与者之间稳定的、可预测的互动行为模式,就是策略均衡。
2. 均衡常用分类
(1)博弈均衡
所谓均衡是指一种稳定的结局,当这种结局出现的时候,所有的对局者都不想再改变他们所选择的策略。
(2)均衡分类
第一,上策与上策均衡
一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,那么这个策略组合肯定是所有博弈方都愿意选择的,必然是该博弈比较稳定的结果。这就是上策均衡。
由博弈各参与人的上策所组成的均衡,称为上策均衡
第二,纳什均衡
纳什均衡是指博弈中这样的局面,对于每个参与者来说,只要其他人不改变策略,他就无法改善自己的状况。纳什证明了在每个参与者都只有有限种策略选择并允许混合策略的前提下,纳什均衡定存在。以两家公司的价格大战为例,价格大战存在着两败俱伤的可能在对方不改变价格的条件下既不能提价,否则会进一步丧失市场;也不能降价,因为会出现赔本甩卖。于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案。相互作用的经济主体假定其他主体所选择的战略为既定时,选择自己的最优战略的状态,也就是纳什均衡
上策均衡与纳什均衡的区别:
A. 上策均衡是双方做出的决策皆为最优策略,这种策略选择的做出,自然达成稳定均衡。
B. 纳什均衡是指给定你的策略,我所选择的是最好的;给定我的策略,你所选择的是最好的。
C.上策均衡是纳什均衡的一种特殊情况,但纳什均衡却不一定是上策均衡。
可以说,纳什均衡是指在对手策略既定的情况下,各自对局者所做出的策略选择都是最好的。
(三)合作博弈与非合作博弈
从战略博弈的视角可分为几种类型:合作博弈与非合作博弈;双人博弈与N人博弈,零和博弈与非零和博弈,一次行动博弈与重复行动博弈。
1.合作博弈(Cooperative game)
(1)内涵。合作博弈亦称为正和博弈,是指博弈双方的利益都有所增加,或者至少是一方的利益增加,而另一方的利益不受损害,因而整个社会的利益有所增加。合作博弈研究人们达成合作时如何分配合作得到的收益,即收益分配问题。合作博弈采取的是一种合作的方式,或者说是一种妥协。妥协其所以能够增进妥协双方的利益以及整个社会的利益,就是因为合作博弈能够产生一种合作剩余。这种剩余就是从这种关系和方式中产生出来的,且以此为限。至于合作剩余在博弈各方之间如何分配,取决于博弈各方的力量对比和技巧运用。因此,妥协必须经过博弈各方的讨价还价,达成共识,进行合作。在这里,合作剩余的分配既是妥协的结果,又是达成妥协的条件。
(2)代表类型
第一,卡特尔和托拉斯。生产相似产品的的独立企业联合起来以提高价格和限制产量的一种组织。例如:石油输出国组织欧佩克,即OPEC--Organization of Petroleum Exporting Countries;
第二,暗中勾结:价格领导寡头们在没有明确和公开协商的条件下,心照不宣地与行业中最大的厂商保持一致,从而达到控制价格、抑制竞争、瓜分市场的目的。
2.非合作博弈(Non Cooperative Game)
(1)内涵。非合作博弈是指在策略环境下,非合作的框架把所有的人的行动都当成是个别行动。它主要强调一个人进行自主的决策,而与这个策略环境中其他人无关。通常也就是我们字面上博弈的意思。博弈并非只包含了冲突的元素,往往在很多情况下,既包含了冲突元素,也包含了合作元素。即冲突和合作是重叠的。
(2)代表类型
第一,纳什均衡(Nash equilibrium)。分析在厂商们以一种非合作的态度相互竞争时,它们各自采取的自认为是最优的策略是什么、厂商的策略之间是如何相互作用的、以及最终导致的结果是什么。
第二,囚犯困境。假设两名罪犯,他们现在面临的选择是:认罪或不认罪。这两个罪犯的选择是相对独立的。我们以甲、乙称呼之。
第三,零和博弈(zero-sum game)。又称零和游戏,属非合作博弈。指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”,双方不存在合作的可能。事实上,“囚犯困境”亦属于零和博弈。
3.比较与评价。
(1)信息与契约。合作博弈与非合作博弈的重要区别在于前者强调联盟内部的信息互通和存在有约束力的可执行契约。信息互通是形成合作的首要前提和基本条件,能够促使具有共同利益的单个局中人为了相同的目标而结成联盟。
(2)规则差异。选择合作是有利的,一方面不想自身受损,同时亦不想两败俱伤,属于“利己策略”亦属于“利他策略”。但是利人利己的事在很多情况下未必是可行的,因为每个人心里存有不同的规则,亦就是它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,也需要它认同你的行为规则,如此,则需要他们也按同样规则与方式行事才行。亦就是中国人说的“己所不欲勿施于人”。在博弈论来讲,那需要讲究“汝不欲,勿施于汝;然,吾不欲,勿施于吾”。
(3)多数属非合作博弈。基于不同人的目标、利益及偏好导向,比如,在其对巨额财富动心后,他的规则不会按你的内心规则行事。所以,很多情况下,合作并不是社会的常态。“纳什均衡”是一种非合作博弈均衡,在现实中非合作的情况要比合作情况普遍。 所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展,甚至可以说是一场革命。
二、完全与不完全信息:静态与动态博弈
(一)子博弈精炼纳什均衡(subgame perfect Nash equilibrium)
1. 子博弈精炼纳什均衡
(1)从内涵上看:
首先,子博弈(Subgame)是指在动态博弈中,所有参与人先后都采取了一次行动后所构成的一组新的博弈,这组博弈中的每一个都称为“子博弈”。当只当参与人的战略在其子博弈的系列(第二代、第三代…)中,每一个子博弈都构成纳什均衡,就构成了子博弈精练纳什均衡。
其次,一个扩展式表示博弈的子博弈G是由一个单结信息集x开始的与所有该决策结的后续结(包括终点结)组成的能自成一个博弈的原博弈的一部分。
对于扩展式博弈的策略组合S*=(S1*,…,Si*,…,Sn*) ,如果它是原博弈的纳什均衡;它在每一个子博弈上也都构成纳什均衡,则它是一个子博弈精炼纳什均衡。
最后,子博弈需要满足的三个条件:
第一,子博弈必须始于单个节点;
第二,子博弈包含上述节点之后所有后续节点;
第三,子博弈的信息集明确,不破坏任何信息。
(2)要点:子博弈精炼纳什均衡将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的,决策者要“随机应变”,“向前看”,而不是固守旧略。
由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。这一点对预测分析是非常有意义的。它在方体现如下几点:
第一,用动态博弈理论来讨论实际究竟发生哪个纳什均衡。
第二,给定“历史”,每一个行动选择开始至博弈结束构成了一个博弈,称为“子博弈”。
第三,只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。
(二)序贯理性与逆向归纳法
1. 序贯理性(Sequential rationality)。
博弈论专家常常使用“序贯理性”(Sequential rationality)的概念。它是指不论过去发生了什么,参与人应该在博弈的每个时点上最优化自己的策略。
子博弈精炼纳什均衡所要求的正是参与人应该是序惯理性的。对于有限完全信息博弈,逆向归纳法是求解子博弈精炼纳什均衡的最简便的方法。因为有限完美信息博弈的每一个决策结都开始一个子博弈。
(1)求解方法:最后一个结点上的子博弈(纳什均衡)→倒数第二个(纳什均衡) → ······ → 初始结点上的子博弈(纳什均衡)。
子博弈精炼纳什均衡作为完全信息静态博弈,其实亦只是一种独特的理想状态。在现实中,当后一个参与人行动时,自然会根据前者的选择而调整自己的选择,而前者也会理性地预期到这一点,所以不可能不考虑自己的选择对他人的影响。1965年,泽尔腾通过对动态博弈的分析,提出了“子博弈精炼纳什均衡”的概念,它要求任何参与人在任何时间、地点的决策都是最优的,决策者应该随机应变,而不是固守前谋。这就推导出子博弈的概念。当参与人的战略在每一个子博弈中都构成纳什均衡时,则形成“子博弈精炼纳什均衡”。也就是说,组成“子博弈精炼纳什均衡”的战略必须在每一个子博弈中都是最优的。
(2)意义。子博弈精炼纳什均衡用于区分动态博弈中的"合理纳什均衡"与"不合理纳什均衡",将纳什均衡中包含有不可置信威胁策略的均衡剔除出去,就是说,使最后的均衡中不再包含有不可置信威胁策略的存在。
2.逆向求解(Backward Induction)
逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推上去,这就是逆向归纳法。所以逆向归纳法就是从动态博弈的最后一个阶段或最后一个子博弈开始,逐步向前倒推以求解动态博弈均衡的方法。
用逆向归纳法求解子博弈精炼纳什均衡;承诺行动与子博弈精炼纳什均衡;逆向归纳法与子博弈精炼均衡存在的问题。
(三)信息博弈:从凯瑟琳转换到贝叶斯法则
1.信息博弈
(1)完全信息与不对称信息博弈
第一,完全信息博弈(perfect information)。信息是博弈基本要素之一,博弈还包括参与人、行动、策略、支付元素。信息是参与人有关博弈的知识,除了参与者的行动以外,还包括参与者的类型。博弈论中的类型包括所有会影响参与者偏好的内容,例如参与者的成本是高还是低;参与者提供产品的质量等。每个参与者都清楚自己的类型,但是不一定知道其他参与者的类型。我们把不能获得其他参与者行动信息的博弈称为不完美信息博弈,而把每个参与人都了解其他参与人的类型的博弈称为完全信息博弈,否则为不完全信息博弈。
第二,不对称信息博弈(asymmetric information)。在不完全信息博弈中,一个参与者的不被其他参与者了解的类型信息被称为该参与者的私人信息,如果只有个别参与者拥有私人信息,这种不完全博弈被称为不对称信息博弈,这是信息经济学的核心内容。
(2)完全但不完美信息
第一,完美信息博弈(perfect information)。与不完美信息博弈相对的完美信息博弈。如果存在行动上的先后顺序,而且后行动的参与者可以观测到先行动的参与者的行动,这种博弈被称为完美信息博弈。
不完美信息博弈是指:如果没有参与者能够获得其他参与者的行动信息,也就是说当参与者做选择的时候不知道其他参与者的选择,这被称为不完美信息博弈
第二,完全但不完美信息(complete but imperfect information)。它是由海萨尼提出的,被称为海萨尼转换。海萨尼把不完全信息博弈转换成完全但不完美信息博弈。这里,不完美信息指的是,她假设了一个自然作出了选择。事实上那个,其他参与人并不知道它的具体选择是什么,甚至它的信息,仅知道各种选择的概率分布。
第三,完美与完全信息的区别。完美信息博弈是依据一个参与者了解其他参与者的行动信息而定义的,完全信息则是双方都掌握参与者对他参与人的战略空间和战略组合下的支付函数有完全的了解。完美信息描述一个关于其它局中人行动(actions)的完全知识的状态,它在新信息出现时立即更新。 而完全信息用于描述这样的一个博弈,在此博弈中关于其它局中人的知识对所有参与人均是可达的。每个局中人都知道其它局中人的支付函数(payoffs)和可行策略(strategies)。
(3)海萨尼转换(Harsanyi transformation)
在1967年前,博弈专家认为不完全信息博弈是没法分析的,因为当一个参考人并不知道他在与谁博弈时,博弈的规则是没有定义的。海萨尼转换(Harsanyi,1967-1968)提出的处理不完全信息博弈的方法是,引入一个虚拟的参与人——“自然”(nature);自然首先行动决定参与人的特征,参与人知道自己的特征,其他参与人不指导。这样,上述不完全信息博弈就转换为完全但不完美信息。
这样就可以在一个博弈矩阵中假设一个自然人在选择不同的行动。这就是所谓的海萨尼转换。比如,如表17.3.3的博弈矩阵。
分析:这本是一个不完全信息博弈的情形,但是,能够做出博弈矩阵是因为引入了“自然”这个参与人。所以,成为了完全但不完美信息博弈。
我们假定“自然”是一位在位者,对于进入者打击也许是属于高成本打击,也许是属于低成本打击。一般来说,自然在博弈开始选择的包括参与人的战略空间、信息集、支付函数等。我们将一个参与人所拥有的所有“个人信息”,即,所有不是共同知识的信息,成为它的类型(type)。注意,根据这个定义,我们甚至允许一个参与人不指导其他参与人是否指导自己的类型,比如说,在市场进入博弈,一种更可能的情况是,在位者不知道进入者是否指导自己是高成本还是低成本,只知道进入者有P’的概率知道自己的成本函数,与(1-P’)的概率不知道自己的成本函数等情况。这种情况下,我们说进入者也是有两种类型:指导(在位者的成本)或不指导(在位者的成本)。因此,参与人的类型是其个人特征的一个完备描述。因为绝大多数博弈中,参与人的特征由支付函数决定,我们一般将参与人的支付函数等同于它的类型。
2、贝叶斯法则(Bayes'theorem)
在展开贝叶斯法则前,我们先分析一种类型的例题,为一种理性的选择,但非最优均衡。
例题:A、B、C三人决斗,每人有2颗子弹,每次发一枪。A、B、C的命中概率分别为0.3、0.8、1.0。三人依次发射,两轮后对决结束。每次可以选择向对手发射,也可以放空枪。
射中即死。问:在这场博弈中A的最优策略
(1)贝叶斯法则
第一,来源。贝叶斯的统计学中有一个基本的工具叫贝叶斯法则、也称为贝叶斯公式。从统计需意义看:如果你看到一个人总是做一些好事,则那个人多半会是一个好人。这就是说,当你不能准确知悉一个事物的本质时,你可以依靠与事物特定本质相关的事件出现的多少去判断其本质属性的概率。 用数学语言表达就是:支持某项属性的事件发生得愈多,则该属性成立的可能性就愈大。
第二,内涵。贝叶斯法则又被称为贝叶斯定理、贝叶斯规则是概率统计中的应用所观察到的现象对有关概率分布的主观判断(即先验概率)进行修正的标准方法。
所谓贝叶斯法则,是指当分析样本大到接近总体数时,样本中事件发生的概率将接近于总体中事件发生的概率。
第三,心里偏差。但行为经济学家发现,人们在决策过程中往往并不遵循贝叶斯规律,而是给予最近发生的事件和最新的经验以更多的权值,在决策和做出判断时过分看重近期的事件。面对复杂而笼统的问题,人们往往走捷径,依据可能性而非根据概率来决策。这种对经典模型的系统性偏离称为“偏差”。由于心理偏差的存在,投资者在决策判断时并非绝对理性,会行为偏差,进而影响资本市场上价格的变动。但长期以来,由于缺乏有力的替代工具,经济学家不得不在分析中坚持贝叶斯法则。
(2)贝叶斯公式
通常,事件A在事件B(发生)的条件下的概率,与事件B在事件A的条件下的概率是不一样的;然而,这两者是有确定的关系,贝叶斯法则就是这种关系的陈述。
贝叶斯法则是关于随机事件A和B的条件概率和边缘概率的。其公式为:
(它是一个表达事件A在事件B(发生)的条件下的概率,L(A|B) Pr(A))
其中:
L(A|B)—在B发生的情况下A发生的可能性。
Pr(A)—A的先验概率或边缘概率。之所以称为"先验"是因为它不考虑任何B方面的因素。
Pr(A|B)—已知B发生后A的条件概率,也由于得自B的取值而被称作A的后验概率。
Pr(B|A)—已知A发生后B的条件概率,也由于得自A的取值而被称作B的后验概率。
Pr(B)是—B的先验概率或边缘概率,也作标准化常量(normalized constant)。
按这些术语,贝叶斯法则可表述为:
后验概率 = (相似度 * 先验概率)/标准化常量
也就是说,后验概率与先验概率和相似度的乘积成正比。
另外,比例Pr(B|A)/Pr(B)也有时被称作标准相似度(standardised likelihood),贝叶斯法则可表述为:
后验概率 = 标准相似度 * 先验概率 ( 17.3.2)
在贝叶斯法则中,每个名词都有约定俗成的名称。作为一个规范的原理,贝叶斯法则对于所有概率的解释是有效的;然而,频率主义者和贝叶斯主义者对于在应用中概率如何被赋值有着不同的看法:
频率主义者根据随机事件发生的频率,或者总体样本里面的个数来赋值概率;贝叶斯主义者要根据未知的命题来赋值概率。贝叶斯主义者有更多的机会使用贝叶斯法则。
3. 黔之驴:获得判断概率
在中国传统文化中,黔驴技穷是一个成语,出自唐·柳宗元的《三戒·黔之驴》。比喻有限的一点本领也已经用完了,但是从概率统计的角度看,它体现为贝叶斯法则的获得统计概率的尝试,通过愈来愈多次的尝试数据,这头驴获得先验认识。从战略上亦可以体现海萨尼转换中由不完全信息向完全但不完美信息过度的尝试过程。因为,在不了解彼此信息下,一方可以通过不断的尝试,从对方的反应中获得对方的信息,或自己想要得到的信息。这种情况下,亦可以获得不同概率出现的频率。所以,在博弈论中,黔之驴并非贬义词,它代表一种策略。
让我们看看原文:
“黔无驴,有好事者船载以入。至则无可用,放之山下。虎见之,庞然大物也,以为神,蔽林间窥之。稍出近之,慭慭然,莫相知。
他日,驴一鸣,虎大骇,远遁;以为且噬己也,甚恐。然往来视之,觉无异能者;益习其声,又近出前后,终不敢搏。稍近,益狎,荡倚冲冒。驴不胜怒,蹄之。虎因喜,计之曰:“技止此耳!”因跳踉大㘎,断其喉,尽其肉,乃去。
噫!形之庞也类有德,声之宏也类有能。向不出其技,虎虽猛,疑畏,卒不敢取。今若是焉,悲夫!”
”
三、两组案例:避免不利到反制最佳策略
1、最大最小策略(maximin strategy):避免十分不利的结果
迄今为止,对市场结构的分析都是假定管理决策的中心是谋求最大利润。但在诸如罐头垄断钠盐个竞争十分激烈的场合 冯 诺依曼和摩根斯坦认为决策者可能采用一种风险-厌恶型策略,及确保在可能的最快结果中得到最好的结果,不管其他决策者如何做。这一决策规则称为最大最小策略。因为它对丁在博弈中,每个对弈着将在可能最少的利润方案(或所需要的其他结果)中选择最大方案。
请看下面的例子。双头龙胆的两家企业恶斗打算推出一种新产品。四种更可能的策略组合的利润结果见下表中的收益矩阵,如果企业谋求最大利润,矩阵就有两个纳什均衡——两种一家企业退出新产品,而另一家企业不推出的情况。
例题:如果企业1推销新产品,企业2如果也推销,后者的利润为200万美元;但是如果企业2不推销,则利润为300万美元。如果企业2不推出新产品,而企业1推出新产品,后者就可比不推出新产品多得利润200万美元。因此,矩阵左下方块是一种纳什均衡。同理右上方块也是一种均衡。
分析: 最大最小决策准则并不是一种纯粹的利润最大化策略。确切地说,它是用来避免十分不利的结果的。在运用这一原理时,每家企业首先要确定它能选择的每种策略可能取得的最低利润。在上表中该,对企业1来说,如果它不推出新产品,是300万美元,如果它推出新产品是200万美元。对于企业2来说,数字亦相同。
第二步是在最小值中选最大值。结果是两家企业都不应推出新产品,因为采取这样的策略,能保证至少获得利润300万美元。注意,最大最小的结果不是两种纳什均衡中的一种。原因是,这种决策所用的准则,不是利润最大,而是避免亏损过多。
2、最佳反制:最优策略选择。
通过前瞻竞争对手在最终博弈中的最佳回答反应,然后对前面每一个问题进行逆向归纳分析,这就是由雷恩哈德·泽尔腾提出的一种顺序博弈均衡战略。
纳什均衡战略是一种决策者的最优行动,在所有其他参与人做出最佳回答反应时,其收益超过了决策者从其他任何行动和假设最佳回答反应中得到的收益。
泽尔腾把这个纳什均衡概念应用于顺序博弈之中,并发明了在一个恰当子博弈中的纳什均衡概念。
例.再举一个顺序博弈的例子,假设两家保险公司经营福利项目,为增加业务而竞标出价该领域内的专家,市场价格为每小时200美元,潜在的顾客不会离开当前的供应商,与新厂商签订福利管理合同,除非出价降低50美元。如果一家公司A决定这样做,那么你的公司必须决定是同样降价,以便使顾客在两家厂商中随机选择,还是把价格进一步降至每小时100美元。不过,根据过去的经验,削价可能不会就此停止。客户们肯定会来往于两家厂商之间选取目前的最优出价,从而形成一种循环降价。
因此,问题就成了:你将把价格降到多低?重要的是,存在第二规则“倒数第二停止规则”,即,当价格低于你的40美元成本时,再增加业务活动就无利可图了。所以必须拒绝。A公司的成本更高,比如说每小时66美元。
另外,你的决策取决于分析预测未来事件的结果,这种情况可用一个博弈树或决策树来表示,如下图所示。为简化起见,假设每次降价幅度为50美元,顾客用抛掷硬币方法在相同的报价中迅速选择,一旦报价被别人赶上,就不能再降,假定该市场上出现很多潜在顾客。现在轮到你在结点Z1上决策,你的价格水平为每小时朽。美元,你应该怎么办?保持相同价格还是继续降价?
3、博弈的企业对抗:先动与次动优势与得益评价
(略)
…………………..
四、中国“三国”中的博弈:华容道
诸葛亮在《隆中对》中提出“跨有荆益、东有孙权、北图中原”,他舌战群儒,力劝东吴孙权与刘备联盟,联吴抗魏。
火烧赤壁一战,孙权刘备联军大败曹操,曹操北逃。诸葛亮明知关羽重义气,必然放走曹操,为何还将捉曹重任交给关羽。
既然放操,为何又设三重拦截?事实上是,如果孙权知道诸葛放操,则孙刘联盟瓦解,因此,既要放,又不能让孙权看出是有意放。而曹操一死,孙刘联盟即刻瓦解。