上QQ阅读APP看书，第一时间看更新

第3章导读

什么是博弈论？

在现实生活中，我们常常会用数学来解决经济学问题。这种尝试虽然很频繁，但至今还没有完全取得成功。之所以会出现这样的现象，是因为人们照搬了物理学的方法来实施这种尝试，而这些物理学方法主要是针对一个系统建立导数方程，并通过导数方程来预测该系统未来可能发生的情况。但是，约翰·冯·诺依曼在《博弈论》中所使用的方法与之却有着天壤之别。约翰·冯·诺依曼没有把经济生活看作一个已知系统，而是将其看作一种由多人参与的博弈。在这种博弈中，参与者需要遵循一定的规则，并试图让自身的利益最大化。约翰·冯·诺依曼研究了参与者的多种可能的行为类型，这些行为既能保障相应参与者的利益最大化，又符合整个博弈的规则。

我们无论在什么情况下对问题进行数学分析，都需要率先用一套公理体系对问题进行数学语言描述。因此，拥有一套完整的公理体系是数学分析的前提。若没有这套公理体系，我们便不能用逻辑推理获得结论。在使用这套公理体系的过程中，人们不用时刻考虑数学表达式对应的现实事物，只需要在逻辑推理的终点将数学符号还原为现实事物。也就是说，这里的每一种数学符号都有其现实意义，但在逻辑推理过程中不需要考虑它们对应的现实意义，只需在得出结论之后再把结论反映为现实事物，这样就能实现这一逻辑推理的价值。约翰·冯·诺依曼根据这一思路对博弈的概念进行了数学公理描述，在此之后，《博弈论》便不用再研究实际生活中的事物，而是成为忠于一种数学形式的理论。不过，实际的博弈顺序仍然是约翰·冯·诺依曼理论的基础，正是受到这些博弈的启发，他才能顺利展开其理论过程。另一方面，读者即使不知道实际博弈的情况，他们也可能明白整个逻辑推理的过程，尽管这对不擅长数学的人来说有些困难。

《博弈论》中首先要构造的概念是个体的策略，具体来说，就是任何参与博弈的人都会采用的策略。在博弈的过程中，参与者势必会有一套属于自己的策略，这个策略也是他所要遵循的行动法则。参与者在任何情况下的行动都要依据这套策略的相关要求，若每个参与者都遵循各自的策略，博弈的过程就被理所当然地确定了，因为参与者最后的收益是已知的。不过，无论采用哪种策略，参与者只能控制自己的选择，而不能决定对手的选择。这就引出一个重要的问题，即每一名参与者在不了解其他参与者做何选择的情况下，如何选择策略才能使自身利益最大化？

这个问题在零和博弈中得到了解决。零和博弈的特点在于参与者只有两人，且一方获得的利益恰好等于另一方失去的利益，或者说一方胜利，另一方注定失败。冯·诺依曼在这种信息完美的博弈中证明了每一个参与者都可能拥有一个最优策略。这意味着博弈中存在两种可能，即两名参与者中的一个必定拥有取胜的策略，或者每一参与者不会获得比平局更坏结果的策略。当然，这些情况仅限于信息完美的博弈，如果在信息不完美的博弈中，情况就不会如此简单了。不过，冯·诺依曼仍然找到了解决办法，他在两人零和博弈中引入了混合策略这一概念，成功解决了这个问题。采用混合策略就意味着要按照一定概率施行不同的纯策略。若合适的混合策略能确保先行者获得的收益不低于1，那么后行者便能阻止先行者获得超过1的收益。通过引入混合策略，两人零和博弈的问题就能全部解决了。

冯·诺依曼并不满足于对两人博弈的研究，他接着又进入了超过两人的多人博弈问题的研究。在多人博弈中，参与者可能为了获利而相互结盟，形成人数相同的两个联盟，或者形成一个多人联盟和一个单人联盟。这样一来，多人博弈又变成了两人博弈。在这里，冯·诺依曼可以直接应用在二人零和博弈中得出的结论。这就意味着，每个联盟都有与之对应的数值，这个数值表示：一个联盟之外的所有参与者一起采取对该联盟最不利的行动，该联盟成员能获得的最少总收益。简言之，它表示在最坏的情况下每个联盟最少能获得的收益。

冯·诺依曼正是根据对各联盟对应数值的研究来完整地论述这场博弈的。事实上，在研究博弈的过程中，冯·诺依曼需要讨论的问题还包括形成联盟所需的条件问题、联盟总收益如何分配给各个成员的问题等。博弈的结果被看作一个归责系统，它规定了每个玩家最终能从博弈中获得的好处。这种好处既可以直接从博弈规则中获得，也可以由联盟其他成员自愿支付。冯·诺依曼的这个理论尽管不能明确指出哪一个归责系统将会实现，却要求应该优先考虑一个特定的归责系统，即博弈的解，这样做的理由在于博弈之外的因素，如传统习俗、价值观等，也能影响博弈的解的确定。

博弈的不同解决方案反映了参与者组成的社会中的普遍接受的行为标准。在参与者的行为标准之中，哪一种归责系统容易实现呢？冯·诺依曼用博弈的解对这个问题进行了描述。确定博弈解集的标准是：参与博弈的人没有理由认为任意一种博弈解集的归责系统要严格优于另外一种。与此同时，那些与博弈解集无关的归责系统一定会被一些参与者认定为要劣于解集内的一种或者多种归责系统。不过，对于所有博弈而言，是否都存在满足该标准的解集还无法确定。另外，不少特殊的案例显示，在一种博弈中，也可能存在多个不同的这样的标准。

《博弈论》对读者在数学知识方面有一定要求，但这个要求不超过基本的代数知识，且书中对一些数学概念都给出了较为详尽的介绍和解释。约翰·冯·诺依曼每提出一个理论总会提出相应的案例，他用数学方法详细地讨论了这些具体案例，同时抓住一切机会对其数学分析和结论给出文字性说明。基于这些因素，书中的内容对于有数学短板的读者来说亦是非常有趣的。这部著作必将成为准确定义和清晰表述经济学的重要工具。

博弈论的“前生今世”

日常生活中，我们总能见到大大小小的博弈，博弈可以是多人参与的，也可以是在多团队之间进行的。在博弈中，参与者会受到特定条件的制约，且都希望能使自身得到的利益最大化。参与者往往会根据对手的策略来实施对应的策略。从这个意义上来看，博弈论又可以被称作对策论，同时它还有一个较为通俗的名字，即赛局理论。博弈是具有斗争性和竞争性的现象，而博弈论所研究的就是有关这类现象的理论和方法。

博弈论中总是会运用到数学知识，所以它也被看作应用数学的一个分支，或者是运筹学的一门重要学科。游戏和博弈中的激烈结构之间相互作用，而博弈论正是用数学的方法来研究这种相互作用。

在一个博弈游戏中，参与者需要考虑对手的实际行为和预测行为，根据这些行为优化自己的策略。表面上来看，有些博弈中的相互作用是不同的，但它们在运作时却可能表现出相似的激励结构，最具代表性的案例是囚徒困境。

博弈行为通常是竞争性行为，所以这种行为往往会表现出对抗的性质。参与这类行为的人一般都具有各自不同的目标或利益。在博弈过程中，人人都会向着自己的目标努力，他们会充分考虑对手可能采取的行动方案，制订自己的合理方案，使自身的利益获得保障，我们在日常生活中进行的游戏，如下棋、打牌等都属于博弈行为。

由此，我们不难理解博弈论所要研究的内容：事实上，博弈论就是站在研究者的角度，充分考虑博弈各方所有可能的行动方案，并运用数学方法找出最合理的行动方案的一种理论或方法。由于它的主要工具是数学，所以严格来说它是一种数学理论或数学方法。

在中国古代，博弈论思想就已经存在，最具代表性的博弈论研究者是著名军事家孙武，他的《孙子兵法》既是一本军事著作，也是一部博弈论专著。人们最初常把博弈论思想用以研究娱乐性质的胜负问题，比如人们在下象棋、打牌或者赌博中都会用到这类思想。不过，在此阶段的博弈论是相对粗浅的，人们只是根据经验来把握博弈的局势，努力使自身利益最大化，还没有向着理论的方向发展。直到20世纪初，博弈论才正式发展成为一门学科。

最早开始研究博弈论的是策墨洛、波雷尔和冯·诺伊曼。策墨洛的研究是用数学方法研究博弈现象的第一次尝试，波雷尔为博弈论的发展起到了巨大的推动作用，冯·诺伊曼和奥斯卡·摩根斯坦第一次对博弈论进行了系统化和形式化的研究。

此后，约翰·纳什提出纳什均衡的概念，他认定博弈中存在着均衡点，并运用不动定理成功证明了该点的存在，这一重要的研究为博弈论的普遍化奠定了基础。什么是纳什均衡呢？它指的是：博弈中的所有人都将面临的一种特殊情况，即当对手不改变自己的策略时，他当前的策略是最优选择，如果参与者改变他当前的策略，他的利益就会受损。只要博弈参与者都保持理性，那么他们在纳什均衡点上就不会有改变自身策略的冲动。

要证明纳什均衡点的存在，就需要提出一个新的概念，即博弈均衡偶。博弈均衡偶指的是若参与者A在两人零和博弈中采取最优策略a+，那么参与者B也会采用其最优策略b+；若参与者A采取策略a，那么他的损失不会超过他采取策略a+时的损失，这种结果也适用于参与者B。若给博弈均衡偶下一个明确的定义，则是：策略集A中的策略a+和策略集B中的策略b+叫作均衡偶，对于策略集A和策略集B形成的成对策略a、b，总是满足以下条件：偶对（a，b+）≤偶对（a+，b+）≥偶对（a+，b）。若纳什均衡点在非零和博弈中，博弈均衡偶的定义则为：策略集A中的策略a+和策略集B中的策略b+叫作均衡偶，对于策略集A和策略集B形成的成对策略a、b，总是满足以下条件：参与者A的偶对（a，b+）≤偶对（a+，b+）；参与者B的偶对（a+，b）≤偶对（a+，b+）。根据这两个定义就可以得到纳什定理：在两人博弈中，只要参与者的纯策略是有限的，其必然存在至少一个均衡偶，也称为纳什均衡点。要证明纳什定理必须运用不动点理论，这一理论是研究经济均衡的主要工具。也就是说，找到了博弈的不动点就等于找到了纳什均衡点。

作为一种重要的分析工具，纳什均衡点能让博弈研究在特定的结构中找到有意义的结果。但是，由于纳什均衡点的定义中规定参与者不会单方面改变策略，忽略了其他参与者改变自身策略的可能性，所以具有非常大的局限性。纳什均衡点的应用在多种情况下缺乏说服力，因此一些博弈研究者将它称为“天真可爱的纳什均衡点”。

除了策墨洛、波雷尔、冯·诺伊曼、奥斯卡·摩根斯坦、约翰·纳什外，对博弈论的发展做出推动性贡献的还有赛尔顿和哈桑尼等人。塞尔顿完善了纳什均衡理论，他剔除了一些不合理的均衡点，形成了两个精炼的均衡新概念，即子博弈完全均衡和颤抖之手完美均衡。

时至今日，博弈论已经发展成一门相对成熟和完善的学科。目前，博弈论在多个学科和领域获得了广泛的应用，特别是在生物学、经济学、计算机科学、数学、政治、军事等学科和领域的表现尤为出色。

例如，一些生物学家会利用博弈论来预测生物进化的某些结果，或者理解生物进化的原因。1973年，美国《自然》杂志上刊登了一篇论文，其中便提出了一个有关博弈论的生物学概念，即进化稳定策略。此外，我们还能在演化博弈理论、行为生态学等方面见到博弈论的身影。作为应用数学的一个重要分支，博弈论还被应用于线性规划、统计学和概率论等方面。

一般来说，博弈论引入经济学是由美国著名数学家约翰·冯·诺伊曼和经济学家奥斯卡·摩根斯坦在20世纪50年代率先完成的。现代经济博弈论已经成为经济分析的主要工具，它极大地促进了经济理论的发展，特别是对信息经济学、委托代理理论和产业组织理论做出了重要贡献。

1994年和1996年，以约翰·纳什为代表的多位从事博弈论研究和应用的经济学家，凭借他们在经济领域所做的突出贡献成功获得诺贝尔经济学奖。在博弈论未被应用在经济领域之前，传统经济学分析的思路较为狭隘，而博弈论的引入清晰地呈现出经济主体之间的辩证关系，使得经济学的分析有了新的思路。这不仅与现实市场竞争十分贴近，还为现代微观经济学和宏观经济学奠定了基础。

博弈论的基础是建立在众多现实博弈案例之上的。博弈需要具备一定的要素，主要有五个方面：局中人、策略、得失、次序、均衡。

局中人是博弈的参与者，每个参与者都能对自身策略进行决策，但不能改变别人的决策。若博弈中的局中人只有两个，这种博弈便称为两人博弈，若博弈中的局中人超过两个，则这种博弈便是多人博弈。

策略是博弈过程中局中人做出的切实可行的行动方案，局中人的一个策略不是指他所采取的某一阶段的行动方案，而是指他在整个博弈过程中从始至终所采用的一个行动方案。根据可能采取的策略的有限性或无限性，博弈可被分为有限博弈和无限博弈。在有限博弈中，局中人的策略是有限的；在无限博弈中，局中人的策略则是无限的。

每场博弈中，局中人最后的结果有得有失，每局博弈的结果便被称为得失。局中人博弈的得失与两个因素相关：一是其自身所选定的策略，二是其他局中人所选定的策略。每个局中人在博弈结束时的得失可根据所有局中人选定的一组策略函数来判定，人们把这个函数称为支付函数。

局中人的决策总是有先有后的，同时，每个局中人都可能要做多个决策选择，这些选择也是有先后顺序的，博弈的次序能决定博弈的结果。在其他要素相同的情况下，若局中人决策和选择的次序不同，博弈也会不同。

每场博弈都会涉及均衡问题。所谓均衡，即指平衡，或者说相关量处于一个稳定值。这是经济学中的常用术语。例如，若一家商场的商品能够处于一个均衡值，人们想买就能买到这种商品，想卖就能卖出这种商品，那么这个商品的价格就是这里的均衡值。有了这个价格做保障，商品的供求就能达到均衡状态。纳什均衡就是这样的一个稳定的博弈结果。

博弈的分类

根据不同的标准，博弈可以分为多种类型。

若根据博弈中的参与者是否达成一个具有约束力的协议来划分，博弈可被分成合作博弈和非合作协议。具体来说，就是当相互作用的局中人就博弈过程制定了一个具有约束力的协议时，这个博弈就是合作博弈，如果局中人之间没有制定这项协议，那么该博弈就是非合作博弈。

若根据局中人行为的时间序列性来划分，博弈也可分为两类，即静态博弈和动态博弈。所谓静态博弈，指的是局中人同时选择所要采取何种行动的博弈，或者在博弈过程中，后做出选择的人不清楚先选择的人的策略而做出行动的博弈。所谓动态博弈，指的是局中人的行动有先后顺序，且后做出选择的人知道先做出选择之人的行动。在著名的囚徒困境中，局中人的选择是同时进行的，或在相互不知道的情况下进行的，属于典型的静态博弈。在我们常玩的棋牌类游戏中，后行者总是知道先行者选择的行动，属于动态博弈。

若根据局中人对彼此的了解程度来划分，博弈同样能分为两类：一类是完全信息博弈，在这类博弈中，每位参与者都能准确地知道所有其他参与者的信息，包括个人特征、收益函数、策略空间等；另一类是不完全信息博弈，在这类博弈中，每位参与者对所有其他参与者的信息不够了解，或者无法对其他每一位参与者的信息都有准确了解。

在经济领域，人们所谈论得最多的博弈是非合作博弈。一般来说，非合作博弈比合作博弈简单，其理论也远比合作博弈成熟。根据复合特征来划分，非合作博弈可分为四类，分别是完全信息静态博弈、不完全信息静态博弈、完全信息动态博弈、不完全信息动态博弈。其中完全信息静态博弈对应的均衡概念是纳什均衡，完全信息动态博弈对应的均衡概念是子博弈精炼纳什均衡，不完全信息静态博弈对应的均衡概念是贝叶斯纳什均衡，不完全信息动态博弈对应的均衡概念是精炼贝叶斯纳什均衡。

此外，根据局中人的策略是有限的还是无限的，或者根据博弈进行的次数是有限次还是无限次，又或者根据博弈持续的时间是有限时间还是无限时间，博弈又可被分为有限博弈和无限博弈。

若根据博弈的表现形式来划分，博弈还可被分为战略型博弈和展开型博弈。

博弈论是以数学为研究工具的理论方法。博弈论研究的第一步是透过现象看本质，即从复杂的现象中抽出本质元素，利用这些元素构建合适的数学模型，再利用这一模型对引入的、影响博弈形势的其他因素进行分析并得出结论。这与用数学研究社会经济的其他学科的研究方法如出一辙。

根据博弈元素抽象水平的不同，博弈可分为标准型、拓展型和特征函数型三种。在日常生活中，我们只需利用博弈的这三种表达方式就能解决许多社会经济性问题，由于它在社会科学方面的贡献以及它自身携带的数学性质，人们形象地称它为社会科学的数学。

博弈论是一门形式理论，它所研究的是理性局中人的相互作用。作为一个成熟的理论，其所具备的理论性质并不比其他学科弱。同样，在实际应用方面，它也不比许多学科逊色。它不仅在数学领域占有重要的地位，还应用于经济学、社会学、政治学等多门社会科学。

严格来说，博弈论是这样一个过程：它是个人或团体在一定规则约束下，依据各自掌握的关于别人选择的行为或策略，决定自身选择的行为或策略的收益过程。既然是一个计算收益的过程，定然与经济学紧密相关，它在经济学上就是一个十分重要的理论概念。

人们常说世事如棋，每一场博弈就像一个棋局，总是包含着变化与不变。若把世界看作一个大棋盘，每个人都是下这盘棋的人，人的每一个行为都是在棋盘中布下一颗棋子。在棋局中，棋手们会尽可能保持理性，精明慎重地走好每一步。棋手之间会相互揣摩、相互牵制，为了赢得最后的胜利，他们会不断变化棋势，下出精彩纷呈的棋局。从这个意义上看博弈论，它正是研究棋手们出棋招数的一门科学。每一次出棋都是一个理性化和逻辑化的过程，若再把这个过程加以系统化，就变成了博弈论。在错综复杂的相互影响之中，棋手们如何才能找出最合理的策略，正是博弈论研究的内容。

毫无疑问，博弈论衍生于下棋、打牌这些古老的游戏。数学家和经济学家们将这些游戏中的问题抽象化，同时建立起完善的逻辑框架，在一定的研究体系中探索其规律和变化。对博弈论的探索不是一件容易的事情，即使最简单的二人博弈也大有玄妙：若在一场棋局中，棋手都是最理性的棋手，他们可以准确地记住对手和自己的每一步棋，那么一方在下棋时，为了能战胜对手，他就会仔细考虑另一方的想法；同样另一方在出子时也会如此考虑。同时，一方还可能考虑另一方在想他的想法，另一方也可能知道对手想到了他的想法，如此往复，问题会变得越来越复杂。

这样的抽象问题会像重重迷雾遮蔽人们的双眼。博弈论要如何着手解决这些问题呢？它如何把现实问题抽象化为数学问题并求出其最优解呢？它如何以理论的方式来指导实践活动呢？这些问题最先在美国大数学家冯·诺依曼那里得到解决。20世纪20年代，冯·诺依曼正式创立了现代博弈理论。1944年，现代系统博弈理论初步形成，其标志是冯·诺依曼与美国经济学家奥斯卡·摩根斯坦合著的《博弈论与经济行为》出版发行。

冯·诺依曼解决了二人零和博弈的问题。这种博弈是一种非合作、纯竞争型的博弈。现实中的博弈案例包括两人下棋、打乒乓球等。在这种博弈中，一人赢就意味着另一人必然输，一人胜一筹，另一人必输一筹，两者的净获利相加始终为零。将两人下棋的博弈抽象化后，就出现了这样的问题：若知道参与者集合、策略集合和盈利集合，如何才能找到其中的平衡？如何让博弈双方都感到最合理？最优解或最优策略是什么？怎样才算合理？在解决这类问题时，人们常会使用传统的决定论，并遵循其中的最大最小原则。具体来说，就是每一位参与者都会猜，为了让自己最大程度失利，对手会实行什么策略，并据此制定出最优策略。冯·诺依曼利用线性运算等数学方法成功证明了在二人零和博弈中可以找到一个最小最大解。

利用线性运算，二人零和博弈的参与者就能根据对应的概率分布，随机选择最优策略中的步骤，使双方利益最大化或相当。这一博弈论的深层意义在于，所得的最优策略与对手在博弈中的操作没有依存关系。简言之，其理性思想就是“抱最好的希望，做最坏的打算”。

博弈论的意义

博弈论的现实意义是广泛而深刻的，从一些现实中的例子就能看出。

在日常生活中，我们会在消费过程中经历大大小小的价格战。例如，我们在选购智能手机时，就能感受到智能手机领域的巨大竞争，各种品牌层出不穷，各种款式让人眼花缭乱，各种优惠活动令人应接不暇。卖家们为了提高销量，打出知名度，一而再再而三地压低价格，高配置低价格的手机越来越多。虽然这种价格战的最终受益者是消费者，但是在市场竞争上，或者说对于企业来说，价格战并不是什么好现象。

除了智能手机领域，各种家电的价格大战也不断上演。家电大战的受益者同样是消费者，每逢这种价格战时，人们似乎都会偷着乐。明明知道会亏本，为什么商家们还要不遗余力地压低价格，义无反顾地投入价格战呢？这其实就涉及博弈问题。对商家来说，其目的是自身利益最大化。压低价格虽然会使自身利益暂时受到损害，但能够吸引更多的消费者购买产品，达到薄利多销的目的，同时也能打出品牌知名度，实现品牌价值增值。另外，低价销售还可以极大迎合消费者的心理需求，使消费者在购买本品牌产品后形成长期惯性消费，为企业的后期布局打下基础。

然而，商家之间的博弈是一种零和博弈，价格战一旦打起来，往往谁都没钱赚。博弈双方的利润之和正好是零，这意味着一方获利，必有一方受损。价格战的博弈永远不可能达到双赢或多赢的局面。价格战博弈属于一种恶性竞争，通常会导致多输局面，不过，其竞争的结果也会趋于稳定，达到一种纳什均衡。其结果可能有利于大多数消费者，但对企业来说却是一场灾难。因此，企业参与价格战无异于自杀。从价格战博弈中能够引申提出两个有价值的问题：第一是价格战达到纳什均衡后虽然是一个零利润的结局，但这个结局是有效率的，至少它不会破坏社会经济效率。第二是若企业之间不存在任何价格战，那么敌对博弈将会产生什么后果呢？这时，每个企业可能有两种考虑，它们首先可能考虑采用正常价格的策略，其次则是采用高价垄断策略。采用正常价格的结果是企业获利。如果每个企业都能在各自的领域内形成垄断，那么博弈双方的共同利润便会最大化。这时，它们通常会进行垄断经营，抬高产品价格。由这两种考虑，我们可以得出一个基本准则，即企业应该把战略建立在假设对手按照其最优策略行动的基础之上，或者假设自身处于利润最低的条件下，再制定应对策略。

实际上，企业之间的完全竞争所能达到的均衡是一种非合作博弈均衡，即纳什均衡。在这种稳定状态下，企业要销售产品，就会按照其他企业的定价来定价，消费者要购买产品也会参照各企业的定价来决定是否购买。企业的目标是实现利润最大化，消费者的目标是争取产品效用最大化。由于这是一种零和博弈，所以两者的利润之和是零。此时，企业所制定的产品价格就等于边际成本。企业之间处于完全竞争的状态时，非合作行为能保障社会的经济效率。如果企业进行合作并采用垄断价格，那么就可能影响社会经济效率。正是由于这个原因，世界贸易组织和各国政府才会反对企业垄断。

发展经济和环境污染是一对矛盾，一般来说，发展经济势必会造成环境污染。这种矛盾便造就了污染博弈。发展市场经济会带来污染问题，如果政府不加以管理，企业就会为了利润而牺牲环境。为了追求利润最大化，企业不会增加环保设备，为了生产产品而产生的污染物便难以处理，这将直接造成环境污染。若所有企业都坚持实施不顾环境污染，只为追求利润最大化的策略，就会步入纳什均衡状态。假设在这种状态中，一个企业愿意从利他的角度出发，购买环保设备，增加治理环境污染的成本，那么其总体生产成本也会水涨船高，成本一高，企业就会提高产品价格，导致产品失去市场竞争力，这样一来企业很难维持经营，甚至有可能破产。要打破这一魔咒，政府就要加强防污染管理，使企业在追求利润的同时也要兼顾环境保护。当所有企业都愿意在环境保护的基础上追求利润时，社会的整体效率就会提高，这又会反过来弥补企业在环保方面的投入，最后，不仅社会环境会变得更好，经济也能又好又快地发展。

除了价格战博弈论、污染博弈论，现实中还有一种博弈论值得人们深思，这就是贸易战博弈论。一个国家在国际贸易方面往往有两个选项：一是保持贸易自由；二是实行贸易保护。贸易的自由和壁垒之间也能形成一个纳什均衡，这个均衡的代价是高昂的，它会使贸易双方采取不合作策略，陷入永无休止的贸易战当中。贸易战一旦打响，必定会使双方的利益都受到损害，所以这是一个双输的策略。例如，A国为了自身利益，采取进口贸易限制策略，提高关税，使出口国B的利益受到损害。B国为了防止利益受损，以同样提高关税的方式进行反击，最终两国利益都受损。相反，如果A国和B国能够达成合作，形成一种合作性均衡，两国都遵循互惠互利原则，减少或免除各自的关税，这样一来，双方都能从自由贸易中获利，与此同时，全球贸易的总收益也会不断增高。

博弈论是现代社会一个热门的研究课题，它不仅存在于运筹学中，也存在于经济学中。近些年，它在学术界的地位越来越重要，许多诺贝尔经济学奖都与对博弈论的研究相关。事实上，博弈论并不是高高在上的学术话题，它所涉及的应用领并不狭隘。在我们的学习、工作和生活之中，随处可见博弈论的身影，比如我们在学习时要与老师、同学博弈，在工作时要与上级、下属、客户、竞争对手博弈，在生活中要与家人、朋友博弈。博弈就在我们的身边，用博弈的方式去思考问题将会给我们带来不一样的思想体验。从某种程度上来说，博弈论意味着一种全新的思想或一种全新的理解分析的方法。

博弈论的重要性不言而喻，它能左右你的生活，实现你的价值。若你想成为一个对社会有价值的人，你要学习博弈论；若你想在商场上叱咤风云、获得成功，你要学习博弈论；若你想赢得生活，成为可被人信赖的人，你也要学习博弈论。总之，博弈论已成为当今社会不得不了解、不可不学习的重要理论之一。

如何找到一个最优策略

博弈理论中存在一些对人的基本假定，比如它假定参与博弈的人必须是理性的，而理性就意味着他在博弈中是从自己的利益出发的，或者说他是自私的。理性的人在博弈过程中会将自身利益最大化作为目标，博弈论的研究也是建立在理性人之间的博弈之上的。约翰·纳什利用他创造的囚徒困境博弈故事清楚地说明了纳什平衡的存在，即在非合作博弈中存在一个均衡解，这个解可使博弈双方的利益都获得保障。

每场博弈中都会涉及三大要素：参与者、策略、得失。在囚徒困境中，两个囚徒是博弈的参与者，他们选择的策略都是承认杀人事实，结果两人都赢得了中间宣判结果。而如果一名囚徒承认杀人事实，另一名囚徒不承认杀人事实，其结果是承认者获得减刑，否认者获得死刑。最后两个理性的囚徒在经过慎重考虑之后，都选择承认杀人事实，这样一来他们都获得了稳妥的保命结果。除了囚徒困境，我们还能在自私基因、智猪博弈等理论中找到这种均衡解。

美国博弈论专家罗伯特·阿克塞尔罗德在研究合作型博弈时首先设定了两个前提条件，第一个条件是每个参与者都是理性的（自私的）；第二个条件是没有外界因素干扰参与者的个人决策。这就意味着，在合作博弈中，每个参与者都会为了利益最大化进行决策。在这两个条件下，罗伯特·阿克塞尔罗德研究了以下三个关于合作的问题：一是博弈者为什么要合作；二是博弈者在什么时候合作，什么时候不合作；三是博弈者如何使别人与他合作。

这三个问题的研究意义深远，它们在社会实践中的合作问题上多有体现，比如贸易博弈中如何通过合作使博弈双方都能获得稳定收益的问题等。在博弈过程中，若参与双方都追求自身利益的最大化，就会损害群体利益。

举例来说，若现在进行一场合作博弈，A、B分别代表博弈双方，两者都能自由进行无差别选择。现在，摆在两人面前的选择有两个：合作和不合作。我们用Y代表合作，用N代表不合作，并设定以下规则：若A和B都选择Y，两人都得3分；若A和B都选择N，两人都得1分；若一人选Y，另一人选N，选Y的人得0分，选N的人得5分。

在这个例子中，对这个两人团体来说，最优的策略是两人都选Y。这样一来，每个人都能得到3分，团体得分就是6分。若两人都选择N，那么每人各得1分，团体得分是2分；若一人选Y，另一人选N，则选Y的人得0分，选N的人得5分，团体得分是5分。

该博弈论通过得分矩阵可以清楚地描述个体理性与团体理性之间的矛盾。若个人在博弈中追求利益最大化，就会使群体利益受损，这就是这类博弈所体现的重要内涵。站在A的角度来考虑，可以发现，若B选Y，A在选N的情况下可以获得最大化利益，即5分；若A在B选择Y的前提下选择了Y，他可以得3分；若B选N，A也选择N，他只能得1分；若A在B选择N的前提下选择了Y，他只能得0分。A所能获得的可能得分从高到低分别是5分，3分，1分，0分。对A来说，要使自身利益最大化就是得5分；要使团体利益最大化就是得3分。其中的困境在于如何使每个人在选定策略后都能得到稳定的分数，同时还不让自己离利益最大化太远。个人得5分虽然可以实现其自身利益最大化，但整个团体的分数只有5分；若每人得3分，团体得6分，团体利益就能实现最大化，但个人只能获得3分，距离他们的最高目标5分还差一些。这就是个人理性和团体理性之间的矛盾。

若这个博弈只进行一次便结束，那么它在数学上是没有最优解的。若博弈可进行多次，且两个参与者知晓博弈的次数，那么理性的他们在最后一次博弈中一定会选择相互背叛，这样才能实现自身利益最大化。如果是这样的话，他们在之前的博弈中是否合作都是无关紧要的，即使两人达成了一次合作，也是没有必要的。所以，参与者在知道博弈次数的情况下不会进行合作。

但是，如果这类博弈是在多人之间进行的，同时每一个参与者都不知道具体的博弈次数，那么在这种情况下，参与者就会意识到这个问题，即在持续地选择合作时，每一个人都能持续且稳定地得到3分。若彼此持续不合作的话，每个人只能持续得到1分而已。通过这样的思考，参与者之间的合作动机就非常明显了。多次博弈的过程中，参与者未来的收益要比现在的收益增加一定的折现率，这个折现率越大，则未来的收益越重要。这个时候，参与者的最优策略就与别人采取的策略产生了联系。我们假设一个参与者第一次选择合作策略，之后一旦对方不合作，他便选择永不合作。与这种参与者进行博弈，一直与他合作下去当然是最有利的。我们再假设无论别人采取何种策略，这个参与者都选择合作，那么与这种参与者进行博弈，始终不与他合作才能获得最高的分数。同时，我们对于那些总是不合作的人往往会采取不合作的策略。

阿克塞尔罗德根据这些思想制定了一个这样的实验：他邀请一群人来参加这个博弈游戏，得分规则与我们提到的A和B之间的合作博弈一样，但没有人知道这个游戏何时结束。阿克塞尔罗德要求每一个参与游戏的人把自己认为得分最高的策略编成计算机程序，然后让这些程序两两博弈循环进行下去，看一看究竟哪种策略的得分最高。

第一轮游戏总共有15个程序参加，包括阿克塞尔罗德自己制定的一半概率合作一半概率不合作的随机程序和14个主要考察对象设计的程序。在两两循环博弈进行了300次后，阿克塞尔罗德终止了游戏，最后的结果显示，加拿大学者罗伯布的一报还一报程序获得了最高得分。一报还一报程序的特点在于第一次对局采取合作策略，之后每次对局都以对手上一次的策略作为参考，即对手上一次选择合作，我这一次就选择合作，对手上一次选择不合作，我这一次就选择不合作。阿克塞尔罗德对得分较高的程序进行了分析，他发现得分排名靠前的程序一般有三个特点：一是具备善良性，即从来不主动背叛别人；二是具备可激怒性，即对于别人的背叛不能一直许以善意的合作，还要具备一定的报复；三是宽容性，即别人背叛了你一次，你不能无休止地进行报复，而要在别人选择合作的时候与其合作。

阿克塞尔罗德没有满足已有的实验，他又邀请了更多的人重新做了相同的实验，并在游戏开始之前，向所有人公布了上一次实验的研究结果。这次实验的对弈程序多达63个，包括他的随机程序和62个研究对象的程序。经过一定数量的对局，这次实验的结果与上一次没有区别，最终一报还一报程序依然斩获了得分第一名。这次实验证明了一报还一报策略仍是最优解，同时也证明了排名靠前的程序都具有善良性、可激怒性、宽容性三个特点。63个程序的前15名中除了第8名程序是不善良的外，其余程序都是善良的；而在得分较低的后15名中，除了一个程序具有善良性外，其余都是不善良程序。另外，优秀程序具有可激怒性和宽容性也在实验中得到了证明。与此同时，阿克塞尔罗德在这次实验中还有新的发现，即优秀策略还具有清晰性，也就是说，优秀的程序通常只需要在几次对弈之后就能被清晰地辨识出来，而那些复杂的策略却并没有令人满意的得分。一报还一报策略显然就具备清晰性特点，在应用这一策略后，对手很容易发现其中的规律，并明白只有主动与对方合作才能赢得合作。

博弈中合作的过程和规律

罗伯特·阿克塞尔罗德在静态群体中研究博弈论，最终得到的最优策略是一报还一报策略。那么作为获得最高分的策略，一报还一报策略在动态群体中是否也是最优的呢？假设博弈的参与者们是一个动态进化的群体，那么其中是否会产生一报还一报的合作者？他们是否能发展和生存下去呢？一个生物群体是倾向于进化成相互合作的群体，还是倾向于进化成不合作的群体呢？假如所有的成员在最初都是不合作的，那么他们是否会在生存发展的道路上进化成相互合作的呢？罗伯特·阿克塞尔罗德提出了这些有深度的问题，并运用生态学原理进行了他的第三次实验。

罗伯特·阿克塞尔罗德首先假设参与者组成的群体是动态进化的，他们会一代接着一代发展进化下去。接着，他又制定了进化的规则：第一，所有参与者在进化的过程中都会有试错行为。参与者在一个陌生环境中不知道该怎么做，他只能不断进行尝试，若某种尝试后的结果是好的，他就会照着这个尝试的方法继续做下去。第二，参与者之间会有遗传现象。如果一个人本身是爱合作的，那么他的后代就会拥有更多的合作基因。第三，每一个参与者都具备学习性。对参与者来说，对局过程也是一个相互学习的过程，比如一报还一报策略优秀，参与者就会学习这种策略。

在第三次实验中，罗伯特·阿克塞尔罗德规定，参与者在第一轮得分越高，其在第二轮中所占比例就越高，之后每一轮以此类推。这样一来，群体的结构就会随之改变，通过最终的结果能够分析出群体进化的方向。最优的一报还一报策略最初只占群体总份额的1/63，进化1000代后，其份额占到了总体的24%。不过，也有一些程序在后代中所占份额是逐渐下降，甚至完全消失的。前15名程序中唯一不善良的程序，其策略是先合作，若对手一直选择合作，它就突然尝试一次不合作；当对手立刻报复它时，它又立刻与其合作；若对手继续合作，它又会突然背叛。这个不善良程序凭借它最开始的分数优势在接下来的进化中有着一定的发展，但等到一些程序消失时，它在群体中所占的比例便开始下降了。通过对这样的合作系数的测量，可以得出结论——群体中的合作是逐渐扩大化的，或者说，群体是向着越来越合作进化的。

罗伯特·阿克塞尔罗德的进化实验说明了这样的道理：优秀的策略总是建立在别人成功的基础之上的。虽然一报还一报策略在两人博弈中无法获得超越对手的分数，利用这个策略最多和对方打个平手，但是对于团体来说，它所得到的分数却是最高的。一报还一报策略能够使参与者稳定地生存下去，这是因为它总能让对手获得高分。而前15名中那个不善良程序总是让自己得到高分，使对方得低分，它总是把自己的利益建立在别人的损失之上，即使它能在一段时间内继续生存，但当那些失败者被淘汰之后，这个投机取巧、爱占别人便宜的成功者也会被淘汰。

如果把坚持一报还一报策略的参与者放入一个极端自私自利的群体中，他是否能生存下去呢？如果得分矩阵是一定的，未来的折现系数也是一定的，那么由此可以计算出只要该群体中有至少5%的成员坚持使用一报还一报的策略，那么这些“善良的”合作者就能一直生存发展下去。更为有趣的是，只要这些合作者所得分数高于群体平均分，他们在群体中就会逐渐壮大，直到取代整个群体。从反向来看，即使不合作者在一个群体中占有较大比例，他们也不会在未来的进化中一直增长下去。这说明社会群体是向着合作方向进化的，且这个进化的大方向是不可逆转的，随着群体的发展，他们的合作性会越来越大。毫无疑问，这是一个十分鼓舞人心的结论，罗伯特·阿克塞尔罗德用这个结论成功地解决了与“囚徒困境”相同的难题。

罗伯特·阿克塞尔罗德的研究揭示了合作的必要条件：第一个条件是博弈要持续进行下去，参与者在一次或几次的博弈中是找不到合作动机的；第二个条件是决策者要对对手的行为做出回报，这个回报可以是好的，也可以是坏的，若一个人永远选择合作，那么是不会有太多人与他合作的。

合作性的提高第一是要建立在持久的关系上，爱情很美好，但恋人之间的合作也需要建立在婚姻契约上才能长久。第二是每一个想提高合作性的人都要提高识别别人行动的能力，如果你连对方是否合作都搞不清楚，你便没法对他的行为做出回报。第三是要说到做到，信誉第一，若别人在比赛的某一回合对你采取不合作策略，你承诺在下一轮比赛中也不与他合作，就一定要做到，让别人知道你是个不好惹的人，就不敢不与你合作。第四是避免一次性对局，能多次完成的对局要尽量分步完成。这样做的好处在于可以使对弈双方长久地维持关系，如此才有合作的可能，比如在贸易谈判的过程中尽量多步骤进行，这样可以一步步敦促别人与你合作。第五是对于别人的成功不要嫉妒，对于别人的失败不要落井下石。第六是不要主动背叛别人，避免成为罪魁祸首，成为众矢之的。第七是不仅要对合作予以回报，也要对背叛进行回报。第八是不要贪小便宜，不会有人与耍小聪明占别人便宜的人合作。

通过对博弈论中合作问题的研究，罗伯特·阿克塞尔罗德发现了两个规律，第一个规律是合作不仅能发生在友人之间，也能发生在敌人之间。在博弈中，友谊不能保证持续的合作，因为它不能作为合作的必要条件。而如果敌人之间能在持续的关系中满足相互回报的条件，他们也能进行合作。举例来说，在第一次世界大战中，德军和英军交战时遇到了连续的阴雨天气，结果在三个月的交战中，双方达成了一种默契——不攻击对方的粮草，直到大反攻时才决一死战。所以，友谊不是合作的前提，敌对不代表不会合作。第二个规律是不能把预见性看作合作的前提，低等动物之间可以进行合作，甚至低等植物之间也能进行合作，这些生物并没有预见性。然而，人类是有预见性的动物，若在了解合作规律的情况下，人类的这种预见性可以加快合作的进程。所以，这个时候预见性和学习都是有用的。

如果博弈中出现随机干扰，比如参与者因为误会而相互背叛时，背叛者采取悔过的一报还一报，被背叛者采用修正的一报还一报以使群体利益最大化。所谓悔过的一报还一报，就是指参与者对对方的背叛行为有一定概率不予以报复。所谓修正的一报还一报，指的是参与者有一定概率主动停止背叛别人。群体成员随机应变的能力越强，这两种策略的效果越好。

阿克塞尔罗德在研究如何突破囚徒困境时，引入了合作概念，他不仅继承了传统的数学化方法来实行这一研究，还与时俱进地借助计算机化的方法将这项研究提高到了一个全新的境界。就如何突破囚徒困境，他给出的证明是令人信服的，至少很少有博弈专家能雄辩过他。他用计算机模拟整个博弈过程，为我们得出了一些惊人的结论，他让我们明白了，总得分最高并不意味着在每一次博弈中都要拿到最高分。

从社会学的角度来看，阿克塞尔罗德得出的最优的一报还一报策略是一种互惠式利他。参与者实行这一策略的动机在于个人私利，不过最终的结果却是博弈的双方都能获利。这种策略几乎覆盖了人类的整个社会生活。人们常常通过送礼和回报的方式来进行交流与合作，这似乎早已成为一种生活秩序，即使相互隔绝、无法用语言交流的人群也很容易理解这种秩序。例如，哥伦布在发现美洲大陆后，最初与那里的印第安人交往的方式就是互赠礼物。无偿捐款看似是一种纯粹的利他行为，但这种行为也可能间接地得到回报，比如它能为捐款者赢得社会声誉等。这些有趣的行为蕴含了生活的哲理，它们能帮助我们理解社会生活，具有非凡的意义。

增加囚徒困境的参与者，将它扩展成多人博弈，就能引申出一个更广泛的话题，即社会资源悖论。地球上的资源是有限的，人类所能分配使用的资源也是有限的。人们都希望从有限的资源中多分一些，这就导致了利益纷争，个人利益与群体利益的冲突早已屡见不鲜。利用“社会资源悖论”可以解释许多现实问题，比如资源危机、交通堵塞、人口问题等。解决这些问题的方法在于建立规则，控制每个人的行为。

中国传统道德文化中有许多思想与阿克塞尔罗德的一报还一报策略相对应，比如投桃报李、人不犯我我不犯人都是该策略的典型体现。由于现实社会生活中充满了随机性，所以这些策略都不能成为最优策略，这正是一报还一报在多变环境中的缺陷所在。圣贤孔子曾提出人与人之间应该以德报德，以直报怨的观点，这是一种修正的一报还一报策略，其先进程度提前了几千年。“直”的意思是公正，“以直报怨”就是用公正来回报背叛，其所修正的是惩罚背叛者的程度。依据公正的原则，本来要罚背叛者10分，现在只需罚其5分。这样做可以结束世代循环报复的魔咒，让文明得以形成。

不过，阿克塞尔罗德的研究是建立在相对理想的假设基础之上的，这使得相关的研究难免会与社会脱节。在阿克塞尔罗德的研究中，他假定了个体之间的博弈完全不存在差异，而现实生活中这种个体之间的公平是难以达到的。在现实生活中，参与博弈的人可能存在着实力上的差异，当两者相互背叛时，可能是强者得3分，弱者得0分，而不是两者每人得一分。这样一来，弱者的报复对强者不起作用，报复也就丧失了意义。假如博弈双方的实力确实旗鼓相当，但一方存在赌徒心理，认定自己比对方实力更强，只要采取背叛就能占得便宜，那么在这样的情形中，阿克塞尔罗德的得分矩阵就是不适用的。若这种赌徒心理不断蔓延，势必会引发许多零和博弈，这也是现实中经常会有的情况。所以，阿克塞尔罗德的程序还能根据这些特殊情况继续改进。

有不少人支持阿克塞尔罗德的一报还一报结论，但也有人对他的观念产生了质疑，比如阿克塞尔罗德坚持认为合作不需要信任，也不需要预期就是被诟病最多的地方。人们习惯根据对手之前的策略来安排战术，合作者希望识别与其产生相互作用的个体和历史，以便根据预期做出反应。在复杂的环境中，信任可能促成合作，或者成为合作的必要条件，但将预期和信任反映于计算机程序是有待研究的。

现实生活中存在的博弈大多数是一次性博弈，这种博弈引发不合作是常有的事情。重复博弈的例子很少或很难实现，参与者在遭到背叛后往往没有机会给予反击，甚至毫无还手之力，比如核威慑、资本实力悬殊的违约行为等。这时就要引入法律手段，用法律的惩罚来取代一报还一报，实现依法治国，以法律促进合作。

博弈论的应用

博弈论在现实生活中具体化的应用主要是在企业经营和管理中的应用。

首先来看博弈论在企业经营活动中是如何应用的。

波特五力分析模型是由哈佛商学院教授迈克尔·波特提出的一项用于分析市场竞争和态势的模型。该模型中有一个特别有意思的概念，叫作潜在进入者的危险。我们知道市场类型主要有四大类：完全竞争市场、垄断竞争市场、完全垄断市场和寡头垄断市场。各大行业市场中多数是垄断竞争市场。垄断竞争市场遵循优胜劣汰原则，有新企业进入市场，也有旧企业退出。于是现有企业与新进入企业之间就产生了博弈，两者的博弈取决于资源控制、企业市场优势、规模经济效益等因素。

如果你是现有市场中的行业垄断者，为了防止潜在竞争者进入市场，你会采取怎样的策略呢？

你可以用以下几个博弈策略来保障自身利益。

策略一：扩大生产能力。

垄断者对潜在进入者实行威胁策略，目的是为了防止他们进入市场。但要达到目的，这种威胁要具备可信度，这主要取决于垄断者的承诺。为此，垄断者要研究让威胁变得可信的条件是什么。一般来说，若垄断者不实行这种威胁，他就会遭受更大的损失。实行威胁策略需要承诺行动，这就意味着要付出成本，而空头威胁无任何成本，所以这种“威胁”无法有效阻止潜在竞争者进入市场。企业发一个声明进行自我标榜或宣称将要做什么是非常容易的，但它们很难带来实质性的效果。因此，对局者必须采取具有较高成本或要付出较高代价的行动，他的威胁才能变得可信。

策略二：保证最低价格。

保证最低价格就是要限制性定价。若潜在进入者的产品定价是A，那么企业只需要将产品定价低于A，就能防范其进入市场。如某家电商家以低价出售一批高端配置电脑，并承诺在未来一周内若其他商家以更低价格出售相同商品，就会退还全部差价并按照差价额的20%予以补偿。例如，一个消费者在该商店用10000元购买了一款电脑，三天后，其他商店相同的电脑指定价5000元，那么这个消费者就能向原商家申请补差价和赔偿。它不仅能获得5000元的退款，还能获得1000元的补偿。

假设一个企业面临一个存在两期的市场，会做出以下选择：

第一期定价100元，并以垄断高价获利20000元。潜在企业见到该行业有利可图就会选择在第二期进入市场。当两大企业都售卖相同商品时，其价格会降为50元，利润变为10000元。于是，该企业两期市场总共获利：20000+10000=30000元。

为了防止潜在企业进入市场，该企业在第一期制定低价60元，获利15000元，潜在企业进入市场后，价格降为30元，两个企业的利润都为0。

潜在企业不会在该企业制定低价后进入市场，因为它明白即使进入第二期市场，其利润也是0。这样该企业就能确保在第二期制定一个垄断高价100元，因此其两期总利润为15000+20000=35000元。

企业的最低价条款可以使消费者在未来一周内不因商品降价而后悔购买商品，这不仅是对消费者的一种承诺，也是对竞争者的一种警告。商家向消费者的承诺一旦公布便不得不实行，否则就会受到法律的制裁，这就保证了该承诺具备了绝对可信度。同时，商家对其他商家发出的不要降价竞争的威胁也会达到其预期效果。

策略三：掠夺性定价。

企业把产品价格制定为成本价以下，让潜在竞争者认为无利可图，从而打消其进入市场的可能。这样一来，就能达到驱逐其他企业的目的。而当竞争对手被驱逐到市场外后，企业就能利用自身在市场内的垄断地位回调价格，并以垄断高价弥补前期的损失。掠夺性定价也可称为价格报复策略。限制定价针对的是还未进入商场的潜在竞争对手，其目的是以一段时间内维持低价来打消潜在对手进入市场，而掠夺性定价针对的是即将或已经踏入行业市场的新企业，例如你在新企业进入时扩张产能，使行业的产能过剩，并以超低价竞争，往往就能防止新企业进入。

策略四：广告战博弈。

在商业圈内，优秀的商品不计其数，有些商品看起来其貌不扬，只有真正使用过后，人们才知道它的价值如何、质量如何。企业家们形象地将这类商品称为经验品。如果一个企业的产品质量堪忧，那么它一般不会去做巨额广告，因为低质量经验品很少能吸引回头客，它明白自己没有强硬的筹码去博弈。那些能生产出高质量经验品的企业才是巨额广告的金主，这些企业的底气在于高质量经验品往往能吸引大量的回头客。

古诺模型和伯川德模型是用来描述企业之间产量竞争博弈、价格竞争博弈的有效模型。无论从宏观层面还是从微观层面，博弈论对企业制定竞争策略都有指导意义。在当今激烈的市场竞争中，利用博弈论思想来经营和管理企业越来越受到企业家们的青睐，商业博弈的艺术不仅能带来名誉，还能带来切实的利益。

其次，我们再来看一看博弈论在企业管理中是如何应用的。

市场经济的发展促使商业竞争日益加剧，在现代企业的经验决策中，博弈论的地位日益提高。行业内大大小小的企业之间都存在竞争，但主要表现在为首的几大企业或集团之间的对抗。这些竞争都能归结为博弈问题，若企业能运用博弈论模型进行决策，将会使决策变得更加合理。各种社会竞争的加剧，让人们开始追求效率、执行力和理性决策，这些方面都充满了博弈思想。

为实现自身利益的最大化，企业要根据市场情形做出最优决策。很多企业会在做出决策行为之前热衷于进行市场调研，不同的市场情形对带来不同的决策。例如，企业在完全竞争市场和寡头市场中所做的决策往往是不一样的。在完全竞争市场中，若一种商品的市场价格是给定的，企业就会根据该价格进行博弈模型的计算，从而决定生产多少产品和向市场供应多少产品。但在寡头市场中所遇到的情况就会复杂很多。企业所要面对的市场信息是不完全的，面对各种强大的竞争对手，企业的决策能力有限，但是市场时效性又会逼着企业做出决策。不过，企业可以在这种情况下做出三个合理假设：

第一是使自身成为理性的经济人，一切行动都要以利润最大化为出发点。

第二是要以他人的生存为自己的决策前提，不能盲目做出决策。与他人建立相互依赖关系或合作关系，使决策能对其他主体产生影响，同时其他主体的决策也能影响自身的决策。

第三是建立寡头市场情态。若行业内只有少数几家企业，则每个企业的市场份额就会变大，在竞争对手较少的情形中，每个企业的行为都会产生较大的相互影响，其中的决策就会充满博弈色彩。

企业在决策过程中要充分考虑均衡问题。在企业博弈中，每一个理性决策者都要在其他参与者反应的基础上来确定自己的理想行动方案。若每一个参与者共同产生的结果是均衡的，那就说明局中人的策略组合是最优的。这个均衡的结果既不意味着每个局中人能获得最大化利益，也不意味着整体能获得最大化利益，它只是一种给定条件下的必然结果。若这个均衡被一方打破，它就可能获得一个更差的结果。近年来，博弈论越来越受到商业界人士的重视，通过调整决策达到合作共赢逐渐成为市场的主流。

如果没有博弈论的研究成功，人们对现代社会竞争和冲突这些现象的理解将处于一个非常浅薄的阶段。正是有了博弈论的研究结果，我们才能受到启发，在现实生活中努力寻求合作共赢。

企业是社会的重要组成单元，要想构建和谐社会，企业需要承担起相应的责任。企业要想实现和谐的目标，就需要以服务社会为宗旨，以公平诚信为原则，以安全环保为基础，以协调有序为保障，以依法治企为根本，以科学发展为目标。这就要求企业建立一个长期有效的协调机制，实现内外环境的和谐，将企业效益和社会效益相统一，从而使企业获得可持续发展。

市场经济中的每一方都在为自身利益而奋斗，不管个人还是企业都会在各自所在的环境中进行大大小小的博弈，而在博弈当中，冲突和矛盾是难以避免的。

随着社会企业现代化进程的加快，企业分工、员工收入、社会保障等诸多领域的矛盾越来越多，越来越复杂，忽视差距和矛盾，否认博弈的现实只能让问题变得尖锐化，所以无论企业还是个人都应该客观看待差别，正视现有的矛盾，用博弈的思路和合作的方式来面对未来。

那么，在博弈中，什么是各方达成协议的基础呢？没有规矩不成方圆，任何情况下都有规则的约束。所以达成协议的首要基础是规则的透明，它也是人们互相信任的首要条件。除了规则透明外，诚实守信也是合作的基础。对政府管理者来说，保证公开、公正执法是取得人民信任的前提；对企业管理者来说，取得员工的拥护和信任是实行企业决策的前提；对竞争企业来说，讲求诚信、公平、公正，才能在行业内立得住、站得稳。若规则不透明，就会产生信任危机，管理者就不能与群众或员工达成共识，社会或企业就不可能向着和谐、稳定迈进。

企业之间的和谐要建立在合作共赢上。作为博弈的参与者，各企业要达成协议，需要各方面都能接受，而不一定要求各方利益均等。在实现和谐的道路上，企业要制定合理的制度用以解决问题，而制度的建立需要利用科学的手段才能实现。企业之间一旦达成合作，就要约束好自身行为，不能想怎么样就怎么样，共赢是双方共同的目标，也是合作的最终目的，它能引导和督促双方向着共同的利益迈进。如果不能保障各方共赢，合作就会产生裂缝，背叛的一方就得不到各方的支持，企业也就无法达到和谐、稳定的状态，甚至还可能导致严重的问题。

在博弈中，经济利益只是构建和谐的部分因素，却不是全部因素。人文因素也是构建社会和谐的基石。企业管理者要多与员工沟通，多了解他们的非经济需求，体现人文关怀，这对促进社会和谐同样非常重要。

第3章 导读

第3章导读