第三节非协同博弈基础_21世纪经济与管理新兴学科教材实验经济学-QQ阅读男生轻小说网

上QQ阅读APP看书，第一时间看更新

第三节非协同博弈基础

协同博弈是博弈论中的经典理论，在很多时候我们都要对这个问题进行讨论。与协同博弈相对应的是非协同博弈。然而，这个理论也相对比较复杂，所以在这一节中我们仅仅对非协同博弈理论作一些基础的介绍，为同学们以后更深入的学习作好准备。

3.1 策略与收益函数

我们在这里的分析仅限于有限标准式博弈。准确地说，令I={1,2, …, n}表示博弈方集合，这里n是正整数。对于每个博弈方i∈I来说，令Si表示他的有限纯策略集合。为了表示的方便，我们将用正整数来表示每个博弈方的纯策略，从而，每个博弈方i∈I的纯策略集合表示为Si={1,2, …, mi}，整数mi≥2。纯策略向量s=（s1, s2, …, sn）称为纯策略组合，其中si是博弈方i∈I的纯策略。因此，博弈中的纯策略组合的集合是各博弈方纯策略集合的卡特尔积S=xiSi，有时候又被称为博弈的纯策略空间。

对任何策略组合s∈S和博弈方i∈I，令πi（s）∈R表示博弈方i相应的收益。在经济学中，收益通常是企业的利润或者是消费者的效用。对每个博弈方i∈I，实数πi（s）的有限并定义了第i个博弈方的收益函数π1:S→R。博弈的组合纯策略收益函数 π:S→Rn对每个纯策略组合 s 赋予了完全的收益向量π（s）=（π1（s）, π2（s）, …, πn（s））。

用纯策略的术语来说，标准式的博弈可以总结为一个三元组G=（I, S, π），其中，I是它的博弈方集合，S是它的纯策略空间，π是它的组合收益函数。在只有两个博弈方的特殊情形下，我们可以方便地将收益函数π1和π2分别写成一个m1×m2矩阵。我们通常将博弈方1的收益矩阵表示为A=（ahk），这里对每个h∈S1和 k∈S2, ahk=π1（h, k）；类似地，将博弈方2的收益矩阵表示为B=（bhk），这里bhk=π2（h, k）。矩阵中的每一行都对应着博弈方2的一个纯策略。任何两人博弈都可以重复地由一个对应的收益矩阵对（A, B）来表示，这里博弈方1可以被视为行博弈方，博弈方2可以被视为列博弈方。

下面，我们来看一个囚徒困境的例子。

在这个两人博弈中每个博弈方只有两个纯策略。下面的一对收益矩阵给出了典型的收益组合

显然，不论博弈方2用什么策略，博弈方1的第二个纯策略（背叛）带来的收益都高于他的第一个纯策略（合作）带来的收益；矩阵A第二行的每个元素都高于第一行对应的元素。类似地，博弈方2的第二个纯策略带来的收益高于他的第一个纯策略带来的收益；矩阵B第二列的每个元素都高于第一列对应的元素。因此，个人理性会导致每个博弈方选择他的第二个纯战略（背叛）。所谓的困境是指，如果这两个博弈方都选择他们的第一个纯策略（合作），他们都会得到更高的收益。