1.2 偏好、效用、期望效用理论简述_博弈论-QQ阅读武侠男生网

上QQ阅读APP看书，第一时间看更新

1.2 偏好、效用、期望效用理论简述

为了讲清楚效用（utility）与期望效用（expected utility）的有关概念，我们先看一个简单例子。

【例1-1】一个工人与老板签订薪酬合约，老板提出两个方案：

方案1：企业绩效高时月薪10000元，企业绩效低时月薪为0元；

方案2：不管企业绩效如何，月薪固定为4500元。

假定企业绩效高或低的概率各占50%，工人会选择哪个方案呢？

【分析】从表面看，方案1给予工人每月的平均薪酬为5000元，高于方案2给予的月薪。但仔细想一下，如果工人每月的收入全靠薪酬，选择方案1时要冒很大的风险，因为如果企业连续几个月绩效不好，工人就没有办法维持生计。下面介绍期望效用理论可以论证：厌恶风险的工人往往宁愿选择方案2。

1.2.1 偏好和效用

因本书以讨论经济学中的博弈论为主，我们先学习一下关于经济人决策的理论。经济人每项经济活动根据决策的不同会得到不同的结果，这些结果可以是一笔财富，也可以是一个消费篮子，等等。

假定在一定条件下，某决策者的各种决策可导出的所有结果构成集合S，于是每个结果就是S的一个元素。在很多情况下，S是某个有限维向量空间（finite-dimensional vector space）的一个凸子集（convex subset）：如果a和b都是S的元素，那么对任意实数r∈［0，1］，ra+（1-r）b也是S的元素。这里ra+（1-r）b称为a和b的一个凸组合（convex combination）。

作为例子，假设某消费者消费食物和衣物，S包含的每个元素（x，y）都包含一定数量x的食物和一定数量y的衣物。如果a=（2，4）和b=（4，2）是两个消费篮子，那么c=0.5a+0.5b=（3，3）也是一个消费篮子。

经济人如何决策依赖于他对S中结果的偏好（preference），即他比较不同结果的准则。我们通常假定决策者的偏好满足下面五个公理：

完全性：任给S的两个结果a、b，对它来说下面三种情况有一种而且只有一种成立：①a比b好；②a和b一样好；③b比a好。当①或②成立时又称“a不比b差”。

传递性：任给S的三个结果a，b，c，如果b不比a差而c不比b差，则c不比a差。

凸性：如果a不比b差，那么a和b的任何凸组合ra+（1-r）b也不比b差。

连续性：如果一个收敛序列{a（n）}中每一个结果都不差于b，那么这个序列的极限a也不差于b。

单调性：如果结果a的每个分量都不小于b的对应分量，那么a不差于b；如果a的每个分量都大于b的对应分量，那么a比b好。

数学上可以严格证明[1]：当经济人的偏好满足上述五个公理时，存在一个定义在S上的实值递增函数u，满足u（a）≥u（b）当且仅当a不比b差。函数u称为这个经济人的效用函数。于是，在其他条件相同的情况下，经济人在决策时总是追求效用最大化。

一个偏好可以用许多不同的效用函数表示，事实上，如果u是表示某偏好的效用函数，那么对任何严格增函数k，k与u的复合函数也表示同样的偏好，因为u（a）≥u（b）⇔k（u（a））≥k（u（b））。[2]作为例子，如果函数u表示某个经济人的偏好，那么函数v=u3也表示同一偏好。

1.2.2 不确定性与期望效用

当经济环境有不确定性（uncertainty）时，经济人决策的结果可能也不确定。可以证明，在满足某些一般条件之下，经济人在不确定环境下的决策行为可以用期望效用最大化（maximization of expected utility）加以解析。

如果决策在经济环境的几个不同状态下得出几个不同结果a，b，…，设这些不同状态发生的概率分别是p，q，…，那么得到的期望效用[3]就是U=pu（a）+qu（b）+…

特别地，如果经济人在不同环境状态下得到的是不同数量的财富，比如说金钱的数量是随机变量X，它的分布函数是F，那么经济人的期望效用就是[4]

U（F）=∫u（x）dF（x）

这里u（x）是一定数量的金钱x给他的效用，u（x）叫作伯努利（Bernoulli）效用函数，U叫作冯·诺依曼-摩根斯坦（von Neumann-Morgenstern）期望效用函数。

定义1-1 我们通常把上文中的金钱随机变量连同其分布函数（X，F）叫作彩票（lottery），这张彩票的期望值（expected value）是固定数量的金钱，定义为：

E（X）=∫xdF（x）

定义1-2 一张彩票（X，F）是非退化的（non-degenerate），如果X至少在两个不同状态下给出不同数量的金钱。如果任何非退化的彩票（X，F）对某经济人都有u（E（X））＞U（F），即他总是喜欢彩票期望值甚于彩票本身，就称他是风险厌恶的（risk averse）；如果任何彩票（X，F）对这个经济人都有u（E（X））=U（F），即他觉得彩票本身和彩票的期望值一样好，就称他是风险中性的（risk neutral）；如果任何非退化的彩票（X，F）对这个经济人都有u（E（X））＜U（F），即他总是喜欢彩票本身甚于彩票的期望值，就称他是风险偏好的（risk loving）。

风险厌恶的经济人其伯努利效用函数是凹函数（concave functions），风险中性的经济人其伯努利效用函数是线性函数，风险偏好的经济人其伯努利效用函数是凸函数（convex functions）。

表示一个不确定环境下对彩票的偏好可以有很多不同的期望效用函数，它们分别对应于不同的伯努利效用函数。事实上，如果u是表示这个偏好的期望效用U的伯努利效用函数，那么对任何正实数α和任何实数β，v=αu+β也是表示同样偏好的伯努利效用函数，相应的期望效用V满足：V（L）=αU（L）+β。[5]

注意：在没有不确定性的经济环境下，表示偏好的效用函数是序数性的（ordinal），它只表明某个经济人对不同市场篮子排列的好坏顺序。正因如此，把效用函数u复合上一个严格递增函数，复合函数依然表示同一偏好（比如v=u3）。

另一方面，在有不确定性的经济环境下，表示偏好的伯努利效用函数是基数性的（cardinal），它不单表示出不同经济结果的好坏顺序，同时还表示出不同结果的好坏相差多少。特别是，如果两个伯努利效用函数u、v表示同一偏好，那么对于三个不同的经济结果w₁、w₂、w₃，有：u（w₁）-u（w₂）=u（w₂）-u（w₃）；当且仅当v（w₁）-v（w₂）=v（w₂）-v（w₃）。

作为例子，我们说明，在有不确定性的经济环境之下，伯努利效用函数u=w1/2和伯努利效用函数v=u3=w3/2事实上代表完全不同的偏好。我们来比较下面两个结果。

A=得到2美元，L=得到0美元或4美元机会各一半。

按照期望效用U，有，U（L）=1，所以经济人选A；按照期望效用V，有，V（L）=4，所以经济人选L。聪明的读者应该都知道，u表示一个厌恶风险的偏好，而v表示一个喜好风险的偏好！

定义1-3 博弈论中在每个博弈结果处每个局中人的赢得（payoff），指的就是他在这个结果得到的效用或期望效用。

下面我们通过一系列练习题复习本节的相关概念。

练习题1-1 假设有男女两个局中人，两个局中人1和2各把1美元放在台面作为押注。局中人1从一副洗匀的扑克牌中抽取一张，私下看过牌的颜色后，决定加注（raise）1美元或者立即开牌（fold）；如果他立即开牌，当他的牌是红牌时，就把台面上的钱全部拿走，而当他的牌是黑牌时，台面上的钱归局中人2所有。如果局中人1加注1美元，局中人2可以选择跟进（meet，也加注1美元）或者认输（pass）：如果她跟进，局中人1必须立即开牌，红牌时他把台面上的钱全部拿走，黑牌时台面上的钱归局中人2所有；如果她认输，台面上的钱全部归局中人1，不管他的牌是红或黑。

【分析】我们用图1-1说明练习题1-1的博弈过程。

图1-1 两个局中人的博弈过程

因局中人1随机抽出的牌颜色是红是黑概率各占0.5，图中把颜色当作自然界（N）的选择。局中人1看牌后可以根据颜色的不同选择加注或开牌；对应于这两种情况，局中人1分别有上下两个不同的决策节点（decision nodes）：上面的节点表示他得到红牌，下面的节点表示他得到黑牌。当局中人1选择开牌时，博弈结束，局中人2没有机会决策；当局中人1选择加注时，局中人2也有上下两个决策节点，分别对应于局中人1手中的牌是红色和黑色。因为局中人2不知道局中人1手中牌的颜色，所以局中人2不知道自己是在上面的节点决策还是在下面的节点决策；正因如此，这两个节点一起用虚线连接起来，构成她唯一一个信息集（information set）。[6]

注意图1-1中我们把每个结果中每个局中人净赢的钱直接作为赢得向量的分量，这是假定了各人的效用都是财富的线性函数，即各人都是风险中性的。在一般的情况下，如果u、v分别是局中人1和2的依赖于总财富的效用函数，如果W₁、W₂分别是他们博弈前的总财富，那么图1-1中的赢得向量（2，-2）就须改为（u（W₁+2），u（W₂-2）），等等。

假设1的策略是：红牌加注，黑牌开牌；同时假定2的策略是（在1加注时）跟进。于是在一般效用函数的情况下，期望赢得向量是：0.5（u（W₁+2），v（W₂-2））+0.5（u（W₁-1），v（W₂+1））。

特别地，当双方都是风险中性时，期望赢得向量经过线性变换总可以表示为（0.5，-0.5）。[7]

练习题1-2 我们来看“1.2偏好、效用、期望效用理论简述”中提及的工人薪酬问题。

【分析】假定工人的效用函数是u（W）=W1/2。W是以元为单位的月收入。倘若工人选择方案1，所得期望效用为0.5（100001/2）+0.5（01/2）=50；如果工人选择方案2，所得效用是45001/2=67.082。显而易见，他应该选择方案2。

练习题1-3 薇姬即将从加利福尼亚大学洛杉矶分校毕业，她决定报考博士研究生。如果她读理科，将来一生净收入的贴现值为4百万美元。如果她读法律，将来她可能成为律师事务所的普通文书，也可能成为知名律师，一生净收入的贴现值分别是为2.25百万美元和36百万美元，相应的概率各为0.9和0.1。薇姬的效用函数是u（W）=W1/2（W是以百万美元为单位的财富）；如果她自己决策，她会如何决定？如果洛杉矶有个占卜先生，他能准确预言薇姬读法律后到底是能成为普通文书还是知名律师。薇姬应该最高愿意付多少钱找他占卜？

【分析】如果薇姬自己决策，读理科时她得到的效用是41/2=2；读法律时，她得到的期望效用是0.9×（2.251/2）+0.1×（361/2）=1.95；所以她会读理科。如果她算命，当算命先生告诉她读法律将来只能当文书时（概率0.9）她就读理科；当算命先生告诉她读法律将来能成为知名律师时（概率0.1）她就读法律。假设算命费为f百万美元，这时她的期望效用为：0.9（4-f）1/2+0.1（36-f）1/2。当且仅当0.9（4-f）1/2+0.1（36-f）1/2＞2时，（即只要f<1.53时！）薇姬就会去算命。

用通俗的话说，“算命”虽然不能改变“吉”或“凶”发生的概率，但能帮助人们对将会发生的情况做好应对，即所谓“趋吉避凶”。这个例子虽然是虚构的，但从中可以看到信息对决策的重大影响。

练习题1-4 一个老婆婆从超市买了24个鸡蛋回家。因为结冰路面很滑，她走一趟在路上滑倒把鸡蛋全部打碎的概率是0.5。假设滑倒时不会造成其他伤害，且老婆婆不在乎走一趟还是两趟，她应该一趟把全部鸡蛋拿回家还是应该分两趟？

【分析】假设老婆婆厌恶风险，她的效用函数u是严格凹函数的。走一趟时她的期望效用是：

U₁=0.5u（12）+0.5u（0）

图1-2 复合彩票树形图

走两趟时她的“财富”可用下面的复合彩票树形图（见图1-2）来表示：从左往右看树形图，第一个节点表示老婆婆第一轮捧着6个鸡蛋走回家，如果没跌倒，到家时有6个鸡蛋；如果跌倒，到家时只有0个鸡蛋。再往右看，上下两个节点各表示第一轮得到不同结果后，老婆婆第二轮捧另外6个鸡蛋回家的情况。括号内的数字是事件发生的概率。节点上的数字分别表示各种情况下老婆婆最终得到的鸡蛋数目。

斜向上的短线表示“没跌倒”，斜向下的短线表示“跌倒”，相应的概率都是0.5，而每条路径出现的概率都是0.25。于是她的期望效用是：

U₂=0.25u（12）+9.5u（6）+0.25u（0）

由计算以及u的严格凹性质：

U₂-U₁=0.5［u（6）-（0.5u（12）+0.5u（0））］＞0[8]

即老婆婆应该走两趟。

[1] 参看Jehle & Reny 2011年英文版14页定理1.1。

[2] ⇔表示两边的式子互相蕴含或等价。

[3] 参看Jehle & Reny 2011年英文版2.4节。

[4] 本书的数学符号在行文内一般用正体英文和希腊字母，在方程式或公式中一般用斜体字母，但偶有例外。好在连贯前后文阅读不会引起误解。

[5] 可以证明，伯努利效用函数u、v导出有不确定性的经济环境下的同一偏好，当且仅当存在实数α＞0和实数β使得v=αu+β。

[6] 有些书把同一信息集的所有节点用封闭的虚线边界围起来，英文称为balloons（气球）；我们为作图简便，单点信息集不再用虚线包围，多点信息集则用虚线连接内中所有的节点。

[7] 这个例子将在2.1节继续讨论。

[8] 注意彩票（12，0；0.5，0.5）的期望值是6；按风险厌恶定义，老婆婆喜欢无风险的期望值甚于有风险的彩票本身。