1704417600
在本章中,我们讨论如下简单形式的博弈:开始时由参与者同时选择行动,然后根据所有参与者的选择,每个参与者得到各自的结果(一定的收益或支出)。在此类静态(即各方同时行动)的博弈中,我们的分析又仅限于完全信息博弈的情况,即每一参与者的收益函数(根据所有参与者选择行动的不同组合决定某一参与者收益的函数)在所有参与者之间是共同知识(common knowledge)。我们在本书的第2章和第4章讨论动态(即序贯行动)博弈,在本书的第3章和第4章分析不完全信息博弈(博弈中的一些参与者不知道其他参与者的收益函数,如拍卖中每一人都不清楚其他人到底愿意为拍卖品出多高的价格)。
1704417601
1704417602
在第1.1节首先介绍博弈论入门的两个最基本问题:如何描述一个博弈问题以及如何求得博弈问题的解。我们定义博弈的标准式表述和严格劣战略的概念,并说明有些博弈问题只要运用理性参与者绝不会使用严格劣战略这一原则,就可得到解决,但此原则在其他博弈问题中也可能出现非常不精确的预测(像任何结果都有可能发生之类)。接着,我们引出纳什均衡的概念并给出定义——这一概念的用途很广,对很多类型的博弈都能作出较为严格的预测。
1704417603
1704417604
在第1.2节我们运用前面介绍的工具,分析其四个应用模型:古诺(Cournot,1838)的不完全竞争模型,贝特兰德(Bertrand,1883)的不完全竞争模型,法伯(Farber,1980)的最后要价仲裁和公共财产问题(休谟(Hume),1739年提出了此类问题,以后又不断被经济学家提出讨论)。在每一应用例子中,我们先把问题的非标准描述转化为博弈的标准式,其后再解出该博弈的纳什均衡。(上面每一例子都存在惟一的纳什均衡,但我们讨论的范围却不限于此。)
1704417605
1704417606
在第1.3节重回理论分析。首先我们定义混合战略(Mixed strategy),它可理解为一个参与者并不能确定其他参与者将会如何行动,然后引出并讨论纳什定理,该定理保证了在非常广泛的博弈类型中都存在着纳什均衡(也许会是混合战略均衡)。由于我们在第1.1节介绍了最基本的理论,在第1.2节安排了应用举例,最后在第1.3节又给出了更进一步的理论内容,显然,在第1.3节中更深入的理论探讨,对第1.2节例子的理解并不是必须的前提,混合战略的概念和均衡的存在性在以后各章中都时有提及。
1704417607
1704417608
本章及其后各章后面均附有习题、建议以及进一步的阅读资料及参考文献目录。
1704417609
1704417610
1704417611
1704417612
1704417614
博弈论基础 1.1 基础理论:博弈的标准式和纳什均衡
1704417615
1704417617
1.1.A 博弈的标准式表述
1704417618
1704417619
在博弈的标准式表述中,每一参与者同时选择一个战略,所有参与者选择战略的组合决定了每个参与者的收益。我们借一个经典的例子说明博弈的标准式——囚徒困境。两个犯罪嫌疑人被捕并受到指控,但除非至少一个人招认犯罪,警方并无充足证据将其按罪判刑。警方把他们关入不同牢室,并对他们说明不同行动带来的后果。如果两人都不坦白,将均被判为轻度犯罪,入狱一个月;如果双方都坦白招认,都将被判入狱6个月;最后,如果一人招认而另一人拒不坦白,招认的一方将马上获释,而另一人将判入狱9个月——所犯罪行6个月,干扰司法加判3个月。
1704417620
1704417621
囚徒面临的问题可用下图所示的双变量矩阵表来描述。(正如同一个矩阵一样,双变量矩阵可由任意多的行和列组成,“双变量”指的是在两个参与者的博弈中,每一单元格有两个数字——分别表示两个参与者的收益)
1704417622
1704417623
1704417624
1704417625
1704417626
囚徒的困境
1704417627
1704417628
在此博弈中,每一囚徒有两种战略可供选择:坦白(或招认)、不坦白(或沉默),在一组特定的战略组合被选定后,两人的收益由上图双变量矩阵中相应单元的数据所表示。习惯上,横行代表的参与者(此例中为囚徒1)的收益在两个数字中放前面,列代表的参与者(此例为囚徒2)的收益置于其后。这样,如果囚徒1选择沉默,囚徒2选择招认,囚徒1的收益就是-9(代表服刑9个月),囚徒2的收益为0(代表马上开释)。
1704417629
1704417630
现在我们回到一般情况。博弈的标准式表述包括:(1)博弈的参与者,(2)每一参与者可供选择的战略集,(3)针对所有参与者可能选择的战略组合,每一个参与者获得的收益。我们后面将经常讨论到n个参与者的博弈,其中参与者从1到n排序,设其中任一参与者的序号为i,令Si代表参与者i可以选择的战略集合(称为i的战略空间),其中任意一个特定的战略用si表示(有时我们写成si∈Si表示战略si是战略集Si中的要素)。令(s1,…,sn)表示每个参与者选定一个战略形成的战略组合,ui表示第i个参与者的收益函数,ui(s1,…,sn)即为参与者选择战略(s1,…,sn)时第i个参与者的收益。将上述内容综合起来,我们得到:
1704417631
1704417632
定义 在一个n人博弈的标准式表述中,参与者的战略空间为S1,…,Sn,收益函数为u1,…,un,我们用G={S1,…,Sn;u1,…,un}表示此博弈。
1704417633
1704417634
尽管我们曾提到在博弈的标准式中,参与者是同时选择战略的,但这并不意味着各方的行动也必须是同时的:只要是每一参与者在选择行动时不知道其他参与者的选择就足够了,像上例中牢里分开关押的囚徒可以在任何时间作出他们的选择。更进一步,尽管在本章中博弈的标准式只用来表示参与者行动时不清楚他人选择的静态博弈,但在第2章中我们就会看到标准式也可用来表示序贯行动的博弈,只不过另一种变通的方式——博弈的扩展式表述更为常用,它在分析动态问题时也更为方便。
1704417635
1704417637
1.1.B 重复剔除严格劣战略
1704417638
1704417639
上节已讲过一个博弈的表述方法,下面开始介绍如何着手分析一个博弈论问题。我们从囚徒的困境这个例子开始,因为它较为简单,只需用到理性的参与者不会选择严格劣战略这一原则。
1704417640
1704417641
在囚徒的困境中,如果一个嫌疑犯选择了招认,那么另一人也会选择招认,被判刑6个月,而不会选择沉默从而坐9个月的牢;相似地,如果一个嫌疑犯选择沉默,另一人还是会选择招认,这样会马上获释,而不会选择沉默在牢里渡过一个月。这样,对第i个囚徒讲,沉默相比招认来说是劣战略——对囚徒j可以选择的每一战略,囚徒i选择沉默的收益都低于选择招认的收益。(对任何双变量矩阵,上例中的收益的具体数字0,-1,-6,-9换成任意的T、R、P、S,只要满足T>R>P>S,上述结论依然成立。)更为一般地:
1704417642
1704417643
定义 在标准式的博弈G={S1,…,Sn;u1,…,un}中,令s’i和s”i代表参与者i的两个可行战略(即s’i和s”i;是Si中的元素)。如果对其他参与者每一个可能的战略组合,i选择s’i的收益都小于其选择s”i的收益,则称战略s’i相对于战略s”i是严格劣战略:
1704417644
1704417645
ui(s1,…,Si-1,s’i,si+l,…,Sn)<ui(s1,…,si-1,s”i,si+1,…,sn). (DS)
1704417646
1704417647
对其他参与者在其战略空间S1,…,Si-1,Si+1,…,Sn中每一组可能的战略(s1,…,Si-1,si+1,…,sn)都成立。
1704417648
1704417649
理性的参与者不会选择严格劣战略,因为他(对其他人选择的战略)无法作出这样的推断,使这一战略成为他的最优反应。[1]这样,在囚徒的困境中,一个理性的参与人会选择招认,于是(招认,招认)就成为两个理性参与者的结果,尽管(招认,招认)带给双方的福利都比(沉默,沉默)要低。囚徒的困境的例子还有很多应用,我们将在第2章和第4章讨论它的变型。现在,我们来看理性参与者不选择严格劣战略这一原则是否能解决其他博弈问题。
[
上一页 ]
[ :1.7044176e+09 ]
[
下一页 ]