打字猴:1.70441762e+09

1704417620

1704417621 囚徒面临的问题可用下图所示的双变量矩阵表来描述。（正如同一个矩阵一样，双变量矩阵可由任意多的行和列组成，“双变量”指的是在两个参与者的博弈中，每一单元格有两个数字——分别表示两个参与者的收益）

1704417622

1704417623

1704417624

1704417625

1704417626 囚徒的困境

1704417627

1704417628 在此博弈中，每一囚徒有两种战略可供选择：坦白（或招认）、不坦白（或沉默），在一组特定的战略组合被选定后，两人的收益由上图双变量矩阵中相应单元的数据所表示。习惯上，横行代表的参与者（此例中为囚徒1）的收益在两个数字中放前面，列代表的参与者（此例为囚徒2）的收益置于其后。这样，如果囚徒1选择沉默，囚徒2选择招认，囚徒1的收益就是-9（代表服刑9个月），囚徒2的收益为0（代表马上开释）。

1704417629

1704417630 现在我们回到一般情况。博弈的标准式表述包括：（1）博弈的参与者，（2）每一参与者可供选择的战略集，（3）针对所有参与者可能选择的战略组合，每一个参与者获得的收益。我们后面将经常讨论到n个参与者的博弈，其中参与者从1到n排序，设其中任一参与者的序号为i，令Si代表参与者i可以选择的战略集合（称为i的战略空间），其中任意一个特定的战略用si表示（有时我们写成si∈Si表示战略si是战略集Si中的要素）。令（s1，…，sn）表示每个参与者选定一个战略形成的战略组合，ui表示第i个参与者的收益函数，ui（s1，…，sn）即为参与者选择战略（s1，…，sn）时第i个参与者的收益。将上述内容综合起来，我们得到：

1704417631

1704417632 定义在一个n人博弈的标准式表述中，参与者的战略空间为S1，…，Sn，收益函数为u1，…，un，我们用G={S1，…，Sn；u1，…，un}表示此博弈。

1704417633

1704417634 尽管我们曾提到在博弈的标准式中，参与者是同时选择战略的，但这并不意味着各方的行动也必须是同时的：只要是每一参与者在选择行动时不知道其他参与者的选择就足够了，像上例中牢里分开关押的囚徒可以在任何时间作出他们的选择。更进一步，尽管在本章中博弈的标准式只用来表示参与者行动时不清楚他人选择的静态博弈，但在第2章中我们就会看到标准式也可用来表示序贯行动的博弈，只不过另一种变通的方式——博弈的扩展式表述更为常用，它在分析动态问题时也更为方便。

1704417635

1704417636 博弈论基础 [:1704417378]

1704417637 1.1.B 重复剔除严格劣战略

1704417638

1704417639 上节已讲过一个博弈的表述方法，下面开始介绍如何着手分析一个博弈论问题。我们从囚徒的困境这个例子开始，因为它较为简单，只需用到理性的参与者不会选择严格劣战略这一原则。

1704417640

1704417641 在囚徒的困境中，如果一个嫌疑犯选择了招认，那么另一人也会选择招认，被判刑6个月，而不会选择沉默从而坐9个月的牢；相似地，如果一个嫌疑犯选择沉默，另一人还是会选择招认，这样会马上获释，而不会选择沉默在牢里渡过一个月。这样，对第i个囚徒讲，沉默相比招认来说是劣战略——对囚徒j可以选择的每一战略，囚徒i选择沉默的收益都低于选择招认的收益。（对任何双变量矩阵，上例中的收益的具体数字0，-1，-6，-9换成任意的T、R、P、S，只要满足T＞R＞P＞S，上述结论依然成立。）更为一般地：

1704417642

1704417643 定义在标准式的博弈G={S1，…，Sn；u1，…，un}中，令s’i和s”i代表参与者i的两个可行战略（即s’i和s”i；是Si中的元素）。如果对其他参与者每一个可能的战略组合，i选择s’i的收益都小于其选择s”i的收益，则称战略s’i相对于战略s”i是严格劣战略：

1704417644

1704417645 ui（s1，…，Si-1，s’i，si+l，…，Sn）＜ui（s1，…，si-1，s”i，si+1，…，sn）. （DS）

1704417646

1704417647 对其他参与者在其战略空间S1，…，Si-1，Si+1，…，Sn中每一组可能的战略（s1，…，Si-1，si+1，…，sn）都成立。

1704417648

1704417649 理性的参与者不会选择严格劣战略，因为他（对其他人选择的战略）无法作出这样的推断，使这一战略成为他的最优反应。[1]这样，在囚徒的困境中，一个理性的参与人会选择招认，于是（招认，招认）就成为两个理性参与者的结果，尽管（招认，招认）带给双方的福利都比（沉默，沉默）要低。囚徒的困境的例子还有很多应用，我们将在第2章和第4章讨论它的变型。现在，我们来看理性参与者不选择严格劣战略这一原则是否能解决其他博弈问题。

1704417650

1704417651

1704417652

1704417653

1704417654 图1.1.1

1704417655

1704417656 考虑图1.1.1所示抽象博弈的例子，[2]参与人1有两个可选战略，参与人2有3个可选战略：S1={上，下}，S2={左，中，右}。对参与人1来讲，上和下都不是严格占优的：如果2选择左，上优于下（因为1＞0），但如2选择右，下就会优于上（因为2＞0）。但对参与人2来讲，右严格劣于中（因为2＞1且1＞0），因此理性的参与人2是不会选择右的。那么，如果参与人1知道参与人2是理性的，他就可以把右从参与人2的战略空间中剔除，即如果参与人1知道参与人2是理性的，他就可以把图1.1.1所示博弈视同为图1.1.2所示博弈：

1704417657

1704417658

1704417659

1704417660

1704417661 图1.1.2

1704417662

1704417663 在图1.1.2中，对参与人1来讲，下就成了上的严格劣战略，于是如果参与人1是理性的（并且参与人1知道参与人2是理性的，这样才能把原博弈简化为图1.1.2），参与人1就不会选择下。那么，如果参与人2知道参与人1是理性的，并且参与人2知道参与人1知道参与人2是理性的（从而参与人2知道原博弈将会简化为图1.1.2所示博弈），参与人2就可以把下从参与人1的战略空间中剔除，余下图1.1.3所示博弈。但这时对参与人2，左又成为中的严格劣战略，仅剩的（上，中）就是此博弈的结果。

1704417664

1704417665

1704417666

1704417667

1704417668 图1.1.3

1704417669

[ 上一页 ] [ :1.70441762e+09 ] [ 下一页 ]