打字猴:1.704417636e+09

1704417636 博弈论基础 [:1704417378]

1704417637 1.1.B 重复剔除严格劣战略

1704417638

1704417639 上节已讲过一个博弈的表述方法，下面开始介绍如何着手分析一个博弈论问题。我们从囚徒的困境这个例子开始，因为它较为简单，只需用到理性的参与者不会选择严格劣战略这一原则。

1704417640

1704417641 在囚徒的困境中，如果一个嫌疑犯选择了招认，那么另一人也会选择招认，被判刑6个月，而不会选择沉默从而坐9个月的牢；相似地，如果一个嫌疑犯选择沉默，另一人还是会选择招认，这样会马上获释，而不会选择沉默在牢里渡过一个月。这样，对第i个囚徒讲，沉默相比招认来说是劣战略——对囚徒j可以选择的每一战略，囚徒i选择沉默的收益都低于选择招认的收益。（对任何双变量矩阵，上例中的收益的具体数字0，-1，-6，-9换成任意的T、R、P、S，只要满足T＞R＞P＞S，上述结论依然成立。）更为一般地：

1704417642

1704417643 定义在标准式的博弈G={S1，…，Sn；u1，…，un}中，令s’i和s”i代表参与者i的两个可行战略（即s’i和s”i；是Si中的元素）。如果对其他参与者每一个可能的战略组合，i选择s’i的收益都小于其选择s”i的收益，则称战略s’i相对于战略s”i是严格劣战略：

1704417644

1704417645 ui（s1，…，Si-1，s’i，si+l，…，Sn）＜ui（s1，…，si-1，s”i，si+1，…，sn）. （DS）

1704417646

1704417647 对其他参与者在其战略空间S1，…，Si-1，Si+1，…，Sn中每一组可能的战略（s1，…，Si-1，si+1，…，sn）都成立。

1704417648

1704417649 理性的参与者不会选择严格劣战略，因为他（对其他人选择的战略）无法作出这样的推断，使这一战略成为他的最优反应。[1]这样，在囚徒的困境中，一个理性的参与人会选择招认，于是（招认，招认）就成为两个理性参与者的结果，尽管（招认，招认）带给双方的福利都比（沉默，沉默）要低。囚徒的困境的例子还有很多应用，我们将在第2章和第4章讨论它的变型。现在，我们来看理性参与者不选择严格劣战略这一原则是否能解决其他博弈问题。

1704417650

1704417651

1704417652

1704417653

1704417654 图1.1.1

1704417655

1704417656 考虑图1.1.1所示抽象博弈的例子，[2]参与人1有两个可选战略，参与人2有3个可选战略：S1={上，下}，S2={左，中，右}。对参与人1来讲，上和下都不是严格占优的：如果2选择左，上优于下（因为1＞0），但如2选择右，下就会优于上（因为2＞0）。但对参与人2来讲，右严格劣于中（因为2＞1且1＞0），因此理性的参与人2是不会选择右的。那么，如果参与人1知道参与人2是理性的，他就可以把右从参与人2的战略空间中剔除，即如果参与人1知道参与人2是理性的，他就可以把图1.1.1所示博弈视同为图1.1.2所示博弈：

1704417657

1704417658

1704417659

1704417660

1704417661 图1.1.2

1704417662

1704417663 在图1.1.2中，对参与人1来讲，下就成了上的严格劣战略，于是如果参与人1是理性的（并且参与人1知道参与人2是理性的，这样才能把原博弈简化为图1.1.2），参与人1就不会选择下。那么，如果参与人2知道参与人1是理性的，并且参与人2知道参与人1知道参与人2是理性的（从而参与人2知道原博弈将会简化为图1.1.2所示博弈），参与人2就可以把下从参与人1的战略空间中剔除，余下图1.1.3所示博弈。但这时对参与人2，左又成为中的严格劣战略，仅剩的（上，中）就是此博弈的结果。

1704417664

1704417665

1704417666

1704417667

1704417668 图1.1.3

1704417669

1704417670 上面的过程可称为“重复剔除严格劣战略”。尽管此过程建立在理性参与人不会选择严格劣战略这一合情近理的原则之上，它仍有两个缺陷：第一，每一步剔除都需要参与者间相互了解的更进一步假定，如果我们要把这一过程应用到任意多步，就需要假定“参与者是理性的”是共同知识。这意味着，我们不仅需要假定所有参与人是理性的，还要假定所有参与人都知道所有参与人是理性的，还需要假定所有参与人都知道所有参与人都知道所有参与人是理性的，如此等等，以至无穷（关于共同知识的正式定义参见奥曼（Aumann，1976））。

1704417671

1704417672 重复剔除严格劣战略的第二个缺陷在于这一方法对博弈结果的预测经常是不精确的。例如，在1.1.4中的博弈中，就没有可以剔除的严格劣战略。（由于没有现实事件作为基础，这一博弈可能会被认为是随意编制或不合逻辑的，为此我们还可以参考1.2.A中经济学应用部分反映同一实质的3个及更多企业的古诺模型）既然所有战略都经得住对严格劣战略的重复剔除，该方法对分析博弈将出现什么结果毫无帮助。

1704417673

1704417674

1704417675

1704417676

1704417677 图1.1.4

1704417678

1704417679 下面我们介绍纳什均衡，它是一种博弈的解的概念，可以对非常广泛类型的博弈作出严格得多的预测。我们通过参与者的纳什均衡战略绝不会在重复剔除严格劣战略的过程中被剔除掉，而重复剔除劣战略后所留战略却不一定满足纳什均衡战略的条件，来证明纳什均衡是一个比重复剔除严格劣战略要强的解的概念。以后各章我们还将证明在扩展式的博弈中，甚至纳什均衡对博弈结果的预测也可能是不精确的，从而还需要定义条件更为严格的均衡概念。

1704417680

1704417681 博弈论基础 [:1704417379]

1704417682 1.1.C 纳什均衡的导出和定义

1704417683

1704417684 导出纳什均衡的途径之一，是证明如果博弈论还可以为博弈问题提供一个惟一解，此解一定是纳什均衡，原因如下。设想在博弈论预测的博弈结果中，给每个参与者选定各自的战略，为使该预测是正确的，必须使参与者自愿选择理论给他推导出的战略。这样，每一参与者要选择的战略必须是针对其他参与者选择战略的最优反应，这种理论推测结果可以叫做“战略稳定”或“自动实施”的，因为没有参与人愿意独自离弃他所选定的战略，我们把这一状态称为纳什均衡。

1704417685

[ 上一页 ] [ :1.704417636e+09 ] [ 下一页 ]