打字猴:1.704325615e+09
1704325615
1704325616
1704325617 图2 微软Xbox进入市场博弈树
1704325618
1704325619 如何读懂博弈树
1704325620
1704325621 博弈树能够为博弈中每一方的选择提供一个清晰的总结,并且能够显示每一方行动后所带来的结果。举个例子,在图2中,第一步,微软率先采取行动,做出是否进入硬件博弈市场的决定,第二步,如果微软进入了,索尼必须决定是否斗争。博弈树同样也显示了,在率先行动的一方已经选择获得结果的前提下,之后的行动可能产生的从最好到最坏的结果情况。比如,“微软入市+索尼包容”对微软是最优选,对索尼是次优选,而“微软入市+索尼斗争”对双方都是最劣选。
1704325622
1704325623 回到我们对于Xbox参与博弈的讨论,索尼可以在微软入市之前就对其施压,扬言说如果微软入市,它将发动全面价格战争。这样的一个承诺,绝对能够有效地让索尼有机会率先行动,从战略眼光的角度看,这就等于诱导微软离开市场。不幸的是,对于索尼来说,它的提前威胁并没有太大的信任度,为什么呢?因为一旦Xbox上市,引诱微软退出市场的可能性微乎其微12。所以,对于未来价格战中唯一让索尼获利的可能在于微软得到了足够的教训,主动在下一代产品发售时退出市场。但那也是几年之后了,而这却是这代索尼产品的“终生”。此外,如果在这代产品中没有获得足够多的利润去支持下一代产品的研发,下一代产品在市场竞争中将变得充满风险和处于被动地位。
1704325624
1704325625 因此,索尼真的无法率先采取行动,去阻止微软发售它的新产品Xbox13。即便这样,索尼仍旧可以获利,只是没有微软退出市场或者发售不直接与PS2竞争的产品情况下那么多。
1704325626
1704325627 迄今为止,在我们所有考虑的博弈情况中,我们都在考虑到底是谁先行动。但是在其他一些情况中,博弈的结果跟行动的时机并无关联,最著名的案例要属“囚徒困境”。
1704325628
1704325629 囚徒困境
1704325630
1704325631 警方逮捕了两名罪犯,刑期最多是5年。但是,警方强烈怀疑这两名罪犯实施了性质更为恶劣的罪行(例如持械抢劫),刑期最高可达20年。警方审讯人员将他们分别单独关押,并对他们说:“现在是坦白你的持械抢劫罪行的时候了。你们的刑期将取决于你们认罪情况。如果只有你一个人认罪,那么你今天就可以离开,因为你很配合。但是,如果你俩都抵赖,你们都会被判5年;如果你俩都认罪,那就是10年;如果只有你抵赖,那么你的刑期就是20年。”
1704325632
1704325633 图3使用收益矩阵,展现了在这场博弈中,两位博弈者可能获得的收益(也就是刑期)。
1704325634
1704325635
1704325636
1704325637
1704325638 图3 囚徒困境的收益矩阵
1704325639
1704325640 对这类图表的使用将贯穿全书,所以,在继续学习之前,我们先来看看怎样读懂这些图表。(尽管收益矩阵乍一眼看上去比较容易晕头转向,但是适应了之后,你可以非常轻松地读懂它们。)
1704325641
1704325642 如何解读收益矩阵
1704325643
1704325644 收益矩阵可以轻易地总结出一场博弈里各方博弈者的动机所在,同时也可以找出不同博弈之间的战略联系,哪怕初看起来这些博弈之间几乎没有联系。一个收益矩阵表现出来的内容有:(1)各方博弈者是谁;(2)每一位博弈者可以做出的行动;(3)每一位博弈者选择行动之后可能出现的相应结果;(4)博弈者如何对这些可能出现的结果——即收益——进行优劣排序。此外,我常用“动机箭头”来体现博弈者的动机是否和如何受到其他博弈者行动的影响。
1704325645
1704325646 1.博弈者:收益矩阵通常用于两方博弈的情况。一位叫作“行博弈者”,另一位叫作“列博弈者”,这是因为他们的名字分别出现在矩阵图的左侧和上方。为了进行进一步区分,所有与行博弈者相关的术语都将斜体加粗显示,而所有与列博弈者相关的术语则用正常字体显示。
1704325647
1704325648 2.行动:矩阵的每一行对应行博弈者可能采取的一种行动,而每一列对应列博弈者可能采取的一种行动。
1704325649
1704325650 3.结果:矩阵的每一格对应这场博弈可能出现的一种结果。在图4的2×2示例矩阵中,可能出现的结果有四种。
1704325651
1704325652 4.收益:根据两位博弈者选择采取的行动,每位博弈者都将获得收益。收益的定义就是每位博弈者所关心的一切因素与博弈最终结果的对比情况14。因此,我们可以从每位博弈者的角度,对可能出现的所有结果进行优劣排序。收益矩阵的每一格都显示了两位博弈者对这一格所对应的结果的排序情况,其中,行博弈者的排序显示在格子左下方,而列博弈者的排序显示在格子的右上方。
1704325653
1704325654
1704325655
1704325656
1704325657 图4 普通收益矩阵(无激励箭头)
1704325658
1704325659 5.动机箭头:收益矩阵有助于将每位博弈者在这场博弈中的动机进行可视化的展现。动机指的就是每位博弈者根据对方行动所采取的偏好行动(也称为最佳回应)。为了展现这些动机,我用纵向箭头来表示行博弈者的动机,用横向箭头来表示列博弈者的动机。
1704325660
1704325661 回到囚徒困境的问题,图3就是其收益矩阵,注意,每位犯人都有单方面的动机去认罪,无论另一位犯人是否认罪。(如果另一位犯人也认罪,那么你的刑期将会从20年减到10年。如果另一位犯人不认罪,那么你将完全免遭牢狱之苦。)也就是说,认罪是每位犯人的“占优战略”。然而,与双方都不认罪相比,若双方都认罪他们的刑期都将变得更长。(前者10年,是次劣结果;后者5年,是次优结果。)15
1704325662
1704325663 “占优战略”是使一位博弈者获得最优收益的行动,无论其他博弈者采取何种行动,将其他博弈者的行动视为固定因素。
1704325664
[ 上一页 ]  [ :1.704325615e+09 ]  [ 下一页 ]