1701029100
6.刚好453分
1701029101
1701029102
7.453.1—499.9分
1701029103
1701029104
8.500—599.9分
1701029105
1701029106
9.600分或以上
1701029107
1701029108
虽然表A.4能提供一些关于特定规则得分的原因,但详细的分析需要大量篇幅。因此,需要一个更简洁的方法。还好,逐步回归提供了这个方法。结果表明,只有5个规则能被用来很好地说明一个给定规则与整个63个规则的得分情况。因此,这5个规则可以被看作是整个规则集的代表,即一个给定规则与它们的得分能够用来预测这个规则与整个规则集的平均得分。
1701029109
1701029110
预测竞赛得分的公式是:
1701029111
1701029112
T=120.0+0.202S6+0.198S30+0.110S35+0.072S46+0.086S27
1701029113
1701029114
这里,T是一个规则的竞赛得分的预测值。Sj是这个规则与第j个规则相遇的得分。
1701029115
1701029116
这个竞赛得分的估计与实际竞赛得分相关性为r=0.979,r2=0.96。这意味着竞赛得分的变化的96%可以由一个规则与这5个代表的成绩来解释。
1701029117
1701029118
“一报还一报”在竞赛中的胜利可以由它与这所有5个代表的好成绩来解释。我们知道453分是双方总是合作所得的分数,“一报还一报”与5个代表规则的得分如下:S6=453,S30=453,S35=453,S46=452以及S27=446。以这些作为比较的标准,你就可以通过其他规则与5个代表的得分比这些标准好多少还是差多少来看这些规则在竞赛中的表现。这些结果在表A.5中。这是有关其他第二轮竞赛的分析的基础(参见表A.5)。
1701029119
1701029120
表A.5 第二轮规则的成绩
1701029121
1701029122
1701029123
1701029124
1701029125
1701029126
1701029127
1701029128
1701029129
1701029130
1701029131
在表A.5中还列有每个规则实际竞赛得分以及它与预测得分之间的差值,我们注意到竞赛值的范围是几百分,但这些差值一般都小于10分,这再一次证明这5个代表能很好地说明规则的总体性能。
1701029132
1701029133
差值的另一个有趣的特点是,名列前茅的规则趋于具有最大的正的差值,这说明在5个代表规则不能说明的方面,它们比大多数其他规则做得好。
1701029134
1701029135
现在这些代表可以用来帮助回答什么在起作用,为什么起作用这个中心问题。
1701029136
1701029137
表A.5很清楚地显示了与5个代表的得分模式。头3个代表本身是善良的,所有善良的规则与这3个规则的得分都是453,所以善良规则与这3个规则的得分和第一名“一报还一报”相比并没有丢分。非善良的规则一般就不如“一报还一报”做得好。就如表A.5这三列所显示的正数比负数占优势。
1701029138
1701029139
举一个例子,非善良规则中最好的是由保罗·哈林顿(Paul Harrington)提交的。这个规则是“一报还一报”的变形,是一个能检查出“随机”程序,有办法摆脱交替背叛(反射作用)和用某种方法来试着逃避惩罚的规则。它总是在第37步背叛并在这之后增加背叛的概率,除非对方在这些背叛之后立即用背叛报复它。它与5个代表竞赛时都不如“一报还一报”做得好。特别是与第二个代表,它损失最大,它比“一报还一报”少得到37.2分。这第二个代表是“修正的状态转换”,它是第一轮中的补充规则的改进,由乔纳森·平克利(Jonathan Pinkley)提交第二轮竞赛。这个“修正的状态转换”规则把对方模拟成一个一步马尔可夫过程,在假设这个模型是正确的基础上,它作出最大化它的长期得分的选择。当哈林顿的规则背叛越来越多时,这个“修正的状态转换”规则一直进行对方在四个可能的结果下的合作概率的估计,最终“修正的状态转换”规则认定在对方占它便宜之后合作是没有好处的,紧接下来它又认定,即使在双方合作之后再合作也是没有好处的。[1]
1701029140
1701029141
因此,即使对方愿意接受一些背叛,一旦达到它的忍耐极限就很难让它相信某人能改过。虽然一些非善良规则在与“修正的状态转换”相遇时表现比“一报还一报”好,但是,这些规则与其他代表相遇时一般都表现很差。
1701029142
1701029143
这5个代表不仅能用来分析第二轮竞赛的结果,还能用来构造竞赛的假想变形。这是通过对各个类型的规则指定不同的相对权重来实现的。5个代表可以看作各自有一个大的选民区。加上残差的非代表选民区,这5个选民区就可以完全决定每个规则在竞赛中的成绩。这些代表的使用使得我们能研究如果这些选民区中的一个比它原来大了许多时会发生什么情况。特别地,我们考虑的假想竞赛是如果一个给定的选区是它原来的5倍时的情况。由于有6个选区,所以有6个假想竞赛。这些假想竞赛每个都与原来的竞赛有很大变化,因为它们各自使6个选区中的一个变为原来的5倍。并且每一个代表了不同种类的变化,因为它们都是基于放大规则环境的不同方面的影响。[2]
1701029144
1701029145
事实上,这些假想竞赛的得分与原来竞赛的得分有很好的相关性,如果残差是原来的5倍,这个竞赛的得分与原来竞赛的得分的相关系数是0.82。并且当5个代表中的任何1个选区变为原来的5倍,所得的竞赛得分与原来第二轮竞赛的得分的相关系数是从0.9到0.96。这意味着即使各种类型参赛程序的分布与原来的情况有很大的不同,总体的结果仍是相当稳定的。因此,第二轮竞赛的结果是相当鲁棒的。
1701029146
1701029147
如果注意力从竞赛的总体情况移到胜利者的一致性上,人们会问“一报还一报”在这6个假想竞赛中表现如何。答案是在6个假想竞赛的5个中它名列第一。这是一个非常强的结果,因为它表明“一报还一报”在变化很大的环境下也还是最好的规则。
1701029148
1701029149
“一报还一报”在假想竞赛中成功的一个例外是很有趣的,在“修正的状态转换”规则的选区变大5倍的情况下,“一报还一报”名列第二。第一名是一个在原来竞赛中只名列49的规则。这个规则是由新西兰奥克兰的罗伯特·莱兰(Robert Leyland)提交的。它的动机与“镇定者”相似。它以合作开始,然后就试探它能够占多大的便宜而不被惩罚。正如从表A.5中可以看到,莱兰的规则由于与第三个代表以及“镇定者”相遇时表现太差而名列49。但是它与“修正的状态转换”相遇时比“一报还一报”多得90分,因为这个规则从初期的合作中得到了很大的好处。如果“修正的状态转换”代表的选区增大5倍,莱兰的规则确实干得比“一报还一报”以及其他任何提交的规则好。
[
上一页 ]
[ :1.7010291e+09 ]
[
下一页 ]