打字猴:1.700495118e+09
1700495118 算法之美:指导工作与生活的算法 [:1700494130]
1700495119 算法之美:指导工作与生活的算法 排序与体育
1700495120
1700495121 搜索与排序的取舍问题表明混乱状况有时反而更加有效。不过,节省时间不是排序的唯一原因,有时秩序本身就是我们追求的目标。最清楚这一点的非运动场莫属。
1700495122
1700495123 1883年,查尔斯·路特维奇·道奇森对英国草地网球的状况产生了令人难以置信的强烈情怀。他解释说:
1700495124
1700495125 不久前,我去观看草地网球锦标赛,一位十分沮丧的运动员引起了我对球赛目前采用的名次确定方法的注意。这位运动员在比赛中早早落败,因此彻底失去了获得奖牌的机会。令他感到屈辱的是,获得第二名的是他知道的一名远不如自己的运动员。
1700495126
1700495127 普通观众可能会把这种“哀叹”归咎于失败的痛苦,但道奇森并不是一个同情心泛滥的人,他是牛津大学数学系讲师,因此,在听到运动员的抱怨之后,他决定对体育赛事展开深入调查。
1700495128
1700495129 道奇森不仅仅是一个数学家(其实他几乎不记得自己是从事数学研究的)。现在,反而是他的笔名——刘易斯·卡罗尔更加广为人知。他以这个笔名写出了《爱丽丝漫游奇境记》以及大量其他深受欢迎的文学作品。他还将他的数学知识与文学天赋相结合,完成了一篇知名度略低的文章——《草地网球锦标赛:正确的名次确定方法以及现行方法辨误》。
1700495130
1700495131 道奇森针对的是单一淘汰赛。在这种赛制下,运动员两两对决,只要输掉一场比赛,就会被淘汰出局。道奇森的理由非常有说服力,他认为,货真价实的第二名有可能是被第一名淘汰的任何人,而不一定是最后才被淘汰的那名运动员。具有讽刺意味的是,奥运会设立有铜牌争夺赛,这个规定似乎表明我们知道单一淘汰模式无法确定第三名。[1]但是,这种赛制其实同样不足以确定第二名的归属,实际上,它只能准确地判断出谁是第一名。正如道奇森所说:“利用现行办法确定的名次,除了第一名,其他的都毫无意义。”直白地说,银牌是一种假象。
1700495132
1700495133 “作为一个数学事实,”他继续写道,“实力排第二位的运动员获得应得名次的机会只有16/31,而最优秀的4名运动员获得与实力相称名次的机会非常小,发生的概率为1/12!”
1700495134
1700495135 尽管道奇森的文章犀利有力,却没有对草地网球产生任何影响。他提出应该采取三败淘汰制(根据这种赛制,击败过你的运动员如果落败,也有可能导致你随之出局),但是这个提议根本没有人理会。不过,虽然道奇森的解决方案实施起来有很大的难度,但是他在这个问题上的看法仍然是有道理的。(可惜的是,至今为止,在单淘汰赛中,仍然会颁发银牌。)
1700495136
1700495137 不过,道奇森的逻辑还给我们带来了一个更加深刻的认识。我们人类不仅会对数据、财产进行排序,还会把我们自己变成排序对象。
1700495138
1700495139 世界杯、奥运会、美国全国大学体育协会(NCAA)、美国全国橄榄球联盟(NFL)、美国全国曲棍球联合会(NHL)、美国职业篮球联赛(NBA)和美国职业棒球大联盟(MLB),所有这些赛事都毫无疑问地使用了排序程序,利用赛季、排位赛和季后赛等算法排出先后关系。
1700495140
1700495141 体育运动中的循环赛制就利用了算法。如果一共有n支运动队,那么每支运动队最终都要和其余n-1支队伍比赛。这种赛制虽然可以说是最全面的,但也最费时费力。让每一支运动队都与其他所有队伍比赛,就像在晚宴上让客人两两拥抱一样,最终会需要可怕的O(n2)次角逐。
1700495142
1700495143 排位赛(在羽毛球、英式壁球和美式壁球等体育项目中比较常见)对运动员进行线性排序,每个球员都可以直接向排在前面一位的球员发起挑战,如果获胜,则交换排位。排位赛就相当于运动场上的冒泡排序,因此也是平方排序,需要O(n2)场比赛才能得到稳定的排名。
1700495144
1700495145 不过,最流行的赛制可能还是分组淘汰——著名的“疯狂三月”NCAA篮球赛就是其中一例。“疯狂三月”锦标赛的赛程包含“64强赛”“32强赛”到“甜蜜16强”“8强赛”“最后4强”和总决赛。每一轮都会导致比赛人数减半。与我们熟悉的对数排序很像吧?这种赛制其实就是合并排序,先让球队无序配对,然后进行一轮又一轮的比较。
1700495146
1700495147 我们知道合并排序需要线性对数时间[即O(nlogn)],因此,如果一共有64支队伍,可以预计比赛只需要进行6轮(一共192场),而采用排位赛或者循环赛,则需要多达63轮(2016场)比赛。这是一个巨大的改进,说明对数设计发挥了效用。
1700495148
1700495149 “疯狂三月”有6轮比赛,似乎没有问题,但是怎么是192场比赛呢?美国大学体育协会锦标赛不是只有63场比赛吗?
1700495150
1700495151 “疯狂三月”其实不完全是一种合并排序法,因为它并没有产生所有64支队伍的完整排序。要对所有球队进行排名,我们需要增加一组比赛才能确定第二名,确定第三名时又需要增加一组比赛,以此类推,比赛的总场次就会是一个线性对数函数。但是“疯狂三月”没有采取这种赛制。相反,就像道奇森抱怨的草地网球锦标赛一样,它采用的是一种单一淘汰制,被淘汰的球队是不排序的。这种赛制的优势在于它的线性时间。由于每场比赛正好淘汰一支队伍,因此,要让一支队伍留到最后,一共需要n-1场比赛。这是一个线性数字。不足之处是,这种赛制只能决出第一名,无法给出名次表。
1700495152
1700495153 具有讽刺意味的是,单淘汰赛制其实根本不需要任何赛制结构。只要在63场比赛中保持不败,就是唯一的冠军。举个例子,你可以选择一支球队担任“擂主”,然后接受其他队伍的挑战。一旦某支队伍挑战成功,击败擂主,就立刻成为新的擂主,然后继续接受挑战。然而,这种赛制有一个缺点:因为所有比赛无法同时进行,63场比赛需要安排成63轮。此外,有一支队伍有可能需要连续参加63场比赛,从疲劳这个角度看,这种赛制不是最理想的。
1700495154
1700495155 迈克尔·特里克的出生时间比道奇森晚100多年。在用数学知识解决体育问题这个方面,他或许算得上是21世纪最坚定的人。我们在前面讨论最优停止问题时已经说过特里克。从他非常不幸地把37%法则应用到他的爱情生活中到现在,已经过去几十年了,他现在不仅已经结婚,并成为美国职业棒球大联盟和多个美国大学体育协会(例如十大联盟、大西洋海岸分区)的主要赛程编排人员,他利用计算机科学,确定当年的对阵安排。
1700495156
1700495157 特里克认为,体育联盟不关心如何快速地确定排名。相反,体育运动的赛程安排需要保证整个赛季都处于一种紧张状态,而排序理论几乎不会关注这个问题。
1700495158
1700495159 例如,在美国职业棒球大联盟,我们常常发现分区的竞争非常激烈。如果我们不重视分区的安排,有些分区的竞争结果可能会在赛季之初就比出来了。但是,我们要保证在最后五周内,每支球队都要与分区内其他球队会面。这样安排是出于一个目的:到底谁还在竞争队伍中并不重要,但是所有球队在赛季最后五周里,都至少要在6场比赛里遭遇势均力敌的对手。在这种情况下,比赛的不确定性将保持到最后,因此观众才会对整个赛程或者赛季感兴趣。
1700495160
1700495161 更重要的是,体育运动当然不可能一味地追求减少比赛场次。如果不注意到这一点,计算机科学家就有可能觉得某些体育赛程神秘莫测。关于包含2430场比赛的棒球常规赛季,特里克说:“我们知道只要比较nlogn次,就可以排出完整的名次表。每支球队的名次都会很清楚。如果他们关心的仅仅是名次,那么他们安排n2场比赛,而且从某种意义上讲,仅仅决出第一名,又是为什么呢?”换句话说,如果我们知道利用线性对数时间就可以完成完全排序,或者利用不到n场比赛就可以把在单淘汰赛中保持不败的球队送上冠军宝座,那么我们为什么要安排O(n2)场循环赛,然后再安排一些其他比赛呢?原因很简单,把比赛场次降到最少其实并不符合联盟的利益。在计算机科学中,不必要的比较总是多余的,浪费时间和精力。但在体育运动中,情况远非如此。毕竟,在很多方面,比赛本身就是意义所在。
1700495162
1700495163 [1]只有极少数情况下(例如,在拳击比赛中,从医学这个角度看,刚刚被击败的选手再次比赛是有危险的),两名运动员才会分享铜牌。
1700495164
1700495165
1700495166
1700495167
[ 上一页 ]  [ :1.700495118e+09 ]  [ 下一页 ]