打字猴:1.704436462e+09
1704436462
1704436463 当然,刊物中最重要的内容还是对每位球员下个赛季表现的预测,预测依据的是赫卡贝创建的“弗拉迪米尔”预测系统。这一系统似乎是继詹姆斯开创的棒球预测革命之后的又一个里程碑。
1704436464
1704436465 一个好的棒球预测系统必须可以完成3项基本任务:
1704436466
1704436467 1. 考虑影响球员表现的外在因素。
1704436468
1704436469 2. 区别看待技术和运气因素。
1704436470
1704436471 3. 熟知老化曲线,了解球员的表现是如何随着年龄增长而发生变化的。
1704436472
1704436473 任务1相对简单。在美国主要的运动项目中,棒球很独特,比赛场地没有标准尺寸。道奇体育场如血管般错综复杂,外围是壕沟般的停车场,相比之下,芬威球场则如缩略版的新英格兰网格街道,整齐、舒适,球员在此更容易获得较高的击球率。通过观察球员在主客场的表现,我们就可以用“球场因素”来解释球员所面临的困难的程度。(比如说,在弗莱德·林恩——20世纪70年代红袜队的“最有价值球员”——的职业生涯中,他在芬威球场时击球率达0.374,但在其他体育场击球率只有0.264。)同样的,通过观察从国家联盟转会到美国联盟的那些球员的表现,就能分辨出哪个联盟更好,也能看出一个球员的竞争实力。
1704436474
1704436475 全世界最丰富的统计数据库
1704436476
1704436477 任务2——区别看待技术和运气因素——就不是那么轻松了。在短期内,运气常会主导棒球比赛:即使最好的球队也会输掉1/3的比赛,即使最好的击球手安全上垒的概率也只有2/5。有时候,运气因素甚至会掩盖一个队员的真实技术水平长达一年之久。某一个赛季中,一个击球手的真实击球率为0.275,受运气因素影响,这个球手的击球率有10%的概率出现浮动,时而升至0.300,时而降到0.250。
1704436478
1704436479 设计完善的预测系统能够辨识出那些容易受运气影响的数据,比如,平均击球数就比本垒打数善变。投手的表现也是出了名的不稳定,所以数据整理对预测投手的表现至关重要。若想预测一位投手的输赢,参考他取得的三振出局数以及保送数目,要比翻阅他前一赛季的输赢纪录更有价值,因为从每年的情况来看,前一类数据要更稳定些。
1704436480
1704436481 像所有预测一样,对棒球比赛进行预测是为找出决定输赢的根本原因:将击球手三振出局就能阻止对手安全上垒,从而阻止对手得分,进而阻止他们赢得比赛,所以三振出局数更为关键。然而,预测这回事,越往下探究,就会遇到越多的噪声干扰:投手的输赢纪录受自己发挥的影响,也受制于对手得分的多少,而后者是他无法左右的。西雅图水手队的明星投手菲利克斯·埃尔南德斯在2009年和2010年的投球表现都很不错,但输赢纪录却有很大差距,分别是19∶5和13∶12,因为2010年水手队的击球手水平极差,给了对手很多机会。
1704436482
1704436483 此类事例的出现绝非偶然,只要用心整理数据,就会发现端倪。棒球比赛为我们提供的数据也许是全世界最丰富的:过去的140年里,在大联盟球场上发生的每一件事都被忠实、准确地记录下来,而且每年还有数百位棒球手在很多较大的联盟中打球。另外,尽管棒球是团队运动,却是以高度有序的方式进行的:投球手轮流投球,击球手按序击球,这样每人都有各自的统计数据。复杂的、非线性的统计问题很少出现,因果关系很容易理顺。
1704436484
1704436485 这使得棒球预测者的工作变得十分轻松。(在这项运动中,)一个假设通常可以根据经验进行检验,利用精确度比较高的统计数据来证实或者证伪。而对于经济预测或政治预测来说,可用的数据就少很多——美国总统大选每4年才举行一次,不是每年都能产生几百个数据点——缺少数据,预测往往更易误入歧途。
1704436486
1704436487 老化曲线与相似分数
1704436488
1704436489 前述观点都是建立在一项假设的基础上的,即球员的技术水平一直保持稳定,年复一年,不会改变。其实不然。只要能将信号与噪声区分开来,我们就能获得所需的任何信息。事实上,每位棒球队员的技术水平都处于一种不断变化的状态,预测的挑战也正在于此。
1704436490
1704436491 研究过数千名球员的统计数据之后,詹姆斯发现,在二十八九岁之前,大多数球员的技术水平都会持续提高,但之后通常会开始走下坡路,三十五六岁时尤其严重。詹姆斯由此得出他最重大的发现:老化曲线。
1704436492
1704436493 奥运会体操运动员的运动巅峰期是十几岁,诗人的黄金时代是二十几岁,国际象棋选手的最佳比赛年龄是三十几岁,应用经济学家在四十几岁时成就辉煌,财富500强首席执行官的平均年龄为55岁。詹姆斯发现,一个棒球运动员状态最好的年龄是27岁。1985~2009年间,获得“最有价值球员”称号的运动员共有50位,其中30人获此殊荣的年龄是在25~29岁,更有10人的年龄刚好是27岁。这个年龄是体能和脑力完美结合的最佳阶段,可以让棒球运动员发挥出最高水平。
1704436494
1704436495
1704436496
1704436497
1704436498 图3–1 击球手的老化曲线
1704436499
1704436500 读过詹姆斯的著作的球队都能从“老化曲线”中受益良多。棒球合同规定,球员必须打满6个大联盟赛季方可成为自由球员,到那时已处于其职业生涯的后期了。(在此之前,所在俱乐部享有对他们的绝对支配权,而且他们的要价要低于市场价格。)通常,一个新晋球员会在二十三四岁时加入大联盟,直到30岁时他才可能成为自由球员——那时他的巅峰表现期已过,运动生涯开始黯然失色。球队为这些自由球员支付大量的保险费用,指望他们可以在30岁时复制二十几岁时的辉煌,而事实上球员的技术水平已不复当年,但大棒球联盟合约规定必须支付这笔费用,球队也没有办法。
1704436501
1704436502 詹姆斯的“老化曲线”并非没有缺陷,表现为其走势过于平缓。诚然,一般球员会在27岁达到巅峰状态。但只要是付过会费的人盯着棒球卡背面研究一会儿都会发现,不同球员的老化速度是不一样的。比如,20世纪80年代亚特兰大勇士队的三垒手鲍勃·霍纳获得年度最佳新秀奖时只有20岁,24岁时就入选全明星队了。如果根据当时通用的假设预测,鲍勃进入名人堂就是板上钉钉的事。但30岁时他却因伤停赛了,之后又草率地加入日本大联盟的“养乐多燕子棒球队”,彻底结束了他的顶级职业棒球生涯。再如,来自西雅图水手队的伟大球员埃德加·马丁内斯直到27岁才在大联盟中有了一份稳定的工作,大器晚成的他在30多岁时才迎来了职业生涯的巅峰时期,40岁时击球数还排在联盟的领先位置。
1704436503
1704436504 尽管鲍勃和马丁内斯的例子有些不合常规,但确实很少有球员如那条老化曲线般平缓发展,高峰低谷间断交错的形式反而更为常见。也就是说,真实的老化曲线充满噪声,而且噪声非常大(见图3–2),不会那样平缓。平均值就像“每个家庭拥有1.7个孩子”这样的说法,不过是一个统计学的抽象概念。按加里·赫卡贝的推论来看,也许詹姆斯的老化曲线没能传递出噪声中的某些信号。也许像游击手这样处于对体能要求比较高的位置的球员,其技术水平的衰退速度要比打右外场的球员快。也许那些颇具运动天赋的全能型球员的职业生涯会比那些只有一两个强项的球员要长。
1704436505
1704436506 赫卡贝的系统则假定存在26条明显的老化曲线,每一条都适用于不同类型的球员。如果他的假设是正确的,你就能评判出哪条曲线适合哪个球员,并以此预测出该球员职业生涯的走势。如果一个球员符合鲍勃·霍纳的老化曲线,那就预示着他会少年得志,但衰退期也会早早到来;如果一个球员符合马丁内斯的老化曲线,那就预示着他将大器晚成。
1704436507
1704436508
1704436509
1704436510
1704436511 图3–2 不同击球手的带有噪声的老化曲线
[ 上一页 ]  [ :1.704436462e+09 ]  [ 下一页 ]