打字猴:1.704437968e+09

1704437968

1704437969 季节性流感

1704437970

1704437971 1.3

1704437972

1704437973

1704437974

1704437975 而且，一种传染病爆发之初的数据经常被误报。例如，之前列举的美国艾滋病诊断病例的数据是在事件发生多年后才统计出来的。即使是时时更新的数据，对预测的帮助也不大。然而，如果依据科学家们当时实际使用的数据，预测结果会更糟糕。这是因为艾滋病出现之初，很多病人（甚至很多医生有时）对这种疾病所知甚少，使预测更加困难。许多带有艾滋病症状的奇怪并发症尚未查明病因或被误诊——艾滋病引发的机会性感染一直被误认为是这种疾病的主要死因。几年后，医生重新审阅旧的病例记录，才对艾滋病出现之初的发病率作出比较准确的估值。

1704437976

1704437977 不准确的数据也是导致2009年 H1N1病毒预测失败的原因之一。那一年，墨西哥 H1N1流感病毒的致死率出奇的高，而美国 H1N1流感病毒的致死率却极低。尽管在某种程度上，这与两国医疗服务水平的差距有关，但主要差异还是统计假象。

1704437978

1704437979 致死率是相对简单的比率关系：由病死人数除以患病人数得出。但是，方程式中的两个数据都有较大的不确定性。一方面，墨西哥倾向于把其他形式的流感甚至其他疾病导致的死亡全都归因于 H1N1。实验测试显示，被认定为 H1N1致死的患者中有1/4的人表现出完全不同的病症。另一方面，H1N1流感病例数肯定存在少报、漏报的情况，也许报告值和实际值之间相差几个数量级。像墨西哥这样的发展中国家，既没有美国那种成熟的新闻报道体系，也没有“一有不适便去就医”的生活习惯。H1N1病毒进入美国之后的传播如此之快，可想而知，在墨西哥很有可能有几千甚至几万个轻微甲流病例没有上报政府。

1704437980

1704437981 事实上，H1N1病毒已经在墨西哥南部和中部地区传播了很久，数月后才引起医学界的关注（尤其是在医学专家开始忙于关注亚洲的禽流感之后）。2009年3月初，有报道称维拉克鲁斯市一个名叫洛里亚的小镇爆发呼吸系统疾病，当时镇上大部分人都已染病，但是墨西哥政府最初认为该病是由一种更为常见的流感病毒 H3N2引起的。

1704437982

1704437983 与之形成鲜明对比的是，H1N1病毒一进入美国就成为媒体炒作的噱头，几乎没有什么病例可以逃过媒体记者的眼睛。有了如此高质量的报道，美国因 H1N1病毒致死的数据想必是相当可靠的。即使后来将一些最糟糕案例的情况从报道中拿掉，但已经太迟了，它们已经引发了公众的极大恐慌。

1704437984

1704437985 自我实现预测与自我否定预测

1704437986

1704437987 在许多涉及人类活动预测的案例中，预测行为本身就会改变人的行为方式。有时，这些行为的改变也会对预测结果产生影响，要么使结果无效，要么令结果更加准确，在经济学领域就是如此。流感和其他传染疾病的预测也受到这一问题的两方面影响。

1704437988

1704437989 若预测会自动实现，这种情况便可称为自我实现预测，或自我实现预言。在一场多候选人的竞选中，如美国总统初选，随着政治民调的公布，这类预测情况就会出现。在这类竞选中，投票者会战略性地选择那些有可能获胜的候选人，这样就不会浪费自己的选票了，此时，一份公之于众的民意调查就会成为候选人成功与否的最佳风向标。举个例子，2012年艾奥瓦州共和党核心竞选的后期，美国有线电视新闻网（CNN）发布的一项民调显示，瑞克·桑德鲁的支持率奋起直追，拥有16%的投票率，而之前他的支持率只有10%。这份民调与众不同——在 CNN 公布这份民意调查之前，其他的调查均未显示桑德鲁有奋起直追之势。这份民调为桑德鲁营造了良好的媒体宣传氛围，一些选民开始放弃那些执政理念与其相似的候选人，如迈克·贝奇曼和瑞克·佩里，转而把选票投给桑德鲁。不久之后，桑德鲁赢得了艾奥瓦州的选举，而贝奇曼和佩里早就结束了竞选。

1704437990

1704437991 设计和娱乐等领域有许多更加微妙的例子。这些领域间的竞争主要是猜测消费者的喜好——但是，商家也可以通过巧妙的营销计划影响消费者的喜好。在时尚界，有种类似家庭手工业的机构会对下一季的流行色进行预测——通常要提前约一年作出预测，因为制衣生产线的调整需要时间。如果一些有影响力的设计师将棕色定为来年的流行色，并开始大量生产棕色的衣服，还让模特和名人穿着棕色服装，门店的橱窗和宣称小册子上也都主推棕色，那么，公众可能也会逐渐追随这一潮流。而公众的反应往往是购买和消费棕色的商品，不仅仅是口头表达一下内心偏好。于是，“预测”到流行色的设计师在人们眼里便如同圣人一般，但即便当初设计师没有选择棕色，而是选了白色或黑色或淡紫色，情况也都是一样的。

1704437992

1704437993 同样的，疾病和其他身体状况也有这种自我实现的特性。当媒体广泛地讨论某些疾病时，人们就更有可能辨识出这些疾病的症状，医生也更有可能对这些疾病做出诊断（或误诊）。近年来，最有代表性的案例就算孤独症了。若将被诊断患有孤独症的儿童数量和“孤独症”一词在美国报纸中出现的频率相比较，你会发现两者旗鼓相当，几乎分毫不差（见图7–3），近年来这两项数字明显都有所增加。人们并没有正确地看待孤独症这种疾病，这一疾病如今大有与流感平分秋色之势。

1704437994

1704437995 哈佛大学公共卫生学院的艾利克斯·欧祖诺夫博士告诉我：“这是一个很令人着迷的现象。在没有因果关系的疾病中，是新闻事件促使报告量不断增加。”欧祖诺夫接受过纯粹的数学训练，在许多数据驱动的领域也是如鱼得水，但现在他正潜心研究如何在流感和其他传染性疾病中运用严格的统计分析。“我们一而再，再而三地发现，人们越担心某种特定情况，这种情况就越容易成为当下讨论的话题，相关报道就越接近真相。”

1704437996

1704437997 欧祖诺夫认为这一现象也许可以解释2009年 H1N1病毒席卷美国时的迅速。这一疾病的传播速度确实很快，而有些人将原本可以忽略不计的病症也都一一报告给他们的医生，于是统计数据激增。

1704437998

1704437999

1704438000

1704438001

1704438002 图7–3 孤独症：1992~2008年媒体报道病例与确诊病例

1704438003

1704438004 如果医生想要预测疾病在人群中的发病率，公开报道的病例数量会误导这一评估。这与犯罪报道的情况相类似：如果警察报告某一居民区的偷盗案件数量增加，是因为警察变得更警惕了，抓到了之前遗漏的罪犯，还是因为这类案件的报道更随意了呢？或者因为这一居民区变得更危险？任何想在流感发生初期做出预测的人都会碰到这类让人感到困惑的问题。

1704438005

1704438006 与自我实现预测相反的是自我否定预测，自我否定预测是指预测会自我破坏。越来越普及的 GPS 就是一个有趣的例子。曼哈顿有两条南北走向的主干道，一条是西部高速公路，靠近哈德逊河；另一条是罗斯福路，位于曼哈顿东部。根据目的地的位置，司机也许没有必须走哪条路的强烈愿望。然而，GPS 导航系统会依据车流量预测哪条路通行的时间更短，然后用语音提示你应该选的道路。可是，当很多车主都用同一款导航仪时，问题就出现了，大家都会选同一条路，于是道路突然会被车流塞满，畅通的路反而变得拥堵。理论和现实的双重证据表明，在纽约、波士顿和伦敦都出现了类似的问题，这些导航系统的作用有时只会适得其反。

1704438007

1704438008 因为流感预测的目标从某种程度上来说是为了提高公众对这种疾病的意识，进而改变其行为习惯，因此这种自我破坏的特性也影响了流感预测的准确性。最有效的流感预测很可能就是无法修成正果的预测，因为这样的预测会促使人们做出更有利于健康的选择。

1704438009

1704438010 预测模型越简单越好，还是越复杂越好？

1704438011

1704438012 芬兰科学家汉娜·库克将构建统计或预测模型比作绘制地图。绘图需要足够多的细节才能真实地展现基本景观，于是，制图者不愿漏掉大城市、主要河流、山脉，或是重要的高速公路。然而，太多细节会让旅行者晕头转向，反而迷了路。正如本书前文中提到的那样，这些问题不是纯粹的审美问题。过于复杂的模型可能会将噪声拟合进来，无法成功地复制内在结构，使预测失败。

1704438013

1704438014 但是，多少细节才算太多（或是太少）呢？地图绘制技术需要穷尽一生才能掌握，这项工作是艺术和科学的有机结合。将模型的建立描述成艺术形式也许有些离谱，但这项工作确实需要作很多判断。

1704438015

1704438016 然而，从理想化的角度来看，像库克提到的那些问题也可以凭经验回答。这样的模型有效吗？如果没有，就需要寻求其他的解决路径。在流行病学界，医生所用的传统模型相当简单，效果也没有那么理想。

1704438017

[ 上一页 ] [ :1.704437968e+09 ] [ 下一页 ]