打字猴:1.704438078e+09
1704438078
1704438079 因此,基于 Agent 建模对研究者的要求颇高,奋斗在这一领域的团队通常都是多学科交互的全明星队,团队成员都是各自研究领域的精英。但由于缺少数据,这些精英常常劳而无功。“就连 H1N1病毒,我们都很难收集到有关何人、何时、何地患病的具体地理数据。”格雷芬斯特哀叹,“可想而知,要想获得过去爆发的所有疾病的数据有多困难。”
1704438080
1704438081 与匹兹堡和芝加哥这两个团队进行交流时,他们的话有时会让我想到一些关于中国的故事,这些故事你和我都读过,讲的是中国某些购物中心极尽装饰的情况——罗马圆柱、室内过山车,威尼斯运河,无一不有——但购物中心却没有店铺营业,也没有人逛。芝加哥和匹兹堡的团队都已经得出了一些十分有用且可行的结论——例如,匹兹堡大学的格雷芬斯特博士想到,过于草率、频繁地让学校停课(以防止疾病传染),有可能会事与愿违;而芝加哥大学的团队猜测到,芝加哥内城的 MRSA 病例数量不正常,这个问题是由进出库克县监狱的人群引起的。但是,这些模型模拟的情况至少都在几年之后才有可能出现,他们正翘首期盼着眼下那些根本不存在的数据。
1704438082
1704438083 基于 Agent 建模——不像气象预报的模型可以依据每日的数据进行修正——也很难检验。重大疫情只是偶尔来袭。即使这些模型是对的,但由于成功的疾病预测存在自我否定的特性,这些模型也有可能会成为自身成功的受害者。假设该模型暗示某项特殊的干预措施——如让学校停课——可能会十分有效,而这项干预措施也确实奏效了,现实中该疾病的传播速度就会降低。但回头想想,这样的结果可能会使该模型之前的预测看似过于悲观了。
1704438084
1704438085 因此,匹兹堡和芝加哥团队一直在犹豫是否将他们的模型应用到具体的预测中。其他团队在2009年 H1N1流感爆发前则没有这么谨慎,其中一些团队发布的相关预测十分糟糕,严重地低估了 H1N1病毒的传播范围。
1704438086
1704438087 目前,这些团队的活动大多局限于多姆的同事奇普·马卡尔所说的“为见解建模”。也就是说,基于 Agent 建模可以帮助我们进行了解传染病的实验,但目前这些模型还不能帮助我们预测疾病的爆发。
1704438088
1704438089 预测是为了让损失最小化
1704438090
1704438091 美国最近两次流感恐慌证明了,天花乱坠的宣传是不可靠的。1976年,只有迪克斯堡爆发了甲型 H1N1疫情,其他地区基本没有疫情;当时的美国总统福特推行的“全民接种疫苗计划”纯属过激反应。2009年,相当数量的人感染了 H1N1流感病毒,但是病亡的病例却很少。这两个例子说明,美国政府关于疫情严重程度的预测实在有些离谱。
1704438092
1704438093 但谁都不能保证,下一次流感疫情爆发时,会不会出现同样的预测错误。虽然人类逐渐适应禽流感,但禽流感病毒 H5N1仍会使数千万人丧生。若一种流感病毒的传播速度和2009年 H1N1病毒的传播速度一样快,致死率又和1918年西班牙流感的致死率一样高,就会使140万名美国人丧生。还有其他一些威胁来自非流感病毒,如传染性非典型肺炎(SARS)病毒,甚至来自天花,虽然早在1977年全球就已经消灭了天花,但这种疾病极有可能被恐怖分子制成生化武器,再次引入社会,谋杀数百万人。根据定义,最严重的流行病传播的速度极快:2009年,H1N1病毒只用了大约一周时间就从医学界毫无察觉的病毒发展成一种让数百万人丧生的病毒。
1704438094
1704438095 我为本章写作所采访的那些流行病专家强烈地意识到自身所用模型的局限性,这一点和其他领域的专家形成鲜明对比。哈佛大学的马克·利普思奇告诉我:“依据3个数据点作预测是很愚蠢的。”利普思奇所说的“3个点”是指1918年、1957年和1968年3次流感的爆发,“我们能做的就是为病情发展的不同状况作好准备”。
1704438096
1704438097 如果你无法做出准确预测,却假装自己可以确保预测准确,这样做通常会贻害无穷。我猜想流行病专家和医学界的其他专家深知这一点,因为他们必须遵从希波克拉底誓言:最重要的是,不能伤害别人。
1704438098
1704438099 医学界对统计模型的使用最为谨慎,医生总能恰如其分地扮演预测的角色。这并不是说经济学家或地震学家作预测时没有风险。但由于医学直接与生命和死亡挂钩,医生会更加谨慎小心。在医学领域,错误的模型会让人丧命。后果很严重。
1704438100
1704438101 另外,奇普·马卡尔关于“为见解建模”的概念还要进一步充实。本书的主导思想是,预测既是手段也是目标。比如,预测在验证假说时发挥核心作用,因此在所有科学领域都发挥核心作用。
1704438102
1704438103 正如统计学家乔治·E·P·博克斯所写:“所有的模型都是错误的,但是其中有些是有用的。”这句话的意思就是,所有模型都是这个世界的简化形式,因为这是必要的。正如另一位数学家所说:“一只猫最好的模型就是一只猫。”其他模型都会遗漏一些细节。这些细节是否关系重大,取决于我们试图解决的问题究竟是什么,还要看我们想要得到的答案有多精确。
1704438104
1704438105 在我们使用的工具中,统计模型并非唯一一个要求我们做出粗略估算的工具。例如,语言就是一种模型,一种我们用于相互沟通的近似值。所有语言都包含一些单词,在别的语言中却没有直接对应的同源词,即使两个词都在尽量解释同一个事物,它们也不是同源词。技术领域有其特有的语言。
1704438106
1704438107 但是,博克斯写道,一些模型是有用的。据我观察,芝加哥和匹兹堡两支团队正在进行的基于 Agent 建模就十分有用。这些模型能断定不同族群对疫苗的态度,能推出疾病在一个城市中不同社区的传播情况,也能猜到人们对流感新闻的反应,这些本身就是重要的问题。
1704438108
1704438109 一个好的模型即使失败了也有价值。“我们应当假设无论作什么预测,通常都是错误的。”欧祖诺夫告诉我,“所以,通常作预测就是为了了解错误是如何形成的,出错时该怎么做,如何将损失最小化。”
1704438110
1704438111 关键是要记住,模型是帮助我们理解某一领域复杂性的工具,而不是取代整个领域。这一点不仅在作预测时十分重要。一些神经学家,如麻省理工学院的托马斯·波焦认为人脑处理信息的方式就是通过一系列近似值获得的。
1704438112
1704438113 这就是为什么在预测时,形成更好的自我认识,正确解读所收到的信号如此重要。本书的前半部分主要介绍这些近似值在哪些领域服务于我们,又在哪些领域使我们惨败。本书的后半部分则关于如何更好地提高近似值,每次只提高一点。
1704438114
1704438115
1704438116
1704438117
1704438118 信号与噪声:大数据时代预测的科学与艺术 [:1704435327]
1704438119 信号与噪声:大数据时代预测的科学与艺术 第八章 贝叶斯定理:只有正确的预测才能让我们更接近真相
1704438120
1704438121
1704438122
1704438123 美国篮球职业联赛(NBA)的“赌神”哈若拉波斯·鲍勃·乌尔加利斯住在美国洛杉矶好莱坞山上的一座富丽堂皇、极富现代感的豪宅里,房子外部由金属和玻璃构造,房后还有一个游泳池,这里美得就像戴维·霍克尼油画中的景象。每年从11月到来年6月,乌尔加利斯每晚都会观看 NBA,每次看5场,分别由5台三星纯平电视机同时播放(就连直播电视公司也没见识过这种场面)。需要暂作休整时,乌尔加利斯会跑到拉斯韦加斯“棕榈树广场度假酒店”,在自己的公寓房中小住几日。如果需要放个长假,他就会跑到非洲来个徒步旅行。即使年景比较差的时候,乌尔加利斯差不多也能赚上100万美元,年景好的时候,赚上三四百万美元也不成问题。
1704438124
1704438125 乌尔加利斯很享受这种高品质的生活,但他并不符合那种穿休闲西装、嘴上叼着雪茄的老派赌徒形象。乌尔加利斯在下注时,从不依靠线人提示、贿赂裁判或是其他小伎俩,他也没有什么所谓的“秘诀”,他使用的是计算机模拟手段,但也并不是完全依赖这个手段。
1704438126
1704438127 乌尔加利斯之所以成功,是因为他分析信息的方式十分有效。乌尔加利斯并没有一味地寻求不同的预测模型,而是将自己掌握的统计学知识和篮球知识结合起来,并理清这些数据之间的重要关联。
[ 上一页 ]  [ :1.704438078e+09 ]  [ 下一页 ]