打字猴:1.704438084e+09
1704438084
1704438085 因此,匹兹堡和芝加哥团队一直在犹豫是否将他们的模型应用到具体的预测中。其他团队在2009年 H1N1流感爆发前则没有这么谨慎,其中一些团队发布的相关预测十分糟糕,严重地低估了 H1N1病毒的传播范围。
1704438086
1704438087 目前,这些团队的活动大多局限于多姆的同事奇普·马卡尔所说的“为见解建模”。也就是说,基于 Agent 建模可以帮助我们进行了解传染病的实验,但目前这些模型还不能帮助我们预测疾病的爆发。
1704438088
1704438089 预测是为了让损失最小化
1704438090
1704438091 美国最近两次流感恐慌证明了,天花乱坠的宣传是不可靠的。1976年,只有迪克斯堡爆发了甲型 H1N1疫情,其他地区基本没有疫情;当时的美国总统福特推行的“全民接种疫苗计划”纯属过激反应。2009年,相当数量的人感染了 H1N1流感病毒,但是病亡的病例却很少。这两个例子说明,美国政府关于疫情严重程度的预测实在有些离谱。
1704438092
1704438093 但谁都不能保证,下一次流感疫情爆发时,会不会出现同样的预测错误。虽然人类逐渐适应禽流感,但禽流感病毒 H5N1仍会使数千万人丧生。若一种流感病毒的传播速度和2009年 H1N1病毒的传播速度一样快,致死率又和1918年西班牙流感的致死率一样高,就会使140万名美国人丧生。还有其他一些威胁来自非流感病毒,如传染性非典型肺炎(SARS)病毒,甚至来自天花,虽然早在1977年全球就已经消灭了天花,但这种疾病极有可能被恐怖分子制成生化武器,再次引入社会,谋杀数百万人。根据定义,最严重的流行病传播的速度极快:2009年,H1N1病毒只用了大约一周时间就从医学界毫无察觉的病毒发展成一种让数百万人丧生的病毒。
1704438094
1704438095 我为本章写作所采访的那些流行病专家强烈地意识到自身所用模型的局限性,这一点和其他领域的专家形成鲜明对比。哈佛大学的马克·利普思奇告诉我:“依据3个数据点作预测是很愚蠢的。”利普思奇所说的“3个点”是指1918年、1957年和1968年3次流感的爆发,“我们能做的就是为病情发展的不同状况作好准备”。
1704438096
1704438097 如果你无法做出准确预测,却假装自己可以确保预测准确,这样做通常会贻害无穷。我猜想流行病专家和医学界的其他专家深知这一点,因为他们必须遵从希波克拉底誓言:最重要的是,不能伤害别人。
1704438098
1704438099 医学界对统计模型的使用最为谨慎,医生总能恰如其分地扮演预测的角色。这并不是说经济学家或地震学家作预测时没有风险。但由于医学直接与生命和死亡挂钩,医生会更加谨慎小心。在医学领域,错误的模型会让人丧命。后果很严重。
1704438100
1704438101 另外,奇普·马卡尔关于“为见解建模”的概念还要进一步充实。本书的主导思想是,预测既是手段也是目标。比如,预测在验证假说时发挥核心作用,因此在所有科学领域都发挥核心作用。
1704438102
1704438103 正如统计学家乔治·E·P·博克斯所写:“所有的模型都是错误的,但是其中有些是有用的。”这句话的意思就是,所有模型都是这个世界的简化形式,因为这是必要的。正如另一位数学家所说:“一只猫最好的模型就是一只猫。”其他模型都会遗漏一些细节。这些细节是否关系重大,取决于我们试图解决的问题究竟是什么,还要看我们想要得到的答案有多精确。
1704438104
1704438105 在我们使用的工具中,统计模型并非唯一一个要求我们做出粗略估算的工具。例如,语言就是一种模型,一种我们用于相互沟通的近似值。所有语言都包含一些单词,在别的语言中却没有直接对应的同源词,即使两个词都在尽量解释同一个事物,它们也不是同源词。技术领域有其特有的语言。
1704438106
1704438107 但是,博克斯写道,一些模型是有用的。据我观察,芝加哥和匹兹堡两支团队正在进行的基于 Agent 建模就十分有用。这些模型能断定不同族群对疫苗的态度,能推出疾病在一个城市中不同社区的传播情况,也能猜到人们对流感新闻的反应,这些本身就是重要的问题。
1704438108
1704438109 一个好的模型即使失败了也有价值。“我们应当假设无论作什么预测,通常都是错误的。”欧祖诺夫告诉我,“所以,通常作预测就是为了了解错误是如何形成的,出错时该怎么做,如何将损失最小化。”
1704438110
1704438111 关键是要记住,模型是帮助我们理解某一领域复杂性的工具,而不是取代整个领域。这一点不仅在作预测时十分重要。一些神经学家,如麻省理工学院的托马斯·波焦认为人脑处理信息的方式就是通过一系列近似值获得的。
1704438112
1704438113 这就是为什么在预测时,形成更好的自我认识,正确解读所收到的信号如此重要。本书的前半部分主要介绍这些近似值在哪些领域服务于我们,又在哪些领域使我们惨败。本书的后半部分则关于如何更好地提高近似值,每次只提高一点。
1704438114
1704438115
1704438116
1704438117
1704438118 信号与噪声:大数据时代预测的科学与艺术 [:1704435327]
1704438119 信号与噪声:大数据时代预测的科学与艺术 第八章 贝叶斯定理:只有正确的预测才能让我们更接近真相
1704438120
1704438121
1704438122
1704438123 美国篮球职业联赛(NBA)的“赌神”哈若拉波斯·鲍勃·乌尔加利斯住在美国洛杉矶好莱坞山上的一座富丽堂皇、极富现代感的豪宅里,房子外部由金属和玻璃构造,房后还有一个游泳池,这里美得就像戴维·霍克尼油画中的景象。每年从11月到来年6月,乌尔加利斯每晚都会观看 NBA,每次看5场,分别由5台三星纯平电视机同时播放(就连直播电视公司也没见识过这种场面)。需要暂作休整时,乌尔加利斯会跑到拉斯韦加斯“棕榈树广场度假酒店”,在自己的公寓房中小住几日。如果需要放个长假,他就会跑到非洲来个徒步旅行。即使年景比较差的时候,乌尔加利斯差不多也能赚上100万美元,年景好的时候,赚上三四百万美元也不成问题。
1704438124
1704438125 乌尔加利斯很享受这种高品质的生活,但他并不符合那种穿休闲西装、嘴上叼着雪茄的老派赌徒形象。乌尔加利斯在下注时,从不依靠线人提示、贿赂裁判或是其他小伎俩,他也没有什么所谓的“秘诀”,他使用的是计算机模拟手段,但也并不是完全依赖这个手段。
1704438126
1704438127 乌尔加利斯之所以成功,是因为他分析信息的方式十分有效。乌尔加利斯并没有一味地寻求不同的预测模型,而是将自己掌握的统计学知识和篮球知识结合起来,并理清这些数据之间的重要关联。
1704438128
1704438129 这需要付出艰辛的努力,有时甚至会作不少无用功。乌尔加利斯能有今天的成功,还因为他下注时胆大、心细。
1704438130
1704438131 乌尔加利斯在加拿大马尼托巴的温尼伯长大,这座城市位于美国明尼苏达州边界以北约145公里,那里的人们工作勤劳却常受霜冻之苦。乌尔加利斯的父亲曾经非常富有,在其事业巅峰期时拥有300万美元身家,却因嗜赌将家产挥霍一空。在乌尔加利斯12岁那年,他的父亲破产了。乌尔加利斯16岁时意识到,要想离开温尼伯这个鬼地方,就必须接受良好的教育,而且只能自己挣学费。所以,考入马尼托巴大学之后,乌尔加利斯想尽各种办法挣钱。夏天,他会到不列颠哥伦比亚省最北部从事爬树的工作,每爬一棵树,可以挣到7美分。在校期间,他会去机场做行李搬运工,为去往多伦多或明尼阿波利斯或更远地方的温尼伯人来来回回地运送行李。
1704438132
1704438133 最后,乌尔加利斯终于存够了钱,买下了他做兼职的那家机场行李搬运公司的部分股份,不久之后,他又拥有了更多股份。1999年,读大学四年级的乌尔加利斯已经攒下了约8万美元。
[ 上一页 ]  [ :1.704438084e+09 ]  [ 下一页 ]