1704522859
大数据的悲剧。变量越多,“老练”的研究员手中的显著相关性越多。虚假相关性的增长比信息增长得更快,数据因而呈现出非线性(凸性)
1704522860
1704522861
前者,也就是在计算机上进行观察,会产生各种各样的结果,而根据约翰·约安尼季斯的计算,十有八九的结果是虚假的——但这些观察性研究却频频见诸报纸和一些科学期刊。值得庆幸的是,这些研究并未被美国食品及药品监督管理局(FDA)所接受,因为该机构的科学家深谙研究内幕。我和积极反对虚假统计数据的斯坦·杨,在《新英格兰医学杂志》上看到一篇声称其统计数据具有显著性的研究,而这些结果在我们看来其实随机性很强。我们致信该杂志表达我们的意见,结果却石沉大海。
1704522862
1704522863
图24–1显示了一些潜在的虚假统计关系的数量正在不断激增。我们的想法如下所示:如果我有一组200个随机变量,彼此完全无关,但在统计运算中几乎不可能找不出某种高度相关的关系,比如相关度达30%的情况,但是,这完全是虚假的。我们有技术来控制这种过滤式选择(其中一种方法被称为邦费罗尼校正法),但即使用了这种方式也没法抓住那些弄虚作假的人,就像监管机构无法阻止内部人欺诈一样。这就解释了为什么在破译人类基因组约12年之后,我们也没有发现多少具有统计显著性的东西。我不是说数据中没有信息:但问题是,这如同大海捞针。
1704522864
1704522865
即使实验也可能因偏见而受影响:研究人员有动机选择那些与其寻求的观点相符合的实验结果,而隐藏起失败的结果。研究人员还可以在得到实验结果后拟定一个假说,再将假说套用在行为上。不过,这个偏见的影响要比前者稍小。
1704522866
1704522867
受数据愚弄的效应如今愈演愈烈。有一个被称为“大数据”的讨厌现象,研究者们将过滤式选择用到了大数据中。现代化提供了太多的变量(但每个变量的信息却太少),而虚假统计关系的数量增长要比真实信息快得多,因为噪声是凸性的而信号是凹性的。
1704522868
1704522869
我们将越来越多地看到,数据只能真正提供以否定法界定的知识——它可以有效地用于揭穿,而非确认某种观点。
1704522870
1704522871
遗憾的是,我们很难得到资金支持来重制——和驳斥——现有的研究。即使能找到融资,也很难找到敢做的人:重制研究成果不会让任何人成为英雄。因此,我们会因对实证结果(除了那些以否定法界定的知识)不信任却又无计可施而寸步难行。回到我说过的业余爱好者和悠闲喝茶的英国牧师的浪漫想法上:专业研究员们往往相互竞争以“找到”统计关系。而科学绝非一种竞争,它不可以用排名来表现——我们可以看到这样一种系统最终将如何崩溃。知识必定不能容忍代理问题的存在。
1704522872
1704522873
集体的专制
1704522874
1704522875
集体而非个体犯错是有组织的知识的标志,也是反对此类知识的最好论据。我们常常听到人们以“因为大家都在做”或“别人就是这么做的”来为自己辩护。这可不是小事:在一个人的情况下,如果感觉做某事很傻,人们就不会去做,但是在一群人的情况下,他们却会参与这样的傻事。而这正是学术界亵渎科学的原因所在。
1704522876
1704522877
有一次,一位美国马萨诸塞州大学的博士生克里斯·S来告诉我,他相信我有关“长尾”的观点,以及我对当前风险管理方法的质疑,但是,这些无法帮助他获得一个学术职位。“每个人教的和论文中所用的,是另一套理论。”他说。另一位学生解释说,他希望在一所好大学中谋职,这样他就可以赚钱养家糊口,但他以专家证人的身份作证说:他们不会相信我的强韧性风险管理的观点,因为“每个人都使用那些教科书”。同样的,我曾受邀到一所大学教标准风险管理法,这种在我看来纯粹是江湖骗术的东西(我拒绝了)。作为一个教授,我的责任是以牺牲社会帮助学生找到工作,还是履行我的公民义务?嗯,如果是前者,那么这些经济学院和商业学校就犯了严重的伦理错误。因为这些有害的理论已经广泛渗透到了生活中,这就是经济中充满了明显的谬论——经科学验证的谬论——却还没崩溃的原因。回想一下,教授们在教你那些摧毁了金融系统的内容后却不受惩罚,致使欺诈得以延续。各个科系都需要教学生某些知识,以便让他们获得就业机会,即使他们教的都是无用的知识——这让我们被困在一个无限恶性循环的系统中,大家都知道这些材料是错误的,但没有人有足够的自由或足够的勇气来对此做些什么。
1704522878
1704522879
问题在于,在这个世界上最可以使用“其他人都这么认为”作为论点的最后一个地方是科学:科学应该让论点本身站得住脚,被经验或数学证明为错误的话点就是毫无疑问地错了,即使有100个“专家”或3万亿条反对意见来支持它也没有用。而且,用“其他人”来支持自己的论点其实意味着这个人——或组成“其他人”的整体——很无用而已。
1704522880
1704522881
但好消息是,我相信,一个人的勇气能击败由懦夫组成的集体。
1704522882
1704522883
在这里,我需要再次申明,我们需要回顾历史来寻找解决方案。历史非常清楚责任分散的问题,古人认为随大流做恶事,以及为迎合众人作伪证都是无可置疑的罪行。
1704522884
1704522885
在结束第七卷之前,我有一个想法。每当我听到有人说“我是道德的”,我就不由得紧张起来。每当我听到谈道德的课程,我就更加紧张。我想要的只是消除可选择性,消除以牺牲他人利益来获取反脆弱性的行为。这个简单的方法就是否定法。其余的顺其自然就可以了。
1704522886
1704522887
1704522888
1704522889
1704522891
反脆弱:从不确定性中获益 第25章 结语
1704522892
1704522893
1704522894
1704522895
就像往常结束一段旅程一样,我在一家餐馆的桌子上看着整部书稿。有一位带有闪米特文化背景的人让我解释一下,为什么我的书通篇只有一个主旨。这一次是一个叫沙伊·皮尔佩尔的人,他是一位概率论者,20年来我与他每每见面就要做一番平心静气的促膝长谈,从不闲聊。现在,已经很少能找到这样有足够的知识和自信直击事物本质,而非吹毛求疵的人了。
1704522896
1704522897
就我的前一本书,他的一位同胞曾问过我同样的问题。那时我还得好好地想一下才答得出来。而这一次,我却不费吹灰之力就有了答案。
1704522898
1704522899
很显然,沙伊自己在提问的同时就已经概括出了答案。实际上他认为,所有真实的想法都可以提炼成一个核心问题,而某些具体领域内的绝大多数人因为专业分工和虚有其表而完全忽略了这一问题。一切宗教律法都可以归结为一条黄金法则的细化、应用和诠释,即“己所不欲勿施于人”。这就是我们看到的《汉谟拉比法典》背后的逻辑。这里的黄金法则是真正的精华,而不是普罗克拉斯提斯之床。核心论点从来都不只是理论概括,它更像是一台引擎。
1704522900
1704522901
沙伊挖掘到了核心:一切都会从波动性中获得收益或遭受损失。脆弱性就是波动性和不确定性带来的损失。放在桌子上的玻璃杯是很怕波动性的。
1704522902
1704522903
在加缪的小说《鼠疫》中,书中的一个人物花了大半辈子为他的小说寻找一句完美的开篇句。一旦他找到了这句话,那么余下的部分就如泉水般从泉眼里汩汩而出。而读者要理解和读懂第一句话,则必须看完整本书。
1704522904
1704522905
我看了一眼手稿,平静中带点儿兴奋。书中的每一个句子都是本书核心思想的推导、应用或解释。一些细节和延伸出来的内容可能有悖常理且描述详尽,尤其是当涉及在不透明的情况下做决策时,但最终一切都源于本书的主旨。
1704522906
1704522907
我们请读者做同样的事。环顾四周,看看你的生活、环境中的事物、你与他人的关系、其他的实体。为简单起见,你可以在书中的任何地方,用混乱集群中的其他文字取代波动,让内容更加清楚,实际上这没有必要——在正式表述时,它们都是符号而已。时间是具有波动性的。教育,从塑造性格和个性、获取真正知识的意义上说,是喜欢无序的;贴标签式的教育和教育者则对无序深恶痛绝。有些事情会因为错误而失败,有些则不会。一些理论会土崩瓦解,而其他理论则不会。创新恰恰是从不确定性中获益的东西;而有的人还会坐等不确定性,并用它作为原料,就像我们的猎人祖先。
1704522908
[
上一页 ]
[ :1.704522859e+09 ]
[
下一页 ]