打字猴:1.704440851e+09
1704440851 信号与噪声:大数据时代预测的科学与艺术 [:1704435333]
1704440852 信号与噪声:大数据时代预测的科学与艺术 结束语
1704440853
1704440854 对美国职业棒球大联盟的游击手来说,有些比赛可以打好,有些比赛永远也无法打好,有些比赛则一定要奋力打好。球员们奋力拼搏的比赛是最精彩的,而且总能吸引人们的注意,但这样的比赛也会使人们低估游击手的能力。
1704440855
1704440856 德瑞克·基特一直是“点球成金”时代备受争议的主角。赛事转播员和球探们注意到基特的比赛似乎都十分精彩,从而得出结论,认为他是该赛季的最佳游击手。而统计怪才在分析这些比赛时,却发现了这种结论的缺陷。尽管基特是一个极好的棒球运动员,但他跃起接球的速度较慢,不得不俯冲上垒以弥补失去的时间。实际上,有分析数据显示,尽管曾5次赢得大联盟“金手套奖”,但基特其实只是一个表现极其一般的防守游击手。基特奋力拼搏的比赛得到的荣誉不会太多,因为这些比赛算不得惊心动魄,若是换了奥奇·史密斯这样的防御游击高手,拿下这些比赛可能就是轻而易举的事。
1704440857
1704440858
1704440859
1704440860
1704440861 图1 游击手奋力接球的范围
1704440862
1704440863 不论能力范围如何,总会有任务等着我们竭尽全力去完成。如果我们用最难的任务来判断自己的能力,那么轻而易举且按照常规完成的事就会被视为理所当然的了。
1704440864
1704440865 历史上最引人注意的正确预测来自英国天文学家埃德蒙·哈雷,他在1705年曾经预测,一颗巨大的彗星会在1758年回归。曾经有很多人怀疑过他的预测,但彗星恰恰就在1758年回归了。在古代,彗星被视为上帝赐予的完全无法预测的事物,如今却成了有规律且可预测的事物。
1704440866
1704440867 天文学家预测,哈雷彗星下一次最接近地球的时间是在2061年7月28日,到那个时候,现在困扰着我们的自然界的许多预测难题,都会在我们的知识范围内了。
1704440868
1704440869 自然法则并没有改变多少,只要人类知识不断积累(自从古腾堡的印刷机问世以来确实是这样),即使不能完全领悟大自然的奥秘,我们对大自然中信号的理解也会逐渐加深。
1704440870
1704440871 然而,如果说科学与技术是本书的主角,那么在大数据时代,人们对科技所能完成的事恐怕过于乐观了。
1704440872
1704440873 没有理由认为人类活动越来越可预测,同样也没有理由认为人类活动越来越不可预测。科学使得社会变得明朗,但科学同样也使得社会组织变得更加复杂。技术完全改变了人们彼此之间的联系。1990年发明万维网的蒂姆·伯纳斯·李对我说:“正因为有了互联网,整个环境、所有方程式、所有信息的动态传播都发生了变化。”
1704440874
1704440875 大量的信息成倍增加,但有用的信息却非常有限,信号的比例正在缩小,我们需要找到更好的方法对信号和噪声进行区分。
1704440876
1704440877 本书讨论我们已知的部分较少,讨论更多的是已知与未知之间的差异,并向人们推荐了缩小鸿沟的策略——人们既需要迈出重大转变的步子,同时也得走好细微谨慎的步子。而重大的一步就是要求大家采用贝叶斯关于预测的概率式思考方法。
1704440878
1704440879 以概率的方法思考问题
1704440880
1704440881 贝叶斯定理的开始和结束,都是以对真实世界可能性的盖然论表达出来的。贝叶斯定理并不要求每个人都相信这个世界从本质上来讲就是不确定的,这一定理提出的时候正是牛顿运动定律成为科学典范的时候。然而,贝叶斯定理却要求人们接受这样的观点,那就是人对这个世界的主观看法确实是十分接近真相的。
1704440882
1704440883 贝叶斯定理主张的概率式思考方法,起初可能会让人感到有些不舒服。除非是玩牌或其他概率性游戏,否则人们不会以概率的方法思考问题。例如在数学课上,人们花在几何和微积分这样的抽象学科上的时间要大大多于花在概率论和统计学上的时间。而在现实世界的各行各业里,不确定性甚至会被误认为是不自信的表现。
1704440884
1704440885 当你第一次对概率进行预测时,可能不会特别准确。但有两条利好消息:第一,这些预测只是一个开始,当你得到新信息时,贝叶斯定理会指导你对你的预测进行修正。第二,有证据表明,我们可以通过学习识别各种信号改进预测。例如,军队有时就会使用这些技术训练士兵,效果相当不错。医生也会用贝叶斯定理进行医疗诊断。
1704440886
1704440887 与电视专家相比,效仿医生和士兵的方法可能会更好一些。
1704440888
1704440889 大脑在处理信息时使用的是近似法。与其说这是一种既成事实,不如说它是一种生物必要性:我们察觉到的信息远多于我们有意识进行思考的信息,我们处理信息的方式是按照规律和模式对它们进行分类。
1704440890
1704440891 在高度的压力下,生活的规律会慢慢被揭示出来。针对“9·11”恐怖袭击事件的幸存者作过的一项研究发现,幸存者对他们所经历的事只能回忆起几分钟的细节,但对于“更大的环境”他们几乎完全不记得了。在这样的情况下,第一直觉和第一近似解可能非常不准确,无法意识到威胁的严重性。那些在强压下被迫做出决定的人,如在战场上的人,更容易成为带领其他人脱离险境的英雄。
1704440892
1704440893 在日常生活中,大脑也会尽可能地简化事物并求取其近似值。利用既有经验,这些简化和求取近似值的过程会成为有用的向导,构建起我们在日常生活中应用的可操作性知识。这两种方法并不完美,而我们也经常意识不到它们的粗糙性。
1704440894
1704440895 仔细思考以下7条陈述,它们与有效市场假说和个人投资者能否击败股票市场有关。每条陈述都只是上述关系的近似值(即粗略说明),但每一条都建立在最后一条的基础上,而且越来越准确。
1704440896
1704440897 1.没有哪个投资者能够击败股票市场。
1704440898
1704440899 2.长期看来,没有哪个投资者能够击败股票市场。
1704440900
[ 上一页 ]  [ :1.704440851e+09 ]  [ 下一页 ]