打字猴:1.703947944e+09
1703947944 大数据洞察
1703947945
1703947946 “理论的终结”似乎暗示着,尽管理论仍存在于像物理、化学这样的学科里,但大数据分析不需要成形的概念。这实在荒谬。
1703947947
1703947948 大数据是在理论的基础上形成的。比方说,大数据分析就用到了统计和数学理论,有时候也会用到计算机科学理论。是的,这不是关于像地心引力这样特定现象的产生原因的理论,但是无论如何这依然是理论。而且如我们所见,建立在这些理论上的大数据分析模式是实现大数据预测能力的重要因素。事实上,就是因为不受限于传统的思维模式和特定领域里隐含的固有偏见,大数据才能为我们提供如此多新的深刻洞见。
1703947949
1703947950 首先就是关于我们怎么收集数据。我们会不会仅仅看数据收集的方便程度来决定呢?或者看数据收集的成本?我们做这些决定的时候就被理论所影响着,而就如达纳·博伊德(Danah Boyd)和凯特·克劳福德(Kate Crawford)说的,我们的选择一定程度上决定了结果。毕竟,谷歌是用检索词来预测流感而不是鞋码。同样,我们在分析数据的时候,也依赖于理论来选择我们使用的工具。最后,我们解读研究结果的时候同样会使用理论。大数据时代绝对不是一个理论消亡的时代,相反地,理论贯穿于大数据分析的方方面面。
1703947951
1703947952 作为第一提出问题的人,安德森应该获得掌声——尽管他的答案不怎么样!大数据绝不会叫嚣“理论已死”,但它毫无疑问会从根本上改变我们理解世界的方式。很多旧有的习惯将被颠覆,很多旧有的制度将面临挑战。
1703947953
1703947954 大数据时代将要释放出的巨大价值使得我们选择大数据的理念和方法不再是一种权衡,而是通往未来的必然改变。但是在我们到达目的地之前,我们有必要了解怎样才能到达。高科技行业里的很多人认为是依靠新的工具,从高速芯片到高效软件等。当然,这可以理解为因为他们自己是工具创造者。这些问题固然重要,但不是我们需要考虑的问题。大数据趋势的深层原因,就是海量数据的存在以及越来越多的事物是以数据形式存在的,这也是我们下一章要谈论的内容。
1703947955
1703947956 [1] 算法思路可参考林登2003年在IEEE Internet Computing上发表的名为“Amazon.com recommendations:item-to-item collaborative filtering”一文。当然,如同谷歌源于PageRank而现在远不仅是PageRank,亚马逊目前的推荐也远远不止基于对象的协同过滤那么简单。举例而言,我所熟悉的百分点通用推荐引擎就包含了数十种常用算法,数千条行业规则和针对用户意图的场景预测模块等。——译者注
1703947957
1703947958 [2] 严格地讲,即便没有相关性,另一个数据值也可以大幅变化,只是没有趋势可循罢了。——译者注
1703947959
1703947960 [3] 除了利用自有数据外,沃尔玛实验室开始尝试用Facebook好友喜好和Twitter流量与内容分析来实现智能零售。下载一个Facebook上名为shopycat的小应用,就能收到沃尔玛为你创建的礼品清单。——译者注
1703947961
1703947962 [4] Teradata的前身是著名的全美现金出纳机公司。——作者注
1703947963
1703947964 [5] 2011年,Reshef等人在《科学》上发表了题为“Detecting Novel Associations in Large Datasets”一文,探讨了度量双变量复杂相关行为的新方法。截至目前,该方法还不能处理多变量相关。——译者注
1703947965
1703947966 [6] 评价自己不了解的学科,一定要谦虚谨慎,最好是不要做这样的评价。其实,目前的电子产业、纳米加工以及大部分先进的医疗技术都直接来源于量子理论。——译者注
1703947967
1703947968
1703947969
1703947970
1703947971 大数据时代:生活、工作与思维的大变革 [:1703946865]
1703947972 大数据时代:生活、工作与思维的大变革 第二部分 大数据时代的商业变革
1703947973
1703947974 大数据时代:生活、工作与思维的大变革 [:1703946866]
1703947975 04 数据化:一切皆可“量化”
1703947976
1703947977 大数据发展的核心动力来源于人类测量、记录和分析世界的渴望。信息技术变革随处可见,但是如今的信息技术变革的重点在“T”(技术)上,而不是在“I”(信息)上。现在,我们是时候把聚关灯打向“I”,开始关注信息本身了。
1703947978
1703947979 【大数据先锋】
1703947980
1703947981 日本先进工业技术研究所的坐姿研究与汽车防盗系统
1703947982
1703947983 谷歌的数字图书馆
1703947984
1703947985 多效地理定位与UPS的最佳行车路径
1703947986
1703947987 Foursquare,让用户在最喜爱的地方“check in”
1703947988
1703947989 用手机数据预测疾病传播和城市繁荣
1703947990
1703947991 英国对冲基金公司,用微博数据预测股市投资时机
1703947992
1703947993 睡眠活动数据库与睡眠模式预测
[ 上一页 ]  [ :1.703947944e+09 ]  [ 下一页 ]