打字猴:1.700432002e+09
1700432002 驾驭大数据 [:1700430559]
1700432003 3.10 本章小结
1700432004
1700432005 以下是本章的主要内容。
1700432006
1700432007 ■ 虽然各行各业都有广泛的大数据源,但它们仍有一些共同的主题。虽然目的不同,但各行各业都使用了相同的底层技术,如RFID。
1700432008
1700432009 ■ 许多大数据源都有隐私问题,我们一定要始终慎重对待这个问题。
1700432010
1700432011 ■ 车载信息服务数据可以针对汽车保险政策提供更好的定价策略。但是,我们收集的车载数据也有可能会使交通管理和道路规划发生革命性的改变。
1700432012
1700432013 ■ 文本数据是最大的,也是应用最广泛的一类大数据源。一般来说,我们关心的是如何从文本中提取到重要的事实,然后如何使用这些事实作为其他分析流程的输入。
1700432014
1700432015 ■ 时间和位置数据的影响力越来越大。为了在某个时间和地点给客户提供针对性的信息,公司必须要利用更复杂的信息。
1700432016
1700432017 ■ 在零售业和制造业,RFID数据开始支持新的分析应用,从库存分析到欺诈分析,再到员工绩效分析。
1700432018
1700432019 ■ 智能电网不但能使电力公司更好地管理电网,而且消费者也可以更好地控制自己的用电量。
1700432020
1700432021 ■ 使用RFID标签跟踪筹码可以帮助赌场更准确地跟踪玩家的活动,同时降低付款错误和作弊的次数。
1700432022
1700432023 ■ 传感器数据可以提供关于发动机和设备性能的有力信息,还能用来更方便地诊断问题,更快地开发解决问题的程序。
1700432024
1700432025 ■ 视频游戏制造商可以使用遥测数据更好地定位微交易,改善游戏流程,通过游戏风格对玩家进行分群。
1700432026
1700432027 社交网络数据滋生出很多种新的客户评价方法。在电信业,社交网络分析已经把焦点从账户盈利分析转向了社交网络盈利分析。
1700432028
1700432029 〔1〕Merv Adrian, “Big Data”, Teradata Magazine, 1:11, www.teradatamagazine.com/v11n01/Features/Big-Data/.
1700432030
1700432031 〔2〕Mckinsey Global Institute, Big Data: The Next Frontier for Innovation, Competition and Productivity, May 2011.
1700432032
1700432033 〔3〕Ibid.
1700432034
1700432035 〔4〕CEO Advisory: “Big Data” Equals Big Opportunity, Gartner, March 31, 2011.
1700432036
1700432037 〔5〕本章内容基于我的同事Rebecca Bucnis的会议演讲。我们也撰写了一篇论文,名称是Taking Your Analytics Up a Notch by Integrating Clickstream Data,发表在SAS Global Forum 2011。
1700432038
1700432039
1700432040
1700432041
1700432042 驾驭大数据 [:1700430560]
1700432043 驾驭大数据 第二部分 驾驭大数据:技术、流程以及方法
1700432044
1700432045 驾驭大数据 [:1700430561]
1700432046 第4章分析可扩展性的演进
1700432047
1700432048 不言而喻,大数据的世界需要更高层次的可扩展性。随着公司处理的数据量持续增长,原有的数据处理方法已经无法应对现有的数据量。那些没有更新技术以提供更高层次的可扩展性的企业,将无法应对大数据带来的数据处理压力。幸运的是,在大数据处理、分析与应用的不同层面中,有很多技术可供使用。其中有些技术还非常新,而大数据领域的公司也需要与时俱进。
1700432049
1700432050 这一章会讨论能够帮助我们驾驭大数据的几种重要技术:分析与数据环境的关联性、海量并行处理架构(Massively Parallel Processing,MPP)、云计算、网格计算以及MapReduce。
1700432051
[ 上一页 ]  [ :1.700432002e+09 ]  [ 下一页 ]