打字猴:1.70043086e+09
1700430860 环顾整个市场,我们在某些领域取得了突破性发展,但仍然面临着大量挑战。例如,研发分析各种多元结构化数据的高效技术,提高大数据分析的易用性,让大数据分析技术实现“开箱即用”,使得数据分析成为政府和企业建立核心竞争力的关键途径。技术创新永无止境,面对快速增长的大数据,我们还需要处理“更大的数据”,激活“各种渠道、各种结构、过去、现在甚至未来的数据”的更大价值。
1700430861
1700430862 驾驭大数据就是驾驭未来
1700430863
1700430864 本书作者Bill Franks先生奉献出自己的智慧、见解和实践经验,帮助武装我们的思想和技能。
1700430865
1700430866 无论你是首席技术官、首席信息官和首席营销官,还是想成为更加优秀的业务分析师,本书将告诉你如何整合数据、探索数据,并转化为行动,并最终带来业务价值。书中不仅介绍了分析流程的演进、方法论、分析团队的组建,还有对建立分析文化的深入探究。我相信本书将成为大家应对大数据来袭的最佳工具书,成为你驾驭未来的技术指南,帮助你成为赢得蓝海的真正王者。
1700430867
1700430868 最后,我要感谢本书的原著作者Bill Franks,感谢几位先期读者在百忙中为本书写下真知灼见的书评,感谢为中文版出版做出贡献的人民邮电出版社的领导、编审和各位译者,感谢Teradata天睿公司的技术和市场团队付出的日日夜夜,请相信你们的努力将会在我们的数据价值发现之旅中绽放精彩。
1700430869
1700430870 辛儿伦
1700430871
1700430872 Teradata天睿公司大中华区首席执行官
1700430873
1700430874 2012年12月12日
1700430875
1700430876
1700430877
1700430878
1700430879 驾驭大数据 [:1700430512]
1700430880 驾驭大数据 序言
1700430881
1700430882 无论你是否喜欢,大量的数据都会在不久的将来涌入你的生活。也许它现在已经出现在你的生活中了,也许你已经与它们打了一段时间交道—例如,试图解决这些数据的存储问题以便后续的访问,处理错误和缺陷,或者将这些数据进行结构化分类。或许你现在准备通过分析庞大的数据集提炼出一些有价值的数据,进而从中得到一些关于你的客户、业务或者你的企业所处商业环境的信息。或许你还没有到这一步,但是你已经意识到了数据管理的重要性。
1700430883
1700430884 无论你属于上述哪种情况,你都找对了地方。正如Bill Franks所说,在不久的将来,不仅会有大数据,还会有许多关于大数据的书籍。但是,我觉得这本书不同于其他的大数据书籍。首先,该书是这个领域的先驱者。最重要的是,它与其他书籍侧重的内容有所不同。
1700430885
1700430886 很多大数据的书籍侧重于大数据管理:如何将大数据存储到数据库或者数据仓库中,或者如何将非结构化数据进行结构化和分类。如果你发现自己阅读到了很多关于Hadoop、MapReduce或者其他关于数据仓库方法的内容,那么你可能已经遇到了,或正在寻找一本“大数据管理(BDM)”的书籍。
1700430887
1700430888 当然,大数据管理是一项重要的工作。无论你有多少何种质量的数据,如果你不能将它们按照某种便于访问和分析的格式存储到一个环境中,那么你就无法体现出这些数据的价值。
1700430889
1700430890 但仅仅是大数据管理方面的知识还不能让你走得更远。为了让这些任意大小的数据变得有价值,你不得不自己分析和操作这些大数据。正如传统的数据库管理工具不能自动地分析来自传统系统的交易数据一样,Hadoop和MapReduce也不能自动解释来自网站、基因图谱、图像分析或者其他大数据源的数据的含义。即使在大数据时代到来之前,许多从事数据管理多年(甚至是几十年)的组织也没能从它们的数据中获取到便于分析和决策的有价值信息。
1700430891
1700430892 在我看来,这本书将重点放对了地方。它主要是关于大数据的有效分析,而不是大数据管理本身。它从数据开始,所有的内容均围绕如何做整体决策,如何构建卓越的数据分析中心,以及如何构建数据分析文化等主题。你也会发现一些大数据管理中提到的内容,但该书内容的主体仍是关于如何利用输入数据生成、组织、配置和执行数据分析。
1700430893
1700430894 或许你还没有意识到,分析在今天的商业领域中是一个很热门的话题。这本书将主要围绕公司如何利用分析进行竞争,我在该领域的著作和论文一直是我所有著作中最热门的内容。关于分析的会议也在各地不断涌现。大的咨询公司,例如,Accenture、Deloitte和IBM已经在该领域积累了大量经验。许多公司、公共服务部门甚至非营利机构都已经将分析作为一个优先的战略。现在人们对大数据非常感兴趣,但是重点仍应该放在如何组织这些数据并使得它们便于分析,进而影响决策和行动。
1700430895
1700430896 Bill Franks独创地将讨论重点放在大数据和分析的交集上。与其他数据仓库和数据应用供应商相比,他所在的公司Teradata,在数据分析及从中提取商业价值的领域,一直都表现出了最高的专注程度。尽管Teradata最被人们熟知的是其企业数据仓库工具,但是这些年来,它也提供了一系列的分析应用工具。
1700430897
1700430898 在过去的一些年中,Teradata为了开发面向大数据的高度可扩展的分析工具,已经和领先的数据分析软件供应商SAS建立了紧密的联系。这些工具通常是数据仓库环境的嵌入式分析工具,并针对大量数据分析应用,例如,实时欺诈检测和大规模客户购买倾向评分。Bill Franks是Teradata的首席分析专家,因此有机会了解大规模分析和库内处理的理念和专业知识。如果讨论这个主题,可能没有比Bill Franks更好的人选了。
1700430899
1700430900 那么,本书还提供了哪些特别有趣且重要的内容呢?以下是关于本书重点的简要介绍。
1700430901
1700430902 ■ 第1章概述了大数据的相关概念,还解释了“数据的大小并不总是最重要的”这个观点。事实上,在整本书中,Franks指出了许多大数据其实并没有用,如何过滤掉无效的数据才是真正重要的。
1700430903
1700430904 ■ 第3章是对大数据源的综述,将大数据源进行了创造性和有价值的分类,且非常全面。该书第2章介绍了网络数据及其分析,对希望了解在线用户行为的企业和个人会很有帮助。这部分内容绝不仅仅是一般的面向网页分析的报表。
1700430905
1700430906 ■ 第4章致力于介绍分析可扩展性的演进,这部分内容为您提供了一个大数据和分析技术平台的全新视角。可以肯定的是,你在其他地方都未曾看到过这部分的内容。该章也讲述了最新的技术,例如,MapReduce,并讨论了大部分大数据分析工作都需要一个混合的环境。
1700430907
1700430908 ■ 该书包含了一部分关于如何生成和管理分析数据环境的最新内容,这也是在其他地方看不到的内容。如果你想要了解最新的关于“分析沙箱”和“企业分析数据集”内容(这对我来讲也是全新的内容,但是现在我知道了它们是什么以及它们的重要性),那么你可以在第5章中找到答案。本章还包含了一些关于对管理系统和处理流程进行建模和评分的重要信息。
1700430909
[ 上一页 ]  [ :1.70043086e+09 ]  [ 下一页 ]