1700432428
4.7 这不是一个单选题
1700432429
1700432430
在驾驭大数据的分析生态环境中,海量并行关系型数据库、云计算、MapReduce都可以发挥重要的作用。可以将这3项技术整合起来使用,并从大数据中获得最大的价值。有许多方式可以把这些不同的技术整合起来。
1700432431
1700432432
■ 数据库可以运行在云里。
1700432433
1700432434
■ 数据库可以内置MapReduce功能。例如,Teradata公司的Aster平台拥有一项SQL MapReduce相关的专利技术,能把MapReduce的处理过程转换为SQL查询的一部分。
1700432435
1700432436
■ 还有一种同时使用数据库和MapReduce的方法,MapReduce可以对数据库内的数据进行处理,也可以把自身的处理结果导入数据库。
1700432437
1700432438
■ MapReduce也可以直接处理云计算环境内的数据。
1700432439
1700432440
■ 更进一步,MapReduce可以对部署在云内的数据库的库内数据进行处理!
1700432441
1700432442
这3种技术可以相互影响并协同工作。每一项技术都能加强其他技术,只要被正确地使用。你完全可以同时使用这些技术,这并不是一个单选题。分析环境内可以同时包含这些不同的技术与方案,许多企业已经开始努力实现这3类技术的整合和协作了。此外,在刚才提到的各种分析场景下,还可以同时部署并配置网格计算方案。
1700432443
1700432445
4.8 本章小结
1700432446
1700432447
以下是本章的重点内容。
1700432448
1700432449
■ 几十年以来,分析师一直在推动提高分析可扩展性,大数据是人们要驾驭的下一代“可怕”数据。
1700432450
1700432451
■ 分析环境与数据管理环境正在互相融合。库内处理模式正在逐渐取代传统的离线分析处理模式,以支持各类高级分析。
1700432452
1700432453
■ 海量并行处理(MPP)数据库,云计算架构,以及MapReduce都是驾驭大数据强有力的工具。
1700432454
1700432455
■ 分析专家可以使用MPP数据库来完成数据准备和评分,具体方法包括直接提交SQL、用户自定义函数(UDF)、嵌入式过程以及预测模型标记语言(PMML)。
1700432456
1700432457
■ 云可以是公有云,也可以是私有云。不管是哪种云,都将使用户更容易地获得所需的系统资源,你只需要为自己的使用付费。对于研发类的活动与工作,云计算可以带来巨大的帮助。
1700432458
1700432459
■ 公有云并不提供性能承诺,数据安全必须被严格监管,因为数据已经脱离了企业的直接控制。
1700432460
1700432461
■ 一旦企业内公有云被广泛使用,使用公有云的成本将可能超过内部构建的自有系统。
1700432462
1700432463
■ 私有云在一个安全的环境下提供了灵活性,这对于大型企业有重要的意义。
1700432464
1700432465
■ 网格计算可以完成一些无法直接交给单一数据库处理的超大型任务。网格计算将被越来越广泛地使用,且功能变得更加强大。
1700432466
1700432467
■ MapReduce架构是一种可以使程序并发执行的技术,它将变得越来越重要。
1700432468
1700432469
■ MapReduce可以帮助人们驾驭大数据,它可以对大数据进行预处理,从中抽取重要的部分信息以进行更深入的分析。
1700432470
1700432471
■ 关系型数据库、云计算、MapReduce都能帮助人们驾驭大数据。这3项技术可以整合起来协同工作,这使得每一项技术都变得更加强大和高效。
1700432472
1700432473
1700432474
1700432475
[
上一页 ]
[ :1.700432427e+09 ]
[
下一页 ]