打字猴:1.700432505e+09
1700432505 驾驭大数据 [:1700430581]
1700432506 5.1.2 分析沙箱的好处
1700432507
1700432508 分析沙箱有什么好处?我们将从分析专家与IT人员两种视角来进行阐述。
1700432509
1700432510 对于分析专家而言,沙箱的好处有以下几个。
1700432511
1700432512 ■ 独立:分析专家可以在数据库系统中独立开展工作,不需要经常来回申请项目所需的各种权限。
1700432513
1700432514 ■ 灵活性:分析专家可以自由地使用各种分析工具,包括商业智能、统计分析或可视化数据工具等。
1700432515
1700432516 ■ 效率:分析专家可以直接使用企业数据仓库或数据集市来进行分析,不需要抽取或移动数据。
1700432517
1700432518 ■ 自由:分析专家不需要负责系统管理与生产流程的监控,这些维护性工作都转移给了IT部门。
1700432519
1700432520 ■ 速度:通过并行处理可以实现大范围的快速优化。这也带来了“快速迭代”与“快速试错”的能力,降低了创新的风险。
1700432521
1700432522 沙箱对每一个人都有好处!
1700432523
1700432524 分析沙箱对分析专家和IT人员有不同的好处,它不会伤害任何一方。双方人员在不理解沙箱时,常常害怕这个概念。建议开展内部培训后再启动沙箱建设,这可能会耗费一些时间,但绝对值得。
1700432525
1700432526 分析沙箱对IT人员有以下几个好处。
1700432527
1700432528 ■ 集中化:IT人员可以像管理其他数据库一样对分析沙箱进行集中管理。
1700432529
1700432530 ■ 流水线作业:沙箱显著地简化了推动在生产流程中使用分析流程的难度,因为开发与部署都发生在同一平台。
1700432531
1700432532 ■ 简化:应用从开发环境迁移到生产环境时,不需要进行任何形式的重新开发。
1700432533
1700432534 ■ 控制:IT可以管理沙箱环境,平衡沙箱用户和其他用户的资源需求。如果沙箱环境的探索工作发生了错误,也不会影响生产环境。
1700432535
1700432536 ■ 降低成本:通过把许多分析型数据集市集中到一个中央集中系统内,可以显著地降低成本。
1700432537
1700432538 驾驭大数据 [:1700430582]
1700432539 5.1.3 内部分析沙箱
1700432540
1700432541 从企业级数据仓库或数据集市中划分出一块区域形成的分析沙箱,就是内部分析沙箱。在这个例子里,沙箱物理上是部署在生产系统中的,但沙箱的数据并不是生产数据库的一部分。沙箱是系统中独立存在的数据库区域,如图5-1所示。
1700432542
1700432543
1700432544
1700432545
1700432546 图5-1 内部分析沙箱
1700432547
1700432548 使用大数据时需要注意,最好增加一个MapReduce环境到混合环境中。通常会同数据库平台一起安装,除非你现在使用的系统没有同时包括这两个环境。MapReduce环境需要访问内部沙箱,数据可以在所需的两个环境中进行共享。我们已经在第4章中讨论过了MapReduce。
1700432549
1700432550 内部沙箱的一个优势是,它可以利用现有的硬件资源和基础设施。这使得我们可以方便地搭建内部沙箱。从系统管理员的角度来看,在系统中搭建一个沙箱与创建一个数据库容器没什么两样。沙箱唯一的不同之处在于,它可以将某些权限授予某些用户,并规定了如何使用它。
1700432551
1700432552 内部分析沙箱最大的优势是,可以直接把生产环境的数据与沙箱的数据进行关联分析。既然生产环境数据与分析沙箱的数据都保存在生产系统中,那么把某一个数据源与另外一个数据源联合起来一起分析就很容易实现了,图5-2介绍了这一工作原理。
1700432553
1700432554
[ 上一页 ]  [ :1.700432505e+09 ]  [ 下一页 ]