1700432488
1700432490
5.1 分析沙箱
1700432491
1700432492
在第4章,我们讨论了海量并行数据库系统的巨大威力。这种数据库系统的一种应用是加快高级分析流程的构建与部署。为了帮助分析专家高效地使用企业级数据仓库和数据集市,分析专家必须获得这些系统的正确权限,并进行访问。分析沙箱就是这样的一种管理机制,如果被恰当地使用,分析沙箱能给大数据领域带来巨大价值。
1700432493
1700432494
“沙箱”这个词来自一种孩子们常见的玩具。在沙箱里,孩子们可以创建他们想要的任何东西,他们可以根据自己的意愿把沙子堆砌成各种形状。类似地,分析环境的沙箱就是一个资源组。在这个资源组里,分析专家能根据自己的意愿对数据进行各种探索研究。沙箱还有另外一个名称,叫做敏捷分析云或数据实验室。具体是什么名称并不重要,重要的是你理解了背后的理念。
1700432495
1700432497
5.1.1 分析沙箱:定义与范围
1700432498
1700432499
分析沙箱提供了一个资源组,可以支持各种高级分析,以找到各类关键业务问题的答案。分析沙箱最适合进行数据探索、分析流程开发、概念验证以及原型开发。这些探索性的分析流程一旦发展为用户管理流程或者生产流程,就应该从分析沙箱里挪出去。
1700432500
1700432501
分析沙箱只被一小部分用户使用。分析沙箱中创建的数据与生产数据库彼此隔离。沙箱用户也可以把自己的数据导入到沙箱内,在短期内作为整个分析项目的一部分数据源,即使这些数据不在企业的数据模型范围内。
1700432502
1700432503
沙箱中的数据都有时间限制。沙箱的理念并不是建立一个永久数据集,而是根据每个项目的需求构建项目所需的数据集。一旦这个项目完成了,数据就被删除了。如果沙箱被恰当地使用,沙箱将是提升企业分析价值的主要驱动力。
1700432504
1700432506
5.1.2 分析沙箱的好处
1700432507
1700432508
分析沙箱有什么好处?我们将从分析专家与IT人员两种视角来进行阐述。
1700432509
1700432510
对于分析专家而言,沙箱的好处有以下几个。
1700432511
1700432512
■ 独立:分析专家可以在数据库系统中独立开展工作,不需要经常来回申请项目所需的各种权限。
1700432513
1700432514
■ 灵活性:分析专家可以自由地使用各种分析工具,包括商业智能、统计分析或可视化数据工具等。
1700432515
1700432516
■ 效率:分析专家可以直接使用企业数据仓库或数据集市来进行分析,不需要抽取或移动数据。
1700432517
1700432518
■ 自由:分析专家不需要负责系统管理与生产流程的监控,这些维护性工作都转移给了IT部门。
1700432519
1700432520
■ 速度:通过并行处理可以实现大范围的快速优化。这也带来了“快速迭代”与“快速试错”的能力,降低了创新的风险。
1700432521
1700432522
沙箱对每一个人都有好处!
1700432523
1700432524
分析沙箱对分析专家和IT人员有不同的好处,它不会伤害任何一方。双方人员在不理解沙箱时,常常害怕这个概念。建议开展内部培训后再启动沙箱建设,这可能会耗费一些时间,但绝对值得。
1700432525
1700432526
分析沙箱对IT人员有以下几个好处。
1700432527
1700432528
■ 集中化:IT人员可以像管理其他数据库一样对分析沙箱进行集中管理。
1700432529
1700432530
■ 流水线作业:沙箱显著地简化了推动在生产流程中使用分析流程的难度,因为开发与部署都发生在同一平台。
1700432531
1700432532
■ 简化:应用从开发环境迁移到生产环境时,不需要进行任何形式的重新开发。
1700432533
1700432534
■ 控制:IT可以管理沙箱环境,平衡沙箱用户和其他用户的资源需求。如果沙箱环境的探索工作发生了错误,也不会影响生产环境。
1700432535
1700432536
■ 降低成本:通过把许多分析型数据集市集中到一个中央集中系统内,可以显著地降低成本。
1700432537
[
上一页 ]
[ :1.700432488e+09 ]
[
下一页 ]