打字猴:1.7004323e+09
1700432300 你确定省钱了吗
1700432301
1700432302 如果分析专家只考虑自己一个人,那么使用公有云确实要比购买一套专用设备便宜得多。但涉及大型企业,情况可能会发生变化。一旦许多不同的人和部门都开始使用云,也许人们很快就会发现,他们为公有云的每次使用支付了更多的钱,远远超过了建立一个自己的专有系统。
1700432303
1700432304 关于公有云还有另外一个常常被忽视的有趣现象。如果只有小部分任务需要被执行,使用公有云确实要比购买一个专有系统便宜。但在某些时候,使用公有云也可以比拥有一个专有的内部系统昂贵。一旦企业有大量的用户开始使用公有云,且他们都按照每次的使用量进行计费,那么购买一个企业自用系统反而会便宜得多。比节约成本更重要的是,公司可以对这些内部系统进行全面地管理控制,进而提升这个系统的性能。
1700432305
1700432306 随着时间推移,也许某一天,公有云可以以某一个合适的价格为企业级的关键任务功能提供服务。但在今天,那些提供更高等级性能保证的云计算供应商,它们会为这些更高品质的服务向用户收取比基本云服务昂贵很多的费用。此外,不管是事实还是一相情愿,云计算确实有可能满足某些安全性的要求。但在这些变成现实之前,大部分企业使用公有云的范围,只可能集中在研发类的工作上。
1700432307
1700432308 驾驭大数据 [:1700430569]
1700432309 4.4.2 私有云
1700432310
1700432311 私有云拥有与公有云完全相同的特征。唯一的区别是,私有云是某一企业拥有的,且通常部署在企业的防火墙内部。私有云提供与公有云完全一样的服务,但是服务对象仅限于企业的内部人员和团队。图4-5说明了公有云与私有云的区别。
1700432312
1700432313
1700432314
1700432315
1700432316 图4-5 公有云与私有云的比较
1700432317
1700432318 部署在企业内部的私有云有一个巨大的优势,就是企业拥有对这个系统的全部控制能力,包括数据与系统的安全。数据是无法跳出企业防火墙的,所以企业完全没有必要去担心数据到底在什么地方。私有云的数据安全性与其他的企业内部系统是完全一样的。
1700432319
1700432320 私有云的一个缺陷是,当你为用户提供服务前,你必须购买并拥有一整套的云计算设备,这在短期内可能会给公司的成本支出带来不利的影响。与公有云相比,公司在第一年花费的钱可能一下子增长了很多,但是随后的那些年,假如公司的大部分任务都在云内进行,私有云的成本反而会比较低。长期来看,如果有大量的用户持续使用云环境提供的服务,私有云的成本会比公有云低得多。
1700432321
1700432322 长期成本与短期成本
1700432323
1700432324 长期来看,如果有大量用户,私有云的成本会比公有云低得多。然而,由于需要启动资金与建设成本,实施私有云在短期内可能会给企业带来更高的费用支出。随着时间推移,这种情况就会逆转过来。
1700432325
1700432326 在概念上,私有云与我们将在第5章中讨论的分析沙箱没有很大的差异。两者的主要区别在于,一个真正的私有云会为用户提供充分的自助服务功能,而分析沙箱则要求系统具有更强的管理能力。这两个概念的确有些相近,在某些使用方面甚至是相同的。对于支持高级分析,可以说两者或多或少是在做同一件事情。其中一个区别是,如果使用私有云,并完全遵循云的规则与定义,系统负载会持续动态地发生变化,这可能会给系统管理带来不小的麻烦,用户可能不得不互相争夺资源。而在分析沙箱的环境中,当需要资源时,系统可以为团队分配一些确定的系统资源。系统资源确定的对立面是,如果你想得到额外的新资源,分析沙箱的用户要付出比私有云用户更多的努力。
1700432327
1700432328 驾驭大数据 [:1700430570]
1700432329 4.4.3 云计算小结
1700432330
1700432331 这些日子云计算获得了很多的关注,也被大肆地炒作,但云计算的架构体系确实有很多的亮点。和其他新事物一样,企业必须理解不同的云的使用方式,以及不同使用方式的优缺点。
1700432332
1700432333 在近期和中期,公有云将主要用于那些数据不太敏感的开发任务。私有云,以及私有云的孪生兄弟分析沙箱,都将得到越来越广泛的应用,并对各种类型的分析工作产生巨大的影响。
1700432334
1700432335 一个基础观点是,在企业内建立一个更加灵活、结构多变、控制更少的分析环境,以支持各种研究、创新与探索性工作,这是完全正确的,而云计算恰恰就能提供这样的环境。
1700432336
1700432337 驾驭大数据 [:1700430571]
1700432338 4.5 网格计算
1700432339
1700432340 某些计算过程与算法无法全部转换成SQL,或者难以嵌入数据库的某个自定义函数中。在这种情况下,必须要把数据从传统的分析环境中抽取出来,然后用传统的分析工具和软件进行分析。在很长的一段时间里,为了完成这个艰巨的任务,人们常使用一些大型服务器。问题是,随着分析师越来越多,以及分析任务越来越繁重,人们不得不对这些服务器进行扩容,或者增加更多的服务器,而这些都是相当昂贵的。即使这样,分析师还是经常把所有可用资源全部用完。
1700432341
1700432342 网格配置可以降低系统成本并提高性能。网格计算通常属于一种“高性能计算环境”。网格计算会使用大量的低成本计算机,而不是一台或几台高性能的服务器。网格计算不使用一台大型服务器来管理执行不同任务的CPU和资源,相反地,不同任务被独立地分配给不同的计算机,并让每一台计算机并发执行。每一台计算机也许都会承担原有服务器的某一部分任务,同一时间一台计算机通常只能执行一项任务。总体来看,网格计算可以承担相当多的工作。因此,网格计算这种系统机制在提升系统性能和容量的同时,可以显著地降低系统的总体成本。同时,网格计算还可以帮助企业平衡系统负载,管理任务的优先级,并为分析任务提供更高的可用性。
1700432343
1700432344 使用网格计算架构,分析专家可以在保持低价与高性能的同时,提升分析系统的可扩展性。当然,网格计算并不适合所有的场景。网格计算可能并不适合同时执行很多非常紧急的任务。因为每项任务都是由一台计算机独立完成的,如果同时有许多的超大型任务,网格计算环境下低成本计算机的表现将低于一台大型服务器。但是,假如一个大型企业内有很多的任务需要执行,而且大部分任务都是中小型的,那么使用网格计算环境将带来极大的提升。
1700432345
1700432346 网格计算还有一个刚出现不久的创新,即高性能的分析架构。在这个创新架构中,网格计算环境下的不同计算机都知道其他计算机的存在,并且不同计算机可以共享信息。这种协作方式,在同一时间充分使用了网格计算环境下的所有计算资源,使得某些大型任务可以更快地完成。这解决了我们之前提到的网格计算缺陷,即网格计算环境下每台独立的计算机只能承担一定复杂度的任务。这种新的网格计算技术被越来越多的人所接受,前景一片光明。在本书的写作过程中,还出现了一种更新颖的创新技术,它让网格环境直接连接到某一个数据库系统,使网格的系统性能得到进一步的提升。SAS公司的高性能分析解决方案就是这样的一个实例。
1700432347
1700432348 建模的理念与方法一直都在发展和进步,我们将在第6章中讨论的简易建模方法也获得了越来越广泛的使用,网格计算可以成为一种处理额外建模工作负载的有效方法。
1700432349
[ 上一页 ]  [ :1.7004323e+09 ]  [ 下一页 ]