打字猴:1.700433074e+09
1700433074 驾驭大数据 [:1700430609]
1700433075 6.2.2 单点解决方案的兴起
1700433076
1700433077 在过去的十年间,单点分析解决方案一直呈现加速发展的趋势。单点分析解决方案的软件包通常只针对某一具体且明确的问题。通常,这些单点分析解决方案会关注一系列相关联的业务问题,并处在分析工具套件中的顶层。
1700433078
1700433079 单点解决方案的例子有价格优化、欺诈检测、需求预测和其他类似的应用。单点解决方案通常基于一些分析工具套件,如SAS,并调用这些分析工具内部的基础功能。然而,从用户界面来看,这些单点分析解决方案仅仅针对某一明确的问题集合。这个单点解决方案的开发可能耗费了大量人年(劳动量单位,一个人在一年内完成的工作量)。与其自己重新构建一个新的解决方案,企业可以考虑购买一个单点解决方案作为替代,这能节约大量的金钱和时间。
1700433080
1700433081 例如,一个针对金融组织的反洗钱应用有一套完整的算法和业务规则来查找可疑的资金转移。这种工具的用户界面专注于分辨可疑的案例,并提供额外的必要信息来帮助进一步分析调查这个可疑案例。这种工具能够帮助企业快速地开始分析工作,而不用从头构建整个流程。
1700433082
1700433083 单点分析解决方案使得企业内特定的业务部门可以在日常管理工作中使用高级分析的成果。这些工具的安装、配置与初始化的分析参数设置通常都需要较高层次的专业知识。随着时间的推移,维护和使用这个解决方案所需要的知识门槛逐渐降低。这使得单点解决方案可以服务于更多的用户群体。请注意,这并不违反之前提到的不理解代码就无法使用工具的说法。创建和配置单点解决方案的目的之一就是指导并约束用户进行适当的操作。
1700433084
1700433085 相对于普通的业务用户,单点分析解决方案通常服务于更高级的用户。不过,这并不意味着这些用户具有分析专家所拥有的熟练的分析技能。这些解决方案一旦被专家配置好后,它们就能自动地执行许多任务,高级用户能够有效监控分析工具的输出,并确保一切工作正常有序。这种方案的优秀之处是让企业更广泛地使用分析成果,并带来了额外的可扩展性的提升。没有哪个企业拥有足够的分析专家来使用人工方式处理所有的分析需求,单点分析解决方案减轻了这种负担。
1700433086
1700433087 了解单点解决方案
1700433088
1700433089 单点分析解决方案是解决特定商业问题一种极好的方式。这些工具让更广泛的用户参与到分析流程中。实施一个成熟的、商业化的单点解决方案,其速度也远远快于创建一个自定义的解决方案。但是,当你看到这些解决方案的价格时,准备被震惊吧。
1700433090
1700433091 单点解决方案的一个很大缺点是它们相当昂贵。某些知名单点解决方案的企业授权许可可能需要1000万美元甚至更多。如果财务回报高于投入,那也没关系。但是,通常大多数企业既无法承受安装配置的时间和精力,也无法承受同时实施大量单点解决方案的投资成本。因此,单点解决方案通常以串行方式执行,执行完一个,再开始执行另一个。
1700433092
1700433093 在未来的几年里,单点解决方案将成为大数据分析的常用分析手段。某些单点解决方案可能正是某些企业现在就需要开始着手的。当计划实施单点解决方案时,有必要对市场上各种成熟方案进行研究比较,以了解你可以选择的范围。
1700433094
1700433095 驾驭大数据 [:1700430610]
1700433096 6.2.3 开源的历史
1700433097
1700433098 开源软件已经出现了一段时间,能够通过下载供公众免费使用,此外,还可以获得开源软件的源代码,用户可以按照自己意愿开发自定义功能并添加到软件中。
1700433099
1700433100 有一些被广泛使用的、成功的开源软件。网络浏览器Firefox就是一个例子,还有Linux操作系统和Apache Web Server软件。之前我们说过了,因特网的高速发展产生了大量的开源活动和社区。网络世界产生了大量的创新,自然也包括了大量的开源创新。
1700433101
1700433102 目前看起来开源软件似乎已经涵盖了各个方面,有开源的数据库、开源的商业智能和报表工具、开源的数据整合工具、开源的办公套件等等。还有一些情况,如Linux和Apache,开源的工具集就算不是领导者,也已经成为相关领域内被大众认可的首选工具。但更多的情况下,开源软件并不是市场的主流,只是在一些特殊的领域内使用,Office办公套件就是这种情况的一个例子。通常来说,大型公司或成立很久的老牌公司,比初创公司或学术型组织更少地使用开源工具。
1700433103
1700433104 开源工具一个引人注目的特点是有成千上万的人为改善提高该工具的性能在持续地做着贡献。由于有大量的开发者在其空闲时间持续优化这个工具,如果发现了某个错误,它会被很快修复。大部分开源项目有正式的组织进行支持。在某些情况下,这些组织可能是完全自愿的;在另一些情况下,可能有非营利组织的全职员工在管理这些项目。通过捐赠,非营利组织可以提供工资,但目的并不是通过软件本身获取收益,仅仅是确保对开源项目的有效管理。开源项目一直对各个领域有着巨大影响,也包括分析领域。下面我们来介绍R项目。
1700433105
1700433106 针对统计计算的R项目
1700433107
1700433108 开源工具达到了世界先进分析水平的一个例子是针对统计计算的R开源项目,也被简称为“R”。R是免费的开源分析软件包,它直接与各种商业分析工具进行竞争并互相补充。R最初是从“S”派生出来的,S是十多年前为统计计算开发的一种早期语言。使用R命名的原因是英文字母S后是R,并且该项目主要开发者的名字也是以R开头(Robert Gentleman与Ross Ihaka)。〔8〕
1700433109
1700433110 R得到了快速发展并且被大量的分析专家使用,在高校和研究领域使用尤为普遍。在现今的企业环境中,如果有一个大型的分析专家团队,通常至少有几个成员在使用R。
1700433111
1700433112 虽然商业工具更加优秀,但是R的影响力仍然在不断扩大。迄今为止,R已经拥有了大量的用户,主要分布在学术界而不是大型企业内。R更多用于研发类任务,而不是针对海量数据的关键生产分析流程。这种情况可能随着时间发生改变,但至少目前是这样的。
1700433113
1700433114 R具有许多强大的功能。相对于其他的分析工具集,R是面向对象的。它能和常用的编程平台,比如C++和JAVA进行连接,这使得在应用程序中嵌入R变得可行。事实上,商业分析工具已经能在内部工具集中执行R程序,这是一个非常吸引人的特性。这个话题的详细讨论超出了本书的范围。
1700433115
1700433116 也许,R的最大优势在于,只要新的模型或分析方法开发完成,这个分析功能就会被人集成到R中。R开发并上线新功能的速度远远超过其他的商业软件,一想到这点,就会感觉特别爽。通常情况下,当某个算法被证明有市场需求后,商业工具的开发商才会考虑将其整合到商业工具中。然后他们将把这个算法加入开发计划,进行编码,把这项工程放入未来的发布版中,这个过程可能会耗费好几年。但是R就不同了,一旦有人认为某一个算法是有价值的,人们就会在R中开发并实现它。
1700433117
1700433118 你在使用R吗?
1700433119
1700433120 R是一个有前途的开源分析工具集。近些年来,R获得了长足的发展并被广泛使用。R有自己的优势和缺点,并不是每一个组织或者组织中的任何问题都适合使用R。但无论如何,R总会有它自己的位置。
1700433121
1700433122 事实上,R是免费的,很多人非常看重这一点。然而,与其他的开源项目一样,有专门提供专有组件和服务的付费公司,这些公司能够帮助你实施或开发R程序,在某些情况下,它们拥有改进开源软件功能的组件。免费软件的一个消极方面是没有商业软件那样的支持。你可能或多或少地需要依靠自己去寻找答案,虽然有大型网络社区能寻找答案,但是并没有一个单独的个人或团队来负责提供支持。
1700433123
[ 上一页 ]  [ :1.700433074e+09 ]  [ 下一页 ]