1700433058
6.2.1 图形化用户界面的崛起
1700433059
1700433060
正如我们刚才提到的,在20世纪90年代中期之前,进行统计分析的唯一方法就是编写代码。许多人,特别是传统守旧的分析人员,依然喜欢通过编写代码的方式来进行分析。然而,随着用户界面逐渐普及,分析专家们不用编写代码也可以高效率地进行分析了。今天的图形化用户界面可以帮助用户生成分析所需的各种代码。
1700433061
1700433062
分析专家们偏向于使用图形化界面还是编写代码,这个问题常引起激烈的争论。事实上,如果用户界面的功能足够丰富,并且在分析效率方面与编写代码相同甚至超过了编写代码,没有人会拒绝使用图形化用户界面,因为真正的分析专家只关心如何能够更快更高效地完成分析任务。另外,目前的软件工具不仅能帮助用户更快地生成分析代码,而且可以通过预先内置的分析解决方案来引导用户解决某些特定问题。
1700433063
1700433064
使用图形化用户界面的另外一个好处是,自动生成的代码几乎是没有错误的,并且经过了优化。这与完全人工编写代码不同,人工编写代码的错误率和性能几乎完全取决于编写者的水平。早期的用户界面非常难用,对于一个知道如何写好代码的人而言,编写代码的速度甚至比使用用户界面更快。新一代用户界面的自动化程度和效率已经提高了很多,它使得人们可以更加专注于需要使用的分析方法和分析内容本身,而不是拼命地编写代码。
1700433065
1700433066
不要做一个守旧的人
1700433067
1700433068
如今,许多用户界面在生成代码时已经快了很多,并且这些代码没有错误,且经过了优化。如果分析专家们给用户界面一个机会,特别是对于那些编写了几十年代码,又无法接受除了直接编写代码之外任何新事物的人而言,结果将是十分惊人的。工具可以使得分析专家更高效地工作,因为他们可以把更多时间花在分析方法上,而不是编写代码上。
1700433069
1700433070
图形化用户界面的一个巨大优势是可以自动生成代码,但这也是一个很大的风险。自动生成代码听上去非常不错,因为它可以快速地生成代码,但是它也可能会生成垃圾代码。这个问题我们将在第8章中进行讨论。如果用户的操作并不熟练,仅仅偶尔使用用户界面来生成代码,那么结果或许和他们所期望的完全不同。如果用户没有理解所生成代码的含义,那么用户将不能辨别代码的状态,这将会导致错误或者不准确的分析流程。
1700433071
1700433072
使用图形化用户界面的用户需要理解代码的含义,并且能够检查生成的代码是否符合自己的分析意图。用户通常希望在使用用户界面之后,仅仅需要点选少量选项就可以得到所期待的分析结果,然而,当看到工具所生成的代码之后,你常常会发现这和你想要的东西不完全一样。如今的用户界面帮助分析专家更有效率地工作,让他们将更多的时间花在分析上,而不是浪费在编写代码上。这些分析工具并不能够代替知识、天赋与努力。
1700433073
1700433075
6.2.2 单点解决方案的兴起
1700433076
1700433077
在过去的十年间,单点分析解决方案一直呈现加速发展的趋势。单点分析解决方案的软件包通常只针对某一具体且明确的问题。通常,这些单点分析解决方案会关注一系列相关联的业务问题,并处在分析工具套件中的顶层。
1700433078
1700433079
单点解决方案的例子有价格优化、欺诈检测、需求预测和其他类似的应用。单点解决方案通常基于一些分析工具套件,如SAS,并调用这些分析工具内部的基础功能。然而,从用户界面来看,这些单点分析解决方案仅仅针对某一明确的问题集合。这个单点解决方案的开发可能耗费了大量人年(劳动量单位,一个人在一年内完成的工作量)。与其自己重新构建一个新的解决方案,企业可以考虑购买一个单点解决方案作为替代,这能节约大量的金钱和时间。
1700433080
1700433081
例如,一个针对金融组织的反洗钱应用有一套完整的算法和业务规则来查找可疑的资金转移。这种工具的用户界面专注于分辨可疑的案例,并提供额外的必要信息来帮助进一步分析调查这个可疑案例。这种工具能够帮助企业快速地开始分析工作,而不用从头构建整个流程。
1700433082
1700433083
单点分析解决方案使得企业内特定的业务部门可以在日常管理工作中使用高级分析的成果。这些工具的安装、配置与初始化的分析参数设置通常都需要较高层次的专业知识。随着时间的推移,维护和使用这个解决方案所需要的知识门槛逐渐降低。这使得单点解决方案可以服务于更多的用户群体。请注意,这并不违反之前提到的不理解代码就无法使用工具的说法。创建和配置单点解决方案的目的之一就是指导并约束用户进行适当的操作。
1700433084
1700433085
相对于普通的业务用户,单点分析解决方案通常服务于更高级的用户。不过,这并不意味着这些用户具有分析专家所拥有的熟练的分析技能。这些解决方案一旦被专家配置好后,它们就能自动地执行许多任务,高级用户能够有效监控分析工具的输出,并确保一切工作正常有序。这种方案的优秀之处是让企业更广泛地使用分析成果,并带来了额外的可扩展性的提升。没有哪个企业拥有足够的分析专家来使用人工方式处理所有的分析需求,单点分析解决方案减轻了这种负担。
1700433086
1700433087
了解单点解决方案
1700433088
1700433089
单点分析解决方案是解决特定商业问题一种极好的方式。这些工具让更广泛的用户参与到分析流程中。实施一个成熟的、商业化的单点解决方案,其速度也远远快于创建一个自定义的解决方案。但是,当你看到这些解决方案的价格时,准备被震惊吧。
1700433090
1700433091
单点解决方案的一个很大缺点是它们相当昂贵。某些知名单点解决方案的企业授权许可可能需要1000万美元甚至更多。如果财务回报高于投入,那也没关系。但是,通常大多数企业既无法承受安装配置的时间和精力,也无法承受同时实施大量单点解决方案的投资成本。因此,单点解决方案通常以串行方式执行,执行完一个,再开始执行另一个。
1700433092
1700433093
在未来的几年里,单点解决方案将成为大数据分析的常用分析手段。某些单点解决方案可能正是某些企业现在就需要开始着手的。当计划实施单点解决方案时,有必要对市场上各种成熟方案进行研究比较,以了解你可以选择的范围。
1700433094
1700433096
6.2.3 开源的历史
1700433097
1700433098
开源软件已经出现了一段时间,能够通过下载供公众免费使用,此外,还可以获得开源软件的源代码,用户可以按照自己意愿开发自定义功能并添加到软件中。
1700433099
1700433100
有一些被广泛使用的、成功的开源软件。网络浏览器Firefox就是一个例子,还有Linux操作系统和Apache Web Server软件。之前我们说过了,因特网的高速发展产生了大量的开源活动和社区。网络世界产生了大量的创新,自然也包括了大量的开源创新。
1700433101
1700433102
目前看起来开源软件似乎已经涵盖了各个方面,有开源的数据库、开源的商业智能和报表工具、开源的数据整合工具、开源的办公套件等等。还有一些情况,如Linux和Apache,开源的工具集就算不是领导者,也已经成为相关领域内被大众认可的首选工具。但更多的情况下,开源软件并不是市场的主流,只是在一些特殊的领域内使用,Office办公套件就是这种情况的一个例子。通常来说,大型公司或成立很久的老牌公司,比初创公司或学术型组织更少地使用开源工具。
1700433103
1700433104
开源工具一个引人注目的特点是有成千上万的人为改善提高该工具的性能在持续地做着贡献。由于有大量的开发者在其空闲时间持续优化这个工具,如果发现了某个错误,它会被很快修复。大部分开源项目有正式的组织进行支持。在某些情况下,这些组织可能是完全自愿的;在另一些情况下,可能有非营利组织的全职员工在管理这些项目。通过捐赠,非营利组织可以提供工资,但目的并不是通过软件本身获取收益,仅仅是确保对开源项目的有效管理。开源项目一直对各个领域有着巨大影响,也包括分析领域。下面我们来介绍R项目。
1700433105
1700433106
针对统计计算的R项目
[
上一页 ]
[ :1.700433057e+09 ]
[
下一页 ]