打字猴:1.700433046e+09
1700433046 驾驭大数据 [:1700430607]
1700433047 6.2 分析工具的演进
1700433048
1700433049 在20世纪80年代的时候,我刚开始从事分析工作,用户体验的友好性并不是描述或评价一个工具或系统的关键指标,所有分析工作都是在大型机中完成的。当时不仅需要直接通过程序代码来实现分析工作,而且需要使用非常晦涩的作业控制语言(Job Control Language,JCL)。任何使用过作业控制语言的人都会理解这种痛苦。
1700433050
1700433051 随着服务器和PC的普及,人们首先将旧的代码界面移植到了新的平台上。在当时的情况下,图形和输出是非常初级的。最初,柱状图是通过输入简单的字符来表示的,网格是通过破折号来表示的,输出物大多是以文本形式进行组织的。
1700433052
1700433053 随着时间的推移,新的图形界面逐渐发展起来了,用户能够通过点击来实现大部分操作,不再需要编写代码。实际上所有可用的商业分析工具都已经在20世纪90年代末实现了图形化界面。用户界面被不断地改进,加入了丰富的图形、虚拟的工作流图表以及特殊单点解决方案的应用程序。工作流图表是一种很好的新特性,因为它允许分析专家将某个流程中单独的步骤展示在一张多任务关联的视图中,这样就可以利用可视化的方法追踪处理流程中的每一个步骤。
1700433054
1700433055 随着工具本身的持续发展,工具的使用范围也逐渐扩大。现在的工具可以帮助分析专家管理分析的部署,管理分析服务和软件,并可以将代码从一种语言转换成另外一种语言。目前,已经存在许多可用的商业分析包。分析工具的领导者是SAS和SPSS,还有不少其他的分析工具可以使用,但许多分析工具仅仅能够分析某些特定的业务问题。此外,也有一些非常好用的开源分析工具,我们随后将会进行讨论。
1700433056
1700433057 驾驭大数据 [:1700430608]
1700433058 6.2.1 图形化用户界面的崛起
1700433059
1700433060 正如我们刚才提到的,在20世纪90年代中期之前,进行统计分析的唯一方法就是编写代码。许多人,特别是传统守旧的分析人员,依然喜欢通过编写代码的方式来进行分析。然而,随着用户界面逐渐普及,分析专家们不用编写代码也可以高效率地进行分析了。今天的图形化用户界面可以帮助用户生成分析所需的各种代码。
1700433061
1700433062 分析专家们偏向于使用图形化界面还是编写代码,这个问题常引起激烈的争论。事实上,如果用户界面的功能足够丰富,并且在分析效率方面与编写代码相同甚至超过了编写代码,没有人会拒绝使用图形化用户界面,因为真正的分析专家只关心如何能够更快更高效地完成分析任务。另外,目前的软件工具不仅能帮助用户更快地生成分析代码,而且可以通过预先内置的分析解决方案来引导用户解决某些特定问题。
1700433063
1700433064 使用图形化用户界面的另外一个好处是,自动生成的代码几乎是没有错误的,并且经过了优化。这与完全人工编写代码不同,人工编写代码的错误率和性能几乎完全取决于编写者的水平。早期的用户界面非常难用,对于一个知道如何写好代码的人而言,编写代码的速度甚至比使用用户界面更快。新一代用户界面的自动化程度和效率已经提高了很多,它使得人们可以更加专注于需要使用的分析方法和分析内容本身,而不是拼命地编写代码。
1700433065
1700433066 不要做一个守旧的人
1700433067
1700433068 如今,许多用户界面在生成代码时已经快了很多,并且这些代码没有错误,且经过了优化。如果分析专家们给用户界面一个机会,特别是对于那些编写了几十年代码,又无法接受除了直接编写代码之外任何新事物的人而言,结果将是十分惊人的。工具可以使得分析专家更高效地工作,因为他们可以把更多时间花在分析方法上,而不是编写代码上。
1700433069
1700433070 图形化用户界面的一个巨大优势是可以自动生成代码,但这也是一个很大的风险。自动生成代码听上去非常不错,因为它可以快速地生成代码,但是它也可能会生成垃圾代码。这个问题我们将在第8章中进行讨论。如果用户的操作并不熟练,仅仅偶尔使用用户界面来生成代码,那么结果或许和他们所期望的完全不同。如果用户没有理解所生成代码的含义,那么用户将不能辨别代码的状态,这将会导致错误或者不准确的分析流程。
1700433071
1700433072 使用图形化用户界面的用户需要理解代码的含义,并且能够检查生成的代码是否符合自己的分析意图。用户通常希望在使用用户界面之后,仅仅需要点选少量选项就可以得到所期待的分析结果,然而,当看到工具所生成的代码之后,你常常会发现这和你想要的东西不完全一样。如今的用户界面帮助分析专家更有效率地工作,让他们将更多的时间花在分析上,而不是浪费在编写代码上。这些分析工具并不能够代替知识、天赋与努力。
1700433073
1700433074 驾驭大数据 [:1700430609]
1700433075 6.2.2 单点解决方案的兴起
1700433076
1700433077 在过去的十年间,单点分析解决方案一直呈现加速发展的趋势。单点分析解决方案的软件包通常只针对某一具体且明确的问题。通常,这些单点分析解决方案会关注一系列相关联的业务问题,并处在分析工具套件中的顶层。
1700433078
1700433079 单点解决方案的例子有价格优化、欺诈检测、需求预测和其他类似的应用。单点解决方案通常基于一些分析工具套件,如SAS,并调用这些分析工具内部的基础功能。然而,从用户界面来看,这些单点分析解决方案仅仅针对某一明确的问题集合。这个单点解决方案的开发可能耗费了大量人年(劳动量单位,一个人在一年内完成的工作量)。与其自己重新构建一个新的解决方案,企业可以考虑购买一个单点解决方案作为替代,这能节约大量的金钱和时间。
1700433080
1700433081 例如,一个针对金融组织的反洗钱应用有一套完整的算法和业务规则来查找可疑的资金转移。这种工具的用户界面专注于分辨可疑的案例,并提供额外的必要信息来帮助进一步分析调查这个可疑案例。这种工具能够帮助企业快速地开始分析工作,而不用从头构建整个流程。
1700433082
1700433083 单点分析解决方案使得企业内特定的业务部门可以在日常管理工作中使用高级分析的成果。这些工具的安装、配置与初始化的分析参数设置通常都需要较高层次的专业知识。随着时间的推移,维护和使用这个解决方案所需要的知识门槛逐渐降低。这使得单点解决方案可以服务于更多的用户群体。请注意,这并不违反之前提到的不理解代码就无法使用工具的说法。创建和配置单点解决方案的目的之一就是指导并约束用户进行适当的操作。
1700433084
1700433085 相对于普通的业务用户,单点分析解决方案通常服务于更高级的用户。不过,这并不意味着这些用户具有分析专家所拥有的熟练的分析技能。这些解决方案一旦被专家配置好后,它们就能自动地执行许多任务,高级用户能够有效监控分析工具的输出,并确保一切工作正常有序。这种方案的优秀之处是让企业更广泛地使用分析成果,并带来了额外的可扩展性的提升。没有哪个企业拥有足够的分析专家来使用人工方式处理所有的分析需求,单点分析解决方案减轻了这种负担。
1700433086
1700433087 了解单点解决方案
1700433088
1700433089 单点分析解决方案是解决特定商业问题一种极好的方式。这些工具让更广泛的用户参与到分析流程中。实施一个成熟的、商业化的单点解决方案,其速度也远远快于创建一个自定义的解决方案。但是,当你看到这些解决方案的价格时,准备被震惊吧。
1700433090
1700433091 单点解决方案的一个很大缺点是它们相当昂贵。某些知名单点解决方案的企业授权许可可能需要1000万美元甚至更多。如果财务回报高于投入,那也没关系。但是,通常大多数企业既无法承受安装配置的时间和精力,也无法承受同时实施大量单点解决方案的投资成本。因此,单点解决方案通常以串行方式执行,执行完一个,再开始执行另一个。
1700433092
1700433093 在未来的几年里,单点解决方案将成为大数据分析的常用分析手段。某些单点解决方案可能正是某些企业现在就需要开始着手的。当计划实施单点解决方案时,有必要对市场上各种成熟方案进行研究比较,以了解你可以选择的范围。
1700433094
1700433095 驾驭大数据 [:1700430610]
[ 上一页 ]  [ :1.700433046e+09 ]  [ 下一页 ]