1700433248
第7章如何提供优质分析
1700433249
1700433250
计算统计、撰写报表、使用模型算法,这些都是提供优质分析的过程中的某一步骤。世界上并不存在一个按钮,可以让你通过简单的一步就得到满意的分析结果。如果不理解或没有专注于分析需求,将带来许多麻烦或导致错误的分析结论,最终将产生大量的额外工作。
1700433251
1700433252
这一章将讨论许多这方面的主题,我们首先要认清一些概念,然后我们将讨论一些与创建一个优质分析相关的主题。每个主题都包含一些教训与差异原则,就是这些细微差别让分析不同于报表和统计结果,也是有意义的分析与无意义分析的区别所在。
1700433253
1700433254
我们讨论的这些原则应用非常广泛,并不只适用于大数据。大数据增加了企业处理数据的复杂度,因此对大数据而言,坚持处理原则就变得更加重要。如果你的公司只使用报表将无法驾驭大数据,你也不能使用不规范的分析方法来处理大数据。
1700433255
1700433257
7.1 分析与报表
1700433258
1700433259
许多组织认为分析与报表是一回事。这种观点看起来好像很对,因此我们需要深入讨论一下。报表很重要并且很有价值,正确使用报表可以显著地提升价值。但是报表有它的局限性,我们必须知道这个局限性是什么。
1700433260
1700433261
总体来说,一个组织要想在大数据方面有所成就,报表和分析都不能少。这一结论是显而易见的,正如二者已经在之前的其他数据源上发挥了很大作用一样。关键问题是清楚地理解报表和分析的区别。另外,还需要明白二者的共同之处。如果没有这些深刻的理解,你的企业一定会在这方面吃亏。
1700433262
1700433263
思想是分析之父
1700433264
1700433265
分析可以生成报表,报表也可以生成分析。大多数情况下是报表生成分析。例如,你可能有十个报表在桌子上,把握它们中的关键信息,总结出你的新发现,并搞清楚这意味着什么,这就是分析。正是人们在数据和统计领域中的思想和思考创造了分析。没有经过翻译和解释的数据和统计是没有用的。
1700433266
1700433268
7.1.1 报表
1700433269
1700433270
让我们先来给报表下个定义。报表环境常被称为商业智能(BI)环境。正是在这种环境中,使用者选择他们想要运行的报表,执行该报表并查看结果。这样的报表或许会包含表格、图形、图表或它们的结合。以下是定义报表的关键因素。
1700433271
1700433272
■ 报表能够将所需的数据反馈给使用者。
1700433273
1700433274
■ 数据将以标准的、预定义的格式呈现。
1700433275
1700433276
■ 在生成报表的过程中,除了通过报表界面请求报表的使用者外,没有其他人参与(我们假定报表模块已经被创造和部署好了)。
1700433277
1700433278
■ 综合以上几点,报表不够灵活。
1700433279
1700433280
我们需要澄清最后一点。创建复杂报表模块的同时,可以创建多种提示(prompts)和筛选(filters)。在这种报表内很可能包含有多种选项,但有了那些预定义选项的限制后,报告就变得相当不灵活了。一般的使用者很难生成全新的报表,或者检查那些预定义的提示和筛选是怎样工作的。使用者可能选择仅仅简单地填写那些默认的提示和筛选。
1700433281
1700433282
一种误用报表的情况是:手头上有大量可用的报表,但误以为它们是大量可用的分析。这种现象在许多组织中都很常见。管理商业智能环境的IT人员会说,“我们有世界一流的BI环境。我们有500多份可用的报表,它们可以覆盖任何商业领域,任何人的需求。我们的业务人员拥有他们想要的一切。”
1700433283
1700433284
同时,业务人员会说,“太失望了!我们花费了一两年时间来创建这个报表系统,但我依然没有得到我需要的。”如果业务人员和IT人员走到一个屋子里,会话往往是这样开始的,商务人员抱怨他们没有得到自己需要的分析结果,IT人员会说,“你们真是疯了!有500份可用报表还不够吗?”最终导致双方相互指责。
1700433285
1700433286
分歧源于下面的事实:好像埋藏在500份报表中的东西才是业务人员所需要的。但当报表多达500份时,他们很难从中找出自己想要的。另外,任何两个人都希望用不同的想法看待同一件事情。每一个商务人员都希望在报表上有一个额外的度量标准,或者用一种不同的方式去组织报表。或许会有500份报表摆在那里,但是没有一份是任何商务人员都想要的。
1700433287
1700433288
在报表中,数量不重要
1700433289
1700433290
许多IT组织致力于建立尽可能多并且尽可能覆盖所有话题的报表。这可能受到业务人员的如下行为驱使:他们提交了覆盖他们所有可能用到的所有可能的需求,而不是他们真正需要并且会使用的需求。结果,业务人员收到各种各样的报表,可还是得不到他们想要的信息。将焦点放到提供紧密关联的有限报表上。不要掉进这个陷阱:认为拥有最多报表的那个人会获得胜利!
1700433291
1700433292
与生成500份各种类型的报表相比,提供少量满足终端使用者需求的报表的效果要好很多。重要的是报表的相关性,而不是报表的数量。然而通常情况是,人们更多地关注报表数量而不是相关性。正如我们接下来要讨论的那样,即使拥有了所有商业报表的完美组合,仍然无法提供优质分析,而这些报表仅仅是分析流程中所需的一些数据而已。
1700433293
1700433294
有的时候我们不需要对报表进行深入分析。例如,假定你有一个每周产品的销售报表,并且你想知道你的产品是否达到了它们上周的销售目标。通过运行这个报表,答案很快就呈现在了你的面前,也就没有做进一步的工作或分析的必要了。这是增加报表价值的一种方式,它们能够快速简洁地回答常见的问题。如果一切顺利,那么就没有做进一步工作的必要了。如果某些事情看起来与期望不符,那么再做进一步的分析。
1700433295
[
上一页 ]
[ :1.700433247e+09 ]
[
下一页 ]