1700433232
1700433233
〔8〕The Comprehensive R Network (CRAN), http://cran.r-project.org/doc/FAQ/R-FAQ.html#Why-is-R-Named-R_03f.
1700433234
1700433235
〔9〕Edward R. Tufte, www.edwardtufte.com/tufte/books_vdqi.
1700433236
1700433237
〔10〕Edward R. Tufte, www.edwardtufte.com/tufte/minard.
1700433238
1700433239
〔11〕ImmerSive Intelligence Colleagues, http://im-tel.org/.
1700433240
1700433241
1700433242
1700433243
1700433245
驾驭大数据 第三部分 驾驭大数据:人和方法
1700433246
1700433248
第7章如何提供优质分析
1700433249
1700433250
计算统计、撰写报表、使用模型算法,这些都是提供优质分析的过程中的某一步骤。世界上并不存在一个按钮,可以让你通过简单的一步就得到满意的分析结果。如果不理解或没有专注于分析需求,将带来许多麻烦或导致错误的分析结论,最终将产生大量的额外工作。
1700433251
1700433252
这一章将讨论许多这方面的主题,我们首先要认清一些概念,然后我们将讨论一些与创建一个优质分析相关的主题。每个主题都包含一些教训与差异原则,就是这些细微差别让分析不同于报表和统计结果,也是有意义的分析与无意义分析的区别所在。
1700433253
1700433254
我们讨论的这些原则应用非常广泛,并不只适用于大数据。大数据增加了企业处理数据的复杂度,因此对大数据而言,坚持处理原则就变得更加重要。如果你的公司只使用报表将无法驾驭大数据,你也不能使用不规范的分析方法来处理大数据。
1700433255
1700433257
7.1 分析与报表
1700433258
1700433259
许多组织认为分析与报表是一回事。这种观点看起来好像很对,因此我们需要深入讨论一下。报表很重要并且很有价值,正确使用报表可以显著地提升价值。但是报表有它的局限性,我们必须知道这个局限性是什么。
1700433260
1700433261
总体来说,一个组织要想在大数据方面有所成就,报表和分析都不能少。这一结论是显而易见的,正如二者已经在之前的其他数据源上发挥了很大作用一样。关键问题是清楚地理解报表和分析的区别。另外,还需要明白二者的共同之处。如果没有这些深刻的理解,你的企业一定会在这方面吃亏。
1700433262
1700433263
思想是分析之父
1700433264
1700433265
分析可以生成报表,报表也可以生成分析。大多数情况下是报表生成分析。例如,你可能有十个报表在桌子上,把握它们中的关键信息,总结出你的新发现,并搞清楚这意味着什么,这就是分析。正是人们在数据和统计领域中的思想和思考创造了分析。没有经过翻译和解释的数据和统计是没有用的。
1700433266
1700433268
7.1.1 报表
1700433269
1700433270
让我们先来给报表下个定义。报表环境常被称为商业智能(BI)环境。正是在这种环境中,使用者选择他们想要运行的报表,执行该报表并查看结果。这样的报表或许会包含表格、图形、图表或它们的结合。以下是定义报表的关键因素。
1700433271
1700433272
■ 报表能够将所需的数据反馈给使用者。
1700433273
1700433274
■ 数据将以标准的、预定义的格式呈现。
1700433275
1700433276
■ 在生成报表的过程中,除了通过报表界面请求报表的使用者外,没有其他人参与(我们假定报表模块已经被创造和部署好了)。
1700433277
1700433278
■ 综合以上几点,报表不够灵活。
1700433279
1700433280
我们需要澄清最后一点。创建复杂报表模块的同时,可以创建多种提示(prompts)和筛选(filters)。在这种报表内很可能包含有多种选项,但有了那些预定义选项的限制后,报告就变得相当不灵活了。一般的使用者很难生成全新的报表,或者检查那些预定义的提示和筛选是怎样工作的。使用者可能选择仅仅简单地填写那些默认的提示和筛选。
1700433281
[
上一页 ]
[ :1.700433232e+09 ]
[
下一页 ]