1700433206
1700433207
■ 用户界面已经发展到包括强大的图形、可视化工作流图表和专业的单点解决方案。
1700433208
1700433209
■ 用户界面是分析专家提升生产力的工具,前提是这些分析专家知道自己在做什么,并能确保该工具“最适当地”工作,在友好的使用界面下其实更容易把事情搞砸。
1700433210
1700433211
■ 单点分析解决方案专注于一个具体领域的分析,如欺诈或定价,并在该领域内进行深入分析。这些工具的影响力在不断地提升。
1700433212
1700433213
■ R是一个开源分析工具,近年来被越来越多地使用。R的一个优点是在软件中增加新算法的速度,它的一个缺点是其目前缺乏企业级的分析可扩展性。
1700433214
1700433215
■ 与文字解释或电子表格数据相比,可视化方式可以更容易地发现模式。现代可视化工具可以直接连接数据库,建立数据联系与交互式分析图形,具备比传统图表分析工具更多的可视化选项。
1700433216
1700433217
■ 数据可视化的重点不是华丽的图形,而是如何对数据进行展示,以获得对分析结论更深入地理解。
1700433218
1700433219
〔1〕你可以在这个网站找到更多相关信息:www.DMG.org。
1700433220
1700433221
〔2〕麦肯锡管理咨询公司,Clearing the Air on Cloud Computing,2009年3月。
1700433222
1700433223
〔3〕美国国家标准技术研究所,草案,NIST Working Definition of Cloud Computing,8-21-09,第15版,http://csrc.nist.gov/publications/drafts/800-146/Draft-NIST-SP800-146.pdf。
1700433224
1700433225
〔4〕美国国家标准技术研究所,www.nist.gov/itl/cloud/index.com。
1700433226
1700433227
〔5〕译者注:英文有26个字母。
1700433228
1700433229
〔6〕Giovanni Seni and John Elder, Ensemble methods in Data Mining: Improving Accuracy through Combining Predictions, Morgan and Clay-pool Publishers, 2010.
1700433230
1700433231
〔7〕James Surowiecki, The Wisdom of Crowds, Anchor Books, 2005.
1700433232
1700433233
〔8〕The Comprehensive R Network (CRAN), http://cran.r-project.org/doc/FAQ/R-FAQ.html#Why-is-R-Named-R_03f.
1700433234
1700433235
〔9〕Edward R. Tufte, www.edwardtufte.com/tufte/books_vdqi.
1700433236
1700433237
〔10〕Edward R. Tufte, www.edwardtufte.com/tufte/minard.
1700433238
1700433239
〔11〕ImmerSive Intelligence Colleagues, http://im-tel.org/.
1700433240
1700433241
1700433242
1700433243
1700433245
驾驭大数据 第三部分 驾驭大数据:人和方法
1700433246
1700433248
第7章如何提供优质分析
1700433249
1700433250
计算统计、撰写报表、使用模型算法,这些都是提供优质分析的过程中的某一步骤。世界上并不存在一个按钮,可以让你通过简单的一步就得到满意的分析结果。如果不理解或没有专注于分析需求,将带来许多麻烦或导致错误的分析结论,最终将产生大量的额外工作。
1700433251
1700433252
这一章将讨论许多这方面的主题,我们首先要认清一些概念,然后我们将讨论一些与创建一个优质分析相关的主题。每个主题都包含一些教训与差异原则,就是这些细微差别让分析不同于报表和统计结果,也是有意义的分析与无意义分析的区别所在。
1700433253
1700433254
我们讨论的这些原则应用非常广泛,并不只适用于大数据。大数据增加了企业处理数据的复杂度,因此对大数据而言,坚持处理原则就变得更加重要。如果你的公司只使用报表将无法驾驭大数据,你也不能使用不规范的分析方法来处理大数据。
1700433255
[
上一页 ]
[ :1.700433206e+09 ]
[
下一页 ]