打字猴:1.70043315e+09
1700433150 现代的可视化工具
1700433151
1700433152 可视化工具发展得如此迅速,以至于许多人并没有意识到它拥有的力量。Tableau、JMP、Advizor、Spotfire这些可视化分析工具帮助分析专家和业务用户创建各种分析图形,不仅能够清晰地描述出已发生的现象与事实,还提供了一种可视化的交互分析方式来发现新的事实。
1700433153
1700433154 今天的可视化工具,可以让多个选项卡内的图形和图表直接链接到基础数据。更重要的是,这些标签、图形和图表是互相关联的。例如,如果用户单击了东北地区的图形区域,所有其他图表将立刻进行调整,只显示东北地区的数据。
1700433155
1700433156 这些新的工具被认为是演示文稿和电子表格软件的“锦囊妙计”。一些可视化工具不仅具有类似电子表格程序的透视和数据处理能力,还具有超出演示程序的图表图形绘制能力。现在这些工具还增加了新的功能,如连接大型数据库、可视化交互分析、随意探索和下钻等。这让分析变得极为强大。
1700433157
1700433158 数据可视化的大前提是,只看大表或一组数字来确定趋势,但是,这对人类是相当困难的。通过恰当的可视化处理,观察趋势就变得容易多了。一些数据可视化图形,如社交网络图形,其传递的信息几乎无法用其他方式来进行理解或描述。
1700433159
1700433160 试想一下,试图向某人有效地解释各个国家的地理分布,但却没有一张地图在旁边作为参考。一旦你看到一张地图,你就能确切地知道这些国家的准确位置,以及它们之间的关联。如果不使用可视化图形而只用文字表达出相同的信息,就算使用非常多的文字解释,也很难达到可视化图形传达信息的清晰程度。
1700433161
1700433162 用图形说话
1700433163
1700433164 人类的大脑可以很精确地理解视觉输入。一个有效的可视化图片可以立刻真实地在你脑海中模仿出类似的画面。只看传统的电子表格或报告,你很难找到想要的内容,也很容易错过重要的发展趋势。图形会说话,很多时候一图胜千言。
1700433165
1700433166 模拟智能〔11〕是商业分析工具中还没有完全实现的一种新技术。模拟智能的概念是借用3D、《第二人生》等虚拟网上世界以及用于基因研究的先进的可视化工具背后的图形处理能力。然后,使用这些技术来提供一个可靠的、交互式的数据视图。有哪些方法可以在一个交互的3D环境中对数据进行处理并获得深入洞察?时间会告诉我们答案。
1700433167
1700433168 可视化确实可以使我们获得其他模式无法提供的深入洞察。分析专家现在可以使用这些工具进行数据探索和开发分析应用。一些分析专家还会使用一些专门用于图形和演示文稿的可视化工具。这些可视化工具比传统的制图工具更快、更可靠。另外,如果有人在演示过程中提出一个问题,他们能够在展示过程中下钻并立刻获得答案。没有这种工具前,他们常常需要绘制新的图表,并承诺在第二天上午发送出去。任何希望驾驭大数据的企业,都需要考虑向工具箱中添加可视化工具。
1700433169
1700433170 可视化对高级分析为什么如此重要
1700433171
1700433172 在第8章中,我们将详细讨论沟通和交付分析成果对于分析的重要性。分析专家们经常需要对非技术的业务人员解释复杂的分析结果。任何对完成这项任务有帮助的事物都是好事物。数据可视化就属于这一类型。
1700433173
1700433174 如果没有必要,为什么要描述清楚逻辑分析的所有细节?如果一个简单的收益或提升图表就可以告诉业务伙伴他真正想知道的所有的一切,那么参数估计、等分统计、模型评估统计等信息就是矫枉过正。细节需要备份,但业务伙伴不应考虑过多的技术细节,他们相信分析专家会处理好这些技术细节。
1700433175
1700433176 如果有一个决策树样式的可视化描述,那么没有多少人会愿意看很长的业务规则描述清单。如果想了解某个赌场或零售商店哪些区域最忙,一种选择是创建一堆数字表格,把它们摊在在桌上,尝试分析出其中的模式。你也可以简单地绘制一个赌场或零售商店的热点分布图,图形中的不同颜色代表不同的活跃程度,答案立即就会变得明显。
1700433177
1700433178 影响力,而不是漂亮
1700433179
1700433180 重要的是专注于可视化的影响力,让一个观点更容易地被看到和理解。可太多的人沉溺于使用绚丽的分析图形,仅仅因为他们可以这么做。事实上,简单才是最好的,除非有明确的需求,否则不应该使用过于绚丽或复杂的图形。
1700433181
1700433182 请注意,我们强调的不是图形本身。很多人经常使用过于复杂的图形,仅仅是因为他们可以这么做。实际上,一个不加任何分析内容的3D条形图看起来很华丽,但比2D条形图更难以阅读和理解。重点应该放在可视化的有效性与影响力上,即可以比其他方式更清楚地说明要点上。一个很漂亮但没有要点的图形只会减损需传递的信息,造成混乱。
1700433183
1700433184 有时候一个简单的表格就足够了。在某些情况下,一个合适的可视化内容会让客户对要点的理解程度提升好几个数量级。回想一下我们之前提到过的地图的例子。理解如何可视化数据与结果可以帮助分析专家更好、更有效、更成功地工作。可视化工具的影响才刚刚开始。这些工具未来将被更多地用于分析和交流结果。
1700433185
1700433186 新数据每一次都会胜过新的工具和方法
1700433187
1700433188 新的数据输入对模型的影响要远远大于新的工具或方法。在传统的分析流程中增加新的数据会显著提升分析效果,这比新工具和新方法的提升更多更明显。这就是为什么重要的是获取大数据,而不是简单地升级并处理你已有的数据。
1700433189
1700433190 最后要提醒读者,本章的重点是分析工具和方法的演进。对于分析的质量和效果,可用的新数据比工具和方法本身有更大影响力。例如,获得了以前不具备的客户浏览Web详细数据会显著提升倾向模型的预测效果,这种效果提升要远远大于逻辑回归或组合模型等具体算法的创新。工具的进步有助于获得最新的数据源,但是数据本身才是最重要的价值驱动因素。这就是为什么企业要不断收集和使用各类可用大数据源的根本原因。
1700433191
1700433192 驾驭大数据 [:1700430612]
1700433193 6.3 本章小结
1700433194
1700433195 以下是本章的主要内容。
1700433196
1700433197 ■ 组合模型利用了群体的智慧,通过组合多种方法的预测结果,最终获得了比每种方法都要好的答案。
1700433198
1700433199 ■ 简易模型的目标是快速并尽量自动化地开发一个足够好的模型,而模型是否最优,所有精力是否用尽,这些并不是关注的重点。
[ 上一页 ]  [ :1.70043315e+09 ]  [ 下一页 ]