打字猴:1.70050339e+09
1700503390
1700503391 本环节从数据收集开始,通过一系列的数据探索和熟悉,识别数据质量问题,发现数据的内部属性。
1700503392
1700503393
1700503394
1700503395
1700503396 数据挖掘与数据化运营实战:思路、方法、技巧与应用 [:1700497753]
1700503397 数据挖掘与数据化运营实战:思路、方法、技巧与应用 19.2.3 数据准备
1700503398
1700503399 这个阶段类似于SEMMA中的数据调整阶段,其主要任务是数据清洗、重组、转换及衍生等。
1700503400
1700503401
1700503402
1700503403
1700503404 数据挖掘与数据化运营实战:思路、方法、技巧与应用 [:1700497754]
1700503405 数据挖掘与数据化运营实战:思路、方法、技巧与应用 19.2.4 模型搭建
1700503406
1700503407 该环节类似于SEMMA中的模式化环节,也就是模型的搭建和知识的发现环节。
1700503408
1700503409
1700503410
1700503411
1700503412 数据挖掘与数据化运营实战:思路、方法、技巧与应用 [:1700497755]
1700503413 数据挖掘与数据化运营实战:思路、方法、技巧与应用 19.2.5 模型评估
1700503414
1700503415 本环节主要内容包括彻底评估备选模型,挑选冠军模型,评价模型的稳定性,确保模型(或结论)正确回答了当初的业务需求。
1700503416
1700503417
1700503418
1700503419
1700503420 数据挖掘与数据化运营实战:思路、方法、技巧与应用 [:1700497756]
1700503421 数据挖掘与数据化运营实战:思路、方法、技巧与应用 19.2.6 模型发布
1700503422
1700503423 正如本书多次强调的那样,模型的搭建并不是数据分析挖掘的目的,更不是项目的结束。只有将模型应用于业务实践,才能实现数据分析挖掘的商业价值,所以这个环节的重要性不言而喻。
1700503424
1700503425 本环节的核心内容包括模型投入业务应用,产生商业价值,并且应用效果要及时跟踪和反馈,以便后期的优化和更新。
1700503426
1700503427 仔细对照SEMMA方法论和CRISP-DM方法论,细心的读者不难发现,两者其实表达的是相同的意思,正所谓英雄所见略同。两大最知名的商业智能品牌异口同声说出来的数据挖掘方法论,难道不值得我们回味吗?
1700503428
1700503429
1700503430
1700503431
1700503432 数据挖掘与数据化运营实战:思路、方法、技巧与应用 [:1700497757]
1700503433 数据挖掘与数据化运营实战:思路、方法、技巧与应用 19.3 Tom Khabaza的挖掘9律
1700503434
1700503435 Tom Khabaza是20世纪90年代著名的数据挖掘工具平台Clementine[1]的早期核心开发者之一。他总结的挖掘9律在数据挖掘业界产生了广泛的反响和认同。本节将简要介绍挖掘9律的主要内容,供感兴趣的数据分析师和数据分析爱好者参考。
1700503436
1700503437 ❑挖掘9律之第1律,又称业务目标律(Business Goals Law),业务目标是所有数据挖掘解决方案的本源(Business Objectives Are The Origin Of Every Data Mining Solution)。数据挖掘不是为了挖掘而挖掘,所有的数据挖掘都必须而且应该服务于特定的商业(业务)目的,离开了业务目的和业务应用,就没有数据挖掘的价值。正如Tom Khabaza所说的数据挖掘,首先它不是技术,而是流程,其中存在着一个或多个业务目标,没有业务目标,就没有数据挖掘。
1700503438
1700503439 ❑挖掘9律之第2律,又称业务知识律(Business Knowledge Law),业务知识是数据挖掘每一步的核心(Business Knowledge Is Central to Every Step of The Data Mining Process)。数据挖掘的本质就是将业务知识、经验和洞察力与数据挖掘方法相结合,从数据中发现有价值的东西。
[ 上一页 ]  [ :1.70050339e+09 ]  [ 下一页 ]