1700503320
1700503321
通过这个环节,可以让数据分析师大致熟悉和了解样本数据的基本信息,为后续的过程和环节提供有效的基础保障。
1700503322
1700503323
1700503324
1700503325
1700503327
数据挖掘与数据化运营实战:思路、方法、技巧与应用 19.1.3 数据调整
1700503328
1700503329
如果说前面两个环节所针对的数据还是原始数据,那么本环节的核心任务就是把之前所抽取的原始数据进行调整和转换。数据调整和转换的目的主要有以下几点:
1700503330
1700503331
❑调整后的数据能更加容易地反映出事物的内在规律和联系。比如增加了衍生变量之后,原来不容易被发现的内在规律就变得比较容易显示出来了。
1700503332
1700503333
❑调整后的数据使得模型的建立更加容易、更加有效,或者使得模型的调整和维护更加方便。本书在8.5节给出了诸多的相关技巧和提示。
1700503334
1700503335
1700503336
1700503337
1700503339
数据挖掘与数据化运营实战:思路、方法、技巧与应用 19.1.4 模式化
1700503340
1700503341
该环节是数据挖掘的核心环节,也就是模型的搭建和知识的发现环节。
1700503342
1700503343
关于如何建模,有哪些关键的注意事项,本书在第7~13章(总共7章)中从纯粹的挖掘技术和技巧的角度进行了比较详细的分析;另外,本书在第15~18章(总共4章)中从方法、意识、管理等角度对其进行了比较详细的分析。希望这些内容能对有缘的朋友提供点滴帮助。
1700503344
1700503345
1700503346
1700503347
1700503349
数据挖掘与数据化运营实战:思路、方法、技巧与应用 19.1.5 评价
1700503350
1700503351
本小节主要对模型和发现的知识进行综合评价和介绍。包括评价并挑选最合适的模型,即所谓的冠军模型,应用于业务实践、模型应用新数据进行稳定性验证、模型所发现的知识和规律的提炼和总结、冠军模型应用于业务实践并跟踪反馈等。
1700503352
1700503353
这个环节是最终体现数据挖掘和数据分析商业价值的环节,其重要性和核心地位无论怎么强调都不过分。
1700503354
1700503355
关于对模型的评价,本书在第7章给出了比较具体、详细的分析。
1700503356
1700503357
1700503358
1700503359
1700503361
数据挖掘与数据化运营实战:思路、方法、技巧与应用 19.2 CRISP-DM方法论
1700503362
1700503363
CRISP-DM方法论全称为Cross-Industry Standard Process for Data Mining,即跨行业的数据挖掘标准流程。它是以SPSS、Daimler Chrysler等几家当时在数据挖掘商业实践中经验丰富的商业公司所倡立的(CRISP-DM Special Interest Group,SIG)组织于1999年开发并提炼出来的。CRISP-DM方法论,目前已经成为世界数据挖掘业界公认的有关数据挖掘项目实践的标准方法论。
1700503364
1700503365
按照CRISP-DM方法论,一个数据挖掘商业实践的完整过程包括6个阶段,分别为业务理解(Business Understanding)、数据理解(Data Understanding)、数据准备(DataPreparation)、模型搭建(Modeling)、模型评估(Evaluation)和模型发布(Deployment)。
1700503366
1700503367
上述6个阶段的顺序并不是固定不变的,在不同的业务背景中,可以有不同的流转方向,如图19-2所示。但是总体来讲,业务理解(Business Understanding)是第1位的,是数据挖掘商业实践过程中的第1环节。
1700503368
1700503369
[
上一页 ]
[ :1.70050332e+09 ]
[
下一页 ]