1700500490
1700500491
1700500492
1700500494
数据挖掘与数据化运营实战:思路、方法、技巧与应用 8.7.2 如何处理共线性
1700500495
1700500496
水至清则无鱼,人至察则无徒,对于数据挖掘实战中出现的共线性问题,也需要本着中庸之道灵活处理。轻微的共线性是可以容忍的。比如说模型拟合度较高,样本量大的时候,轻微的共线性可以适当的采用视而不见的方法。但是,当样本量较少,很轻微的共线性问题都有可能导致参数的不稳定。如果发生严重的共线性问题,一般采取以下措施:
1700500497
1700500498
❑对相关变量进行取舍。高度共线性的相关变量,可以选择保留对业务方最有价值、最有意义的变量,而过滤掉相关变量。
1700500499
1700500500
❑对相关变量组合,生成一个新的综合性变量。
1700500501
1700500502
❑当我们利用相关变量通过线性的方式衍生出新的变量时,要记得两者之间的共线性问题,并且及时删除相关的原始变量,不要将其投入到模型中。在实践应用中这种情况会经常出现,也很容易被人忽视。
1700500503
1700500504
❑尝试对相关变量进行一些形式的转换(参考8.5节),恰当的转换可以在一定程度上减少甚至去除共线性关系。
1700500505
1700500506
1700500507
1700500508
1700500510
数据挖掘与数据化运营实战:思路、方法、技巧与应用 第9章 聚类分析的典型应用和技术小窍门
1700500511
1700500512
物以类聚,人以群分。
1700500513
1700500514
——《战国策·齐策三》
1700500515
1700500516
9.1 聚类分析的典型应用场景
1700500517
1700500518
9.2 主要聚类算法的分类
1700500519
1700500520
9.3 聚类分析在实践应用中的重点注意事项
1700500521
1700500522
9.4 聚类分析的扩展应用
1700500523
1700500524
9.5 聚类分析在实际应用中的优势和缺点
1700500525
1700500526
9.6 聚类分析结果的评价体系和评价指标
1700500527
1700500528
9.7 一个典型的聚类分析课题的案例分享
1700500529
1700500530
从本章开始到第13章,将针对常见的分析(课题或算法)类型分别进行详细介绍,包括典型应用、案例、模型的评价指标和体系、相关技术应用在实践中的优点和缺点、主流的应用场景和扩展的应用场景等,还有一些重点技术要领和小窍门。
1700500531
1700500532
本章则是针对聚类分析的上述相关问题来展开讲解和进行总结的。之所以把聚类分析作为第一个专题来进行探讨,主要是想强调聚类分析技术在数据分析挖掘中的重要性和常用性,聚类技术一方面本身就是一种模型技术,通过有效聚类后的结果常常就可以直接指导落地应用实践;另一方面聚类技术又常常作为数据分析过程中前期进行数据摸底和数据清洗、数据整理(数据转换)的工具。鉴于聚类技术在实践应用中的上述多样性、多元性,数据分析师应该要对该技术的实践应用有比较深刻的认识和比较熟练地掌握。
1700500533
1700500534
1700500535
1700500536
1700500538
数据挖掘与数据化运营实战:思路、方法、技巧与应用 9.1 聚类分析的典型应用场景
1700500539
[
上一页 ]
[ :1.70050049e+09 ]
[
下一页 ]