打字猴:1.70053572e+09
1700535720
1700535721
1700535722
1700535723
1700535724
1700535725
1700535726 其中表示点x到点y之间的距离,代表点x所在的簇中心ci与点y所在的簇中心cj之间的距离,为所有(x,y)点对的个数,因此指标相当于对每个点对的和做了归一化处理。理想情况下,对于每个点对(x,y),如果d(x,y)越小,对应的也应该越小(特别地,当它们属于同一个聚类簇时,);当d(x,y)越大时,的取值也应当越大,所以Γ值越大说明聚类的结果与样本的原始距离越吻合,也就是聚类质量越高。
1700535727
1700535728 此外,为了更加合理地评估不同聚类算法的性能,通常还需要人为地构造不同类型的数据集,以观察聚类算法在这些数据集上的效果,几个常见的例子如图5.10~图5.14所示。
1700535729
1700535730
1700535731
1700535732
1700535733 图5.10 观察聚类误差是否随聚类类别数量的增加而单调变化
1700535734
1700535735
1700535736
1700535737
1700535738 图5.11 观察聚类误差对实际聚类结果的影响
1700535739
1700535740
1700535741
1700535742
1700535743 图5.12 观察近邻数据簇的聚类准确性
1700535744
1700535745
1700535746
1700535747
1700535748 图5.13 观察数据密度具有较大差异的数据簇的聚类效果
1700535749
1700535750
1700535751
1700535752
1700535753 图5.14 样本数量具有较大差异的数据簇的聚类效果
1700535754
1700535755
1700535756
1700535757
1700535758 百面机器学习:算法工程师带你去面试 [:1700532197]
1700535759 百面机器学习:算法工程师带你去面试 第6章 概率图模型
1700535760
1700535761 如果用一个词来形容概率图模型(Probabilistic Graphical Model)的话,那就是“优雅”。对于一个实际问题,我们希望能够挖掘隐含在数据中的知识。概率图模型构建了这样一幅图,用观测结点表示观测到的数据,用隐含结点表示潜在的知识,用边来描述知识与数据的相互关系,最后基于这样的关系图获得一个概率分布,非常“优雅”地解决了问题。
1700535762
1700535763 概率图中的节点分为隐含节点和观测节点,边分为有向边和无向边。从概率论的角度,节点对应于随机变量,边对应于随机变量的依赖或相关关系,其中有向边表示单向的依赖,无向边表示相互依赖关系。
1700535764
1700535765 概率图模型分为贝叶斯网络(Bayesian Network)和马尔可夫网络(Markov Network)两大类。贝叶斯网络可以用一个有向图结构表示,马尔可夫网络可以表示成一个无向图的网络结构。更详细地说,概率图模型包括了朴素贝叶斯模型、最大熵模型、隐马尔可夫模型、条件随机场、主题模型等,在机器学习的诸多场景中都有着广泛的应用。
1700535766
1700535767
1700535768
1700535769
[ 上一页 ]  [ :1.70053572e+09 ]  [ 下一页 ]