1702658880
1702658881
简单地说,聚类分析的结果往往取决于变量的选择和变量值的获取两个方面。变量的选择越准确,变量的测量越可靠,那么得到的分类结果就越能够描述事物各类间的本质区别。
1702658882
1702658883
聚类分析所使用的方法不同,常常会得到不同的结论。不同研究者对于同一组数据进行聚类分析,所得到的聚类数未必一致。
1702658884
1702658885
从统计学的观点看,聚类分析是通过数据建模简化数据的一种方法。传统的统计聚类分析方法包括系统聚类法、图论聚类法、聚类预报法、分解法、加入法、动态聚类法、有序样品聚类法、有重叠聚类法和模糊聚类法等。
1702658886
1702658887
在聚类分析中,聚类要素的选择是十分重要的,它直接影响分类结果的准确性和可靠性。
1702658888
1702658889
在地理分类和分区研究中,被聚类的对象常常是由多个要素构成的。不同要素的数据往往具有不同的单位和量纲,其数值的变异可能是很大的,这就会对分类结果产生影响。因此,当分类要素的对象确定之后,在进行聚类分析之前,首先要对聚类要素进行数据处理。
1702658890
1702658891
假设有m个聚类的对象,每一个聚类对象都由n个要素构成。它们所对应的要素数据如图12.1所示。
1702658892
1702658893
1702658894
1702658895
1702658896
图12.1 聚类对象与要素数据示意图
1702658897
1702658898
1702658899
1702658900
1702658902
Excel统计分析与应用大全 12.1.2 聚类分析方法概述
1702658903
1702658904
在聚类分析中,常用的聚类要素的数据处理方法有以下几种。
1702658905
1702658906
(1)总和标准化
1702658907
1702658908
分别求出各聚类要素所对应的数据的总和,以各要素的数据除以该要素的数据的总和,即
1702658909
1702658910
1702658911
1702658912
1702658913
这种标准化方法所得到的新数据满足如下定义:
1702658914
1702658915
1702658916
1702658917
1702658918
(2)标准差标准化
1702658919
1702658920
通过公式表达,体现为
1702658921
1702658922
1702658923
1702658924
1702658925
由这种标准化方法所得到的新数据,各要素的平均值为0,标准差为1,即有
1702658926
1702658927
1702658928
1702658929
[
上一页 ]
[ :1.70265888e+09 ]
[
下一页 ]