打字猴:1.70265938e+09
1702659380
1702659381 类别的数目则视具体情况而定。如果要将股票的收益分为高、中、低三档,那么就需要分为三类。如果要求分类非常精确,方便其他研究,那么有时候会需要更多分类。当然,分类数目也要考虑最终的分类效果。如果分成两个类别,一类中只有少数股票,而另一类中却有很多股票,那么一般会认为分成两类是不合理的,因此还需要进一步聚类,直至几个类别的样本数量相当。当然,如果没有具体要求,应当将可能的所有分类都列举出来。
1702659382
1702659383 总而言之,在聚类分析过程中,核心是定义和计算“距离”,然后根据具体要求确定类别数目。
1702659384
1702659385 Excel统计分析与应用大全 [:1702652511]
1702659386 12.2.1 最短距离法的应用
1702659387
1702659388 下面通过示例5,介绍如何在Excel 2013中通过最短距离法的运用进行相应的聚类分析。
1702659389
1702659390 示例5:
1702659391
1702659392 假定以下数据为某地14家中小企业去年年均收入统计汇总,要求以该数据文件为基础,运用最短距离法对该地14家中小企业去年年均收入的汇总数据进行聚类分析,并且将企业年均收入分为较高、中等、一般、较低和很低5个类别。原始数据如图12.35所示。
1702659393
1702659394
1702659395
1702659396
1702659397 图12.35 示例5原始数据
1702659398
1702659399 为了消除量纲影响,一般先要将数据标准化。操作步骤如下:
1702659400
1702659401 ①设置单元格区域。在C1单元格和D1单元格中分别输入“标准化企业年均收入”和“标准差”,如图12.36所示。
1702659402
1702659403
1702659404
1702659405
1702659406 图12.36 单元格区域设置
1702659407
1702659408 ②计算该系列数据的标准差。在D2单元格中输入公式”=STDEV(B2:B15)”,其中,函数”STDEV”是用来计算一个数列标准差的,括号中输入的是这个序列的位置,按下Enter键即可得到该数列的标准差。标准差计算结果如图12.37所示。
1702659409
1702659410
1702659411
1702659412
1702659413 图12.37 标准差计算结果
1702659414
1702659415 ③计算标准化企业年均收入。用各个企业的企业年均收入值除以步骤2中计算所得的标准差,得到各个企业的标准化企业年均收入。以序号为109011的企业为例,计算标准化企业年均收入的具体操作步骤如下:
1702659416
1702659417 1)在C2单元格中输入公式”=B2/D$2”,按下Enter键即可得到序号为109011的企业的标准化企业年均收入。标准化企业年均收入计算结果如图12.38所示。
1702659418
1702659419
1702659420
1702659421
1702659422 图12.38 标准化企业年均收入计算结果
1702659423
1702659424 2)通过自动填充功能的使用,将C2单元格中的公式复制到C3至C15的单元格区域,即可得到各个企业的标准化企业年均收入值,计算结果如图12.39所示。
1702659425
1702659426
1702659427
1702659428
1702659429 图12.39 各个企业标准化企业年均收入计算结果
[ 上一页 ]  [ :1.70265938e+09 ]  [ 下一页 ]