1702659380
1702659381
类别的数目则视具体情况而定。如果要将股票的收益分为高、中、低三档,那么就需要分为三类。如果要求分类非常精确,方便其他研究,那么有时候会需要更多分类。当然,分类数目也要考虑最终的分类效果。如果分成两个类别,一类中只有少数股票,而另一类中却有很多股票,那么一般会认为分成两类是不合理的,因此还需要进一步聚类,直至几个类别的样本数量相当。当然,如果没有具体要求,应当将可能的所有分类都列举出来。
1702659382
1702659383
总而言之,在聚类分析过程中,核心是定义和计算“距离”,然后根据具体要求确定类别数目。
1702659384
1702659386
12.2.1 最短距离法的应用
1702659387
1702659388
下面通过示例5,介绍如何在Excel 2013中通过最短距离法的运用进行相应的聚类分析。
1702659389
1702659390
示例5:
1702659391
1702659392
假定以下数据为某地14家中小企业去年年均收入统计汇总,要求以该数据文件为基础,运用最短距离法对该地14家中小企业去年年均收入的汇总数据进行聚类分析,并且将企业年均收入分为较高、中等、一般、较低和很低5个类别。原始数据如图12.35所示。
1702659393
1702659394
1702659395
1702659396
1702659397
图12.35 示例5原始数据
1702659398
1702659399
为了消除量纲影响,一般先要将数据标准化。操作步骤如下:
1702659400
1702659401
①设置单元格区域。在C1单元格和D1单元格中分别输入“标准化企业年均收入”和“标准差”,如图12.36所示。
1702659402
1702659403
1702659404
1702659405
1702659406
图12.36 单元格区域设置
1702659407
1702659409
1702659410
1702659411
1702659412
1702659413
图12.37 标准差计算结果
1702659414
1702659415
③计算标准化企业年均收入。用各个企业的企业年均收入值除以步骤2中计算所得的标准差,得到各个企业的标准化企业年均收入。以序号为109011的企业为例,计算标准化企业年均收入的具体操作步骤如下:
1702659416
1702659417
1)在C2单元格中输入公式”=B2/D$2”,按下Enter键即可得到序号为109011的企业的标准化企业年均收入。标准化企业年均收入计算结果如图12.38所示。
1702659418
1702659419
1702659420
1702659421
1702659422
图12.38 标准化企业年均收入计算结果
1702659423
1702659424
2)通过自动填充功能的使用,将C2单元格中的公式复制到C3至C15的单元格区域,即可得到各个企业的标准化企业年均收入值,计算结果如图12.39所示。
1702659425
1702659426
1702659427
1702659428
1702659429
图12.39 各个企业标准化企业年均收入计算结果
[
上一页 ]
[ :1.70265938e+09 ]
[
下一页 ]