1702659991
12.3.1 判别分析的概念
1702659992
1702659993
判别分析是一种比较常用的分类分析方法。判别分析先根据已知类别的事物的性质,利用某种技术建立函数式(自变量的线性组合,即判别函数),然后对未知类别的新事物进行判断以将之归入已知的类别中。其中,变量或指标必须确实与分类有关;个体的观测值必须准确;个体的数目必须足够多。
1702659994
1702659995
例如,银行为了对贷款进行管理,需要预测哪些类型的客户可能不会按时归还贷款。已知过去几年中700个客户的贷款归还信誉度,据此可以将客户分成两组:可靠客户和不可靠客户。再通过收集客户的一些资料,如年龄、工资收入、教育程度、存款等,将这些资料作为自变量。通过判别分析,建立判别函数。那么,如果有100个新的客户提交贷款请求,就可以利用创建好的判别函数,对新的客户进行分析,从而判断新的客户是属于可靠客户类还是不可靠客户类。
1702659996
1702659997
综合以上实例,可总结得出判别分析的基本步骤:
1702659998
1702659999
①根据研究目的确定研究对象或研究样本及其所用指标;
1702660000
1702660001
②收集数据,得到训练样本;
1702660002
1702660003
③用判别分析方法得到判别函数;
1702660004
1702660005
④对该判别函数是否有实用价值进行考核;
1702660006
1702660007
⑤实际应用。
1702660008
1702660009
进行判别分析首先要建立判别函数Y=a1x1+a2x2+…anxn。其中,Y为判别分数,即判别值;x1,x2,…,xn为反映研究对象特征的变量;a1,a2,…,an为系数。
1702660010
1702660011
对于分为m类的研究对象,建立m个线性判别函数。对于每个个体进行判别时,把观测量的各变量值代入判别函数,得出判别分数,从而确定该个体属于哪一类,或计算属于各类的概率,即可建立适合条件的判别函数。得到判别函数之后,还需要对该函数是否具有实用价值进行考核验证,验证无误后即可实际运用。
1702660012
1702660013
判别分析一般有如下假定:
1702660014
1702660015
●预测对象服从正态分布。
1702660016
1702660017
●预测对象之间没有显著的相关性。
1702660018
1702660019
●预测对象的平均值和方差不相关。
1702660020
1702660021
●预测对象应是连续变量,因变量(类别或组别)是间断变量。
1702660022
1702660023
●两个预测对象之间的相关性在不同类中是一样的。
1702660024
1702660025
在判别分析的各个阶段应把握如下原则:
1702660026
1702660027
●事前组别类的分类标准(作为判别分析的因变量)要尽可能准确和可靠,否则会影响判别函数的准确性,从而影响判别分析的效果。
1702660028
1702660029
●所分析的自变量应是因变量的重要影响因素,应该挑选既有重要特性又有区别能力的变量,达到以最少的变量获得最高的辨别能力的目标。
1702660030
1702660031
●初始分析的数目不能太少。
1702660032
1702660033
1702660034
1702660035
1702660037
Excel统计分析与应用大全 12.3.2 判别分析常用方法
1702660038
1702660039
判别分析是一种根据观测到的某些指标对所研究的对象进行分类的多元统计分析方法。判别分析内容丰富,方法很多。
[
上一页 ]
[ :1.70265999e+09 ]
[
下一页 ]