1700500910
1700500911
❑每层内的输入变量。输出层的变量由具体分析背景来决定;隐蔽层的数量为输入数与输出数的乘积开平方;输入层的数量应该尽量精简,遵循少而精的原则,这在后面要详细阐述。
1700500912
1700500913
❑联系的程度。一般都选择所有层次间全部联系。
1700500914
1700500915
❑转换函数。选用逻辑斯蒂函数为主要转换函数,因为逻辑斯蒂函数可以提供在最短时间内的最佳拟合。
1700500916
1700500917
❑模型开发样本要足够充分,避免过拟合现象发生。
1700500918
1700500919
[1]罗茂初.数据库营销[M].北京:经济管理出版社,2007
:239.
1700500920
1700500921
1700500922
1700500923
1700500925
数据挖掘与数据化运营实战:思路、方法、技巧与应用 10.1.2 神经网络的应用优势
1700500926
1700500927
在数据挖掘实践应用中,人工神经网络的应用主要有以下优点:
1700500928
1700500929
❑有良好的自组织学习功能。神经网络可以根据外界数据的变化来不断修正自身的行为,对未经训练的数据模式的分类能力也比较强。
1700500930
1700500931
❑有比较优秀的在数据中挑选非线性关系的能力,能有效发现非线性的内在规律。在纷繁复杂的业务实践中,数据间非线性关系出现的机会远比线性关系多得多,神经网络的这种有效发现非线性关系的能力,大大提高了其在数据化运营等各种商业实践中的应用价值和贡献潜力。
1700500932
1700500933
❑由于神经网络具有复杂的结构,因此在很多实践场合中其应用效果都明显优于其他的建模算法;它对异常值不敏感,这是个很不错的“宽容”个性。
1700500934
1700500935
❑对噪声数据有比较高的承受能力。
1700500936
1700500937
1700500938
1700500939
1700500941
数据挖掘与数据化运营实战:思路、方法、技巧与应用 10.1.3 神经网络技术的缺点和注意事项
1700500942
1700500943
虽然神经网络有上述这多优点,但是人无完人,金无足赤,它同样也有以下一些典型的不足之处需要引起数据分析师的注意:
1700500944
1700500945
❑神经网络需要比较长的模型训练时间,在面对大数据量时尤其如此。
1700500946
1700500947
❑对于神经网络模型来说少而精的变量才可以充分发挥神经网络的模型效率。但是,神经网络本身是无法挑选变量的。因此,对于神经网络的实际应用来讲,之前的变量挑选环节就必不可少了。虽然变量的选择对于任何一个模型的搭建来说都是很重要的环节,但是必须强调的是,对于神经网络模型来说尤为重要,这是由其复杂的内部结构决定的。
1700500948
1700500949
❑如果搭建模型后直接将其投入应用,可能会得不到想要的效果。为了确保模型投入应用后具有稳定的效果,最好先尝试几种不同的神经网络模型,经过多次验证后,再挑选最稳定的模型投入应用。
1700500950
1700500951
❑神经网络本身对于缺失值(Missing Value)比较敏感。所以,应用该技术时要注意针对缺失值进行适当的处理,或者赋值,或者替换,或者删除,参见本书8.4.1节。
1700500952
1700500953
❑它具有过度拟合(Over-Fitting)数据的倾向,可能导致模型应用于新数据时效率显著下降。鉴于此,针对神经网络模型的应用要仔细验证,在确保稳定的前提下才可以投入业务落地应用。
1700500954
1700500955
❑由于其结构的复杂性和结论的难以解释性,神经网络在商业实践中远远没有回归和决策树应用得广泛,人们对它的理解、接纳还有待提高。它也缺乏类似回归那样的丰富多样的模型诊断指标和措施。正因为如此,很多数据分析师视之为“黑盒子”,只是在实在无计可施的时候才“放手一搏”。
1700500956
1700500957
1700500958
1700500959
[
上一页 ]
[ :1.70050091e+09 ]
[
下一页 ]