1700432794
1700432795
当企业级分析数据集部署好时,企业应该尽量多使用这些数据。EADS不应该只被分析专家使用。商业智能和报表环境,以及这些环境的用户,没有任何理由不使用EADS。如果EADS已经开发好了可用的属性与指标,为什么还在要报表环境里开发处理逻辑来重复计算呢?
1700432796
1700432797
类似地,所有能从EADS数据中获得好处的应用都应该考虑使用EADS。一个常见例子是客户关系管理系统(CRM),其使用客户域的EADS来加快客户细分的分析流程。EADS内的客户信息可以直接被CRM使用,CRM用户可以直接使用EADS的客户属性来选择客户群体,而不需要在CRM工具中重新进行计算。另一个例子是,使用了客户EADS的呼叫中心可以为呼叫中心客服人员提供用户的各项指标。当客户打入电话时,呼叫中心客服人员的电脑屏幕上会显示客户的大量信息。这些信息,如最近的交易行为,可以帮助客服人员选择如何更好地处理呼叫。
1700432798
1700432799
重要的是,EADS有大量有价值的信息,可以避免不必要的工作,显著地提高规范性与透明性,并确保数据一致性。EADS还提供了更快的分析速度与更大的分析可扩展性。同样重要的还有,EADS给其他用户和应用提供了获取客户信息的简易方式,这些用户和应用也许无法通过其他方式来获得类似的信息。
1700432800
1700432802
5.4 嵌入式评分
1700432803
1700432804
当建立分析沙箱并实施企业分析数据集后,企业可以更快、更高一致性地开发分析流程和模型。分析流程的扩展性也得到了提高。下一步是什么?这些新的分析流程带来的价值如何把企业带到一个更高的层次?一种方式是通过嵌入式评分过程实现分析结果的广泛应用。
1700432805
1700432806
嵌入式评分能在数据库内定期地执行评分过程,让用户更加高效、更加方便地使用模型。一个成功的嵌入式评分,不仅包含部署每一个独立的评分过程,还包括建立一个机制来管理和监控这些评分过程。请注意,“评分结果”可以来自于一个预测模型,也可以是分析模型其他类型的输出。
1700432807
1700432808
回顾一下之前谈到的内容,分析流程会最终产生新的信息。例如,客户购买某一种产品的概率,某个产品的最优价格,或者在促销活动中能带来销量提升的区域。把开发好的分析模型应用于最新数据,这就是评分。例如,在决定给哪些用户发电子邮件前,需要使用最新的数据对客户有多大的可能性参加这次活动进行评分。把评分过程嵌入在数据库环境中能带来一系列的好处,接下来我们逐个讨论这些好处。
1700432809
1700432810
首先,批处理形式的评分过程可以根据需求运行。当按计划完成了对一系列评分结果的更新后,用户想使用数据时,就可以直接使用这些数据。例如,邮件列表一旦创建完成,系统就会自动开始对列表内的客户进行评分。
1700432811
1700432812
其次,嵌入式评分可以用于实时评分。这对于某些场景特别重要,如网页推荐。如果某人登录了这个网页,系统必须立刻基于现有的信息,例如他在这个网页上做了什么等,对他进行评分,然后在他浏览下一个网页时,为他提供最合适的促销方案。类似地,当客户通过电话与呼叫中心的客服人员进行交流时,客服人员会将刚刚了解到的一些客户信息输入系统,系统利用这些信息立刻完成对客户的评分,这样,客户服人员才知道下一步要跟客户说什么。
1700432813
1700432814
再次,嵌入式评分为用户屏蔽了模型的复杂度。不管是用户还是应用,都可以轻易得到评分结果。系统会处理这些复杂运算,因此嵌入式评分使得技术背景不强的用户更容易理解评分结果。
1700432815
1700432816
最后,嵌入式评分把模型集中到了一个地方。模型列表和评分结果通过一个模型管理流程来进行集中管理,监控跟踪这些模型的创建过程就更方便了。分析专家不再需要在企业的不同地方保存并执行这些自己创建的模型了。相反地,为了扩大使用范围,这些模型将被集中地管理和部署。
1700432817
1700432819
5.4.1 嵌入式评分集成
1700432820
1700432821
当嵌入式评分过程部署完成了,生成的评分结果就可以被各个用户与应用使用了。例如,CRM应用选择了一个客户分类,就可以获得客户倾向的评分结果。CRM用户要做的事情是,简单地单击CRM工具获得客户评分。运营类应用也可以使用这些评分结果。例如,模型根据历史销售情况预测某些商品可能要断货脱销,一旦发现这种高风险现象,系统立刻给本地经理发出提醒。类似的例子是航空公司建立对天气状况的评分模型来预测航班的延误概率。预测结果会根据航班定期更新,并发送给监控和处理延误任务的应用。任何用户都可以通过即席查询(ad hoc)来直接获取评分结果。
1700432822
1700432823
分析结果必须用来创造价值
1700432824
1700432825
要从分析中获得价值,企业就必须使用分析成果。如果不能方便地使用分析成果,企业将无法从分析中获得应有的价值。嵌入式评分过程对于提高易用性极为重要,它使得更大范围的用户和应用可以使用这些评分结果。
1700432826
1700432827
在第4章中,我们讨论过多种并行数据库系统的应用方案。同样的理念也适用于嵌入式评分过程。
1700432828
1700432829
■ SQL,作为最广泛使用的数据库语言,是第一种方案。这种方案特别适合决策树、线性回归、逻辑回归等模型。甚至使用SQL手动编写一个评分程序来执行这些模型也是非常简单的。
1700432830
1700432831
■ 用户自定义函数(UDF)让事情更有趣了,它把定期评分过程嵌入到数据库中,作为数据库的自由函数执行。
1700432832
1700432833
■ 预测建模标记语言(PMML)可以在一个系统内开发模型,然后把模型部署到另外一个系统。PMML传输的信息可以确保接收模型的新系统自动地生成评分结果。
1700432834
1700432835
■ 最后,嵌入式过程让分析工具直接在数据库内运行程序,不需要把分析工具的语言转换为其他语言。
1700432836
1700432837
读者可以回顾第4章来了解这4种方案的详细内容。在这里进行强调的目的是,所有这些应用方案同样适用于嵌入式评分过程。
1700432838
1700432840
5.4.2 模型与评分管理
1700432841
1700432842
要管理完成开发的模型与分析流程,企业需要管理4个主要组件,如图5-9所示,包括输入分析数据集、模型定义、模型验证与报表制作、模型评分输出。一些商业化的可用工具可以用于模型和评分的管理,也可以开发客户化的解决方案来满足企业的特定需求。我们来说明一下这4个组件。
1700432843
[
上一页 ]
[ :1.700432794e+09 ]
[
下一页 ]