1700432819
5.4.1 嵌入式评分集成
1700432820
1700432821
当嵌入式评分过程部署完成了,生成的评分结果就可以被各个用户与应用使用了。例如,CRM应用选择了一个客户分类,就可以获得客户倾向的评分结果。CRM用户要做的事情是,简单地单击CRM工具获得客户评分。运营类应用也可以使用这些评分结果。例如,模型根据历史销售情况预测某些商品可能要断货脱销,一旦发现这种高风险现象,系统立刻给本地经理发出提醒。类似的例子是航空公司建立对天气状况的评分模型来预测航班的延误概率。预测结果会根据航班定期更新,并发送给监控和处理延误任务的应用。任何用户都可以通过即席查询(ad hoc)来直接获取评分结果。
1700432822
1700432823
分析结果必须用来创造价值
1700432824
1700432825
要从分析中获得价值,企业就必须使用分析成果。如果不能方便地使用分析成果,企业将无法从分析中获得应有的价值。嵌入式评分过程对于提高易用性极为重要,它使得更大范围的用户和应用可以使用这些评分结果。
1700432826
1700432827
在第4章中,我们讨论过多种并行数据库系统的应用方案。同样的理念也适用于嵌入式评分过程。
1700432828
1700432829
■ SQL,作为最广泛使用的数据库语言,是第一种方案。这种方案特别适合决策树、线性回归、逻辑回归等模型。甚至使用SQL手动编写一个评分程序来执行这些模型也是非常简单的。
1700432830
1700432831
■ 用户自定义函数(UDF)让事情更有趣了,它把定期评分过程嵌入到数据库中,作为数据库的自由函数执行。
1700432832
1700432833
■ 预测建模标记语言(PMML)可以在一个系统内开发模型,然后把模型部署到另外一个系统。PMML传输的信息可以确保接收模型的新系统自动地生成评分结果。
1700432834
1700432835
■ 最后,嵌入式过程让分析工具直接在数据库内运行程序,不需要把分析工具的语言转换为其他语言。
1700432836
1700432837
读者可以回顾第4章来了解这4种方案的详细内容。在这里进行强调的目的是,所有这些应用方案同样适用于嵌入式评分过程。
1700432838
1700432840
5.4.2 模型与评分管理
1700432841
1700432842
要管理完成开发的模型与分析流程,企业需要管理4个主要组件,如图5-9所示,包括输入分析数据集、模型定义、模型验证与报表制作、模型评分输出。一些商业化的可用工具可以用于模型和评分的管理,也可以开发客户化的解决方案来满足企业的特定需求。我们来说明一下这4个组件。
1700432843
1700432844
1700432845
1700432846
1700432847
图5-9 模型与评分管理组件
1700432848
1700432849
1.输入分析数据集
1700432850
1700432851
有必要监控那些用于分析流程的分析数据集和EADS,监控的信息包括数据集的各类细节信息,以及创建与保存数据集的技术细节。模型与评分管理系统的这个组件会管理分析数据集本身的信息。请注意,这些数据集可以是企业分析数据集,也可以是个性化的数据集,或者两者的组合。监控的具体信息包括以下几项。
1700432852
1700432853
■ 提供数据给用户的各类数据集的名称,包括SQL脚本、数据存储脚本、UDF、嵌入式过程、表格、视图等。
1700432854
1700432855
■ 运行这些数据处理任务的参数。例如,某个分析也许只针对某一时间范围或有限的几类产品。
1700432856
1700432857
■ 数据处理过程中创建的输出表或者视图,以及这些输出包含的信息。
1700432858
1700432859
■ 分析数据集与分析流程之间的关系。一个分析数据集可以被多个分析流程使用,而一个分析流程可以使用多个分析数据集。
1700432860
1700432861
2.模型定义
1700432862
1700432863
有必要监控每一个模型和分析流程的描述信息。请注意,这里的模型可以是一个预测模型,也可以是一个分析流程,如客户按销售收入从高到低的排序,这些模型需要定期更新并被广泛使用。模型或分析流程在创建时需要到模型管理系统进行注册。监控的具体信息包括以下几项。
1700432864
1700432865
■ 模型的使用目的。模型解决的业务问题是什么?使用模型的业务场景是什么?
1700432866
1700432867
■ 模型的历史。什么时候创建的?谁创建的?模型经历了几个版本?
[
上一页 ]
[ :1.700432818e+09 ]
[
下一页 ]