1700432868
1700432869
■ 模型的状态。它是处于开发阶段么?正在生产环境下使用,还是已经退出了?
1700432870
1700432871
■ 模型的类型。模型使用了什么算法?开发方案是什么?
1700432872
1700432873
■ 模型的评分功能。那些能给出评分结果的程序名称是什么?包括SQL脚本、存储过程、UDF、嵌入式过程。请注意,假设这里的评分功能可以获得所需的任何数据集。
1700432874
1700432875
■ 模型的输入变量信息。输入的分析数据集里,哪些变量被模型使用了?模型使用了一个还是多个分析数据集?
1700432876
1700432877
3.模型验证与报表制作
1700432878
1700432879
通常还需要建立一套模型验证与报表来帮助管理模型和分析流程。这些报表覆盖了很多主题和目标。监控的具体信息包括以下几项。
1700432880
1700432881
■ 评分过程的特定执行过程与开发原则的比较报表。
1700432882
1700432883
■ 特定的统计分析或验证报告,例如,每一次模型运行完后,都要研究提升率和收益图。
1700432884
1700432885
■ 模型的比较以及变量分布的总结。
1700432886
1700432887
报表可以在评分完成后自动生成,也可以在有需要时生成。这些报表通常是对模型评分效率进行持续监控的关键步骤。随着时间推移与业务环境的变化,所有模型的评分效率都会下降。这些报表可以帮助人们选择什么时候重新开发模型。
1700432888
1700432889
不要失去控制!
1700432890
1700432891
如果不对模型和分析流程进行监控管理,企业就有可能错误地使用模型,甚至完全忘记了某个模型的存在。模型与评分管理系统可以保证这种情况不会发生。有了这个系统,当某一个分析流程更新后,就能很容易地发现那些会受到影响的其他分析流程。
1700432892
1700432893
4.模型评分输出
1700432894
1700432895
最后一个组件是模型与分析流程的输出,即评分结果。这些输出结果可以描述任何一类实体,如客户、区域或者产品。监控的信息包括以下几项。
1700432896
1700432897
■ 评分是多少?保存在哪里?评分的实体,如客户或产品,其范围是什么?
1700432898
1700432899
■ 获得这个评分的时间戳。
1700432900
1700432901
■ 如果有必要,除了当前评分,还可以保存历史评分。某些企业会保留一段时间内的历史评分,有一些则不会。你需要决定你的企业使用哪一种方式更合理。
1700432902
1700432904
5.5 本章小结
1700432905
1700432906
以下是本章的重点内容。
1700432907
1700432908
■ 部署了分析流程和模型并不意味着就能获得价值。更新分析流程来充分利用分析的可扩展性,这对于驾驭大数据是非常关键的。
1700432909
1700432910
■ 分析专家比其他类型的用户更需要系统资源与权限。分析沙箱这种机制使得分析专家自由地探索数据,还能让IT人员保证系统资源的平衡。
1700432911
1700432912
■ 沙箱最适合数据探索、分析开发以及原型创建这些活动,它不适合那些重复性或生产性的任务。
1700432913
1700432914
■ 有多种类型的沙箱环境,包括内部沙箱、外部沙箱以及混合式沙箱。每一种沙箱都可以与MapReduce环境组合在一起处理大数据。
1700432915
1700432916
■ 分析数据集是可以直接用于分析的数据集合,例如,客户、区域、产品、供应商等。
1700432917
[
上一页 ]
[ :1.700432868e+09 ]
[
下一页 ]