打字猴:1.700498712e+09
1700498712
1700498713 任何模型的搭建都是用于响应特定的业务场景和业务需求的,有时候搭建信息质量模型的目标变量是该信息(如商品Offer)是否在特定的时间段产生了交易,此时,目标变量就是二元的,即是与否;更多的时候,信息质量模型的目标变量与是否交易没有直接关系(这其实很容易理解,因为影响成交的因素太多),甚至有些时候信息质量本身是主观的判断,在这种情况下,没有明确的来自实际数据的目标变量。那如何定义目标变量呢?专家打分,模型拟合是一个比较合适的变通策略。
1700498714
1700498715 对于专家打分,模型拟合的具体操作,下面以“商品Offer的星级划分”项目为例来进行具体的解释和示范。商品Offer其实就是网上交易中,卖家针对每种出售的商品展示具体的商品细节、交易条款、图片细节等,使其构成的一个完整的页面,一般来说买家浏览了某种具体的商品Offer以后,只要点击“加入购物车”就可以进行后续的购买付费流程了。在某次“商品Offer的星级划分”项目中,目标变量就是专家打分,由业务专家、行业专家基于行业的专业背景知识,针对商品Offer构成要素的权重进行人为打分,这些构成要素包括标题长度、图片数量、属性选填的比例、是否有分层价格区间、是否填写供货总量信息、是否有混批说明、是否有运营说明、是否支持在线第三方支付等。首先抽取一定数量的样本,请行业专家对这些样本逐个打分赋值,在取得每种商品Offer的具体分数后,把这些分数作为目标变量,利用数据挖掘的各种模型去拟合这些要素与总分数的关系,最终形成一个合适的模型,该模型比较有效地综合了专家打分的意见并且有效拟合Offer构成要素与总分数的关系。为了更加准确,在专家打分的基础上,还可以辅之以客户调研,从而对专家的打分和各要素的权重进行修正,最后在修正的基础上进行模型的搭建和拟合,这属于项目的技术细节,不是项目核心,故不做深入的讲解。
1700498716
1700498717 信息质量模型是电子商务和网上交易的基本保障,其主要目的是确保商品基本信息的优质和高效,让买家更容易全面、清楚、高效地了解商品的主要细节,让卖家更容易、更高效地展示自己的商品。无论是C2C(如淘宝),还是B2B(如阿里巴巴),抑或是B2C(如当当网、凡客网),都可以用类似的方法去优化、提升自己的商品展示质量和效果,有效提升和保障交易的转化率。
1700498718
1700498719
1700498720
1700498721
1700498722 数据挖掘与数据化运营实战:思路、方法、技巧与应用 [:1700497510]
1700498723 数据挖掘与数据化运营实战:思路、方法、技巧与应用 3.7 服务保障模型
1700498724
1700498725 服务保障模型主要是站在为客户服务的角度来说的,出发点是为了让客户(平台的卖家)更好地做生意,达成更多的交易,我们(平台)应该为他们提供哪些有价值的服务去支持、保障卖家生意的发展,这里的服务方向就可以有很多的空间去想象了。比如,让卖家购买合适的增值产品,让卖家续费合适的增值产品、卖家商业信息的违禁过滤、卖家社区发帖的冷热判断等,凡是可以更好地武装卖家的,可以让卖家更好地服务买家的措施,无论是产品武装,还是宣传帮助,都属于服务保障的范畴,都是服务保障模型可以并且应该出力的方向。
1700498726
1700498727 针对服务保障模型的示例将会在随后的预测(响应、分类)模型里专门进行介绍,所以这里不展开讨论,但是对于服务保障环节,我们还是应该有一定的认识,无论从数据化运营的管理、客户关系管理,还是数据分析挖掘应用上,服务保障环节都是不能忽视的一个方面。
1700498728
1700498729
1700498730
1700498731
1700498732 数据挖掘与数据化运营实战:思路、方法、技巧与应用 [:1700497511]
1700498733 数据挖掘与数据化运营实战:思路、方法、技巧与应用 3.8 用户(买家、卖家)分层模型
1700498734
1700498735 用户(买家、卖家)分层模型也是数据化运营中常见的解决方案之一,它与数据化运营的本质是密切相关的。精细化运营必然会要求区别对待,而分层(分群)则是区别对待的基本形式。
1700498736
1700498737 分层模型是介于粗放运营与基于个体概率预测模型之间的一种折中和过渡模型,其既兼顾了(相对粗放经营而言比较)精细化的需要,又不需要(太多资源)投入到预测模型的搭建和维护中,因而在数据化运营的初期以及在战略层面的分析中,分层模型有着比较广泛的应用和较大的价值。
1700498738
1700498739 正如预测模型有特定的目标变量和模型应用场景一样,分层模型也有具体的分层目的和特定用途,这些具体的目的和用途就决定了分层模型的构建思路和评价依据。其常用的场景为:客户服务团队需要根据分层模型来针对不同的群体提供不同的说辞和相应的服务套餐;企业管理层需要基于在线交易卖家数量来形成以其为核心的卖家分层进化视图;运营团队需要通过客户分层模型来指导相应的运营方案的制订和执行,从而提高运营效率和付费转化率等。这些分层模型既可以为管理层、决策层提供基于特定目的的统一进化视图,又可以给业务部门做具体的数据化运营提供分群(分层)依据和参考。
1700498740
1700498741 分层模型常用的技术既包括统计分析技术(比如相关性分析、主成分分析等),又可以含有预测(响应、分类)模型的技术(比如通过搭建预测模型发现最重要的输入变量及其排序情况,然后根据这些变量对分层进行大致的划分,并通过实际数据进行验证),这要视具体的分析目的、业务背景和数据结构而定,同时要强调的是,一个好的分层模型的搭建一定是需要业务方的参与和贡献的,而且其中的业务逻辑和业务思考远远胜过分析技术本身。
1700498742
1700498743 下面我们分别用两个典型的案例来说明分层模型是如何搭建和应用的。
1700498744
1700498745 案例一:以交易卖家数量为核心的卖家分层进化视图
1700498746
1700498747 背景:某互联网公司作为买卖双方的交易平台,其最终的价值体现在买卖双方在该平台上达成交易(从而真正让买卖双方双赢,满意)。现在,管理层希望针对在线成交的卖家(群体)形成一个分层进化的视图。其基本目标就是,从免费注册的卖家开始,通过该视图可以粗略地、有代表性地勾画出卖家一步一步成长、进步乃至最终达成交易的全过程。这里的每一层都是一个或几个有代表性的重要指标门槛,顺着不同的门槛逐步进化,越往上走,人群越少,越有可能成为有交易的卖家,而最后最高一层将是近30天来有交易的卖家。从这个背景和目标描述里,我们可以大致想象出这个分层模型是一个类似金字塔的形状(底部人数多,越往上越小,表示人群在减少)。
1700498748
1700498749 这个分层模型的主要价值体现在:可以让管理层、决策层对交易卖家的成长、进化、过滤的过程有个清晰、直观的把握,并且可以从中直观地了解影响卖家交易的一系列核心因素,以及相应的大致门槛阀值,也可以让具体的业务部门直观地了解“培养成交卖家,让卖家能在线成交”的主要因素,以及相应的运营抓手。
1700498750
1700498751 在本案例中,有必要了解一些关键的业务背景和业务因素,比如要想在线交易,卖家的Offer必须是“可在线交易Offer”。这个条件很关键,所谓“可在线交易Offer”是指该商品的Offer支持支付宝等第三方在线支付手段,如果卖家的Offer不支持这些手段,那就无法在线交易,也就无法满足本课题的目标了。所以,这里的“卖家Offer必须是可在线交易Offer”是一个前期的重要门槛和阀值,从此也可以看出,对业务背景的了解非常重要,它决定了课题是否成功。
1700498752
1700498753 下面来谈谈具体的分析思路,先是从最基本的免费注册的卖家(即“全会员”)开始,之后是近30天有登录网站的卖家(说明是“活”的卖家,这里经过了直观的业务思考),再到近1年有新发或重发Offer的卖家,然后是当前有效Offer的卖家,最后是当前有可在线交易Offer的卖家,这个分析过程其实是第一部分的思考,它们构成了金字塔的下半部分,基本上是基于业务背景的了解和顺理成章的逻辑来“进化”的,之所以在“全会员”与“当前有可在线交易Offer”之间安插了另外3层逐步“进化”的指标,主要也是基于业务方需要门槛的进度和细分的考虑,但这不是主要的核心点。
1700498754
1700498755 接下来,从“当前有可在线交易Offer的卖家”开始,层层进化到最高端的“近30天有在线交易的卖家”,也就是找出影响卖家成交的核心因素,并将之提炼成具体的层级和门槛,这一部分则是本案例的重点和核心所在。
1700498756
1700498757 如何找出其中的核心要素以及重要性的先后顺序?在本课题中,使用了预测(分类、响应)模型的方法,即通过搭建预测(响应)模型(目标变量是“近30天是否在线成交”,输入变量由数据分析团队与业务团队共同讨论确定),并通过多种模型算法的比较,最后找出决定交易的几个最重要的输入变量及先后次序。
1700498758
1700498759 最终的分层模型大致如图3-3所示,限于企业商业隐私的考虑,针对该数据做了处理,请勿对号入座。
1700498760
1700498761
[ 上一页 ]  [ :1.700498712e+09 ]  [ 下一页 ]