打字猴:1.700501308e+09
1700501308 数据挖掘与数据化运营实战:思路、方法、技巧与应用 [:1700497633]
1700501309 数据挖掘与数据化运营实战:思路、方法、技巧与应用 10.6 一个典型的预测响应模型的案例分享
1700501310
1700501311 数据挖掘与数据化运营实战:思路、方法、技巧与应用 [:1700497634]
1700501312 10.6.1 案例背景
1700501313
1700501314 某垂直细分的B2B网站平台,其商业模式是通过买卖双方在平台上产生交易而对卖家抽取交易提成费。对于该网站平台来说,促成买卖双方的线上成交是该平台的价值所在,网站平台的发展和盈利最终取决于是否能有效且规模化地促成买卖双方的线上成交并持续成交。
1700501315
1700501316 要有效且规模化地促成买卖双方在线成交,该网站平台有许多事情要做,包括吸引优质卖家、吸引广大有采购意愿的优质买家、帮助卖家在平台上更好地展示商品、帮助买家更快更有效地匹配所需要的卖家、优化网站交易流程以方便交易更有效、提供风险控制措施,保障双方交易的安全等。这里提到的每一个目的其实都是包含着一揽子的分析课题和项目开发的,需要数据分析团队在内的所有相关部门协同合作来实现。
1700501317
1700501318 本案例所要分享的就是其中一个细分的项目:初次成交的预测模型和运营应用。对于该平台上的卖家来说,从最开始的注册、发布商品信息,到后期的持续在线获得订单和在线成交,其中有一个结点对于卖家来说是至关重要,具有突破性的,那就是第一次在线成交,也叫初次成交转化,这个初次成交对于卖家的成功体验和激励的价值是不言而喻的;另外,从网站平台的运营方来说,卖家的初次成交也是网站运营工作的一个重要考察环节和考察指标,只有初次成交的卖家数量越多,周期越短,才可以有效保障后期持续性、规模化在线成交的可能性。本着上述背景和考虑思路,网站平台运营方希望通过数据分析找出短期内最有可能实现初次成交的卖家群体,分析其典型特征,运营方可以据此对卖家群体进行分层的精细化运营。最终的目的是一方面希望可以通过数据化运营有效提升单位时间段内初次成交的卖家数量,另一方面为今后的卖家培养找出一些运营可以着力的“抓手”,以帮助卖家有效成长。
1700501319
1700501320
1700501321
1700501322
1700501323 数据挖掘与数据化运营实战:思路、方法、技巧与应用 [:1700497635]
1700501324 数据挖掘与数据化运营实战:思路、方法、技巧与应用 10.6.2 基本的数据摸底
1700501325
1700501326 为了慎重起见,数据分析团队与运营方协商,先针对网站平台的某一个细分产品类目的卖家进行初次成交的专题分析。视分析和建模的应用效果,再决定后期是否推广到全站的卖家。
1700501327
1700501328 因此,本次专题分析只针对代号为120023的细分产品类目卖家,根据网站平台的运营规律和节奏,初步的分析思路是通过对第N-1月份的卖家行为数据和属性数据的分析,寻找它们与卖家第N个月有实际的在线初次成交之间的关系。
1700501329
1700501330 在进行数据摸底后发现,截止当时项目进行时,代号为120023的细分产品类目卖家共有170 000家,交易次数为0,即是还没有发生初次成交的卖家,经过连续几个月的数据观察,发现每个月实现初次成交的卖家基本上稳定在2000家左右。如果基于总共170 000家来计算每个月初次成交的转换率,大约在1.12%。
1700501331
1700501332 根据数据分析师的项目经验以及运营方的业务判断,总数170 000的大池子里应该是可以通过数据分析找出一些简单的阀值过滤掉一批最不可能近期实现初次成交的卖家群体的。通过业务经验和连续几个月对重点字段的数据摸底,得到了如下结果:
1700501333
1700501334 ❑月度登录“即时通信工具”达10天次以上的潜在卖家,平均每月大概为50 000人,其中在次月实现初次成交的用户有1900人左右(对比原始数据每月大概170 000的潜在卖家,次月实现(初次成交)的用户有2000人左右;浓缩过滤后只保留50 000人(过滤了大约71%的近期可能性很小的大部分卖家),但是次月实现初次成交的用户只过滤掉5%;换句话说,通过设置阀值月度登录即时通信工具达到10天次以上,初次成交的转换率就从原始的1.12%提升到3.5%左右。并且这个阀值的设立只是丢失了5%的初次成交卖家。找到这个阀值的意义在于,基于3.5%的转换率搭建的模型相比在原始转换率1.12%基础上搭建的模型来说要更加准确,更容易发现自变量与因变量之间的关系。
1700501335
1700501336 ❑来自两个特定省份A省和B省的卖家,其初次成交的转换率约为3.3%,所覆盖的初次成交卖家数为70%左右,即是丢失了将近30%的初次成交卖家。
1700501337
1700501338 ❑可交易Offer占比大于等于0.5的卖家,其初次成交的转换率约为3.7%,所覆盖的初次成交卖家数为85%左右。
1700501339
1700501340 基于上述的一些数据摸底和重要发现,数据分析师与业务方沟通后,决定设置阀值为月度登录即时通信工具达到10天次以上,在此基础上尝试数据分析挖掘建模和后期应用。
1700501341
1700501342 在数据摸底环节中,还有一个重要的基础性工作,那就是与业务方一起列出潜在的分析字段和分析指标,如图10-3所示[1]。这个工作是后期分析挖掘的基础,可圈定大致的分析指标和分析字段的范围,并据此进行数据的抽取工作。之所以强调要与业务方一起列出潜在的分析字段和分析指标,是因为在项目的前期阶段,业务方的业务经验和灵感非常重要,可以协助数据分析师考虑得更加全面和周详。
1700501343
1700501344
1700501345
1700501346
1700501347 图10-3 初步分析字段一览
1700501348
1700501349 在上述原始字段的基础上,数据分析师通过走访业务方,以及经过资深业务专家的检验,增添了一些重要的衍生变量如下:
1700501350
1700501351 ❑类目专注度。公式是卖家该类目下总的有效商品Offer数量除以该卖家在网站中总的有效商品Offer。因为有足够的理由相信,类目专注度越高,越容易产生成交。
1700501352
1700501353 ❑优质商品Offer占比。公式是卖家的优质Offer数量除以该卖家总的有效商品的Offer数量。因为有足够的理由相信,优质的商品Offer越多,越容易产生成交。
1700501354
1700501355 ❑可在线交易Offer的占比。公式是卖家的可在线交易Offer数量除以该卖家总的有效商品的Offer数量。
1700501356
1700501357 [1]限于业务方的商业隐私,这些字段和指标的中文含义就不详述了。
[ 上一页 ]  [ :1.700501308e+09 ]  [ 下一页 ]