1703907539
第三方支付领域的各类支付中,移动支付、互联网支付的数据质量较好。其数据流转速度比较快,数据类型也比较丰富,数据形态多样,通过实时的多类型数据交叉分析辅助决策的潜力很大。POS机收单、预付卡等传统支付方式的数据质量好,但数据流转速度不够,数据类型太少,数据形态不丰富,通过多类型数据交叉分析辅助决策的潜力较小,但也并非无可作为(见表3–7)。
1703907540
1703907541
表3–7 各类支付的数据质量和类型
1703907542
1703907543
1703907544
1703907545
1703907546
数据质量 数据流转速度 数据交叉潜力 品类数据 销量数据 金额数据 评价数据 位置数据 音频 图像视频 文字/数字 移动支付 高 快 大 多 多 多 多 多 较多 较多 多 互联网支付 较高 较快 较大 多 多 多 多 多 较多 较多 多 POS机收单 极少 较慢 极少 少 – 多 – 少 – – 多 预付卡支付 – 极慢 极小 少 – 多 – 少 – – 多 电视支付 – 中 中 较多 较多 多 中 少 少 多 多 数据挖掘关键在于对多个类别的数据交叉分析得出有价值的新数据。与目前商业银行掌握的数据相比,通过互联网、移动互联网第三方支付机构的用户账户,第三方支付机构掌握的消费品类、销量、用户评价、用户位置等各类数据有更大的交叉分析潜力。商业银行只掌握资金的进出流向,而第三方支付机构还能掌握资金的使用情况,不仅知道用户花了多少钱,还知道用户钱花到哪里去了。
1703907547
1703907548
针对特定的分析目标,假若企业自身业务当中生成的多类型数据不够充分,适当引入外部数据源用于交叉分析也是可行的。例如,支付宝引入了用户水电煤缴费情况等外部数据来帮助确立用户信用评级。这些交叉分析足以产生有价值的数据结论。
1703907549
1703907550
对支付宝交易指数进行小数据淘金
1703907551
1703907552
2011年12月上线的淘宝指数是由淘宝官方免费提供的数据分享平台,面向淘宝卖家、买家及广大的第三方提供精准数据服务。通过淘宝指数,淘宝卖家可以获取淘宝购物数据,通过对数据的深入挖掘可掌握淘宝购物趋势,以更合理地安排进货和销售。
1703907553
1703907554
淘宝指数提供的是总体性的数据,不涉及买家、卖家任何个体的数据。指数计算基于支付宝真实成交数据,过滤了未付款及退款交易。该计算也基于正常记录交易,过滤了超大额、超小额及有刷信用嫌疑的交易。此外,聚划算、淘金币等营销活动带来的成交,均在自然成交之外单独计算(见表3–8)。
1703907555
1703907556
表3–8 淘宝指数的数据来源、数据覆盖度特点
1703907557
1703907558
1703907559
1703907560
类别 数据采集与分析详情 数据来源 商品数据 对淘宝全站热门商品的相关属性统计,经过算法聚合而成 成交数据 淘宝全站(含集市、商城)最近7天的后台真实销售笔数(后续会扩展到30天及更长时间) 人群数据 用户在淘宝、支付宝上的注册信息,及过去12个月的购物历史行为(浏览、搜索、购买)数据记录,及登录IP与收货地址,经过数据挖掘及相关算法整理,得出与用户的年龄、性别、身份、星座、地域、爱好相关的判断 热销指数 商品的近7天销量、近30天销量,指数化处理后得出 价格指数 根据该商品在淘宝全网价格得出购买该商品价格的平均值 相关款式 购买了该商品的人还买了同类目下的其他商品 相关风格 和该商品在同网页下的商品 数据覆盖度 商品体系 覆盖淘宝热门成交商品90%以上 人群指数 覆盖淘宝全网用户90%以上 成交数据 统计数据覆盖成交100% 以手机销售为例,可根据淘宝指数了解2013年8~9月手机市场行情,并比较不同地域、不同性别、不同爱好、不同年龄段、不同星座和不同消费层级的客户关于苹果手机与三星手机的销售情况(见图3–11)。
1703907561
1703907562
1703907563
1703907564
第一,从总体行情来看,搜索指数表明用户对三星手机的搜索明显多过苹果手机。长三角地区用户对苹果手机喜好度更高,而广东、福建等珠三角地区用户对三星手机喜好度更高。
1703907565
1703907566
第二,从性别、年龄、星座等来看搜索指数和成交指数都表明男性比女性更喜欢买手机,女性和男性用户比例接近3∶7。25~29岁之间的年轻人购买手机多于其他年龄群。35~39岁的用户不喜欢买苹果手机,喜欢买三星手机。双鱼座、白羊座人士对苹果手机和三星手机都比较感兴趣。
1703907567
1703907568
第三,从有特定爱好的人群来看,搜索指数和成交指数都表明,数码一族爱看手机、爱买手机,而且爱苹果手机超过爱三星手机。但手机对爱好收藏的人群来说可能毫无吸引力。户外一族和运动一族都想买手机,但他们对品牌的敏感度不高。
1703907569
1703907570
第四,从消费层级来看,在网上消费手机的主力军还是中等收入人群。中偏低收入人群爱上网搜索手机但买的少。三星手机为中高客户群所接受的程度已经和苹果手机基本上不相上下了。而苹果手机在中低收入客户群的销售比例反而还比三星手机略高。
1703907571
1703907572
通过淘宝指数分析,作为卖家,你是否感到能更加容易细致入微地洞察到你的潜在顾客?例如,如果你知道你的顾客是个收藏爱好者,那你可以马上决定无须多费力气向他推销手机了。
1703907573
1703907574
同时,作为一个以“潮人”自诩的买家,你是否更加准确深入地体察到了消费潮流呢?例如,数据显示苹果手机已经开始更多为中低收入人群购买,不那么高级了,但中高收入人群买三星手机的已经和买苹果手机的差不多了。你会马上意识到,眼下买三星手机才更“潮”。
1703907575
1703907576
1703907577
1703907578
1703907579
1703907580
1703907581
1703907582
1703907583
1703907584
1703907585
图3–11 淘宝指数
1703907586
1703907587
产生商业价值的多类型数据交叉分析不一定需要大数据分析技术。支付宝的复杂网络计算等数据挖掘技术实际上也都还在主流软件技术的处理能力之内。目前还处于大数据时代的早期,有些号称数据挖掘的产品其实还不能解决大数据环境下的数据挖掘。有的最多只能称之为机器学习系统,或统计分析、实验系统原型,有的解决不了海量数据的分析,有的精准度达不到要求,有的稳定性不行,实际上这些都算不上是大数据概念之下的数据挖掘技术。
1703907588
[
上一页 ]
[ :1.703907539e+09 ]
[
下一页 ]