1703907511
表3–6 各类第三方支付机构的每日数据存储量
1703907512
1703907513
支付交易量数据(TB) 2012年第四季度交易笔数(亿笔) 总量中自身产生数据量(TB) 总量中外部数据引入量 支撑支付的大平台数据量(PB) 微信支付(财付通) 20.0 9.35 29 无 微信 支付宝 48.7 21.28 66 少量 30 汇付天下 6.1 0.65 2 无 无 快钱 6.8 1.66 5 无 无 银联商务 10.0 0.92 2.8 无 银联 通联支付 3.5 1.51 4.7 无 无 天翼支付 3.0 1.15 3.6 无 电信 易宝支付 20.0 9.35 29 无 微信 环讯支付 48.7 21.28 66 少量 30 中国商业银行每日数据量一般在100TB,工商银行的大型数据中心业务处理能力达到43 000MIPS,即一秒可处理430亿个指令,服务1.65万个分支机构及4.7万台ATM和自助银行设备、18万台POS机的业务处理,服务6亿个账户。
1703907514
1703907515
而中国2012年第四季度第三方支付总交易笔数为36.989 7亿笔,按每笔31KB数据量计算,每日产生的总数据量为12TB,第三方支付机构全行业的数据存储量总合可能也不过几个PB。因此,中国平均每家第三方支付机构每日产生的业务数据量不超过1TB,不足一家商业银行每日数据的1%。
1703907516
1703907517
有电子商务或移动社区商务平台支撑的第三方支付机构,由于企业非支付部门的数据可以用于数据分析,其数据存储量可以认为是支付行业中最大的。如腾讯微信、淘宝和支付宝。但支付宝业务每日产生的数据量仍然不到国际单个银行数据量的5%,不到国内单个商业银行数据量的7%。淘宝、支付宝、阿里巴巴三大子公司加在一起的每日数据量才达到PB级别。
1703907518
1703907519
第三方支付机构数据量级别与国内银行、证券、基金、投行等行业相去甚远。如果在此基础上奢谈引入外部的海量数据,必然使第三方支付机构面临巨大的数据获取和数据处理成本压力。
1703907520
1703907521
第三方支付机构应用好小数据
1703907522
1703907523
从大数据的内涵来看,数据质量和数据分析远比海量的数据量更重要。大数据非常重要的含义是多类型数据的交叉分析。如果充分发掘多类型数据的交叉分析潜力,一样能创造对企业经营极为重要的数据价值。
1703907524
1703907525
实际上,围绕对用户的分析需求,积累用户的相关数据,只需很小的数据量就可获取较为全面的用户数据。例如,把某个用户一段时间内的上网行为、社交行为、交易行为、支付行为等组合起来,数据规模可能只有兆字节,存储量非常小。
1703907526
1703907527
用户张先生的小数据
1703907528
1703907529
我们可从百度上获取网友“晒”的流量,以此估计某位张先生每月的手机流量使用明细。一般聊QQ10MB/月。玩游戏40MB/月。飞信比QQ稍高也可计为10MB/月,如果用飞信收发信息,一天1MB左右。浏览网页可计为10MB/月。用微信聊天,一天要几十MB,可计为100MB/月;若只是用文字聊天的话,10MB就够了。
1703907530
1703907531
照此估算,张先生每天上网、QQ、微信、飞信、打游戏,一月也就是80~190MB流量,平均每天3~6MB的数据流量。10万个张先生一天也就产生3~6TB数据储存量,1亿个张先生一天才达到3~6PB的数据存储量。这还是宽松计算,实际人均日数据流量可能还要少得多。
1703907532
1703907533
但是对商户、电商和第三方支付机构来说,凭借张先生每天3~6MB的数据流量,足可以形成出色的商业智能:刻画了张先生丰富的行为构成;张先生每天每时的数据都在更新;从多个动态维度和数据类型刻画了张先生。
1703907534
1703907535
在法律许可的范围内,在这些数据基础上采用合适的分析角度,可以对张先生开展行为分析、偏好分析、心理分析、价值观分析、身份分析、收入分析、社交分析、信用分析等。这些分析都是实现商业智能的重要基础。
1703907536
1703907537
第三方支付作为数据的一种重要来源,从交易、支付等角度刻画了用户的商品和服务购买决策行为,是高质量的数据。第三方支付机构应该积极利用好自身数据。
1703907538
1703907539
第三方支付领域的各类支付中,移动支付、互联网支付的数据质量较好。其数据流转速度比较快,数据类型也比较丰富,数据形态多样,通过实时的多类型数据交叉分析辅助决策的潜力很大。POS机收单、预付卡等传统支付方式的数据质量好,但数据流转速度不够,数据类型太少,数据形态不丰富,通过多类型数据交叉分析辅助决策的潜力较小,但也并非无可作为(见表3–7)。
1703907540
1703907541
表3–7 各类支付的数据质量和类型
1703907542
1703907543
1703907544
1703907545
1703907546
数据质量 数据流转速度 数据交叉潜力 品类数据 销量数据 金额数据 评价数据 位置数据 音频 图像视频 文字/数字 移动支付 高 快 大 多 多 多 多 多 较多 较多 多 互联网支付 较高 较快 较大 多 多 多 多 多 较多 较多 多 POS机收单 极少 较慢 极少 少 – 多 – 少 – – 多 预付卡支付 – 极慢 极小 少 – 多 – 少 – – 多 电视支付 – 中 中 较多 较多 多 中 少 少 多 多 数据挖掘关键在于对多个类别的数据交叉分析得出有价值的新数据。与目前商业银行掌握的数据相比,通过互联网、移动互联网第三方支付机构的用户账户,第三方支付机构掌握的消费品类、销量、用户评价、用户位置等各类数据有更大的交叉分析潜力。商业银行只掌握资金的进出流向,而第三方支付机构还能掌握资金的使用情况,不仅知道用户花了多少钱,还知道用户钱花到哪里去了。
1703907547
1703907548
针对特定的分析目标,假若企业自身业务当中生成的多类型数据不够充分,适当引入外部数据源用于交叉分析也是可行的。例如,支付宝引入了用户水电煤缴费情况等外部数据来帮助确立用户信用评级。这些交叉分析足以产生有价值的数据结论。
1703907549
1703907550
对支付宝交易指数进行小数据淘金
1703907551
1703907552
2011年12月上线的淘宝指数是由淘宝官方免费提供的数据分享平台,面向淘宝卖家、买家及广大的第三方提供精准数据服务。通过淘宝指数,淘宝卖家可以获取淘宝购物数据,通过对数据的深入挖掘可掌握淘宝购物趋势,以更合理地安排进货和销售。
1703907553
1703907554
淘宝指数提供的是总体性的数据,不涉及买家、卖家任何个体的数据。指数计算基于支付宝真实成交数据,过滤了未付款及退款交易。该计算也基于正常记录交易,过滤了超大额、超小额及有刷信用嫌疑的交易。此外,聚划算、淘金币等营销活动带来的成交,均在自然成交之外单独计算(见表3–8)。
1703907555
1703907556
表3–8 淘宝指数的数据来源、数据覆盖度特点
1703907557
1703907558
1703907559
1703907560
类别 数据采集与分析详情 数据来源 商品数据 对淘宝全站热门商品的相关属性统计,经过算法聚合而成 成交数据 淘宝全站(含集市、商城)最近7天的后台真实销售笔数(后续会扩展到30天及更长时间) 人群数据 用户在淘宝、支付宝上的注册信息,及过去12个月的购物历史行为(浏览、搜索、购买)数据记录,及登录IP与收货地址,经过数据挖掘及相关算法整理,得出与用户的年龄、性别、身份、星座、地域、爱好相关的判断 热销指数 商品的近7天销量、近30天销量,指数化处理后得出 价格指数 根据该商品在淘宝全网价格得出购买该商品价格的平均值 相关款式 购买了该商品的人还买了同类目下的其他商品 相关风格 和该商品在同网页下的商品 数据覆盖度 商品体系 覆盖淘宝热门成交商品90%以上 人群指数 覆盖淘宝全网用户90%以上 成交数据 统计数据覆盖成交100% 以手机销售为例,可根据淘宝指数了解2013年8~9月手机市场行情,并比较不同地域、不同性别、不同爱好、不同年龄段、不同星座和不同消费层级的客户关于苹果手机与三星手机的销售情况(见图3–11)。
[
上一页 ]
[ :1.703907511e+09 ]
[
下一页 ]