1703907501
图3–10 2009年美国各行业平均数据存储量
1703907502
1703907503
第三方支付机构没有大数据的海量数据
1703907504
1703907505
总的看来,第三方支付机构的数据存储量还不够大,尚不能符合大数据四个特点中的第一个,即自身业务产生不了海量的数据规模。
1703907506
1703907507
第三方支付机构系统数据库至少由CIF信息、交易日志、交易流水3部分组成。CIF信息包括商户用户和个人用户信息,商户用户信息平均大小为20KB左右,个人用户信息平均大小为5KB左右。每一笔交易都要记交易日志,日志的平均大小为4KB左右。每一笔转账交易都要记交易流水,交易流水的大小为2KB左右。
1703907508
1703907509
根据第三方支付监测数据,2012年第四季度互联网支付交易共37亿笔。可大致估计出中国第三方支付机构的数据量(见表3–6)。
1703907510
1703907511
表3–6 各类第三方支付机构的每日数据存储量
1703907512
1703907513
支付交易量数据(TB) 2012年第四季度交易笔数(亿笔) 总量中自身产生数据量(TB) 总量中外部数据引入量 支撑支付的大平台数据量(PB) 微信支付(财付通) 20.0 9.35 29 无 微信 支付宝 48.7 21.28 66 少量 30 汇付天下 6.1 0.65 2 无 无 快钱 6.8 1.66 5 无 无 银联商务 10.0 0.92 2.8 无 银联 通联支付 3.5 1.51 4.7 无 无 天翼支付 3.0 1.15 3.6 无 电信 易宝支付 20.0 9.35 29 无 微信 环讯支付 48.7 21.28 66 少量 30 中国商业银行每日数据量一般在100TB,工商银行的大型数据中心业务处理能力达到43 000MIPS,即一秒可处理430亿个指令,服务1.65万个分支机构及4.7万台ATM和自助银行设备、18万台POS机的业务处理,服务6亿个账户。
1703907514
1703907515
而中国2012年第四季度第三方支付总交易笔数为36.989 7亿笔,按每笔31KB数据量计算,每日产生的总数据量为12TB,第三方支付机构全行业的数据存储量总合可能也不过几个PB。因此,中国平均每家第三方支付机构每日产生的业务数据量不超过1TB,不足一家商业银行每日数据的1%。
1703907516
1703907517
有电子商务或移动社区商务平台支撑的第三方支付机构,由于企业非支付部门的数据可以用于数据分析,其数据存储量可以认为是支付行业中最大的。如腾讯微信、淘宝和支付宝。但支付宝业务每日产生的数据量仍然不到国际单个银行数据量的5%,不到国内单个商业银行数据量的7%。淘宝、支付宝、阿里巴巴三大子公司加在一起的每日数据量才达到PB级别。
1703907518
1703907519
第三方支付机构数据量级别与国内银行、证券、基金、投行等行业相去甚远。如果在此基础上奢谈引入外部的海量数据,必然使第三方支付机构面临巨大的数据获取和数据处理成本压力。
1703907520
1703907521
第三方支付机构应用好小数据
1703907522
1703907523
从大数据的内涵来看,数据质量和数据分析远比海量的数据量更重要。大数据非常重要的含义是多类型数据的交叉分析。如果充分发掘多类型数据的交叉分析潜力,一样能创造对企业经营极为重要的数据价值。
1703907524
1703907525
实际上,围绕对用户的分析需求,积累用户的相关数据,只需很小的数据量就可获取较为全面的用户数据。例如,把某个用户一段时间内的上网行为、社交行为、交易行为、支付行为等组合起来,数据规模可能只有兆字节,存储量非常小。
1703907526
1703907527
用户张先生的小数据
1703907528
1703907529
我们可从百度上获取网友“晒”的流量,以此估计某位张先生每月的手机流量使用明细。一般聊QQ10MB/月。玩游戏40MB/月。飞信比QQ稍高也可计为10MB/月,如果用飞信收发信息,一天1MB左右。浏览网页可计为10MB/月。用微信聊天,一天要几十MB,可计为100MB/月;若只是用文字聊天的话,10MB就够了。
1703907530
1703907531
照此估算,张先生每天上网、QQ、微信、飞信、打游戏,一月也就是80~190MB流量,平均每天3~6MB的数据流量。10万个张先生一天也就产生3~6TB数据储存量,1亿个张先生一天才达到3~6PB的数据存储量。这还是宽松计算,实际人均日数据流量可能还要少得多。
1703907532
1703907533
但是对商户、电商和第三方支付机构来说,凭借张先生每天3~6MB的数据流量,足可以形成出色的商业智能:刻画了张先生丰富的行为构成;张先生每天每时的数据都在更新;从多个动态维度和数据类型刻画了张先生。
1703907534
1703907535
在法律许可的范围内,在这些数据基础上采用合适的分析角度,可以对张先生开展行为分析、偏好分析、心理分析、价值观分析、身份分析、收入分析、社交分析、信用分析等。这些分析都是实现商业智能的重要基础。
1703907536
1703907537
第三方支付作为数据的一种重要来源,从交易、支付等角度刻画了用户的商品和服务购买决策行为,是高质量的数据。第三方支付机构应该积极利用好自身数据。
1703907538
1703907539
第三方支付领域的各类支付中,移动支付、互联网支付的数据质量较好。其数据流转速度比较快,数据类型也比较丰富,数据形态多样,通过实时的多类型数据交叉分析辅助决策的潜力很大。POS机收单、预付卡等传统支付方式的数据质量好,但数据流转速度不够,数据类型太少,数据形态不丰富,通过多类型数据交叉分析辅助决策的潜力较小,但也并非无可作为(见表3–7)。
1703907540
1703907541
表3–7 各类支付的数据质量和类型
1703907542
1703907543
1703907544
1703907545
1703907546
数据质量 数据流转速度 数据交叉潜力 品类数据 销量数据 金额数据 评价数据 位置数据 音频 图像视频 文字/数字 移动支付 高 快 大 多 多 多 多 多 较多 较多 多 互联网支付 较高 较快 较大 多 多 多 多 多 较多 较多 多 POS机收单 极少 较慢 极少 少 – 多 – 少 – – 多 预付卡支付 – 极慢 极小 少 – 多 – 少 – – 多 电视支付 – 中 中 较多 较多 多 中 少 少 多 多 数据挖掘关键在于对多个类别的数据交叉分析得出有价值的新数据。与目前商业银行掌握的数据相比,通过互联网、移动互联网第三方支付机构的用户账户,第三方支付机构掌握的消费品类、销量、用户评价、用户位置等各类数据有更大的交叉分析潜力。商业银行只掌握资金的进出流向,而第三方支付机构还能掌握资金的使用情况,不仅知道用户花了多少钱,还知道用户钱花到哪里去了。
1703907547
1703907548
针对特定的分析目标,假若企业自身业务当中生成的多类型数据不够充分,适当引入外部数据源用于交叉分析也是可行的。例如,支付宝引入了用户水电煤缴费情况等外部数据来帮助确立用户信用评级。这些交叉分析足以产生有价值的数据结论。
1703907549
1703907550
对支付宝交易指数进行小数据淘金
[
上一页 ]
[ :1.703907501e+09 ]
[
下一页 ]