打字猴:1.70426498e+09
1704264980 忠诚度革命:用大数据、游戏化重构企业黏性 [:1704264405]
1704264981 忠诚度革命:用大数据、游戏化重构企业黏性 大数据是如何产生的
1704264982
1704264983 现在数据几乎已不是什么新鲜事了,但纵观人类发展的历史,电子化数据的出现在人类历史上只有很短的一段时间,大数据更是直到最近才粉墨登场。传统概念上的数据,诸如顾客或员工的记录、家庭住址、采购记录以及表现情况,都已过于简陋。这类数据保存在结构化数据库中,只要具备相应的权限、拥有合适的查询工具,并了解数据库构建模式(例如架构图或示意图),即可对数据库进行访问。大数据则代表着那种存储容量巨大,数量繁多,信息类型与格式与每个个体、企业甚至事件息息相关的数据。大数据的数据源来自各个方面,并在不断增长;同时,大数据有很多种组成形式,有些是结构化的数据,可以进行批量处理;而另一些则属于非结构化数据,无法批量化处理;此外,大数据的数据量之大也是前所未有的。
1704264984
1704264985 长期以来,企业都是使用标准的结构化数据保存用户记录,例如姓名、通信地址、电话号码、电子邮件地址,或许还有部分历史交易记录。同时,整合一些从外部购得的市场信息,包括从杂志订阅中推测出客户相关的兴趣爱好,以及从居住地和社会经济地位预估他的消费行为。日积月累,这类记录中包含了越来越多的信息,但仍然是以某种标准的结构化格式存在。
1704264986
1704264987 当前,计算能量的快速增长、移动设备以及其他新型的数据输入组成了另一个海量数据源。今天由于我们通过技术所做的每件事情都会产生数据,因此,新出现的大量非结构化数据流有待输入。其中许多数据源都属于“点击流数据”,如互联网IP地址、全球定位系统(GPS)的定位地址、移动电话使用情况、在线购物模式、社交网络非接触式射频识别(RFID)芯片、传感器及互联设备、博客文章、客户反馈以及其他你在互联网上创建和阅读的“公共”信息。这些和许多未被提及的数据源在极大程度上扩展了现在企业可用的数据总量。麻省理工学院科学家安德鲁·麦卡菲(Andrew McAfee)和埃里克·布林约尔松教授(Erik Brynjolfsson)在最近一期的《哈佛商业评论》中提道:“今天,我们每个人都是一台行走中的数据发生器。”
1704264988
1704264989 这些数据呈现出以下特征:(1)分布范围广;(2)不为某家企业所拥有或控制;(3)无法通过传统的“结构化”数据库管理;(4)数量庞大。这就是大数据。高德纳公司的分析师对大数据作出如下定义:“一般来说,大数据可以定义成数量大、处理快、类型多的信息资产,通过高性价比、创新的流程处理工具利用它,可以提升企业洞察力并使其快速作出市场决策。”换言之,大数据不同于传统数据之处就在于这三个V——存储容量(Volume)、处理速度(Velocity)和类型复杂(Variety)。
1704264990
1704264991
1704264992
1704264993
1704264994 忠诚度革命:用大数据、游戏化重构企业黏性 [:1704264406]
1704264995 忠诚度革命:用大数据、游戏化重构企业黏性 用大数据提升忠诚度
1704264996
1704264997 在企业和个人消费者之间,大数据的作用比较易于理解:通过大数据,企业能够了解到消费者在做什么、在哪里做、什么时候做以及喜欢什么样的信息。从另一个角度来看,这件事情就是企业经营的所有参与者,在和企业互动的过程中不断间接或直接向企业透露出有关他们自己的信息。而大数据的收集和分析工具则会帮助企业接收到这些信息并且做出反馈。
1704264998
1704264999 计算能力的提升、强大而廉价的网络、海量存储设备的激增,以及数据生成系统的增长都促成了今天大数据的规模和容量。然而对于大数据应该有多大这样的问题,并没有真正的标准或者定义。
1704265000
1704265001
1704265002
1704265003
1704265004 通常在谈到大数据时,你可以对其规模有这样的理解:有人估计沃尔玛的数据库容量在2.5个PB(拍字节)——相当于美国国会图书馆藏书量的167倍。1PB等同于1000000GB(十亿字节),大约等于两千万个文件柜中所能包含的文档上的字数。而对于在线商业大亨易趣公司来说,用户每天在其站点检索、购买和浏览的过程中则会产生50PB的数据量。
1704265005
1704265006 如果将这些全都算上,我们现在每一天新产生的数据总量高达2.5EB(艾字节),这是沃尔玛数据仓库的1000倍。事实上,绝大多数企业今天所存储的数据量都已超过了美国国会图书馆的藏书量。另一组数据或许更能说明问题,今天全球所有企业的商业数据量预计每1.2年就会翻番,即每年的新数据产生速度高达40%。根据谷歌公司主席埃里克·施密特的讲述,自人类文明创始至2003年,我们一共创建的信息总量为5EB,而这只等于现在我们在两天内产生的数据量。
1704265007
1704265008 目前市场上的各种应用软件数量众多,且种类各异,有做精准定位广告的,有提供卖场布局优化的,还有用于电子邮件市场营销以及改善成交转化率的。大数据的应用已经成为企业运营的核心,帮助企业管理产品研发、生产制造、供应链和其他各类商业活动。而正如我们即将看到的,大数据在凝聚企业和员工、企业和合作伙伴的关系方面,也将发挥巨大的作用。当然,一个很明显的问题是如何做到这一点。大数据在这些方面将如何帮助到我们?
1704265009
1704265010 在目前阶段,长篇累牍叙述大数据如何产生作用或是分析其原理并无多大意义,我们还是将其留给IT专家、数据科学家以及经过认证的数值计算研究机。相反,我们将会综述性地介绍一些大数据的分析方式和其产出的结论种类,同时对那些出类拔萃的大数据处理工具作一个简要概述。同样,我们的目的只是认识大数据这个词汇并了解大数据的相关问题,而不是让你成为专家。
1704265011
1704265012 下面列出了一些重要的大数据收集和分析形式。
1704265013
1704265014 ■聚类分析。聚类分析就是将不同类型的对象分成各个小组,从而使得同一组中的对象相比其他组中的对象而言彼此之间更为相似。关键是,这种分组或相似性是事前未知的。举例来说,随机询问一组人对于科幻小说的兴趣,评分从–5(厌恶)到+5(喜爱)不等。同时也以相同的评分方式询问同一组人对于巧克力的喜好。将他们的回复绘制成图表,将同时喜欢科幻小说和巧克力的人放在右上角,而把对两者都反感的放在左下角。这些答复在图表中是否均匀分布,你是否能找出同类群?每组同类群代表着一组对科幻小说和巧克力均抱有兴趣的个体,在今天,这类信息能够用于企业和消费者的互动之中,并获取他们的积极响应。以零售行业的场景为例,假如在上述案例中有特定人群同时喜欢科幻小说和巧克力,在他们购买《星球大战》的DVD时,你或许应当同时向他们推销巧克力。
1704265015
1704265016 ■A/B测试(亦称对比测试)。在这类实验中,通过对比测试组A和测试组B,来判断何种处理(改变)方式能够改善特定的对象,比如一次市场营销的反馈或参与率(通常也称为转化率)。假设你想要判断是否应当推出某款产品,产品推出的时间,甚至是在网站上的呈现方式是否有效,通过A/B测试,你可以尝试不同的方式,来找出哪一种能够达到最高的转化率,也就是你所期望的效果。不论是用户注册、发生采购还是只是简单地点击按钮进入下一步流程,高转化率在任何情况下都是商业成功的必要条件。A/B测试还可以演变为多变量测试,即在同一时间对业务进行多项A/B测试。样本容量(测试数量)取决于被测对象的可变数量及所应具备的准确性。
1704265017
1704265018 在互联网站点建设方面,企业通常会通过A/B测试来验证素材内容、放置位置、颜色以及“期望点击”按钮大小,比如那些标有“现在加入”、“马上购买”或者“了解更多”字样的按钮,来找出哪一种类型可以获得的点击次数(转化率)最多。虽然人们对这类问题的答案都有大致的估计猜测,但A/B测试也有助于更为客观地获得最优化的解决方案。
1704265019
1704265020 ■众包模式。众包模式是指将工作外包给一群分散且彼此互不相识的人,即所谓的“大众”。有很多种形式的群众外包,而且通常取决于所外包的工作性质——观点看法、计件制的工作、计算能力、想法意见甚至是资金经费。一些比较著名的案例有:
1704265021
1704265022 ●无线T恤(Threadless)。自从2000年起,无线T恤就成了由百万名T恤设计师组成的在线社区。最有趣的是,每周社区成员会提交成百上千款T恤衫设计,同时对他人的作品投票并作出评论。在每周结束之前,无线T恤的员工会根据得分和用户反馈,审查排名最高的作品,并从中选择10款设计,将其打印在T恤和其他衣物上,通过网站和其位于芝加哥的零售商店进行销售。作品被打印出的作者则会收到现金支票和无线T恤送出的礼品卡作为报酬。由此你可以看到这家公司的产品(设计)源于众包模式、产品推出经由众包模式完成(用户投票和评论)、销售预测依赖众包模型(同样通过投票和评论),甚至市场营销中也使用了众包模型(胜出的设计师会主动传播消息,让别人去购买他们的作品)。
1704265023
1704265024 ●花海公司(CrowdFlower)。花海公司帮助企业将工作任务众包给全球数百万名劳动者。这类可以众包的小块工作包括影像调节(图片中是否有瑕疵)、语境分析(这条Twitter信息中所指的内容是正面的还是负面的)、内容分类(这部影片属于什么类型)以及内容创建(写一篇有关忠诚度的短文)。对于数据日益增长、需要人工处理的企业而言(例如Facebook有数百万张有待修饰的图片),花海所提供的服务能够帮助其灵活地应对各种繁杂的工作量。通过花海汇聚起大量人力资源的另一项好处在于,它可以让不同的人完成同一件工作,并通过共识“投票”来决定最佳答案(例如,只有当三个人中有两个人认为这张图片令人不快时,你才会这样标记)。此外随着时间的推移,参考各位工作人员是否能准时完成任务以及工作质量(通过公众投票)的数据,你可以为每个人建立一份“信用档案”,以决定是否给他提供更多更好的机会。
1704265025
1704265026 ●证券市场。证券价格是一个风向标,反映出市场对企业未来发展的共识。它由无数个交易员在他们的实际交易的每毫秒之内所反映出的观点组成的。IBM目前的股票价格是否合理?没有哪个单独的个体能够判断,但是“市场大众”知道。证券市场的赢家往往是那位能够处理反映市场环境的大数据(例如,经济、政策、新闻、顾客情绪等),并对处理结果做出最快速反应的人。
1704265027
1704265028 ■预测建模。预测建模是指对已创建的一组数据建模的技巧,它能最准确地预测某个结局,并且比聚类分析更为深入。它不仅能分析出一组人相似的行为或特性,并且还能基于过往事件和数据,预测该组成员在特定环境下必然会采取的行为。举例来说,预测模型可以从各种直接或间接的因素中,分析出某特定区域的天气。在消费领域,预测模型能够预估客户加入、持续参与或者退出某项活动的可能性。和天气预报类似,这种分析基于大量的直接和间接因素,以及与其他行为的关联。这些模型同样能够用于预测跨交叉销售或增售的可能性。企业也可以通过使用建模来协助预测员工的流动性,甚至是预估员工可能出现的最佳或最差表现。
1704265029
[ 上一页 ]  [ :1.70426498e+09 ]  [ 下一页 ]