1703947671
1703947672
[3] 特定的大数据企业可以用类似的思路提供实时的指数,例如著名的淘宝消费物价指数(TCPI),其数据来自于淘宝网内消费,可以做到完全实时更新。——译者注
1703947673
1703947674
[4] 虽然完全由用户自由添加,标签的形成和组织也有自身的规律。好的标签使用习惯会帮助用户更好管理资源,也会让用户的照片、博客等受到更多关注。相反,胡乱添加标签也会伤害自己。与此同时,标签可以帮助系统提供更好的搜索和推荐服务。关于标签系统的最新研究成果汇总,可以参考张子柯等人2011年在Journal of Computer Science and Technology上发表的“Tag-aware recommender systems:A state-of-the-art survey”一文。——译者注
1703947675
1703947676
1703947677
1703947678
1703947680
大数据时代:生活、工作与思维的大变革 03 更好:不是因果关系,而是相关关系
1703947681
1703947682
知道“是什么”就够了,没必要知道“为什么”。在大数据时代,我们不必非得知道现象背后的原因,而是要让数据自己“发声”。
1703947683
1703947684
【大数据先锋】
1703947685
1703947686
沃尔玛,请把蛋挞与飓风用品摆在一起
1703947687
1703947688
FICO,“我们知道你明天会做什么”
1703947689
1703947690
美国折扣零售商塔吉特与怀孕预测
1703947691
1703947692
UPS与汽车修理预测
1703947693
1703947694
大数据预测早产儿病情
1703947695
1703947696
幸福感的非线性关系
1703947697
1703947698
二手车质量预测
1703947699
1703947700
纽约大型沙井盖爆炸预测
1703947701
1703947702
林登与亚马逊推荐系统
1703947703
1703947704
1997年,24岁的格雷格·林登(Greg Linden)在华盛顿大学就读博士,研究人工智能,闲暇之余,他会在网上卖书。他的网店运营才两年就已经生意兴隆。他回忆说:“我爱卖书和知识,帮助人们找到下一个他们可能会感兴趣的知识点。”他注册的这家网店就是日后大获成功的亚马逊。后来林登被亚马逊聘为软件工程师,以确保网站的正常运行。
1703947705
1703947706
亚马逊的技术含量不仅体现在其工作人员上。虽然亚马逊的故事大多数人都耳熟能详,但只有少数人知道它的内容最初是由人工亲自完成的。当时,它聘请了一个由20多名书评家和编辑组成的团队,他们写书评、推荐新书,挑选非常有特色的新书标题放在亚马逊的网页上。这个团队创立了“亚马逊的声音”这个版块,成为当时公司这顶皇冠上的一颗宝石,是其竞争优势的重要来源。《华尔街日报》的一篇文章中热情地称他们为全美最有影响力的书评家,因为他们使得书籍销量猛增。
1703947707
1703947708
杰夫·贝索斯(Jeff Bezos),亚马逊公司的创始人以及总裁,决定尝试一个极富创造力的想法:根据客户个人以前的购物喜好,为其推荐具体的书籍。从一开始,亚马逊已从每一个客户身上捕获了大量的数据。比如说,他们购买了什么书籍?哪些书他们只浏览却没有购买?他们浏览了多久?哪些书是他们一起购买的?
1703947709
1703947710
客户的信息数据量非常大,所以亚马逊必须先用传统的方法对其进行处理,通过样本分析找到客户之间的相似性。但这些推荐信息是非常原始的,就如同你在波兰购买一本书,会被东欧其他地区的价格水平搞得晕头转向,或者在买一件婴儿用品时,会被淹没在一堆差不多的婴儿用品中一样。詹姆斯·马库斯(James Marcus)回忆说:“推荐信息往往为你提供与你以前购买物品有微小差异的产品,并且循环往复。”詹姆斯·马库斯从1996年到2001年都是亚马逊的书评家,在他的回忆录《亚马逊》(Amazonia)里,他说道:“那种感觉就像你和一群脑残在一起逛书店。”
1703947711
1703947712
格雷格·林登很快就找到了一个解决方案。他意识到,推荐系统实际上并没有必要把顾客与其他顾客进行对比,这样做其实在技术上也比较烦琐。它需要做的是找到产品之间的关联性。1998年,林登和他的同事申请了著名的“item-to-item”协同过滤技术的专利[1]。方法的转变使技术发生了翻天覆地的变化。
1703947713
1703947714
因为估算可以提前进行,所以推荐系统快如闪电,而且适用于各种各样的产品。因此,当亚马逊跨界销售除书以外的其他商品时,也可以对电影或烤面包机这些产品进行推荐。由于系统中使用了所有的数据,推荐会更理想。林登回忆道:“在组里有句玩笑话,说的是如果系统运作良好,亚马逊应该只推荐你一本书,而这本书就是你将要买的下一本书。”
1703947715
1703947716
现在,公司必须决定什么应该出现在网站上。是亚马逊内部书评家写的个人建议和评论,还是由机器生成的个性化推荐和畅销书排行榜?批评者说了什么,或者是顾客的点击意味着什么?从字面上来讲,这是一场人与鼠标的战争。
1703947717
1703947718
林登做了一个关于评论家所创造的销售业绩和计算机生成内容所产生的销售业绩的对比测试,结果他发现两者之间的业绩相差甚远。他解释说,通过数据推荐产品所增加的销售远远超过书评家的贡献。计算机可能不知道为什么喜欢海明威作品的客户会购买菲茨杰拉德的书。但是这似乎并不重要,重要的是销量。最后,编辑们看到了销售额分析,亚马逊也不得不放弃每次的在线评论,最终书评组被解散了。林登回忆说:“书评团队被打败、被解散,我感到非常难过。但是,数据没有说谎,人工评论的成本是非常高的。”
1703947719
1703947720
如今,据说亚马逊销售额的三分之一都是来自于它的个性化推荐系统。有了它,亚马逊不仅使很多大型书店和音乐唱片商店歇业,而且当地数百个自认为有自己风格的书商也难免受转型之风的影响。事实上,林登的工作彻底改变了电子商务,现在几乎每个人都在使用电子商务。
[
上一页 ]
[ :1.703947671e+09 ]
[
下一页 ]