打字猴:1.703948238e+09
1703948238 [10] 尽管所有微博都是公开的,对“firehose”的访问却需要付费。——作者注
1703948239
1703948240 [11] 贝尔纳多·哈柏曼毫无疑问是惠普实验室最有影响力的科学家之一,但是“社会网络之父”这个赞誉还是有些不同寻常。在他11岁的时候,J.A.巴恩斯(J.A.Barnes)已经开始系统研究社交关系,并使用了社会网络这个概念;他10岁到14岁阶段,正是兰普珀特(A.Rapoport)发展关于社交网络上信息和资源如何扩散、哪些因素导致了社交关系的形成、如何用随机网络和其他数学方法刻画社交网络等一系列研究的关键时间,比哈柏曼更资深、更有影响力的社交网络学者还有很多,譬如林顿·C·弗里曼(Linton Freeman)、马克·格兰诺维特(Mark Granovetter)等。社交网络之父这顶帽子恐怕不应该戴在他的头上,尽管他毫无疑问是非常杰出的科学家。——译者注
1703948241
1703948242 [12] 通过阅读Toyabe等人在《自然·物理》上发表的名为“Experimental demonstration of information-to-energy conversion and validation of the generalized Jarzynski equality”一文必会加深读者对该问题的理解。——译者注
1703948243
1703948244
1703948245
1703948246
1703948247 大数据时代:生活、工作与思维的大变革 [:1703946874]
1703948248 大数据时代:生活、工作与思维的大变革 05 价值:“取之不尽,用之不竭”的数据创新
1703948249
1703948250 数据就像一个神奇的钻石矿,当它的首要价值被发掘后仍能不断给予。它的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山的一角,而绝大部分都隐藏在表面之下。
1703948251
1703948252 【大数据先锋】
1703948253
1703948254 IBM,电动汽车动力与电力供应系统优化预测
1703948255
1703948256 Hitwise,通过流量判断消费者喜好
1703948257
1703948258 亚马逊,让数据的价值再大一点
1703948259
1703948260 移动运营商与数据再利用
1703948261
1703948262 谷歌街景与GPS采集
1703948263
1703948264 微软与谷歌的拼写检查
1703948265
1703948266 谷歌,从大的“噪音”数据中受益
1703948267
1703948268 巴诺与NOOK快照
1703948269
1703948270 在线教育课程,找到最合适阅读的论坛帖子
1703948271
1703948272 Facebook,从66亿到1040亿
1703948273
1703948274 DataMarket与InfoChimps,提供免费与付费数据
1703948275
1703948276 ReCaptcha与数据再利用
1703948277
1703948278 20世纪90年代后期,网络逐渐变得拥堵起来。有人开发了一款名为“Spambots”的垃圾邮件程序软件,向成千上万名用户批量发送广告信息,淹没收件人的电子邮箱。他们会在各种网站上注册,然后在评论部分留下成百上千条广告。网络因此成了一个不守规矩、不受欢迎、不够友善的地方。而且,这种软件似乎打破了网络原有的开放性和易用性模式,要知道,正是这种模式向人们提供了各种便利,比如免费电子邮件。当特玛捷这一类公司根据“先到先服务”的原则提供演唱会门票网上订票服务时,作弊软件会偷偷摸摸跑到真正排队的人之前,将门票全部买下。
1703948279
1703948280 2000年,22岁大学刚毕业的路易斯·冯·安(Luis Von Ahn)提出了解决这个问题的想法:要求注册人提供真实身份证明。他试图找出一些人类容易辨别但对机器来说却很难的东西,最后他想到了一个办法,即在注册过程中显示一些波浪状、辨识度低的字母。人能够在几秒钟内识别并输入正确的文本信息,但电脑却可能会被难倒。雅虎采用了这个方法以后,一夜之间就减轻了垃圾邮件带来的苦恼。冯·安将他的这一创作称为验证码(全称为“全自动区分计算机和人类的图灵测试”)。五年后,每天约有2亿的验证码被用户输入。
1703948281
1703948282 这一切给冯·安这位家里经营糖果厂的危地马拉人带来了相当高的知名度,使他能够在取得博士学位后进入卡内基梅隆大学工作,教授计算机科学;也使他在27岁时获得了50万美元的麦克阿瑟基金会“天才奖”。但是,当他意识到每天有这么多人要浪费10秒钟的时间输入这堆恼人的字母,而随后大量的信息被随意地丢弃时,他并没有感到自己很聪明。
1703948283
1703948284 于是,他开始寻找能使人的计算能力得到更有效利用的方法。他想到了一个继任者,恰如其分地将其命名为ReCaptcha。和原有随机字母输入不同,人们需要从计算机光学字符识别程序无法识别的文本扫描项目中读出两个单词并输入。其中一个单词其他用户也识别过,从而可以从该用户的输入中判断注册者是人;另一个单词则是有待辨识和解疑的新词。为了保证准确度,系统会将同一个模糊单词发给五个不同的人,直到他们都输入正确后才确定这个单词是对的。在这里,数据的主要用途是证明用户是人,但它也有第二个目的:破译数字化文本中不清楚的单词。ReCaptcha的作用得到了认可,2009年谷歌收购了冯·安的公司,并将这一技术用于图书扫描项目。
1703948285
1703948286 大数据的力量
1703948287
[ 上一页 ]  [ :1.703948238e+09 ]  [ 下一页 ]