1704026720
1704026721
瓦格纳将他父亲的教诲铭记在心,并在2012年的选举中将其付诸实践。简而言之,他所做的一切,都是为了弄清楚,如何更加高效和有效地给起重机安装销轴。瓦格纳的方法渐渐被越来越多的企业所认识,尤其是随着数据变得越来越廉价和灵活。瓦格纳说,“从传统意义上来讲,一个机构的正常心理,不会觉得‘如果我有这么多钱来做一件事,那我就会用预算中的一部分,来弄清楚剩下的预算有没有投入在值得的事情上’。不幸的是,这样的想法并不是机构的常态,但是我认为它正在成为新常态。你需要在预算中留出一部分,弄清楚剩下的预算究竟有没有在实现你想做的事。这只会增加间接费用,但是却能够使你资产的收益前景更加光明。而且比起从前,现在你可以这样安排预算,因为其中涉及的许多事物都需要通过一些现在可用的数据进行测量,而以前我们并没有这些数据。”
1704026722
1704026723
奥巴马数据驱动型竞选活动的另一名架构师迈克尔·斯拉拜认为,除了新的可用数据,运算领域的最新进展也造就了大数据的超前地位:“我们收集大量数据已经很长时间了,所以‘大数据’真正的含义是,接近实时地处理大量信息,从而使我们能够利用信息做出行动的能力。如果有这样的能力,我们就能以战略性的方式而不是事后回顾性的方式,做出不同的决定。过去典型的大数据分析,总是在事后的反思中进行,比如在一些大型研究或长期的项目中,而不是作为现有战略进程的一部分进行。”
1704026724
1704026725
如果你想知道正在进行的全国大选的投票情况,就要思考全国普查长达数年的分析和实时分析之间有什么区别。速度使得全新的项目成为可能。这就是斯拉拜认为大数据的崛起了不起的地方:“大数据其实只是运算能力商业化的应用,结合了云计算更广泛的实用性。我们现在能够以人们负担得起的方式,足够快速地消化足够多的数据……而且储存现在变得廉价,因此我们可以存储大量数据……然后就可以足够快地处理并利用这些数据。”
1704026726
1704026727
数据收集的增长与运算能力的提升相辅相成。数据越多,就有越多人投资高性能计算机和大量被存储数据,来消化数据并从中提取商业情报。而计算机的性能越强大,收集更多数据和制造更大、更深入的数据集就更容易。
1704026728
1704026729
大数据本身是自相矛盾的。它既是个人的也是广阔的。它调查细小的事件,并将这些有限的事件集合成既全面又能被个性化的信息。学者们将大数据比作显微镜和望远镜的合体——作为一个工具,它让我们既能检视比以前所能观察到的更小的细节,又能更大规模地审视数据,揭示之前离我们太远而无法被察觉的相互关系。
1704026730
1704026731
大数据在现实世界的影响力,到这里为止在很大程度上都是关于物流和说服的。大数据对于供应链、选举和广告来说都是福音,因为这些领域倾向于涉及许多小的、重复的、可量化的行动,所以大数据才成了亚马逊和网飞的“推荐引擎”,向用户提供更精确的推荐。但是这些领域只是一个开始,等到我的孩子们就业的时候,“大数据”将不再是一个时髦短语。现在的生活中,我们认为并不扎根于数据分析的那些部分,到那时都将被大数据渗透。大数据将改变我们吃什么、我们怎么说话以及我们的公开和私人角色之间的界限。
1704026732
1704026733
你会运用多少种语言?
1704026734
1704026735
未来10年,大数据的目标之一是让每个人都能用几十种外语流利地阅读本书,消除所谓的语言障碍。过去常有这种情况,每当出国旅游,我会带本袖珍字典,上面有常见单词短语的翻译。如果想造个句子,我常常要查阅5分钟才能说出一个生硬的词组,不知道动词用法是否正确,名词发音有没有问题。而现在我拿出手机,把短语输入谷歌翻译,只要连网,就能快速得到答案,90多种语言任意选择。结果当然总是称心如意。当我不知道要怎么说时,我会举起手机屏幕,我那位不会英语的同伴就能读懂我未能表达之意。当然,我的发音断断续续,而且一次只能说几个句子,我也不知道其他人在回答我的问题时说了什么。基本上会问洗手间在哪里,然后对方能听懂就已经很厉害了。
1704026736
1704026737
如今的机器翻译发展迅速,远比我那古老的查字典的方法有效,但是它的准确性、功能性和达意程度仍有待提高。实际上,这只是数据和计算问题。专业的译者认为当地方言、句子的婉转变化和语义的细微差别对计算机来说过于复杂,机器无法充分表达出来。但是他们错了。现在由机器提供的翻译工具每天要为2亿多人服务,翻译10亿多次。随着数据呈指数级增长,这一数字不久就只代表一下午的翻译量,然后就是一个小时的翻译量。大量语言数据将不断被更新。而当翻译的数据量呈指数级增长,机器翻译的准确度也将成倍增加,甚至能照顾到细枝末节。只要机器翻译出错,用户就会标注错误,这些数据将被纳入数据库以供机器在未来的翻译中避免它们。我们只是需要更多数据、更强大的运算能力和更高级的软件。这些随着时间的推移都会实现,也将填补我们在发音和口头交流方面的沟通隔阂。
1704026738
1704026739
机器翻译最有趣的创新将伴随人性化界面接踵而来。未来10年内,一只小小的耳机就几乎能用母语传递你听到的外语。而滞后时间只是音速。这的确不可思议。你耳朵听到的声音不会是像Siri那样的机械的机器声音。由于生物声学工程测量频率、波长、声音强度和其他声音特质的进步,与耳机相连的云端软件将使发言者的声音更人性化,并用你的母语表达。当你回答时,你的语言将通过你同伴的耳机被翻译成他的母语,或者通过手机、手表以及其他2025年才会有的个人设备上的扬声器被放大。
1704026740
1704026741
现在的翻译工具也倾向于只在两种语言之间转换。让任何一种机器尝试翻译三种语言,简直就是一团乱。未来,会说多少种语言已经不再重要。你可以举办一个8人晚餐派对,席间你们可以说8种不同语言,而你耳中听到的声音永远会是你所擅长的语言。
1704026742
1704026743
机器翻译的普及将大规模加速全球化进程。虽然现阶段在很大程度上通过把英语作为商业通用语言来推动全球化发展——目前把英语作为第二语言的人数是以英语为母语人数的两倍——而下一轮全球化将消除对通用语言的需求,更进一步扩大交流。最近在巴西召开的一次会议上,当一位韩国商人要和中国商人交流,他们都要将母语翻译成英语。但将来不会再有这种需要,全球经济的大门将为非精英人士和大量不会说英语的人敞开。
1704026744
1704026745
机器翻译也将在那些因语言障碍而难以驾驭的市场占据一席之地,解决语言障碍问题。印度尼西亚正是如此。虽然雅加达和巴厘岛有很多人说英语、中文和法语,但是其他6 000个有人居住的小岛上几乎没人会说这三种语言。如果大家不必用流利的爪哇语(或者另外700种印度尼西亚语言)和其他地方的人做生意,那么他们的交流就会变得很简单,反过来也更容易获得外部资本。
1704026746
1704026747
跨过临近印度尼西亚东部的班达和阿拉弗拉海,就是资源丰富的巴布亚新几内亚。巴布亚新几内亚富含矿藏,拥有肥沃的土地以及名贵海鲜水产(拥有全世界18%的金枪鱼),但是该国使用的850种语言却让外国投资商敬而远之。被应用于翻译的大数据将改变这个局面,它将找出与世界经济分离的地区,帮助它们融入全球经济。
1704026748
1704026749
正如任何一种新技术一样,全球机器翻译的兴起也会有不足,其中有两点尤为显著。首先是翻译行业的消失。未来10年,就连仅有的专业译员都要为翻译软件工作。虽然大多数机器翻译软件(比如谷歌翻译)仍会很大程度上继续依赖人工翻译,但是一旦翻译数据库足够大,译员将不再被需要。专业译员的工作可能就像是点灯者,或者像现在的煤矿开采工作一样;现在依然需要少量能够超越机器的煤矿工人,但他们不是亲自去地下挖煤。那些经过精简、与机器一起工作的专业译员负责俚语翻译和速记,俚语和速记才总能进入语言的生命系统。我曾建议,为了收录得更及时、全面,在希拉里·克林顿演讲的同时我们看看机器在如何翻译。我记得美国国务院那些外交官们被我的建议吓坏了。“这绝不可能发生。”他们惊叫道。这些外交官们是对的,现在的解决方案还不够完美,一些错误甚至可能导致外交骚动。但他们认为这绝不会发生倒是错了,实现这一步只是时间问题。
1704026750
1704026751
第二个缺点是欺诈风险的增加。如果我的声音能被再创造,并且和我的“原声”难以分辨,这就为诈骗带来了新的机会——利用不下几十种语言实施诈骗。在一个普遍用翻译进行交流的世界中,具有讽刺意味的是,我们需要看着对方的眼睛来辨别他的话是否可信。
1704026752
1704026753
未来有90亿人口需要粮食
1704026754
1704026755
大数据可能把乌尔都语、希腊语和斯瓦西里语全都变为平常的对话用语,这将显著地改变世界。然而大数据更令人印象深刻的是它在大举消除饥饿中所扮演的角色。饥饿可能是人类永恒的难题。联合国粮食计划署发布报告称,每9个人中就有一人因食物匮乏无法拥有健康积极的生活,而这一人数多达8.05亿。随着人口持续增长,预计未来30年将突破90亿,粮食至少要增产70%才能保证全世界饥饿现状不再进一步恶化。再加上全球气候变化,气温升高,可饮用水资源也会更加缺乏(全球70%的淡水资源用于农业)。
1704026756
1704026757
供养全球如此众多人口的最大希望就是把大数据和农业结合——精细农业。几千年来,农民凭着自己的经验和直觉耕种。人类历史的大多数时刻,都把月相的变化作为农事活动最重要的科学依据(因为月亮对土壤和种子有影响的古老信仰以及在没有时钟或者日历的情况下根据它来安排农时)。“二战”以后,科技创新蓬勃兴起,通过绿色革命,农业产量大幅增加,饥饿和贫困得到有效缓解。绿色革命引进了新的技术和实践,包括杂交种子、灌溉、农药和化肥。
1704026758
1704026759
从那以后,农民不用再遵循固定的农时种植、施肥、修剪,收获时也不用过多考虑季节改变、气候条件以及每块田里不断变化的琐碎细节;农业成为工业时代的延伸。
1704026760
1704026761
精细农业将收集、评估包括天气、水、氮素浓度、空气质量和病害等因素在内的很多实时数据——不仅每块田、每英亩[9]的数据非常明确,农田里每平方英寸[10]的数据都很清楚。传感器会帮农田排序,然后将几十种不同形式的数据传向云端。在将这些数据收集分析之后,算法就会生成一整套准确指令,告诉农民要耕种的内容、时间和地点。
1704026762
1704026763
小时候我常爬进拖拉机或者收割机里,在我看来,就是个简单坚硬的机器:只有一个钢架、几个粗大的橡胶轮胎和一个发动机。农民会根据天气和时令耕作,目测自己面前的土地还剩多少没有耕作。相比我童年时的拖拉机,未来的农具更像是飞机座舱。在平板电脑上运行的软件程序上会有图表界面,农民能看得到。机器前进的方向不再由农民掌控,而是由来自软件的指示远程控制。当机器耕地时,放置在车前灯头旁的有源传感器会把作物冠层的信息传递给系统。机器自己在农田里前行,实时接收来自遥远的卫星和土壤的处理信息。机器的本能是算法。通过算法机器操作精密,超越了自古以来农民们最异想天开的梦想。
1704026764
1704026765
如今的机器仅在说明一切皆有可能。最终拖拉机将能够判断每平方英寸土地的需求,然后根据不同需求为每一块土地送去量身定制的肥料。它会分析所需肥料的精确数量,而不是给所有土地都播撒固定量的磷肥或氮肥。
1704026766
1704026767
为了使精细农业在全球得以推行,早期投资主要来自孟山都公司、杜邦公司和美国迪尔等农业综合企业巨头。孟山都公司很快就对大数据的重要性坚信不疑,接着展开了收购狂潮,斥资几十亿美元收购农业数据分析公司。他发现通过分析数据能让农作物产量提高30%,创造200亿美元的经济价值。
1704026768
1704026769
孟山都公司刚开始实地试验一个新品种,这给我们一个信号,即FieldScripts[11]会成为未来农业的主流。FieldScripts会收集既定农场的信息,包括农田大小、生产历史和肥力测试结果,然后把农场划分为很多小型管理区域。之后通过运算推荐合适的种子以及种子的简介(播种时间、地点、种子类型和数量),这些信息会通过平板电脑上Field View这个应用程序发送给农民。农民把数据从Field View传输到一个鸟状的大件农用机器——可变速播种机。这个拥有和拖拉机相似的驾驶室、拖着两个重重铁翼的机器能在30英尺的范围内播撒种子。驾驶室里面是一个精细的监视器,有点像新款波音787。在数据的指导下,播种机向每一块小型管理区域播散定制的种子。
[
上一页 ]
[ :1.70402672e+09 ]
[
下一页 ]