1703966370
对他而言,所谓“纳受一切”,其实就是规划一份蓝图,也就是围绕能够感知人类、环境和周围物体的传感器开发一种新的计算体验。这种新的计算体验必须支持三种交互:能够输入模拟数据,能够输出数字数据,还要具备感知或触摸数据的能力,也就是所谓的触觉反馈。
1703966371
1703966372
Kinect是这场旅程的第一步,它实现了一个目标,让人类只要动一动身体就能为电脑输入数据。突然之间,我们竟然跟电脑一起跳舞。现在,HoloLens则在努力实现多个目标,它让人类、环境和物体能够跨越时间和空间相互收发数据。突然之间,地球上的宇航员竟然可以查看火星上的陨石坑了。最后一项触觉反馈则需要包含触摸和感受的能力。当我们使用Kinect跳舞或使用HoloLens接触岩石的时候,我们还无法感觉到自己的舞伴或那块石头。但这一天迟早会到来。
1703966373
1703966374
今天,微软的重点是实现混合现实的全民化,让每个人都能使用它。我们推出HoloLens时采用的是一种经过验证的策略——邀请外部开发人员帮助我们为HoloLens平台创建富有想象力的应用程序。在我们宣布推出HoloLens之后不久,就有5000多名开发人员提交了他们的应用程序构思。我们在推特上进行了24小时的调查,向粉丝询问我们应该优先考虑哪个构思。开发者和粉丝们选择了Galaxy Explorer,它让你可以看向窗外、畅游银河——你可以在自己的空间里穿梭、放大,为你看到的东西添加注释,还能把这份经历存储下来,以供日后使用。它还能把一颗行星上的环境复制到你房间的墙上——风沙、热等离子体和冰块。
1703966375
1703966376
现在,其他开发人员正在为HoloLens开发非常有用的新应用。比如,借助HoloLens,劳氏公司(Lowe’s)的家装店就能让顾客站在他们自己的厨房和浴室里,把新的橱柜、电器和配件的全息图叠加上去,好让他们准确地看到改造后的样子。
1703966377
1703966378
技术轨迹的开端只是追踪所能看到的事情,但有朝一日可以完全理解所传达的信息,就像我们在发展人工智能的过程中所学到的一样。Kinect让电脑有能力跟踪你的动作——使之能够看到你,还能理解你的动作。这就是今天的人工智能、机器学习和混合现实所处的阶段。科技的视觉、语言和分析能力会不断提升,但它却无法感受。不过,混合现实或许能够帮助机器对人类产生同理心。通过这些技术,我们可以越来越多地体会难民或犯罪受害者的经历,这可能会增强我们的能力,让我们能够穿透如今将人们彼此分隔的障碍,与他人构建情感联系。事实上,我曾经遇到几个参加了微软“创新杯”比赛的澳大利亚学生。他们开发了一个混合现实应用,帮助一些看护者学会透过自闭症患者的眼睛了解世界。
1703966379
1703966380
*
1703966381
1703966382
好莱坞已经通过无数方式描绘过人工智能,他们甚至把这种科技变成了自己的一个亚流派。在1973年的《西部世界》(Westworld)里,尤尔·布伦纳(Yul Brenner)扮演了一个机器人——一个硬汉形象的人工智能牛仔,他走进一间酒馆,渴望发生一场枪战。多年以后,迪士尼对此进行了不同的刻画。在《超能陆战队》(Big Hero 6)中,他们设计了一个名叫“大白”的巨型机器人,帮助他14岁的小主人完成一场悬疑之旅。这部电影宣称:“他会改变你的世界。”
1703966383
1703966384
人工智能确实将改变我们的世界。它将给人类带来提升和帮助,它更像大白,而不是布伦纳。
1703966385
1703966386
大数据、庞大的计算能力和复杂的算法这三大突破正在让人工智能加速从科幻变成现实。由于相机和传感器在我们日常生活中呈现指数级增长,相关数据正以惊人的速度被收集和利用。人工智能需要数据才能学习。云计算可以为每个人提供强大的计算能力,现在还能编写复杂的算法,从海量数据中提取洞见和智慧。
1703966387
1703966388
但与大白或布伦纳不同的是,如今的人工智能还算不上所谓的通用人工智能(AGI)。达到这一阶段,计算机便可匹配甚至超越人类智能。与人类智能类似,人工智能也可以划分成不同的层次。底层是简单的模式识别。中间层是感知,负责感知越来越复杂的场景。据估计,有99%的人类知觉都是通过语言和视觉来获得的。最后,最高级的智能就是认知,也就是对人类语言的深刻理解。
1703966389
1703966390
这些都是人工智能的组成模块。多年来,微软一直致力于推动每个层次的发展——用统计型机器学习工具来理解数据和识别模式;能够看到、听到和移动的电脑,它们甚至开始学习和理解人类的语言。在我们的首席语音科学家黄学东和他的团队的领导下,微软创造了一项纪录:在速记一段电话录音时,电脑系统的准确率甚至能超过受过专业训练的人类速记员。在计算机视觉和学习方面,我们的人工智能团队在2015年末的5项挑战中获得了一等奖。但实际上,我们只是针对其中一个挑战对系统进行了训练。在常见物体图像识别(COCO)挑战赛中,一套人工智能系统要尝试解决几个视觉识别任务。我们训练系统完成了第一个任务:简单地看一看照片,然后给它看到的东西添加标签。然而,通过早期的迁移学习技术,我们建立的神经网络成功学习并完成了其他任务。它不仅可以解释照片,还能在照片上的每一个不同的物体周围画一个圆圈,再造一个英文句子,描述它在照片中看到的动作。
1703966391
1703966392
我相信,人工智能的语音和视觉识别能力将在10年内超过人类。但是一台机器仅仅具备看和听的能力,并不意味着它能具备真正的学习和理解能力。自然语言理解以及电脑与人类之间的互动,是下一个前沿领域。
1703966393
1703966394
那么,人工智能将如何实现它的广阔前景?人工智能如何通过扩大规模来惠及所有人?答案同样要分成几个层次。
1703966395
1703966396
定制。我们现在基本处在人工智能的第一层,那就是定制。有特权获取数据、计算能力和算法的科技公司可以打造一款人工智能产品,然后向全世界提供。只有很少的公司能够为许多人开发人工智能。当今的多数人工智能都处在这个阶段。
1703966397
1703966398
全民化。下一个层次是全民化。作为一家平台公司——这样的公司总是开发基础技术和工具,为其他人提供创新基础,微软的方法是将人工智能开发工具提供给所有人。人工智能全民化意味着使每一人和每一组织都能想象并创造出令人惊叹的人工智能解决方案,满足他们的特殊需求。这类似于活字印刷和印刷术的全民化。据估计,在15世纪50年代,欧洲只有3万本书——每一本都是修道院的人手工制作的。《谷登堡圣经》(Gutenberg Bible)是第一本使用活字技术制作的书。此后50年内,欧洲的图书数量增加到大约1200万册,引发了学习、科学和艺术等方面的复兴。
1703966399
1703966400
人工智能也应该遵循同样的轨迹。为了实现这一目标,我们必须具备包容性和普及性。因此,我们的愿景是开发各种工具,将真正的人工智能灌输到各种机器人、应用、服务和基础设施中:
1703966401
1703966402
•我们利用人工智能来从根本上改变人们与微软小娜这样的机器人互动的方式,这种机器人将在我们的生活中变得越来越普遍。
1703966403
1703966404
•像Office 365和Dynamics 365这样的应用将会融入人工智能,这样它们就能帮助我们专注于最重要的事情,充分利用每一点时间。
1703966405
1703966406
•我们将把我们自家服务的底层智能——模式识别、感知和认知能力——向全世界的所有应用开发者开放。
1703966407
1703966408
•最后,我们正在打造世界上最强大的人工智能超级计算机,并让所有人都能使用它。
1703966409
1703966410
许多行业都在使用这些人工智能工具。麦当劳正在开发一套人工智能系统,帮助员工在得来速式流水线(drivethrough line)上接受订单,使点餐过程更简单、更高效、更准确。优步则在使用我们的认知服务工具来防止欺诈,提升乘客的安全,他们通过匹配司机的照片来确保坐在驾驶座上的司机确实是其本人。沃尔沃也在使用我们的人工智能工具来帮助其识别司机们在什么时候分心,在合适的时候提醒他们,防止发生事故。
1703966411
1703966412
如果你是一名企业主或管理者,可以想象一下,如果你有这样一套人工智能系统,它能看到整个运营过程,了解正在发生的事情,还能把你最关心的事情告诉你。棱镜天空实验室(Prism Skylabs)以我们的认知服务为基础展开了创新,好让电脑监控摄像头,并分析正在发生的事情。如果你有一家建筑公司,当系统看到水泥卡车到达你的一个建筑工地时,它就会通知你。对零售商而言,它可以跟踪库存,或者帮助你在其中一家商店找到经理。有朝一日,它可能会在医院里监督外科医生和后勤人员,在发现医疗错误时及时发出警告,避免遗留后患。
1703966413
1703966414
学会学习。最终,最先进的技术是让电脑学会学习——让电脑能够生成自己的程序。就像人类一样,计算机将不再单纯模仿人类的行为,而是会发明更好的新方案来解决问题。深度神经网络和迁移学习正在引领当今的各种突破,但人工智能就像一个梯子,而我们目前只踏上了第一级。梯子的顶端是通用人工智能,届时,机器可以完全理解人类的语言,电脑将具备与人类相同或难以区分的智能。
1703966415
1703966416
我们的一位顶级人工智能研究人员决定尝试用实验来证明电脑如何能够学会学习。作为一位非常受人尊敬的计算机科学家兼医学博士,埃里克·霍维茨(Eric Horvitz)负责我们的雷德蒙德研究实验室,他长期以来一直痴迷于能够感知、学习和推理的机器。他的实验是让访客更容易找到他,并解放他的人类助理,使之能有更多时间来处理关键工作,而不是把时间花在不停指引方向这种乏味的任务上。所以,要拜访他的办公室,你可以先进入一楼大厅,那里的摄像头和电脑会立即注意到你,计算你的方向、速度和距离,然后做出预测。这样一来,你就会发现突然有一个电梯在等你。下了电梯后,会有一个机器人向你问好,问你是否需要它帮忙在混乱的走廊和拥挤的办公室里找到埃里克的办公桌。一旦到达,就会有一个虚拟助理预料到你的到来。它知道埃里克即将打完一个电话,于是问你是否愿意坐下等埃里克忙完。系统接受了一些基本的培训,但是随着时间的推移,它还会学会自学,所以就不再需要程序员。例如,由于受过训练,所以当有人在大厅里面停下来打电话,或者俯身去捡掉在地上的钢笔时,它就知道应该怎么做。它开始推理,开始学习,开始自己编程。
1703966417
1703966418
彼得·李(Peter Lee)是微软的另一位天赋异禀的人工智能研究员兼思想家。在他办公室的一次晨会上,彼得想到了记者杰弗里·威朗斯(Geoffrey Willans)说过的一句话:“你至少要懂两门语言,才能真正理解一门语言。”杰弗里接着又说:“不懂外语的人也无法理解自己的母语。”学习或改进一项技能或心理功能,可以对另外一项产生积极影响。这种效果便是迁移学习,不仅人类智能具备这种能力,机器智能同样如此。比如,我们的团队发现,如果我们训练电脑说英语,那它学习西班牙语或其他语言的速度也会加快。
1703966419
[
上一页 ]
[ :1.70396637e+09 ]
[
下一页 ]