1703966390
这些都是人工智能的组成模块。多年来,微软一直致力于推动每个层次的发展——用统计型机器学习工具来理解数据和识别模式;能够看到、听到和移动的电脑,它们甚至开始学习和理解人类的语言。在我们的首席语音科学家黄学东和他的团队的领导下,微软创造了一项纪录:在速记一段电话录音时,电脑系统的准确率甚至能超过受过专业训练的人类速记员。在计算机视觉和学习方面,我们的人工智能团队在2015年末的5项挑战中获得了一等奖。但实际上,我们只是针对其中一个挑战对系统进行了训练。在常见物体图像识别(COCO)挑战赛中,一套人工智能系统要尝试解决几个视觉识别任务。我们训练系统完成了第一个任务:简单地看一看照片,然后给它看到的东西添加标签。然而,通过早期的迁移学习技术,我们建立的神经网络成功学习并完成了其他任务。它不仅可以解释照片,还能在照片上的每一个不同的物体周围画一个圆圈,再造一个英文句子,描述它在照片中看到的动作。
1703966391
1703966392
我相信,人工智能的语音和视觉识别能力将在10年内超过人类。但是一台机器仅仅具备看和听的能力,并不意味着它能具备真正的学习和理解能力。自然语言理解以及电脑与人类之间的互动,是下一个前沿领域。
1703966393
1703966394
那么,人工智能将如何实现它的广阔前景?人工智能如何通过扩大规模来惠及所有人?答案同样要分成几个层次。
1703966395
1703966396
定制。我们现在基本处在人工智能的第一层,那就是定制。有特权获取数据、计算能力和算法的科技公司可以打造一款人工智能产品,然后向全世界提供。只有很少的公司能够为许多人开发人工智能。当今的多数人工智能都处在这个阶段。
1703966397
1703966398
全民化。下一个层次是全民化。作为一家平台公司——这样的公司总是开发基础技术和工具,为其他人提供创新基础,微软的方法是将人工智能开发工具提供给所有人。人工智能全民化意味着使每一人和每一组织都能想象并创造出令人惊叹的人工智能解决方案,满足他们的特殊需求。这类似于活字印刷和印刷术的全民化。据估计,在15世纪50年代,欧洲只有3万本书——每一本都是修道院的人手工制作的。《谷登堡圣经》(Gutenberg Bible)是第一本使用活字技术制作的书。此后50年内,欧洲的图书数量增加到大约1200万册,引发了学习、科学和艺术等方面的复兴。
1703966399
1703966400
人工智能也应该遵循同样的轨迹。为了实现这一目标,我们必须具备包容性和普及性。因此,我们的愿景是开发各种工具,将真正的人工智能灌输到各种机器人、应用、服务和基础设施中:
1703966401
1703966402
•我们利用人工智能来从根本上改变人们与微软小娜这样的机器人互动的方式,这种机器人将在我们的生活中变得越来越普遍。
1703966403
1703966404
•像Office 365和Dynamics 365这样的应用将会融入人工智能,这样它们就能帮助我们专注于最重要的事情,充分利用每一点时间。
1703966405
1703966406
•我们将把我们自家服务的底层智能——模式识别、感知和认知能力——向全世界的所有应用开发者开放。
1703966407
1703966408
•最后,我们正在打造世界上最强大的人工智能超级计算机,并让所有人都能使用它。
1703966409
1703966410
许多行业都在使用这些人工智能工具。麦当劳正在开发一套人工智能系统,帮助员工在得来速式流水线(drivethrough line)上接受订单,使点餐过程更简单、更高效、更准确。优步则在使用我们的认知服务工具来防止欺诈,提升乘客的安全,他们通过匹配司机的照片来确保坐在驾驶座上的司机确实是其本人。沃尔沃也在使用我们的人工智能工具来帮助其识别司机们在什么时候分心,在合适的时候提醒他们,防止发生事故。
1703966411
1703966412
如果你是一名企业主或管理者,可以想象一下,如果你有这样一套人工智能系统,它能看到整个运营过程,了解正在发生的事情,还能把你最关心的事情告诉你。棱镜天空实验室(Prism Skylabs)以我们的认知服务为基础展开了创新,好让电脑监控摄像头,并分析正在发生的事情。如果你有一家建筑公司,当系统看到水泥卡车到达你的一个建筑工地时,它就会通知你。对零售商而言,它可以跟踪库存,或者帮助你在其中一家商店找到经理。有朝一日,它可能会在医院里监督外科医生和后勤人员,在发现医疗错误时及时发出警告,避免遗留后患。
1703966413
1703966414
学会学习。最终,最先进的技术是让电脑学会学习——让电脑能够生成自己的程序。就像人类一样,计算机将不再单纯模仿人类的行为,而是会发明更好的新方案来解决问题。深度神经网络和迁移学习正在引领当今的各种突破,但人工智能就像一个梯子,而我们目前只踏上了第一级。梯子的顶端是通用人工智能,届时,机器可以完全理解人类的语言,电脑将具备与人类相同或难以区分的智能。
1703966415
1703966416
我们的一位顶级人工智能研究人员决定尝试用实验来证明电脑如何能够学会学习。作为一位非常受人尊敬的计算机科学家兼医学博士,埃里克·霍维茨(Eric Horvitz)负责我们的雷德蒙德研究实验室,他长期以来一直痴迷于能够感知、学习和推理的机器。他的实验是让访客更容易找到他,并解放他的人类助理,使之能有更多时间来处理关键工作,而不是把时间花在不停指引方向这种乏味的任务上。所以,要拜访他的办公室,你可以先进入一楼大厅,那里的摄像头和电脑会立即注意到你,计算你的方向、速度和距离,然后做出预测。这样一来,你就会发现突然有一个电梯在等你。下了电梯后,会有一个机器人向你问好,问你是否需要它帮忙在混乱的走廊和拥挤的办公室里找到埃里克的办公桌。一旦到达,就会有一个虚拟助理预料到你的到来。它知道埃里克即将打完一个电话,于是问你是否愿意坐下等埃里克忙完。系统接受了一些基本的培训,但是随着时间的推移,它还会学会自学,所以就不再需要程序员。例如,由于受过训练,所以当有人在大厅里面停下来打电话,或者俯身去捡掉在地上的钢笔时,它就知道应该怎么做。它开始推理,开始学习,开始自己编程。
1703966417
1703966418
彼得·李(Peter Lee)是微软的另一位天赋异禀的人工智能研究员兼思想家。在他办公室的一次晨会上,彼得想到了记者杰弗里·威朗斯(Geoffrey Willans)说过的一句话:“你至少要懂两门语言,才能真正理解一门语言。”杰弗里接着又说:“不懂外语的人也无法理解自己的母语。”学习或改进一项技能或心理功能,可以对另外一项产生积极影响。这种效果便是迁移学习,不仅人类智能具备这种能力,机器智能同样如此。比如,我们的团队发现,如果我们训练电脑说英语,那它学习西班牙语或其他语言的速度也会加快。
1703966419
1703966420
彼得的团队决定发明一种实时语言翻译工具,打破语言障碍。它可以让100个说9种语言的人同时顺畅地沟通,如果以文本形式沟通,最多可以支持50种语言。结果令人鼓舞。全球各地的员工都可以通过Skype相互联系,或者只要对着智能手机说话,就能立刻理解彼此的意思。一个中国演讲者可以用她的母语来表达销售和营销计划,团队成员则能用自己的母语看到或听到她所表达的内容。
1703966421
1703966422
我的同事史蒂夫·克莱顿(Steve Clayton)向我讲述了这项技术对他的多元文化家庭产生的深远影响。他说他第一次看到这项技术的演示时,就知道他那几个说英语的孩子将第一次能够跟他们说中文的亲戚展开一场实时对话。
1703966423
1703966424
展望未来,还会有许多人使用我们的工具来扩展翻译的范围,不再局限于最初的语种。例如,一家医疗保健公司可能想要开发能说英语、西班牙语和其他医疗用语的专业翻译器。可以让人工智能工具观看和收听医疗专业人士的对话,然后,经过一段时间的观察,它就能针对医疗专业生成新的模型。一个美洲原住民部落或许要通过倾听长辈说话来传承自己的语言。最理想的状态是,这些人工智能系统不仅可以翻译语言,还可以改进语言——或许能把对话转换成改进病人治疗方案的想法,或者把对话转换成一篇论文。
1703966425
1703966426
长期以来,圣杯般的人工智能都是一个非常优秀的私人助理,它可以通过一种有意义的方式帮助你在生活和工作中取得最大的收获。小娜的名字来自人气游戏《光晕》中的一个人工智能角色。这是一个有趣的案例,她可以显示我们今天的研究从哪里起步,并展现有朝一日我们如何推出一位高效率且深入懂你的助理。这位助理了解你的背景、你的家庭,以及你的工作,也了解这个世界。她的潜力深不可测,你越是使用她,她就会变得越聪明。她和你的各种应用之间的交互,以及你在Office中的文档和电子邮件,都是她学习的素材。
1703966427
1703966428
如今,小娜每月有超过1.45亿名用户,他们来自116个国家和地区。这些用户已经提出了130亿个问题,而且每提出一个问题,这个机器人都能通过学习变得越来越有帮助。事实上,我已经开始依赖小娜的承诺功能,它可以在我的电子邮件中搜索我所做的承诺,然后在最后期限临近时温柔地提醒我。如果我告诉某个人我会在三周内跟他联系,小娜就会做好笔记,并在日后提醒我,确保我信守承诺。
1703966429
1703966430
我们的小娜团队隶属于成立不久的人工智能和研究部门,他们在贝尔维尤市中心的一栋微软大楼里工作,那里的窗户可以向外眺望太平洋西北地区的湖泊和山脉。周围优美的环境和推进创新的使命吸引了一流的人才——设计师、语言学家、知识工程师和计算机科学家。
1703966431
1703966432
该部门的一名工程经理乔恩·哈米克(Jon Hamaker)说,他的目标是让顾客告诉他:“我的生活中不能没有小娜,她今天又救了我一命。”他和他的团队每天都在思考如何实现这一目标。我们的用户会干什么——什么时候,通过什么方式,在哪里,跟谁互动?通过什么与用户建立纽带?如何节省用户的时间,减轻用户的压力,帮助用户在日常挑战中领先一步?哈米克的目标是捕捉各种各样的数据,而来源则包括全球定位系统(GPS)、电子邮件、日历以及来自网络的相关数据,然后将数据转化为理解力,甚至同理心。你的数字助理或许也会安排时间向你提问,这将有助于填补数据不足的空白,从而为你提供更多帮助。助理可能会在你面临不确定环境的时候提供帮助——比如,当你身处一个使用外币和外语的新地方时。
1703966433
1703966434
这些不确定性吸引了专门研究语义本体的微软工程师,这是一门专门研究人与实体之间相互关系的学问。他们的目标是开发一种机器人,但这种机器人的功能绝不仅仅是为你提供搜索结果。他们梦想数字机器人有朝一日能够理解上下文和语义,并借此更好地预测你的所需和所想。数字助理应该随时都能提供很好的答案,有时甚至可以回答连你自己都未曾想过的问题。
1703966435
1703966436
艾玛·威廉姆斯(Emma Williams)不是工程师,而是一位英语文学学者,她的研究领域是盎格鲁–撒克逊语和古挪威文学。她的工作是思考我们的人工智能产品的情感智能设计,其中也包括小娜。她对负责开发机器人的这个团队的智商很有信心,她希望我们的产品也有这种情感智能。
1703966437
1703966438
有一天,她发现新版小娜在被问及某些问题时,竟然表现得很愤怒。威廉姆斯迅速采取了行动。(如果中世纪的挪威海盗故事告诉了她什么,那就是掠夺式的资源探索是发现不了新事物的。)她提出了一个观点:小娜应该与用户达成一种默契,承诺她将永远保持冷静和镇定。小娜不应该对你生气,而是应该毫无保留地理解你的情绪状态,还要做出适当的回应。团队按照威廉姆斯的观点改进了小娜。
1703966439
[
上一页 ]
[ :1.70396639e+09 ]
[
下一页 ]