1704804660
1704804661
一旦发现了某种工作的套路,人工智能的判断力就能持续保持高水平。来看两个例子。
1704804662
1704804663
谷歌在Gmail上推出的智能自动回复功能Smart Reply,能对海量邮件里的场景、邮件写作风格和写作语气进行分析,从而帮助用户筛选适合语境的回复短句。
1704804664
1704804665
在2015年某国家级英语考试阅卷中,科大讯飞的产品在翻译题和作文题中的评分比大多数专家老师的评分准确度还要高,同时科大讯飞的评阅系统可以指出具体语法错误、格式错误和错词等。语文作文的评分相对难一些,因为要评判作文的立意和整个篇章的结构,不像英文更多的是看有没有字词拼写和句子结构错误。但是科大讯飞语文作文的评阅系统也通过了验证,相关性、分差上表现得也比专家要好。它还能写作文评语,找出文章立意和篇章结构上的错误,区分出议论文的引论句、立论句和论点,可以方便学生查找自己薄弱的地方。
1704804666
1704804667
传统计算机需要专家传授套路,人工智能则能够自己发现套路。
1704804668
1704804669
大约半个世纪前,机器就能完成一些高难度的认知任务,但机器能处理的是一些经过预先手工编程的任务,或者进行一些预设程序的计算,它们并没有自学能力。比如要训练一台计算机来识别银行交易中的诈骗交易,必须由专家预先准确地告诉它所需要查找的内容。如果没有人能解释完成一个任务时的所有步骤,那么也就没有程序员能将这些规则嵌入到软件中,这个领域的问题就无法被机器处理。
1704804670
1704804671
深度学习跨越了这个巨大障碍,即使没有人类教导,机器也能学习了。还是以识别诈骗交易为例,我们只需将一些标记上“欺骗性的”和“非欺骗性的”数据交给计算机,然后计算机依靠算法就能学会应该去查找哪些内容,告诉你是否存在欺诈行为。
1704804672
1704804673
判断某个基因会不会发生病变,需要运用通过参考医学论文而得来的推理规则,人工智能可以吸收许多医学论文,明确地制作出疾病预测的推理规则。人类在漫长的抗癌过程当中写了大量文件,进行了大量分析,有2300万个相关的文件和医学研究文章。IBM估计,仅做到和相关的医学信息及资料保持同步,一位人类医生每星期就要把160个小时花在阅读上,这显然不现实。未来的医疗进步离不开人工智能的分析能力。
1704804674
1704804675
再以图片识别为例。传统算法认猫,是靠人类标注猫的各种特征,然后让机器去学习这些规则,比如猫有大眼睛,有胡子,有花纹,有尾巴。但人制定的种种规则是有缺陷的,有时候机器会分辨不出猫和老虎,或者分不出狗和猫。深度学习算法是直接给机器几百万张图片,告诉它这里有猫,同时再给机器上百万张图片,说这里没猫。人工智能通过深度学习自己去学猫的特征。
1704804676
1704804677
深度学习与人的认知过程相似,大致分成两个步骤:首先是分层,把要认识的事物特征分成若干层次,比如把猫的识别分成轮廓识别、颜色识别、毛发识别、五官识别、行动方式识别等层次来分别进行辨认和比对。其次是针对每个层次分别进行数据收集,比如看大量各种轮廓的猫、各种颜色的猫、各种毛发的猫、各种五官的猫、各种行动方式的猫,形成一个综合认知。之后把目标物(比如一张新的小猫照片)根据分层进行拆解并与之前总结的各层特征分别进行比对和打分,最后兼顾各层进行综合评分。
1704804678
1704804679
再以人脸识别为例。当我们的眼睛极其靠近一张人脸图片进行观察时,只能看到人脸上的像素级别点;当我们把距离一点点拉开,就可以观察到人脸的线条→图案→局部→人脸,这是一步步获得高层特征的过程。深度学习与此相似,通过逐层训练的方法降低了判断的难度:底层网络学习出点、直线、曲线、拐角等初级特征,中层网络在此基础上学习出眼睛、鼻子、嘴等器官特征,高层网络则进一步组合这些器官特征,判断出图片是否包含人脸。
1704804680
1704804681
深度学习的另一个重要机制是外部反馈。
1704804682
1704804683
比如智能机器的语言能力要提高,必须有大量的外部反馈,就像孩子通过父母的不断反馈快速提高自身语言水平。微软曾在2015年推出对话机器人Tay。它能够学习、模仿用户的语言,在大量用户无数粗俗对话的刺激下,Tay在一天之后就满口脏话了,就像一个学坏了的不良少女。截至2016年5月,伴侣虚拟机器人“微软小冰”已和多个国家的数千万人类进行了超过200亿次对话,平均对话长度达到23轮,而图像等多感官的对话也已超过2亿次。频繁的外部反馈让“微软小冰”的对话能力突飞猛进。这两个例子说明了频繁对话在机器人语言学习中的威力。
1704804684
1704804685
谷歌和Facebook也都在利用广大用户的频繁互动,锻炼自己的人工智能的语言能力,让它知道什么样的句子是好的,什么样的表达方式是对的,最终掌握人类语言。
1704804686
1704804687
深度学习作为一种先进的算法,引起业界广泛重视是在2012年,那年的ImageNet挑战赛展现了深度学习的巨大威力。
1704804688
1704804689
ImageNet是一个拥有数百万张各类图片的在线数据库,所有图片都有人工做的标签,比如“台灯”或“网球”。
1704804690
1704804691
每年的ImageNet竞赛主要用来衡量各种图像识别系统的进展。这些系统首先使用被正确标记的图片集进行训练,然后挑战标记之前没见过的测试图片。
1704804692
1704804693
2010年获胜的系统可以正确标记72%的图片;2012年,多伦多大学的Geoff Hinton带领的团队凭借新技术“深度学习”实现了85%的准确率;在2015年的ImageNet竞赛上,一个深度学习系统以96%的图像识别准确率第一次超过了人类——人类平均有95%的准确率。
1704804694
1704804695
深度学习源于人工神经网络(ANN)的研究。一个简单的ANN网络有一个输入层,在这里数据被输送进网络中;还有一个输出层,这里会输出结果;输入层和输出层中间可能还会有两三个隐藏层对信息进行处理。ANN曾在识别手写数字等少数任务上实现了成功应用,但在完成更为复杂的任务上陷入了困境,因为真正达到实用所需要的数据和计算能力都不具备。
1704804696
1704804697
进入21世纪,数据和计算能力问题都得到了解决。一方面是多种多样的数据大量出现;另一方面,到2009年左右,几个人工智能研究团体发现,个人计算机和视频游戏机上用于生成精致画面的GPU也同样适用于运行深度学习算法,并且能够几百倍地加速深度学习系统。这样训练一个四层的神经网络就变得很快了,由之前需要花费几周的时间变成了不到一天时间。
1704804698
1704804699
依托于成熟的深度学习技术,2012年ImageNet挑战赛的优异成绩震动了科技界,此后更多机构投入开发深度学习系统中。二三十层的网络变得很常见,微软的研究人员曾建立过152层的网络,因为更深层的网络能进行更高水平的抽象并产生更好的结果。
1704804700
1704804701
这些机构的投入取得了哪些成果?深度学习是仿人类大脑神经感知外部世界的算法,而最直接的外部自然信号莫过于图像(包括人脸)、声音和文字(非语义),深度学习首先在这几个领域取得了重大进展。
1704804702
1704804703
人工智能的人脸识别能力已经超过人类。2014年,香港中文大学的团队开发了名为DeepID的深度学习模型,在LFW(Labeled Faces in the Wild,人脸识别使用非常广泛的测试基准)数据库上获得了99.15%的识别率,而人用肉眼在LFW上的识别率为97.52%,这是深度学习在人脸识别领域的重大突破。
1704804704
1704804705
图像识别的一个重要应用领域是协助医疗诊断。有一家公司出了一种胶囊摄像头。胶囊吃进去后,它能在你的消化道每隔5秒就拍一幅图,然后再排出人体,这样就能将所有关于肠道胃部的问题全部完整记录。这个技术可以代替痛苦的胃镜检查,但同时带来一个问题,医生光把那些图看完,就需要5个小时。这个问题的解决方案是深度学习。他们将8000多例图片数据灌进去,让机器自学诊断规则,提高了诊断精确率,减少了医生的漏诊问题。
1704804706
1704804707
传统的语音识别算法,在噪音的环境下达不到可用的级别。深度学习使得识别错误率在以往最好的基础上相对下降30%以上,达到了商业可用的水平。最近几年语音识别得到了极大的提高,科大讯飞的很多产品能达到95%以上的识别准确率。
1704804708
1704804709
在文字识别领域,谷歌在垃圾邮件过滤器中引入了深度学习。这一技术能够通过分析大量计算机上的电子邮件学习识别垃圾邮件和钓鱼邮件,其垃圾邮件拦截率提高到了99.9%。
[
上一页 ]
[ :1.70480466e+09 ]
[
下一页 ]