打字猴:1.70480467e+09

1704804670

1704804671 深度学习跨越了这个巨大障碍，即使没有人类教导，机器也能学习了。还是以识别诈骗交易为例，我们只需将一些标记上“欺骗性的”和“非欺骗性的”数据交给计算机，然后计算机依靠算法就能学会应该去查找哪些内容，告诉你是否存在欺诈行为。

1704804672

1704804673 判断某个基因会不会发生病变，需要运用通过参考医学论文而得来的推理规则，人工智能可以吸收许多医学论文，明确地制作出疾病预测的推理规则。人类在漫长的抗癌过程当中写了大量文件，进行了大量分析，有2300万个相关的文件和医学研究文章。IBM估计，仅做到和相关的医学信息及资料保持同步，一位人类医生每星期就要把160个小时花在阅读上，这显然不现实。未来的医疗进步离不开人工智能的分析能力。

1704804674

1704804675 再以图片识别为例。传统算法认猫，是靠人类标注猫的各种特征，然后让机器去学习这些规则，比如猫有大眼睛，有胡子，有花纹，有尾巴。但人制定的种种规则是有缺陷的，有时候机器会分辨不出猫和老虎，或者分不出狗和猫。深度学习算法是直接给机器几百万张图片，告诉它这里有猫，同时再给机器上百万张图片，说这里没猫。人工智能通过深度学习自己去学猫的特征。

1704804676

1704804677 深度学习与人的认知过程相似，大致分成两个步骤：首先是分层，把要认识的事物特征分成若干层次，比如把猫的识别分成轮廓识别、颜色识别、毛发识别、五官识别、行动方式识别等层次来分别进行辨认和比对。其次是针对每个层次分别进行数据收集，比如看大量各种轮廓的猫、各种颜色的猫、各种毛发的猫、各种五官的猫、各种行动方式的猫，形成一个综合认知。之后把目标物（比如一张新的小猫照片）根据分层进行拆解并与之前总结的各层特征分别进行比对和打分，最后兼顾各层进行综合评分。

1704804678

1704804679 再以人脸识别为例。当我们的眼睛极其靠近一张人脸图片进行观察时，只能看到人脸上的像素级别点；当我们把距离一点点拉开，就可以观察到人脸的线条→图案→局部→人脸，这是一步步获得高层特征的过程。深度学习与此相似，通过逐层训练的方法降低了判断的难度：底层网络学习出点、直线、曲线、拐角等初级特征，中层网络在此基础上学习出眼睛、鼻子、嘴等器官特征，高层网络则进一步组合这些器官特征，判断出图片是否包含人脸。

1704804680

1704804681 深度学习的另一个重要机制是外部反馈。

1704804682

1704804683 比如智能机器的语言能力要提高，必须有大量的外部反馈，就像孩子通过父母的不断反馈快速提高自身语言水平。微软曾在2015年推出对话机器人Tay。它能够学习、模仿用户的语言，在大量用户无数粗俗对话的刺激下，Tay在一天之后就满口脏话了，就像一个学坏了的不良少女。截至2016年5月，伴侣虚拟机器人“微软小冰”已和多个国家的数千万人类进行了超过200亿次对话，平均对话长度达到23轮，而图像等多感官的对话也已超过2亿次。频繁的外部反馈让“微软小冰”的对话能力突飞猛进。这两个例子说明了频繁对话在机器人语言学习中的威力。

1704804684

1704804685 谷歌和Facebook也都在利用广大用户的频繁互动，锻炼自己的人工智能的语言能力，让它知道什么样的句子是好的，什么样的表达方式是对的，最终掌握人类语言。

1704804686

1704804687 深度学习作为一种先进的算法，引起业界广泛重视是在2012年，那年的ImageNet挑战赛展现了深度学习的巨大威力。

1704804688

1704804689 ImageNet是一个拥有数百万张各类图片的在线数据库，所有图片都有人工做的标签，比如“台灯”或“网球”。

1704804690

1704804691 每年的ImageNet竞赛主要用来衡量各种图像识别系统的进展。这些系统首先使用被正确标记的图片集进行训练，然后挑战标记之前没见过的测试图片。

1704804692

1704804693 2010年获胜的系统可以正确标记72%的图片；2012年，多伦多大学的Geoff Hinton带领的团队凭借新技术“深度学习”实现了85%的准确率；在2015年的ImageNet竞赛上，一个深度学习系统以96%的图像识别准确率第一次超过了人类——人类平均有95%的准确率。

1704804694

1704804695 深度学习源于人工神经网络（ANN）的研究。一个简单的ANN网络有一个输入层，在这里数据被输送进网络中；还有一个输出层，这里会输出结果；输入层和输出层中间可能还会有两三个隐藏层对信息进行处理。ANN曾在识别手写数字等少数任务上实现了成功应用，但在完成更为复杂的任务上陷入了困境，因为真正达到实用所需要的数据和计算能力都不具备。

1704804696

1704804697 进入21世纪，数据和计算能力问题都得到了解决。一方面是多种多样的数据大量出现；另一方面，到2009年左右，几个人工智能研究团体发现，个人计算机和视频游戏机上用于生成精致画面的GPU也同样适用于运行深度学习算法，并且能够几百倍地加速深度学习系统。这样训练一个四层的神经网络就变得很快了，由之前需要花费几周的时间变成了不到一天时间。

1704804698

1704804699 依托于成熟的深度学习技术，2012年ImageNet挑战赛的优异成绩震动了科技界，此后更多机构投入开发深度学习系统中。二三十层的网络变得很常见，微软的研究人员曾建立过152层的网络，因为更深层的网络能进行更高水平的抽象并产生更好的结果。

1704804700

1704804701 这些机构的投入取得了哪些成果？深度学习是仿人类大脑神经感知外部世界的算法，而最直接的外部自然信号莫过于图像（包括人脸）、声音和文字（非语义），深度学习首先在这几个领域取得了重大进展。

1704804702

1704804703 人工智能的人脸识别能力已经超过人类。2014年，香港中文大学的团队开发了名为DeepID的深度学习模型，在LFW（Labeled Faces in the Wild，人脸识别使用非常广泛的测试基准）数据库上获得了99.15%的识别率，而人用肉眼在LFW上的识别率为97.52%，这是深度学习在人脸识别领域的重大突破。

1704804704

1704804705 图像识别的一个重要应用领域是协助医疗诊断。有一家公司出了一种胶囊摄像头。胶囊吃进去后，它能在你的消化道每隔5秒就拍一幅图，然后再排出人体，这样就能将所有关于肠道胃部的问题全部完整记录。这个技术可以代替痛苦的胃镜检查，但同时带来一个问题，医生光把那些图看完，就需要5个小时。这个问题的解决方案是深度学习。他们将8000多例图片数据灌进去，让机器自学诊断规则，提高了诊断精确率，减少了医生的漏诊问题。

1704804706

1704804707 传统的语音识别算法，在噪音的环境下达不到可用的级别。深度学习使得识别错误率在以往最好的基础上相对下降30%以上，达到了商业可用的水平。最近几年语音识别得到了极大的提高，科大讯飞的很多产品能达到95%以上的识别准确率。

1704804708

1704804709 在文字识别领域，谷歌在垃圾邮件过滤器中引入了深度学习。这一技术能够通过分析大量计算机上的电子邮件学习识别垃圾邮件和钓鱼邮件，其垃圾邮件拦截率提高到了99.9%。

1704804710

1704804711 深度学习算法在商业领域的运用已经非常深入。我们来看来自阿里集团执行副总裁曾鸣介绍的一个典型案例：依托淘宝网的大数据，蚂蚁小贷能做到在几秒钟内决定是否给小商家们发放贷款。

1704804712

1704804713 淘宝卖家正在卖哪些商品、生意好不好，卖家经营店铺是否勤快、之前是否有过不诚信的行为……这些淘宝网分享给蚂蚁小贷的数据的丰富度、准确度远高于传统银行能采集到的贷款者的信息。

1704804714

1704804715 在“全面了解客户”这点上，蚂蚁小贷拥有了非常关键的数据优势。接下来算法工程师们建立了一套算法模型来处理这些海量数据，给每位客户的信用水平打分，根据分数决定是否贷款。

1704804716

1704804717 基于在线数据和算法的模型是实时迭代的，这和传统数据分析有着本质区别。

1704804718

1704804719 一方面，随着新数据的不断涌入，这个信用分会随之变动。根据客户的每一单交易、每一次旺旺上线、每一次还款，蚂蚁小贷会每天更新一次客户的信用分，这样的更新频率是传统银行绝对做不到的。

[ 上一页 ] [ :1.70480467e+09 ] [ 下一页 ]