1700532396
1700532397
于是,我们这一批想去做自动诊断的人,反而去做了一些基础的工作。这个基础的工作用一句话说,就是把世界上所有的信息数字化。
1700532398
1700532399
在一批人致力于把世界上每一本书、每一张图、每一个处方都变成电子版的时候,互联网的广泛应用,又把这些信息相互联接了起来,成了真正的大数据。同时,摩尔定律(Moore’s law)预测的计算性能增加一直在起作用。随着计算能力的指数增长,那些只能在实验室里或有限场景下实现的应用,离现实生活越来越近了。1997年,“深蓝”打败当时的世界象棋冠军Garry Kasparov,和2017年AlphaGo围棋打败李世石一样,被公认是一个里程碑 。其实,随着计算能力的提高,在这些单一的、有确定目标的事情上机器打败人,都只是个时间问题。
1700532400
1700532401
第三次的人工智能浪潮就是基于另外两个技术领域的大发展,一个是巨大的计算能力,一个是海量的数据。巨大的计算能力来自于硬件、分布式系统、云计算技术的发展。最近,专门为神经网络制作的硬件系统(neural-network-based computing)又一次推动了人工智能软硬件结合的大进步。海量的数据来源于前几十年的数据积累和互联网技术的发展。比如,2001年上市的GPS系统,带来前所未有的大量出行数据;智能手机带来了前所未有的人们生活习性的数据,等等。计算能力和数据的结合,促进、催化了机器学习算法的飞跃成长。
1700532402
1700532403
这次的人工智能浪潮起始于近10年。技术的飞跃发展,带来了应用前所未有的可能性。最近这次人工智能浪潮和前两次最基本的不同是它的普遍应用和对普通人生活的影响。也就是说,人工智能离开了学术实验室,真正走进大众的视野。
1700532404
1700532405
■ 人工智能全面逼近人类能力?
1700532406
1700532407
为什么这次人工智能浪潮如此凶猛?人工智能真的全面逼近了人类的能力吗?人工智能技术现在发展到什么阶段?我们先来看3个简单的事实。
1700532408
1700532409
首先,历史上第一次,计算机在很多复杂任务的执行上超过人类或者即将超过人类,比如图像识别、视频理解、机器翻译、汽车驾驶、下围棋,等等。这些都是人们容易理解的,一直由人类完成的任务。所以,人工智能取代人类的话题开始出现在各种头条。
1700532410
1700532411
其实,在单一技术方面,许多计算相关的技术早已超过人类的能力,而且被广泛应用,比如导航、搜索、搜图、股票交易。不少人已经习惯于用语音给简单指令操作。但是,这些相对单纯的技术主要是“完成一个任务”,计算机没有过多地涉猎人的感知、思考、复杂判断,甚至于情感。
1700532412
1700532413
然而,近几年来机器完成的任务,从复杂性和形式越来越逼近人类。比如,基于机器学习的自动驾驶技术已经趋于成熟,这项技术不仅会对人们的出行方式有革命性的影响,而且会影响到城市建设、个人消费、生活方式。人们也许再也不需要拥有汽车,再也不需要会开车。大家对这类新技术的快速到来既兴奋又恐惧,一方面享受技术带来的便利,另一方面又对太快的变化有些手足无措。
1700532414
1700532415
另外,计算机的自学习能力不断增强。现代机器学习算法,尤其深度学习类机器学习算法的发展,使机器的行为不再是相对可预测的“程序”或者“逻辑”,而更像“黑盒思考”,有了近乎人类的难以解释的思考能力。
1700532416
1700532417
然而,仔细看来,虽然在不少特殊领域中,人工智能有了突飞猛进的发展,但是距离人工智能的鼻祖们在第一次浪潮时研究的通用智能(general purpose intelligence)其实还相差非常远。这是第二个事实。机器还是被放在特定情况下完成特定任务,只不过任务更复杂了。机器还是缺少一些最基本的人的智能,比如常识。人工智能仍然无法理解哪怕是简单的情感,比如害怕。对两三岁的孩子来说非常简单的帮忙、合作,机器都是做不到的。好比有人开玩笑说:“它们还是不会炒鸡蛋。”
1700532418
1700532419
第三个事实,是这次人工智能和机器学习的应用场景非常宽广。近几年人工智能和机器学习应用的大发展,这个曾经是学术研究领域的概念一时间进入大众视野,成为和未来相关的必谈话题。计算机视觉、深度学习、机器人技术、自然语言理解,都被提到应用层。算法类的应用走出学术界,深入社会的各个角落, 渗入人们生活的方方面面。大家熟知的有人脸识别、自动驾驶、医疗诊断、机器助手、智慧城市、新媒体、游戏、教育等,还有并不常被谈论的比如农业生产的自动化、老人和儿童的护理、危险情景的操作、交通调度,等等。我们很难想象社会的哪一个方面,不会被这次浪潮所波及。
1700532420
1700532421
向前看十年,人工智能和机器学习的大发展,在于这些技术的普及和应用。大批的新应用将会被开发,人工智能基础设施会迅速完善,原有的传统软件和应用需要被迁移使用新的算法。所以,现在是成为一个人工智能和机器学习专家的良机。
1700532422
1700532423
■ 这本书是如何写成的
1700532424
1700532425
无论海内海外,媒体行业一直都走在人工智能应用的最前沿,因为媒体往往接触上千万甚至上亿的用户;有千变万化的用户每天离不开的内容,比如新闻、体育、电影;有丰富多彩的内容与用户的结合场景;还有丰厚的有创意的商机。
1700532426
1700532427
Hulu是一家国际领先的视频媒体公司,提供优质电影、电视剧点播和直播节目。Hulu技术架构最为先进的一点是人工智能和机器学习算法的广泛应用,用在个性化内容推荐、搜索、视频内容理解、视频传输和播放、 广告预测和定向、安全检测、决策支持,甚至视频编辑和客服系统。机器学习算法的背后是专门打造的大规模数据处理系统。“算法无处不在”是Hulu当今和未来技术架构的定位。 可以说,Hulu是未来的互联网技术公司,全面“算法化”的一家带头公司。
1700532428
1700532429
为了支持各类的人工智能算法应用,Hulu在北京的创新实验室集合了大批人工智能和机器学习的顶尖人才。Hulu的数据科学家、算法工程师和软件工程师都工作在同一个团队,每天解决用户的实际问题,积累了大量实用的经验。Hulu 北京的学习气氛也相当浓厚。除了定期的机器学习专题研讨和大数据及机器学习公开课,Hulu也在内部开设了深度学习课程。
1700532430
1700532431
2017年年底,人民邮电出版社的俞彬编辑问我能否写一本关于人工智能和机器学习算法实操的书。目前市场上有关人工智能的书可以分为两类,一类是非常系统的教科书,还有一类是关于人工智能和人类未来的社科类图书。我们能否写一本实操类的书,介绍一个真正的计算机从业人员需要掌握的技能呢?
1700532432
1700532433
抱着试一试的心理,我让公司里的同事自愿报名参加这个集体项目。一共有15位资深研究员和算法工程师参与了这本书的内容创作,这是个成功的合作案例。我们先学习了一下现有的相关书籍,然后头脑风暴了一番,觉得我们可以做一个问答集,以比较有趣的问答形式,集中当前算法工程师和研究员感兴趣的话题,用问答引出这个行业的基本概念。
1700532434
1700532435
在互联网行业,敏捷开发都是以最快的速度,做一个“最小化产品”,让用户的反馈来带领产品的方向。我们写这本书也是如此。为了让大家能够落笔写出没有错误、通俗易懂的问答,为了收集读者的反馈,也为了不把写一本大部头书列为第一天的目标,我们先在Hulu的微信公众号上,以每周发两个问答的形式,从2017年11月到2018年3月期间,一共发出了30篇“机器学习问答”系列文章。这些文章受到了业界好评,也收到各种问题和反馈,成了我们这本书的核心内容。
1700532436
1700532437
关于书的章节组织,我们也进行过仔细的讨论。人工智能和机器学习算法范围很大,我们的理念是要涵盖该领域最基本的内容,介绍基本概念,同时,跟上算法发展的最新步伐。所以本书介绍了传统机器学习算法,比如逻辑回归、决策树等,同时花了比较大的篇幅介绍近几年流行的最新算法,包括各种神经网络(深度学习)、强化学习、集成学习等,还会涉猎学术界正在讨论中的新领域和新算法。同时,本书强调了实现一个企业里真正实用的算法系统所需要的技能,比如采样、特征工程、模型评估。因为机器学习算法往往需要比较深的背景知识,所以在每个问题和解答之前,会对该领域做简单的背景介绍。每个问答有不同的难度,以供读者自我衡量。
1700532438
1700532439
在核心的机器学习算法问答内容之外,我们增加了两个部分,一是“机器学习算法工程师的自我修养”,介绍业界典型的算法工程师的工作内容和要求。这些实例可以帮助广大的读者了解掌握机器学习技能以后的工作和去向。二是“人工智能热门应用”,相信不少读者都听说过这些应用的故事,比如无人驾驶车、AlphaGo等。我们希望从内行人的角度,解释一下这些超级应用背后的原理是什么。当你读完本书,掌握了机器学习技能以后,你也可以在幕后操作这些热门的智能应用了。
1700532440
1700532441
本书信息量很大,涉猎人工智能和机器学习的各个子领域。每个公司、每个业务、每个职位,不一定会用到全部的技能。所以关于阅读这本书,我有以下几个建议。
1700532442
1700532443
(1)顺读法:从头至尾阅读。如果你能读懂全部内容,所有的题目都会解答,欢迎你到Hulu来申请工作吧!
1700532444
1700532445
(2)由简至难法: 每道题的旁边都标明了难度。一星最简单,五星最难。在本书中,还提供了一个题目的列表。一颗星的题目,主要是介绍基本概念,或者是为什么要做某一件事,比如 “什么是ROC曲线?”“为什么需要对数值类型的特征做归一化?”。如果你是机器学习的入门学习者,可以从背景知识和简单的题目出发,循序渐进。
[
上一页 ]
[ :1.700532396e+09 ]
[
下一页 ]