打字猴:1.700515945e+09

1700515945 天才与算法：人脑与AI的数学思维 [:1700514896]

1700515946 天才与算法：人脑与AI的数学思维偏见和盲点

1700515947

1700515948 奈飞公司的推荐系统算法可以提取出影片中那些人类都难以名状的特征，非常令人不可思议。这无疑挑战了洛夫莱斯的观点，即机器永远无法突破程序员思维的局限。现如今，机器掌握了人类所不具备的一项技能：对海量数据进行分析，并从中发掘出有价值的信息。

1700515949

1700515950 人类的大脑不擅长进行概率分析，这是进化的失败。概率直觉感知力的构建必须基于大量的试验，然后从中发现可能的趋势性。我们缺乏大量试验的机会，所以无法建立这种直觉。从某种程度上来说，机器代码的发展弥补了人类大脑在数据交互方面低速率的缺陷。因此，机器学习可以看作对人类思维方式的补充，而不仅仅是简单的复制。

1700515951

1700515952 概率是机器学习的核心。我们在第4章中讨论的许多算法实际上都是确定性的。这就好比一个人发现了问题的解决办法，然后通过编程促使计算机机械地在人所设定的规则下完成某一件事情。这就像牛顿的世界观：宇宙是由数学方程控制的，科学家的任务是发现其中蕴含的规律并用它们来预测未来。

1700515953

1700515954 20世纪的物理学家们向人们揭示了宇宙并不像我们此前想象的那样具有确定性。量子物理理论认为，世界就像上帝在玩骰子，结果具有不确定性，取决于事件发生的概率。概率思想主导下形成的算法具有非常强大的力量，这或许是为什么在新算法的世界中，那些受过物理思维训练的人比数学学者显得更游刃有余。这是理性主义与经验主义之间的对抗。但就我而言，经验主义占了上风。

1700515955

1700515956 那台机器是如何在不知道游戏规则的情况下仅靠一个可以左右移动的滑块，以及屏幕中的像素及分数变化情况就学会了雅达利开发的Breakout游戏的？算法计算的是当前状态下，左右移动滑块对得分情况的影响。由于移动所产生的影响是持续性的，可能是几秒钟时间，所以还需要计算延迟影响。这就非常难了，因为我们并不总是能够确定这之间存在什么样的因果关系。而这暴露了机器学习的一个缺点：它有时会把某些关联误认为是因果关系。动物们也会被这个问题所困扰。

1700515957

1700515958 有一个试验能很好地说明这一点，该试验拍摄了鸽子在笼子中的行为。试验人员在白天的某个时刻，将喂食机放进笼子。如果喂食机的门没有打开，鸽子们就会在旁边兴奋地等待着。此时，倘若在门打开之前鸽子做了什么动作，第二天鸽子就会重复此动作。比如，鸽子看到门是关着的，它转了两个圈，然后门打开了，鸽子就会认为“转圈”是导致门打开的原因。它会觉得这是一种“奖赏”，所以下一次喂食机出现时，它就又会转两圈。[1]

1700515959

1700515960 美军用神经网络训练机器识别坦克图片的例子，是在机器学习社区里被反复提起的一个经典的反面教材。该算法的训练数据是一些带标签的图片（标记出哪些有坦克，哪些没有坦克）。通过对这些图片进行分析，算法获得了识别坦克的重要特征。在分析了数百张带标签的图片之后，研究人员用一些算法从未见过的图片进行测试，结果非常振奋人心，识别准确率达到了100%。

1700515961

1700515962 但将装有该算法的探测器部署到战场后，美军很快发现它毫无用处。令研究小组感到迷惑不解的是，当他们用美军所使用的图片做分析时，探测器所给出的识别结果竟然是随机的。直到后来通过深入研究他们才发现，只要图片拍摄于阴天，探测器就能做出正确的判断。

1700515963

1700515964 一想到训练数据，他们就明白问题出在哪儿了：研究小组只是获得批准有权使用坦克有限的几天，所以他们将坦克开到不同地方，拍摄了大量位于不同伪装位置的照片，但没注意到那些天一直都阴阴沉沉的。返回后，他们拍摄了一些没有坦克的乡村照片，但那时的天空是异常晴朗的。用这些照片作为训练数据，算法就误认为晴天和阴天也是区分坦克的重要特征。所以，一个坦克探测器就变成了一个对军方毫无用处的“阴天探测器”了。从这个事件中我们总结的经验教训是：机器是能够学习的，但前提是你要让它学习对的东西。

1700515965

1700515966 现如今，随着基于数据训练的算法广泛应用于社会的各行各业，如申请抵押贷款、治安决策、个人健康建议等，上面这个问题所造成的负面影响日益凸显。很多证据表明，算法中暗藏着歧视和偏见。麻省理工学院的一名研究生乔伊·布兰维尼（Joy Buolamwini）发现，她的脸相较于那些肤色较浅的同学，更加不易被所使用的机器人软件识别。当她带上一个万圣节用的白色面具时，技术识别很顺利，可一旦取下面具，她就在机器眼中“消失”了。

1700515967

1700515968 问题出在哪儿呢？该算法虽然针对大量的人脸图像进行了训练，但这些数据中黑色皮肤的面孔较少。本应公平公正的人工智能，从数据中学会了人类的偏见，这种偏差导致算法生成了许多令人不可接受也难以接受的结果：针对男性的声音进行训练的语音识别软件识别不了女性的声音；某图像识别软件将黑人辨认为大猩猩；护照照片拍摄软件不适用于亚洲人，原因是它始终认为他们在拍照时闭眼了。硅谷的科技公司雇用的员工中有4/5都是男性白人，这正是布兰维尼创立算法正义联盟以对抗人工智能算法偏见的原因。

1700515969

1700515970 法律体系也面临着考验，申请抵押贷款、应聘工作、申领社会福利被算法程序拒绝后，人们有理由知道为什么。但是，由于算法是基于数据交互构建决策树的，证明其决策的合理性并不容易。

1700515971

1700515972 虽然有些人主张采取法律措施补救，但执行起来非常困难。2018年5月生效的欧盟《一般数据保护条例》的第22条规定：数据主体有权反对“完全依靠自动化处理做出的决策”。若个人对自动化决定不满，有权主张人工介入，以表达自己的观点并提出质疑。对于计算机所做出的任何决策，数据主体有权获得“有关所涉及逻辑推断的有意义的信息”。关于这一点，我只能表达我的个人观点：祝你好运！

1700515973

1700515974 人工智能领域一直呼吁开发一种元语言，机器可用它来证明自己的决策是合理的。而在此之前，我们必须谨慎对待这些算法对日常生活的影响。绝大多数算法都有其专长，不善于处理无规律的行为，当意料之外的事情出现时，算法只能选择将其忽略，而人类对这类场景却能表现出非凡的应变能力。

1700515975

1700515976 没有免费午餐的定理表明，在任何情境下都能做出准确预测的通用性算法是不存在的。机器学习的目标不是建立放之四海而皆准的通用模型，而是构建关于特定问题有针对性的解决方案。这个定理还表明，即使只向算法出示一半数据，它还是有可能将未出示的另一半数据伪造出来，以保证对它自己所进行的数据训练的完整性。但当需要分析的数据属于另一半未出示的数据时，它就会决策失准或失败。

1700515977

1700515978 数据本身永远无法自给自足，它必须与知识相结合。正是在这一点上，人类的思维和智慧似乎能更好地应对环境的变化并对全局进行把控——至少在目前看是这样。

1700515979

1700515980 [1] 原理同巴甫洛夫的条件反射试验。——译者注

1700515981

1700515982

1700515983

1700515984

1700515985 天才与算法：人脑与AI的数学思维 [:1700514897]

1700515986 天才与算法：人脑与AI的数学思维机器之间的战争

1700515987

1700515988 是改变和适应新挑战的能力，让AlphaGo得以诞生。谷歌的DeepMind团队用一段时间的“监督学习”构建了他们的算法，这就好比一个成年人帮助孩子学习成年人已经掌握的技能。作为一个物种，人类之所以取得进步，是因为我们积累了知识，并以比最初获得知识时更有效的方式将知识传递了下去。作为一个数学家，我也是用上大学的几年时间快速学习了前辈们近几个世纪发现的数学理论，而不是凭借一己之力去重新发现所有的数学知识，以此站到学科前沿的。

1700515989

1700515990 AlphaGo也经历了同样的学习阶段——我们称之为基础学习阶段。互联网上有数以百万计的棋局，其中不乏高手之间的对弈。这是一个极佳的资源宝库，通过检索就可以找到给对手致命一击的决胜杀招。这样一个庞大的数据库使得计算机能够建立一个概率的概念，即给定一个特定的棋盘位置，算法可分析出每一步落子对获胜的影响概率。仅考虑每一盘棋已有走法的优劣是不够的，因为未来的对手可能不会使用数据库中失败棋手所用过的棋路。这个学习阶段为AlphaGo下围棋提供了必要的基础准备，但仅仅使用这个数据库还是不够的。

1700515991

1700515992 第二阶段被称为强化学习阶段。从长远来看，它为算法自我的发展确立了优势，提供了可能。算法通过自我对战、强化学习来提高对弈水平，即与之前的“自己”不间断地训练以提高下棋的水平。如果某些有望获胜的棋招失败了，算法就会修改这些棋招的概率。这种强化学习会综合生成大量的新数据，有助于算法发现自身可能存在的弱点。

1700515993

1700515994 局部最优是这种强化学习的弱点之一。机器学习有点像攀登珠穆朗玛峰，如果目标是爬上这座世界上最高的山峰，但是此时你既不知道自己身处何处，又被蒙上了眼睛，那么可选择的策略就是以你所在位置为起始点，如果下一步能够爬得更高，那么就继续往上爬，如此往复，直至抵达顶峰。按照该策略，你可以抵达所在地理区域内（当前环境下）的最高点。一旦越过这个顶点，高度就会下降，你就有可能滚落下来。但这并不意味着，在不断努力之下，你会抵达山谷对面另一座更高的山峰。这个高点是相对的，在数学中被称为“局部极大值”。就好比你好不容易爬上一座山的山顶，却发现它不过是在高耸的群山环绕下的一座小山包。如果AlphaGo训练的算法只能在局部极大值的情况下击败对手，那终极结果会是怎么样的呢？

[ 上一页 ] [ :1.700515945e+09 ] [ 下一页 ]