打字猴:1.704036283e+09
1704036283 障碍之一是计算机的运算能力。早年的计算机有限的内存和处理速度几乎没法解决任何实际的AI问题。例如,罗斯·奎廉(Ross Quillian)在自然语言方面的研究结果只能用一个含20个单词的词汇表进行演示,因为那个时候内存只能容纳这么多。
1704036284
1704036285 计算被一个称为计算复杂度(Complexity)的概念制约着。除了一些最简单的情况,要想解决很大一部分可以被称作“智能”的问题,都需要指数时间才能解决,就是我们常说的NP难,处理对象集合稍微大那么一点儿,需要的时间就近乎无限长了。这就类似棋盘上摆米粒的桥段,据说古时候一个下棋赢了国王的大臣要求的奖励是在棋盘第一个格子摆一粒米,以后每个格子米的数量翻倍,结果国王发现全国的米都用上也无法摆满那个区区64格的棋盘。简言之,大部分问题都算不过来。
1704036286
1704036287 其二是计算机对真实世界的感知能力。到目前为止,人类研究的人工智能在“智力”上已经很高,但却依然无法像人类一样感知世界。哪怕是当今“学霸”的人工智能系统,其感知现实世界的能力都很难和一位年迈老人相比。人们早期曾经有个错觉,以为如果人工智能解决了比较困难的问题(比如逻辑和代数运算),就可以轻松解决容易的问题(比如环境识别)。后来发现真相却颇有哲学意味,那些所谓的困难问题是对人类而言困难的问题,而对于人工智能来说,“困难的问题是简单的,简单的问题是困难的”。这个问题也被莫拉维克抽象为一个悖论(Moravec’s Paradox):对计算机而言,实现逻辑推理等人类高级智慧只需要相对很少的计算能力,而实现感知、运动等人类低等级智慧却需要巨大的计算资源。
1704036288
1704036289 其三是推理和逻辑框架。一般性的智能系统其实是一种基于知识的系统,常识问题是其核心之一,比如如何进行清晰的常识表达以及如何运用这些常识进行推理。然而,即使拥有庞大的知识库,人工智能也无法像人类一样,在没有老师的情况下还能自行推理并进行联想学习。所以人工智能要模拟人的智能,其难点不在于人脑所进行的各种必然性推理(数学证明之类的东西),而是最能体现人的能动性和创造性的不确定性推理。而人类的这种常识推理往往具有非单调性、非协调性和容错性等。举个例子,知识库可能是不协调的、有矛盾的,但这种不协调对于人类进行合理的推理行为影响甚微,对计算机进行推理的影响却巨大。近年来逻辑学家和计算机科学家发展出一些非经典的逻辑,比如非单调逻辑(Non-monotonic Logic)和次协调逻辑(Paraconsistent Logic)等,就是试图解决这一问题。
1704036290
1704036291 人的头脑不是一个要被填满的容器,而是一支需要被点燃的火把。
1704036292
1704036293 ——德谟克里特
1704036294
1704036295 这几方面说白了,就是装备差(运算能力有限)、技能少(新的算法还没开发)、经验值低(没有足够的数据),想打怪练级发现野怪打不过(“智能”问题都太复杂)。
1704036296
1704036297 有些时候困扰大牌专家的问题听起来都让外行人非常不理解。举个例子,一个经常玩斗地主的扑克牌爱好者,有时候也会忽然出一些昏招,比如忘了还有一个2没有出而用A闯牌最后导致全盘失败,但是这个人的偶尔失误通常是可以理解的失误;可是一个一直运行良好的人工智能程序就不一样了,它的失误就可能直接把自己的智商降成比初学者还不如,瞬间成为一个完全的傻子。这个人工智能鲁棒性问题,就导致了人工智能和人类智能的巨大鸿沟。
1704036298
1704036299 虽然单个计算设备的智能十分有限,但信息的网络化却真枪实弹地在发现货真价实的新知识。进入Web 2.0时代以来,人们深深跌入一个碎片化阅读的时代,但另一方面,我们也能感受到网络化的信息所带来的喜悦。这种喜悦来自于网络化蕴含的巨大能量——人类的知识和能力通过网络的渠道连接到一起,以计算的方式聚合成一体,将突破这些知识和能力的总和。
1704036300
1704036301 这不禁让人想起一个思想实验:无数只猴子在无数台打字机上随机地打字,如果持续无限长的时间,那么在某一个时刻,它们会打出莎士比亚的著作。这就是“无限猴子定理”,也叫“猴子和打字机”实验,本意是用来阐释“无穷”的本质。就跟薛定谔不明生死的猫、缸体大脑等其他著名的思想实验一样,在三维空间里,估计我们没办法验证猴子们究竟能不能打出莎士比亚作品。
1704036302
1704036303 但人类还是发现了开外挂的方法。
1704036304
1704036305 大家都知道,有一种游戏外挂是可以让你的角色24小时挂机然后可以实现按键的自动输入(刷怪或者抢宝箱),你只要预先录制好连续按键动作,再通过指定某些按键的组合来触发,就可以模拟真人重复进行按键的输入。有时候挂上一晚比自己辛辛苦苦打一星期的收获还要大。
1704036306
1704036307 2008年,华盛顿大学结构蛋白科学家David Baker设计开发出一款名为Foldit的在线蛋白质折叠游戏,这款Foldit游戏让玩家用各种氨基酸自由随意组装蛋白,最终拼凑出目标蛋白的完整结构(图3-5)。
1704036308
1704036309 借助全世界几十万普通玩家的群体智慧,David Baker迅速攻克了许多蛋白结构未解之谜,其中一个蛋白结构据说曾困扰科学研究者15年之久。这个与艾滋病毒相关的蛋白结构,竟然在短短10天内被Foldit的大量草根用户轻易破解。有趣的是,David Baker也颇具玩世不恭的精神,不仅大胆把“多人联机游戏”(Multiplayer Online Game)直接放在论文的标题中发表到全世界最权威也最具名望的科学期刊《自然》杂志上,更是光明正大地在论文作者栏大书特书“超过57000 Foldit玩家”——他们所属的机构则是“全世界”(Worldwide),简直相当于直接告诉服务器“我开了挂”。
1704036310
1704036311
1704036312
1704036313
1704036314 图3-5 在线蛋白质折叠游戏Foldit(图片来源网络)
1704036315
1704036316 Foldit完成蛋白结构突破的方式就是使用了近几年炙手可热的众包(Crowdsourcing)思想,利用零散的非专业用户完成大规模复杂的专业性感知或计算任务。在Foldit这个例子里面,绝大多数参与玩家不具有蛋白质研究的任何知识,甚至不知道蛋白质结构为何物,就像游戏外挂并不知道自己操作的那几个键是什么意义一样,但最终却恰恰是这些用户的参与完成了资深蛋白质专家尚且需要花费毕生精力才可能攻克甚至无法攻克的科学难题。
1704036317
1704036318 更不可思议的是,这些新攻克的结果不仅超出了所有参与者所具备的知识总和,甚至超出了人类认识的边界——发现了新的知识!而完成这样一个巨大飞跃,倚靠的并不只是一位聪明绝顶的科学家、一个高端的算法或者一台超群的计算机,而是一个将大量用户的知识联合到一起的网络化平台。
1704036319
1704036320 其实,工业互联网的核心就是通过信息网络使原本割裂的工业数据实现流通,从而变成一个“智能网络”。我们可以概括为“感、联、知、控”四大环节:首先,复杂多样的工业生产实体智能地识别、感知和采集生产相关数据,即“感”环节;之后,这些工业数据在互联互通的泛在化网络上进行传输和汇聚,即“联”环节;再次,对这些网络化的工业大数据进行快速处理和实效分析,即“知”环节;最后,将数据分析所得到的信息形成开放式服务,从而反馈到工业生产,即“控”环节。根据上述特点,我们定义工业互联网为“三网四层”结构(图3-6)。
1704036321
1704036322
1704036323
1704036324
1704036325 图3-6 工业互联网“三网四层”结构
1704036326
1704036327 从下到上,我们依次来看。首先是智能感知层。这是指复杂多样的工业生产实体(如机器、机组、物料以及生产人员等)实现对于自身状态、环境信息和其他实体的识别、感知和交互协作,从而实现不同生产实体之间的深度协同。这一层是打通物理世界和数字世界的桥梁,是信息物理融合的核心。
1704036328
1704036329 第二是网络互联层。多元联网对象组成的异构复杂网络之间形成彼此互联互通的泛在化网络,使得所有联网对象可以随时随地接入网络,实现信息和数据在不同联网对象、不同生产环节和不同生产部门之间的高效传输和流通。网络化是第四次工业革命的主要特征,网络互联则是奠定数据和服务等不同层的关键基础。
1704036330
1704036331 第三是数据分析层。网络化的数据有些在传输过程中被即时处理,更多的则是汇聚到中心节点后被集中处理。数据分析层负责工业大数据的存储、处理、建模、挖掘和优化等方面,为面向工业生产应用的服务提供数据支撑和决策依据。
1704036332
[ 上一页 ]  [ :1.704036283e+09 ]  [ 下一页 ]