1704805080
1704805081
斯坦福大学的一位计算机博士曾用托尔斯泰的长篇小说《战争与和平》来训练人工智能。他完全不教机器任何语法规则,包括标点和字母区别都不告诉它,只是不停地用上百万字小说内容对机器进行训练,每训练100个回合,就叫它写文章。100个回合后,机器知道写作要有空格,但仍然有乱码。500个回合后,机器能正确拼写一些短单词。1200个回合后,机器写作时会有标点符号和长单词。训练2000个回合之后,机器已经可以正确拼写更复杂的语句。这是“自学成才”的典型案例。
1704805082
1704805083
在自然语言处理方面,有一个著名的深度学习模型:斯坦福大学的安德烈·卡帕西于2015年开发的卡帕西模型。这个模型只有几千行的代码量,但功能非常强大,只要给它输送大量的文字段落——任何语言都可以,它就会用递归神经网络分析段落,寻找出字与字之间的关系。
1704805084
1704805085
从数学角度看,文章无非是文字的序列。只要计算机破解了这个序列的规律,那它也能生成这样的序列,也就是写出类似的文章。
1704805086
1704805087
什么样的文章是装了卡帕西模型的机器人最擅长模仿的?有人做了测试,发现机器人学习古龙小说的效果好于学习金庸小说,因为古龙的语言比金庸简单,他的句子短,段落短,语法结构相对简单,并且词汇量比金庸少。换句话说,相比于金庸小说的复杂多变,古龙小说的规律性较强,更有利于机器人学习。现在流行的动不动几百万字的网络小说,使用的词汇量比古龙小说更少,故事情节也更加套路化,而越是单调重复,机器人越是能找出规律,模仿出类似的作品。
1704805088
1704805089
唐诗在各种文学类型中最具规律性,对仗、平仄、韵脚等规则都是机器人可以准确提炼的,因此艺术性最高的唐诗反倒成为机器人最擅长的创作领域。此外,诗歌强调意境,强调联想,机器人创造的看似不合道理的汉字组合,反而别具一番风味。
1704805090
1704805091
至于高度格式化的工作报告、新闻报道,机器人更是手到擒来。人工智能通过分析媒体多年积累的新闻报道,能训练出各类新闻稿的写作模板。韩国的一个人工智能记者,仅用0.3秒即可完成一篇股市行情的新闻报道。调查结果显示,一半以上的读者看了它的作品后分不清到底是不是人写的。我国的腾讯和新华社也已经采用写稿机器人撰写财经新闻稿了。《华盛顿邮报》为更好地报道2016年里约奥运会,组成了一支机器人记者团队,它们能快速地制作与奥运会积分榜、奖牌榜以及其他以数据为核心的新闻点相关的简单明了的新闻,这样,《华盛顿邮报》的人力记者就能够从事更加有趣、更加复杂的工作。
1704805092
1704805093
2016年以来,全球人工智能研究的一个新重点是艺术创作。
1704805094
1704805095
比如人工智能软件Ostagram可以把人们输入的两幅图画的内容和风格进行混合,形成一幅新的图画,效果十分惊艳。
1704805096
1704805097
再比如百度人工智能针对美国艺术大师罗伯特·劳森伯格的巨作《四分之一英里画作》,将其中两联分别谱成了20余秒的钢琴曲。把看到一幅图画的感受谱写成乐曲,这样的本事以前为人类独有,如今人工智能也具备了“看图作曲”的能力。
1704805098
1704805099
百度人工智能是怎样进行创作的呢?在“看到”画作后,它首先会对图像进行分析解读,然后通过搜索挖掘相关的音乐信息,对音乐拆分重组,再合成与图片内容相匹配的音乐旋律,最终拼接成完整的曲子。不过,它目前的作曲水平还较为初级,乐曲中的和弦部分由人工干预实现。
1704805100
1704805101
机器进行文艺创作,目前仅是“小荷才露尖尖角”,今后其能力将不断提高。需要强调的是,人工智能写诗、写小说、作曲,这些所谓的创造性是在预设的模板和方向上走,其创作本质上是逻辑计算,而人的想象力具有无限可能性。人工智能在文艺领域的主要作用是帮助作家和艺术家,使他们的创作更上一层楼。
1704805102
1704805103
无法复杂沟通:情商是硬伤
1704805104
1704805105
李世石说他最害怕的是阿尔法狗的一个特点——“毫无情感”:人会有心理上的摇摆,即使知道准确的答案,在下子那一刻还是有可能会选择另一条路,考虑其他的选择。但阿尔法狗不会有任何的动摇,这是李世石所面对的最大困难。
1704805106
1704805107
毫无感情是人工智能的优势,也是它的缺陷。智能机器不懂“赢了有什么感受”,也不懂“为什么围棋好玩”,更不懂“人为什么要下棋”。今天的智能机器无法理解人的七情六欲、信任尊重、价值观、美和爱、幽默感。这显然会降低它对很多事情的判断水平。
1704805108
1704805109
阿里的人工智能小Ai在对《我是歌手4》的预测中,准确率很高,但在那场张信哲和老狼的对决中,小Ai的预测一直有较大倾向性,张信哲的获胜概率长时间处于75%以上。机器试图理解人类的感情,但它对中国摇滚三十年的意义、对老狼粉丝喜欢他的怀旧感,都无法真正理解,也就无法准确预测。目前人工智能领域对于情感认知的研究有进步,但还是很缺乏深度。
1704805110
1704805111
人是理性动物,同时也是情感动物,有爱有恨,会伤心会快乐,会追求使命,会寻求意义,而人工智能本质上是不理解情感和意义的,这就导致人工智能缺乏复杂沟通的能力。
1704805112
1704805113
复杂沟通属于人类的高级智能,人类本身也需要努力学习才能掌握。职业发展专家秋叶认为,Word排版、Excel报表、PPT制作、思维导图、手绘、速记、播音、外语……这些都属于职场初级能力,学好这些技能能让人做好一件事,在职场里面能顺利起步,因此有必要学好,但指望靠这些初级能力功成名就是很难的。职场新人需要知道,假如自己把PPT做得很好,还需要哪些能力才能赚钱。答案是掌握职场高级能力,就是掌握改变别人、说服别人、营销别人、组织别人的能力。秋叶所说的这些职场高级能力都属于复杂沟通的范畴。
1704805114
1704805115
人与人对话时的言外之意,幸福、快乐、满足、满意这些类似情绪间的区别,为什么陈凯歌的《霸王别姬》是好电影,而《无极》是烂电影……目前的人工智能还不理解这些相对比较复杂的事物,因此只能停留在简单沟通的水平上。
1704805116
1704805117
导致人工智能缺乏复杂沟通能力还有一个重要原因:人工智能在自然语言理解方面的能力不足。
1704805118
1704805119
美国伯克利大学的人工智能专家认为,深度学习技术有其适用点,也有不适应的地方。比如目前在人脸识别、图像识别以及语音识别等方面,由于能够获得大量数据素材,因此深度学习技术能够适用得很好。但在自然语言理解方面,目前还没有取得上述几方面那么大的突破。
1704805120
1704805121
目前的人工智能无法有效完成更深层次的语义识别和常识识别。语义识别面临很多困难,比如说“万万没想到”,指的是出乎意料呢,还是一个叫万万的人没想到呢,还是指一部电影的名字呢,机器要准确理解歧义有很长的路要走。此外,人类的很多交流是需要知识为依托的,机器还欠缺很多对世界和生活的常识。例如我们看到“小明拿起他的电话并离开了房间”,我们根据经验知道这个电话是手机,小明是通过一扇门离开的。机器因为缺乏常识而无法推断出那样的信息,理解一篇文章就更困难了。把常识教给软件不仅仅是一个技术问题,也是一个基础科学和数学难题,可能需要几十年时间才能解决。
1704805122
1704805123
智能机器能识别一个人讲话的内容是什么,但和真正理解这段话的意思还有一个巨大的鸿沟,这可能需要十年以上的时间来突破。目前人工智能理解自然语言的能力还达不到大规模应用的水平。大家熟悉的小Ai机器人、图灵机器人、智齿机器人等人机对话的人工智能,都只是变相的关键词匹配。
1704805124
1704805125
为了让机器更好地阐释信息,当前人工智能的许多创新都围绕着理解自然语言开展,无论是从网络中读取和理解文本,还是从事智能对话。
1704805126
1704805127
2016年6月,人工智能创业公司Maluuba公司开发的机器阅读理解系统EpiReader,在CNN和童书测试(CBT)两个数据集的填空题测试中,分别有74%和67.4%的准确率,成绩都超过了谷歌、Facebook和IBM。
1704805128
1704805129
Maluuba公司在Youtube上传了一段技术演示视频,视频中的人工智能机器人Marcy在阅读了第五季《权力的游戏》剧情梗概后,马上领会了故事的复杂情节。当工作人员问它,是谁刺死了男主角John Snow时,机器直接给出了准确的回答:守夜人。如果你问其他公司的语音助手,它们可能还完全不知道你在说什么,从而将你推到搜索网页来寻找答案。
[
上一页 ]
[ :1.70480508e+09 ]
[
下一页 ]