1700516402
天才与算法:人脑与AI的数学思维 创造力竞争
1700516403
1700516404
除了证明可行性以外,“复活伦勃朗”项目是没有什么意义的。真正令人兴奋的新艺术能从代码中产生吗?罗格斯大学(Rutgers University)的艾哈迈德·埃尔加马尔(Ahmed Elgammal)猜想,如果把艺术创作变成一个竞争性的游戏,是否会促使计算机进入新的、更有趣的艺术领域?他的想法是创建一种算法,其首要任务是放弃已知的所有艺术风格,然后判断由算法自己所产生的艺术品是否具有与所有艺术风格都截然不同的特性,即真正独树一帜的艺术风格。这是一个典型的生成式对抗网络[1] 的例子,这个概念由谷歌研究员伊恩·古德费罗(Ian Goodfellow)首先提出。该网络模型通过框架中(至少)两个模块,生成模型(generative model)和判别模型(discriminative model)的互相博弈学习,产生相当好的输出。埃尔加马尔希望开发出这样一种算法,并希望其创造性在世界范围内得到认可。
1700516405
1700516406
有一些证据表明,这种对抗性模型同样适用于人类创造力代码的引导。汤米·麦克休(Tommy McHugh)的神奇经历就证明了对抗性模型的力量。汤米是利物浦的一名快活的建筑工人,他结了婚,住在伯肯黑德的一所小房子里,除了在监狱里纹的文身,他对艺术毫无兴趣。但是在2001年,汤米中风了,中风之后,发生了神奇的事情:汤米突然有了创作的冲动,他开始写诗,买颜料和刷子,并开始在他房子的墙壁上创作艺术品。但问题是,他无法控制自己的这种冲动。他被这种冲动“劫持”,强迫自己在家里的每面墙上作画。
1700516407
1700516408
走进他的房子,就像走进了媚俗版本的西斯廷教堂,一切都被图画覆盖着。汤米的妻子拿创造力爆发的汤米毫无办法,只能对他听之任之。汤米停不下来,他一直不停地绘制新画来覆盖旧画。
1700516409
1700516410
他对我说:“我已经把整个房子画了5遍,地板、天花板、地毯……我只有累了睡觉的时候才会停止作画。如果允许,房子的外立面、树和人行道都会成为我作画的地方。”
1700516411
1700516412
他的作品都是杰作吗?答案是不尽然。但是,为什么汤米在中风后突然有了作画的冲动?他试图向我描述当这种创造的冲动出现时,在他的脑子里发生了什么:“在我的脑海里有一股闪电射向大脑的一侧,击中了其中的某个细胞,这个细胞激活了充满着泡泡的埃特纳火山[2] 。我脑海中每一个泡泡都与其他数十亿个泡泡相联系,当它们连锁爆发时,我所有的创造力也都跟着爆发了。”
1700516413
1700516414
神经科学家的研究发现,就像在Google Brain上运行的生成式对抗网络算法一样,人类大脑也有两个相互竞争的系统。一个系统是表现欲(生成模型),产生制造东西的冲动,是创造、表达的系统。另一个系统是抑制剂(判别模型),是对我们的想法产生怀疑、质疑和批评的系统。我们需要非常谨慎、仔细地平衡两者,这样才能有新的产出或是决定。一个创造性的思想需要与判别模型相平衡,通过反馈循环对创意进行评估,以便创意(生成模型)能够被修改并产出。
1700516415
1700516416
由此看来,汤米的中风使得他大脑中的判别模型失去了效用。虽说他所创造的可能并不那么伟大,但没有什么能让他停下来,因为在他的脑中只剩下了爆炸式的表现欲(生成模型),即想要创造出越来越多疯狂的图像和想法。
1700516417
1700516418
德国艺术家保罗·克利在他的教学素描本中表达了这种张力:“在创造艺术行为伊始,有了最初的想法之后不久,就出现了最初的反向运动,即接受性的最初运动。”这意味着,创作者对他创作的作品有质量的把控。
1700516419
1700516420
2012年,汤米死于癌症,但他对自己的遭遇并不感到遗憾,他这样说道:“我的两次中风让我经历了11年无与伦比、无人能及的精彩。”
1700516421
1700516422
埃尔加马尔的想法是编写代码来模拟艺术家潜意识中的生成模型和判别模型之间的反馈循环。首先,他需要建立一个判别模型,这个模型相当于艺术史专家,其评估生成结果。他与同事巴巴克·萨利赫(Babak Saleh)合作创建一种算法,该算法可以创作一幅从未面世的作品,并负责对作品的风格或作者进行归类。维基艺术(WikiArt)拥有1119位艺术家的81 449幅画作,在时间跨度上跨越了1500年,这可能是世界上最大的数字化图像数据库。是否可以创建一种算法,它可以通过维基艺术中的数据训练自己,随机抽取一幅画后,对其风格或艺术家进行分类?埃尔加马尔使用了部分数据作为算法的训练集,其余数据则用来测试算法。他应该怎样编写他的算法?哪些关键的因素可能有助于对这一庞大的艺术数据库进行分类?
1700516423
1700516424
想通过数据来对艺术家进行分类,我们需要一些具体的衡量标准。这一基本过程与声田公司[3] (Spotify)或奈飞公司背后的算法类似,但你要寻找的不是个人品位,而是与众不同的特征。如果对数据库中的画作以两个不同的特点为目标进行扫描、测量、归类,那么每幅画作都可以用二维图上的一个点(横轴上的一点)来表示。那么,选择哪种特性来扫描、检测,会让你惊奇地发现毕加索的画作集中在横轴的一个区域,而凡·高的画作集中在另一个区域呢?
1700516425
1700516426
例如,以一幅画作中使用的黄色量为特征进行测量,你可能会看到毕加索的画作(标记为×)和凡·高的画作(标记为○)的分布如图8-1所示:
1700516427
1700516428
1700516429
1700516430
1700516431
图 8-1
1700516432
1700516433
对单一特征进行测量并不能帮助我们判断画作归属。在上例中,有时候毕加索会用少量的黄色,比如P1 这幅画作对应的黄色刻度值为1。但P2 对应的黄色刻度值达到了3。而同是凡·高绘制的两幅画作VG1 和VG2 的黄色特征分布范围与毕加索的存在重合现象,故无法清楚地辨别两个人的作品。所以,单是测量黄色特征对我们是没有帮助的。
1700516434
1700516435
如果选择另一个特征来测量,比如画作中蓝色的使用量,会发生什么呢?我们在垂直的轴上以相同的画作为样本,标记出该特性的值,如图8-2所示。
1700516436
1700516437
1700516438
1700516439
1700516440
图 8-2
1700516441
1700516442
事实再一次证实蓝色这一单一的特征也不能真正帮助进行画作归属的判定,毕加索、凡·高的画作之间并没有明确的区分。但是,如果把这两个特征相结合,在平面直角坐标系里标出这些画会不会有所发现呢?
1700516443
1700516444
如图8-3所示,毕加索的画作P1 对应平面中的点(1,2),凡·高的画作VG1 对应平面中的点(2,4),依此类推可以找出所有作品的所在位置。将黄色和蓝色两个特征相结合,我们发现通过一条直线(图8-3中的虚线)可以将艺术家的作品分为两个不同的区域,毕加索的作品聚集在线的左侧区域,而凡·高的作品聚集在线的右侧区域。
1700516445
1700516446
在算法学习了如何利用这两个特征来区分毕加索和凡·高的画作之后,拿出一幅新的绘画作品给算法,并要求它识别该画作的作者是凡·高还是毕加索时,算法将测量这两个属性,然后在平面直角坐标系中绘制出该画作的坐标,确定其所处位置,并根据这一结果判断出这幅画作的创作者。
1700516447
1700516448
在这个简单的例子中,我选择了颜色作为特征来区分艺术家,当然,也可以利用画作中其他众多的特征来进行分析。机器学习的强大功能是探索可能的度量空间,就像在以上示例中测量黄色和蓝色一样,其可以挑选出有助于区分艺术家特征的正确组合。显然,用来区分艺术家,只测量两个维度的特征是远远不够的,所以我们需要找到足够多的、可测量的、独有的特征。每一个新特征都有助于更好地标记艺术家和他们的风格,增加定位艺术家和他们风格的空间维度。最后,绘制出多维度的图表,而不是我们在上述的简单示例中用到的平面直角坐标系。
1700516449
1700516450
[
上一页 ]
[ :1.700516401e+09 ]
[
下一页 ]