1700516986
天才与算法:人脑与AI的数学思维 艾米:人工智能作曲家
1700516987
1700516988
我喜欢做这样一件事:当听到收音机播放音乐时,我会在公布是谁的作品之前猜是谁的作品。一天早上,我坐在书桌前听到一首乐曲,我很快意识到这是巴赫的风格,这首曲子应该是巴赫的作品。曲终时,播音员说这首曲子是由一个算法创作的,这令我十分讶异。让我震惊的不是这首作品让我为以为它是巴赫创作的,而是在短短一首乐曲的时间内我被所听到的打动了。一段代码真的能做到吗?让我好奇的是,其背后的算法是如何让我认为所听到的是伟大的巴赫创作的乐曲。
1700516989
1700516990
巴赫的作品是大多数作曲家开始学习创作的起点,也是大多数计算机开始学习作曲的起点。那天我在广播中听到的那首曲子,是由一位一直在苦苦寻找灵感的作曲家按照简单的代码规则创作出来的。大卫·柯普(David Cope)正在创作一部委约歌剧作品,可是他灵感枯竭,连一个音符都写不出来。当记起阿达·洛夫莱斯曾经预言的“分析机可能会生成任意复杂程度、精细程度的科学的音乐作品”时,他决定在乐思枯竭的状况下求助于算法,探索阿达的预言。
1700516991
1700516992
那是在20世纪80年代初,计算机还不像现在我们见到的这样。他将打孔卡片输入IBM计算机,而音符就是输出。后来他回忆道:“早期实验的结果确实不尽如人意。”但他坚持了下来,并前往斯坦福大学学习了计算机音乐的相关课程。随着委约作品交稿日期的临近,他决定将他在计算机上做的试验付诸现实。
1700516993
1700516994
如果有一种算法可以准确地理解、把握他的创作风格,那么每当他的创作陷入困境并无法继续的时候,这个算法就能给他提供与他创作风格相兼容的建议。即使算法给出的建议是荒谬的,至少算法会帮助他理解并找到可能会是更好的选择。这个算法将成为激发创造力的催化剂。柯普为他的这一套试验命名为“音乐智能试验”(experiments in musical intelligence),简称EMI。从算法试验中诞生的“作曲家”被命名为艾米(Emmy),起这个名字一方面是避免与英国百代唱片公司(EMI)重名,另一方面是柯普想让艾米更人性化。
1700516995
1700516996
柯普在创作歌剧上下了7年的功夫,在艾米的帮助下,他用两周时间就完成了这部歌剧的创作。歌剧《摇篮坠落》(Cradle Falling)发表时,他决定不让外界知道这部作品是在艾米的帮助下创作的,以免使乐评人产生偏见。发表两年后的1987年,歌剧首次公演时,柯普很高兴地发现这部作品获得了他职业生涯中最好的一些评论。一位乐评人说:“这作品太感人了!无疑是一部现代的经典名作!”这样的反馈鼓舞着柯普继续与艾米合作创作作品。
1700516997
1700516998
如果该算法能够学习柯普的创作风格,那么它是否可以经由训练“变成”那些“经典大师级的作曲家”呢?举个例子:算法可以在学习巴赫或巴托克的创作风格后,创作出那些风格的作品吗?柯普相信每一段音乐都内含了编码和指令,用以创造出其他相似但微妙不同的音乐片段。这里所面临的问题是如何将这些指令具体化成代码。
1700516999
1700517000
在艾米的帮助下,他开始为每位作曲家建立一个与他们的风格相对应的数据库,比如他们具有专属特性的音乐语言语汇和技法。音符就是字母,但是什么样的单词可以与某位作曲家的专属语言特征相对应呢?柯普分析的关键概念之一是标志性主题动机,这是一个由4~12个音符组成的序列,它会反复出现在同一作曲家的多部作品中。例如,在莫扎特的钢琴协奏曲中,我们会发现有一种模式反复出现,它被称为“阿尔贝蒂低音”[1] 。它通常出现在音乐的二声部,由三个音按13231323的顺序组成(见图11-2)。
1700517001
1700517002
1700517003
1700517004
1700517005
图 11-2
1700517006
1700517007
这个模式就会汇入到与莫扎特风格相对应的数据库中。在柯普分析的所有作曲家中,莫扎特的作品尤其富有特色。这些特征可能会以不同的速度、节奏和音高出现,但对于发现潜在的模式,数学是很拿手的。这有点像无论你以怎样的方式将一个球抛向空中,这个球始终按照抛物线方程描述的路径运动。
1700517008
1700517009
柯普的分析揭示了作曲家的作品带有强烈的富有个人特色的模式性。从巴赫到莫扎特,从肖邦到勃拉姆斯,从格什温到斯科特·乔普林[2] ,每个人似乎都有自己偏爱的特定的动机。也许这并不奇怪。为什么在广播中听了几个小节后,即使以前从未听过这首曲子,我还是经常能猜出作曲家是谁呢?就像盲人品酒师一样,我在研究一些关键的指标。而在音乐中,这些指标就是音符的模式,它们就像画家标志性的笔触一样。有些作曲家,如巴赫,甚至在乐谱上用音符来签名。巴赫在其最后的巨作——《赋格的艺术》中最后一首未完成的赋格里,以“音乐签名”的方式把自己的姓名“BACH”留于其中。在德国乐理体系里,与B对应的唱名是降si,与A对应的唱名是la,与C对应的唱名是do,与H对应的唱名是si。
1700517010
1700517011
在将作品分割成一个个单元和标志性动机,即形成每个作曲家的数据库之后,柯普的算法转向了他所说的“重构”。识别、拆解、分析一个复杂结构是一回事,找到一种方法将经过拆解的构件重新组合构造成一个全新的结构是另一回事。柯普本可以选择使用像莫扎特的《骰子音乐》游戏那样的随机过程,但是随机组合不太可能反映出作曲家在创作中所想展现的情感张力,所以他在程序中又增加了一个步骤:他为每一部分都创建了热图。
1700517012
1700517013
作曲家经常把各种元素组合在一起,他们称之为乐句或乐节。柯普尝试用一种他称为“SPEAC”的方法来将这些模式抽象化。如果数据库是字典,那么“SPEAC”就是作曲家使用字典中的单词编写乐句的方式。“SPEAC”确定了乐句的五个基本组成要素:
1700517014
1700517015
Statement(声明):“简单存在”的乐句,只能做重复。
1700517016
1700517017
Preparation(准备):以出现在S或其他要素前为前提,修改其含义的要素。
1700517018
1700517019
Extension(扩展):一种扩充、延展S的方法。
1700517020
1700517021
Antecedent(先导):有重大暗示、引导作用并要解决问题的乐句。
1700517022
1700517023
Consequent(解决):将A未解决的问题解决的乐句。C通常与S具有相同的和弦或旋律片段,但是它们具有不同的含义。
1700517024
1700517025
许多古典主义时期的作曲家都会使用这种套路来作曲,有时他们是在不知不觉的状况下使用,但通常他们在学习作曲的时候就学会了这种作曲技法:这个和弦需要在曲子的这个位置得到解决;接下来的和弦会让人觉得回到了主音,有一种安定感;这个和弦会进一步提高亟待解决的程度,让人觉得非要解决不可。柯普可以在SPEAC的帮助下分析一首作品,因为每个作曲家都有自己独特的套路。例如,图11-3是柯普对斯克里亚宾的一首钢琴曲的分析:
1700517026
1700517027
1700517028
1700517029
1700517030
图 11-3
1700517031
1700517032
柯普的这一基本程序建立伊始,他就用其测量音程的和谐度。若纯八度音程[3] 和纯五度音程是和谐的,不会造成很大的紧张感,这在数学中也得到了证实——两音之间的振动频率比是小整数比:纯八度是1:2;纯五度是2:3。钢琴上两个相邻键之间的音程(小二度或半音)就会造成很强的紧张感。同样地,在数学中也反映了这一点:它们的振动频率比是更大的数字之间的比(15:16)。通常在一段音乐中听到了这种高紧张感的音程后,你会知道它们接下来必然朝着低紧张度的方向解决。
1700517033
1700517034
柯普将这些规则输入到系统中,用以帮助艾米从给定的作曲家作曲风格的大型数据库中构建新的乐曲。艾米的重组规则是将片段按照一定的指导原则组合在一起,这些片段必须与柯普的SPEAC分析编码相匹配。例如,如果片段B与片段A具有相同的起始动机,但是片段B的发展指向了一个新的方向,那么组合的方式就是片段A+片段B,而不是片段B+片段A。
[
上一页 ]
[ :1.700516985e+09 ]
[
下一页 ]