1700517085
1700517086
我的自由是把有限的精力分配到我力所能及的每件事中去。正因为如此,我将会走得更远:我越是限制自己的领域,越是给自己设定障碍,我的自由越将变得伟大和有意义。
1700517087
1700517088
我的作曲老师教给我了一套可以帮助我作曲的规则,让我开始了自己的小小音乐之旅。在使用了有量卡农之后,我又为自己创建了一些规则,并完成了一个算法来指导我作曲。我曾经看到过约翰·凯奇的轶事,他经常作完曲后,在作品首演的时候才第一次听自己的作品。我对此种方式很好奇,也想这样听听我对数学的重新想象会是什么样子。
1700517089
1700517090
但当坐在钢琴旁听到自己创作的弦乐三重奏时,我很失望。我所遵循的规则本打算让曲子有一个有趣的逻辑来吸引听众听下去,但实际上曲子听起来怪怪的。我真的不知道这是为什么。当然,认为音乐和数学一样有正确或错误的唯一答案这种想法是愚蠢的。在对最初的结果感到失望之余,我开始违反我设定的规则,打乱了我写下的音符,以期创作出一些听起来更具乐感的东西。我无法解释为什么我要做出这些改变,我把自己交给了更深层次的东西——身体与音乐,潜意识和人性。
1700517091
1700517092
这是一个重要的教训。作曲是规则、模式、算法以及其他诸多因素的融合,这就是霍夫斯塔特所说的“环游世界,行万里路”所得到的东西。正是这种神秘的东西开始渗入我写下的音符,开始赋予它生命和美感。
1700517093
1700517094
这些结构是否需要通过对情感的感知来了解?如果需要,计算机怎样感知情感?如果音乐是在编码情感,那么这些代码能用于模拟计算机的情感状态吗?也许,创建艾米的2万行代码已经成了其中的一部分。霍夫斯塔特对艾米创作的肖邦风格的作品有情感上的反应,这是对2万行代码的情感反应吗?难道这段代码不是像肖邦创作的作品那样捕捉情感的吗?
1700517095
1700517096
把艾米输出的音乐称为人工智能创作的音乐是个骗局。艾米的创作依赖于作曲家数据库。作为作曲家,柯普拥有职业的敏感性和专业的分析工具,可用于选出与作曲家风格相对应的元素,并重组这些元素。艾米的大部分创意来自柯普和历史上伟大的音乐大师的作品。
1700517097
1700517098
柯普使用自上而下的编码过程构建了艾米,是柯普编写了所有的代码用来输出音乐。我们现在处于这样一个阶段:我们可以将更具自适应性的新算法应用到作曲家的原始数据里,而无须经过人类音乐分析的烦琐过程,并且我们可以训练这些算法从零开始学习音乐理论。那么,机器学习的算法能够从头开始并创造出与历史上的伟大作品相媲美的作品吗?答案就像音乐学中经常说的那句话:让我们再次回到巴赫。
1700517099
1700517100
[1] 又译为侯世达,1961年诺贝尔物理学奖得主罗伯特的儿子。他是美国著名学者、计算机科学家、印第安纳大学计算机科学和认知学教授、观念与认知研究中心主持人,也是哲学、心理学、比较文学、科学史与科学哲学副教授。——译者注
1700517101
1700517102
[2] 该书获得1980年普利策文学奖(此奖是美国出版界的最高奖项)。作者通过对哥德尔的数理逻辑、艾舍尔的版画和巴赫的音乐的综合阐述和对比,引人入胜地介绍了数理逻辑学、可计算理论、人工智能学、语言学、遗传学、音乐、绘画的理论等多方面内容。——译者注
1700517103
1700517104
1700517105
1700517106
1700517108
天才与算法:人脑与AI的数学思维 “深度巴赫”:从头开始再生作曲家
1700517109
1700517110
巴赫写了389首四部和声的圣咏合唱,格拉斯对其进行过重构,柯普对其做过分析。巴赫著名的《约翰受难曲》包括好几首圣咏合唱。如果你正在寻找巴赫对数学痴迷的例子,你会在他所做出的选择中找到,并发现巴赫痴迷于数字14。在巴赫的时代,许多欧洲思想家和哲学家对卡巴拉[1] (kabbalah)很感兴趣,它包括将字母转换成数字并探索单词之间的数字联系以推断更深层次的联系。巴赫很惊奇地发现,他姓氏的字母按照排序翻译成数字加起来是14(2+1+3+8)。这成了他的“数字”签名,就像足球运动员球衣上的号码。例如,巴赫要加入其学生米兹勒建立的米兹勒音乐学社,他其实可以早早入会,但他一直在等,等到第13个人入会后他再入会。他还发现了一些有趣的方法把数字引入他的作品中。在《约翰受难曲》中,共有11首圣咏曲。我们来看一下前10首圣咏的小节数,是这样的:11、12、12、16、17、11、12、16、16、17。
1700517111
1700517112
接下来第11首圣咏是关键:有28(即2×14)个小节。将前10首两两配对,第1首和第10首,第2首和第9首,依此类推……我们得到了:11+17=28,12+16=28……如果以对称的方式相配对,小节数之和都会是28!这是巧合吗?我看不太可能!
1700517113
1700517114
创作这些合唱,巴赫通常会先安排路德教派众赞歌旋律在女高音声部,然后将其他声部进行组合,以协调旋律。柯普对其作品进行分析,然后将各声部的协调关系编入他的算法。他了解巴赫在和声中所使用的规则,但是,计算机只依靠本身能从原始的数据中学习和声的规则吗?做和声题的练习就像是玩一个异常复杂又非常需要耐心的游戏,或是做一个开放式的数独游戏。每一步,你都需要决定你的男高音声部下一步的走向。旋律走向高还是低?音域是否合适?节奏、速度怎样安排?在你考虑其他两个声部时,你需要考虑的就更多了,你必须要保持整体的协调,牵一发而动全身!
1700517115
1700517116
作曲专业的学生在做和声练习时,老师一定会强调很多规则。比如,一定要避免平行五度或八度[2] 。平行五度将会削弱两个和弦的独立性,导致和声效果变弱,听觉上会感觉一下子从立体声变成了单声道。早在13世纪,在作曲的规范里就禁止使用平行五度,直至今日这还是作曲界的共识。
1700517117
1700517118
格拉斯回忆有一次上课,他的老师布朗热问道:“你最近身体怎么样?没生病吧?头疼吗?身体不舒服要去看医生,精神压力大了可以去看心理医生。我可以给你假,我们可以调课。”格拉斯答道:“我身体挺好的,没什么问题。”布朗热突然转过办公椅面向他,拿着他这周的和声作业,尖声咆哮道:“那这是怎么回事!你怎么解释!”果然,格拉斯在自己作业里的女低音声部和男低音声部里看到了隐伏五度[3] 。
1700517119
1700517120
打破传统规则是创造性思维的标志。在AlphaGo的制胜一招中,我们能看到这一点。同样地,我们发现巴赫有时也会打破规则,使用平行五度。但这会不会让作品变糟呢?正如我的作曲老师艾米丽向我解释的,创作的乐趣之一就是打破规则,这是实现创意的最佳机会。
1700517121
1700517122
和声有一种二维的特性:和声必须在垂直方向上有意义,而旋律本身在水平方向上也必须有逻辑并且和谐。对人类作曲家来说,创作和声作品并将这两个维度结合起来是一个考验。
1700517123
1700517124
那么,由机器学习驱动的新算法可以解决这样的问题吗?巴赫创作技巧的秘密能否通过他的389首圣咏解码出来?测试这个问题的一种方法是做统计分析:根据这一个音符,猜测可能性最高的下一个音符。例如,在不同的作品里,ABCBA这样的旋律片段作为和声的一部分出现了好几次,那么你可以对A后面那个音进行统计分析。在作品BWV[4] 396中紧跟A的音符是#G,音高降低了半音。然而,在作品BWV 228里紧跟A的音符就跃进到了F。通过建立这样的统计分析,可以创建一个音乐骰子游戏,不同的权重代表不同的音符可能出现的概率。假设巴赫有8次选择了使用#G,有4次选择了F,那么算法就有2/3的概率选择#G。这有点像算法DeepMind学习如何玩《打砖块》游戏:算法该朝哪个方向移动球拍,移动多少能获得胜利。应用于音乐的算法只不过把球拍换成了或高或低的音符。
1700517125
1700517126
柯普在着手识别作曲家的标志性乐句时发现,这种方法的难点在于确定音符的数量:如果太少了,那么满篇都是;如果太多了,乐句就会被过度确定,以致输出变成了复制原作品。此外,除了音高,你还需要考虑节奏模式。
1700517127
1700517128
根据我们听音乐的方式,从左至右跟着时间轴,根据以前的节奏模式构建,这是最简便的办法。但这并不是对一件作品进行统计分析的唯一方法。在弗朗索瓦·帕切特(François Pachet)和弗兰克·尼尔森(Frank Nielsen)的指导下,音乐专业学生盖坦·哈德耶勒斯(Gaëtan Hadjeres)为他的博士论文开发了一种算法——“深度巴赫”(DeepBach)。该算法旨在透过现象看本质,将巴赫的作品二维化,并进行分析。这就像在拼图中移除一块,并分析其周围的图像,然后我们就能猜到巴赫往这空白处填了什么。因此,它不是在时间轴上向前组合,而是向后查看。这是解迷宫的一个典型技巧:从结束开始,试着如何回到起点。[5] 当然我们也可以选择中间的部分,问问“深度巴赫”怎么填补。
1700517129
1700517130
基于这种多维度的分析导致,“深度巴赫”创作出了比以前的算法所做的在结构上更加连贯的圣咏。那些算法漫无目的,只是在时间轴上向前曲曲折折地组合。然而,“深度巴赫”的这种分析仍然是局部层面的分析:其以每个音符为中心向四周扩散,一组一组地观察并进行分析,但是“音群”的大小是受限制的。在“深度巴赫”的算法中,“音群”的范围是以某音符为中心的前后各四拍。那么,这个算法有多成功呢?
1700517131
1700517132
盖坦和他的导师将巴赫的圣咏分为两部分:80%用来训练算法,20%用作测试数据。志愿者被请来配合试验,他们将听到“深度巴赫”和真正的巴赫的作品。志愿者必须在听完后判断该作品是计算机所作还是人类(巴赫)所作。志愿者的音乐教育背景被考虑到了,因为这会严重影响评估的可靠性:学过作曲的人的耳朵要比没经过训练的人的耳朵灵,能听见他们听不到的声音。
1700517133
1700517134
总体结果令人震惊:“深度巴赫”的作品有50%被认为是巴赫的。学习过作曲的志愿者成绩稍好,但仍然有45%的“深度巴赫”作品被认为是巴赫所作。这令人印象深刻。标准是无情的,只要有一点小纰漏就能被识别出来。巴赫在他的作品中没有犯任何错误,然而他25%的作品被判定为机器生成的。这同样令人印象深刻。并不是我傲慢自大,我觉得圣咏可能是巴赫作品中最乏味的。虽然这些圣咏是他反复推敲出来的,但无法感动我。
[
上一页 ]
[ :1.700517085e+09 ]
[
下一页 ]