1700517123
1700517124
那么,由机器学习驱动的新算法可以解决这样的问题吗?巴赫创作技巧的秘密能否通过他的389首圣咏解码出来?测试这个问题的一种方法是做统计分析:根据这一个音符,猜测可能性最高的下一个音符。例如,在不同的作品里,ABCBA这样的旋律片段作为和声的一部分出现了好几次,那么你可以对A后面那个音进行统计分析。在作品BWV[4] 396中紧跟A的音符是#G,音高降低了半音。然而,在作品BWV 228里紧跟A的音符就跃进到了F。通过建立这样的统计分析,可以创建一个音乐骰子游戏,不同的权重代表不同的音符可能出现的概率。假设巴赫有8次选择了使用#G,有4次选择了F,那么算法就有2/3的概率选择#G。这有点像算法DeepMind学习如何玩《打砖块》游戏:算法该朝哪个方向移动球拍,移动多少能获得胜利。应用于音乐的算法只不过把球拍换成了或高或低的音符。
1700517125
1700517126
柯普在着手识别作曲家的标志性乐句时发现,这种方法的难点在于确定音符的数量:如果太少了,那么满篇都是;如果太多了,乐句就会被过度确定,以致输出变成了复制原作品。此外,除了音高,你还需要考虑节奏模式。
1700517127
1700517128
根据我们听音乐的方式,从左至右跟着时间轴,根据以前的节奏模式构建,这是最简便的办法。但这并不是对一件作品进行统计分析的唯一方法。在弗朗索瓦·帕切特(François Pachet)和弗兰克·尼尔森(Frank Nielsen)的指导下,音乐专业学生盖坦·哈德耶勒斯(Gaëtan Hadjeres)为他的博士论文开发了一种算法——“深度巴赫”(DeepBach)。该算法旨在透过现象看本质,将巴赫的作品二维化,并进行分析。这就像在拼图中移除一块,并分析其周围的图像,然后我们就能猜到巴赫往这空白处填了什么。因此,它不是在时间轴上向前组合,而是向后查看。这是解迷宫的一个典型技巧:从结束开始,试着如何回到起点。[5] 当然我们也可以选择中间的部分,问问“深度巴赫”怎么填补。
1700517129
1700517130
基于这种多维度的分析导致,“深度巴赫”创作出了比以前的算法所做的在结构上更加连贯的圣咏。那些算法漫无目的,只是在时间轴上向前曲曲折折地组合。然而,“深度巴赫”的这种分析仍然是局部层面的分析:其以每个音符为中心向四周扩散,一组一组地观察并进行分析,但是“音群”的大小是受限制的。在“深度巴赫”的算法中,“音群”的范围是以某音符为中心的前后各四拍。那么,这个算法有多成功呢?
1700517131
1700517132
盖坦和他的导师将巴赫的圣咏分为两部分:80%用来训练算法,20%用作测试数据。志愿者被请来配合试验,他们将听到“深度巴赫”和真正的巴赫的作品。志愿者必须在听完后判断该作品是计算机所作还是人类(巴赫)所作。志愿者的音乐教育背景被考虑到了,因为这会严重影响评估的可靠性:学过作曲的人的耳朵要比没经过训练的人的耳朵灵,能听见他们听不到的声音。
1700517133
1700517134
总体结果令人震惊:“深度巴赫”的作品有50%被认为是巴赫的。学习过作曲的志愿者成绩稍好,但仍然有45%的“深度巴赫”作品被认为是巴赫所作。这令人印象深刻。标准是无情的,只要有一点小纰漏就能被识别出来。巴赫在他的作品中没有犯任何错误,然而他25%的作品被判定为机器生成的。这同样令人印象深刻。并不是我傲慢自大,我觉得圣咏可能是巴赫作品中最乏味的。虽然这些圣咏是他反复推敲出来的,但无法感动我。
1700517135
1700517136
任何试图向大师学习的项目的关键难点在于缺乏良好的数据。389首圣咏听起来很多,但实际上只勉强够学习之用。在计算机图像识别的领域,算法会有数百万张图像训练自己。而在“深度巴赫”这个算法中,只有区区389个数据采集点,而大多数作曲家远没有巴赫这样多产。测试巴赫的圣咏是很有实践意义的,因为其提供了一组非常相似的单一现象的例子。但当你更广泛地观察作曲家的作品时,你会发现这里有太多的变化,以至于一台机器无法从中吸取足够的有效信息,甚至会迷失学习方向。也许,这就是人类创造的艺术不受机器进步影响的终极安全锁——好作品的数量太少,机器无法学习如何复制。当然,它们可以生成穆扎克音乐[6] ,但无法创作高质量的音乐。
1700517137
1700517138
[1] “卡巴拉”是犹太教的神秘哲学,传说它最原始的根源来自埃及文化。生命之树,就是“卡巴拉”思想的核心,它被视为神创造宇宙的蓝图,也有人称之为神体的构造图。他们认为它不只是一个存在于纸上的图样,而且是一个真正存在的三度空间的宇宙,也就是我们存在于其中的这个宇宙。卡巴拉思想以生长于天国的“生命之树”来象征宇宙全体,其意义非常难解,真要说的话,生命之树意味着广大的宇宙、身为小宇宙的人体,以及达到神之境界的精神遍历。生命之树大概可以分为3个支柱、10个原质、4个世界、22条路径等基本结构。卡巴拉学者使用生命之树作为创世的示意图,从而将创世这个概念发展成为一个完全的现实模型。——译者注
1700517139
1700517140
[2] 平行五度(parallel fifths)指的是乐曲的两个声部隔开纯五度平行进行。八度亦同。——译者注
1700517141
1700517142
[3] 在分部写作中,两声部同向进入纯五度,叫作隐伏五度。这种进行中隐含着平行五度。八度亦同。——译者注
1700517143
1700517144
[4] BWV代表巴赫·韦尔科·韦尔泽奇尼斯(Bach-WerkeVerzeichnis),他对巴赫的所有作品进行了分类编号。——译者注
1700517145
1700517146
[5] 即反推法。——译者注
1700517147
1700517148
[6] 即安静柔和的背景音乐。这样的音乐在过去被称作“电梯音乐”,因为我们经常在电梯里听到它。这种音乐是专门设计出来让人放松心情或增加活力的。有时候,你甚至没有意识到正在播放这种音乐,但其总是会让你有所反应。近年来,我们在越来越多的地方都能听到它,因而它又被称为“衬托音乐”。——译者注
1700517149
1700517150
1700517151
1700517152
1700517154
天才与算法:人脑与AI的数学思维 第12章 歌曲的创作公式
1700517155
1700517156
维克多·雨果(Victor Hugo)
1700517157
1700517158
音乐能言不能言,亦能言,不得不言。
1700517159
1700517160
我是一名小号演奏员,但是我从未掌握即兴爵士乐的技能。我在管弦乐队中按照乐谱演奏完全没有问题,但要成为一名爵士乐手,那就要求我同时成为一名作曲家。我曾经见过一位作曲家,他可以一边和乐团的其他同事正常交流,一边作曲。我一直非常佩服这样的天才。
1700517161
1700517162
在学习爵士音乐的过程中,我意识到实现好的即兴演奏有一个很大的令人困扰的问题。一般来说,一首爵士乐会有一组标准的和弦,这些和弦会随着乐曲的演奏出现并变化。小号手的任务是在变换和弦时吹奏一条与和弦相吻合的旋律线条。对于小号手来说,他吹奏的旋律必然是一个音符到另一个音符,同时还要保证能组成旋律,所以演奏爵士乐就像在二维迷宫中描绘一条线一样。和弦决定了垂直方向的动态,而他刚刚演奏的旋律决定了水平的动态。随着爵士乐即兴成分的增加,音乐变得更自由,同时和声的发展也会变得更加流动,这就要求小号手必须能敏锐地觉察并预判钢琴手的发展意图,其发展的方向是由前面和声的发展决定的。判断即兴演奏者水平的标准是,他是否会倾听并预判出主奏乐器的发展意图且配合得天衣无缝。
1700517163
1700517164
创建一台能够做到这一点的机器似乎并不是不可能,但是要克服很多问题,这是像艾米这样的算法作曲家没有遇到过的。即兴爵士乐算法必须在实时交互中同时完成播放与对新材料的处理和响应。
1700517165
1700517166
马克·列文(Mark Levine)所著的《爵士乐宝典》(The Jazz Theory Book)是许多青年音乐家初学时的经典用书。列文经常和20世纪最伟大的即兴爵士乐演奏家迪兹·吉莱斯皮(Dizzy Gillespie)、弗雷迪·哈伯德(Freddie Hubbard)一起演奏。诚如列文所说:“一首伟大的爵士独奏是由1%的魔力和99%的可解释、可分析、可分类、可操作的东西组成的。”这99%都是可以放进算法里的。
1700517167
1700517168
迈尔斯·戴维斯(Miles Davis)的Kind of Blue是我最喜欢的爵士乐专辑。那么,我们离创造“深蓝”(DeepBlue)还有多远呢?
1700517169
1700517170
1700517171
1700517172
[
上一页 ]
[ :1.700517123e+09 ]
[
下一页 ]