1700517181
1700517182
帕维尔·涅克拉索夫和马尔可夫的观点恰恰相反,他认为,现实世界中的事物是相互依存的(比如人的行为),所以现实中的事物并不恰好符合数学模式或分布。如果统计数据遵循大数定律,那么它的假设必是每个事件都是完全独立的。涅克拉索夫试图用这样的例子来证明,俄国的犯罪率统计是遵循大数定律的,但事实上,罪犯决定犯罪都是由个人意志决定的。
1700517183
1700517184
马尔可夫对涅克拉索夫错误的逻辑感到沮丧,他评价涅克拉索夫的论调是“对数学的滥用”,并决心证明其是错误的。因此,马尔可夫需要建立一个模型,在这个模型中,结果的概率取决于以前发生的事件,但长期来看仍然遵循大数定律。抛硬币的结果并不取决于以前抛硬币的结果,所以这不是马尔可夫理想的模型。但是,如果增加一点依赖关系,使下一个事件取决于刚刚发生了什么,而不是整个系统如何影响了当前事件,又会怎么样呢?每个事件的概率仅取决于先前事件的一系列事件被称为马尔可夫链。预测天气就是一个例子:明天的天气肯定取决于今天的天气,但并不特别依赖于上周的天气。
1700517185
1700517186
我们来看以下模型。天气有晴天(S)、阴天(C)和雨天(R)。如果今天是晴天,那么明天就有60%的可能是晴天,30%的可能是阴天,10%的可能是雨天。但是如果今天是阴天,那么明天天气的可能性就会变化:明天下雨的可能性就变成了50%,阴天的可能性是30%,晴天的可能性是20%。在这个模型中,明天的天气只取决于今天的天气。即使我们已经有两周连续的晴天也没有关系,只要今天阴天,那么明天就有50%的概率下雨。这个模型的最后一部分是,如果今天是雨天,那么明天有40%的可能是晴天,10%的可能是阴天,50%的可能是继续下雨。让我们用矩阵来描述这些概率:
1700517187
1700517188
1700517189
1700517190
1700517191
用这个模型,我们可以计算出两日后下雨的概率。当然,有好几种途径可以得到下雨的结果,所以我们需要把所有可能的概率都考虑进来。它可能是SSR,可能是SCR,还可能是SRR:
1700517192
1700517193
SSR的概率=SS的概率×SR的概率=0.6×0.1=0.06
1700517194
1700517195
SCR的概率=SC的概率×CR的概率=0.3×0.5=0.15
1700517196
1700517197
SRR的概率=SR的概率×RR的概率=0.1×0.5=0.05
1700517198
1700517199
这意味着两日后下雨的概率是0.26或26%(我们用SxS=0.06+0.15+0.05来表示)。
1700517200
1700517201
计算两日后下雨的可能性,还有一种简便的方法,就是将我们前面描述概率的矩阵进行平方。
1700517202
1700517203
1700517204
1700517205
1700517206
尽管每天的天气都依赖于前一天的天气,但从长远来看,无论我们的模型是从晴天、雨天还是阴天出发,下雨的概率都会趋向于相同的数值(32.35%)。为了证实这一点,我们可以提高矩阵乘方的指数来进行验证,结果我们会发现每一行都会趋向于相同的概率。因此,即使明天的天气依赖于今天的天气,长期的天气预报也与今天的天气无关。
1700517207
1700517208
下面这个矩阵每一行表示的是十天后晴天、阴天或雨天的概率。通过数据我们可知,今天的天气是什么并不重要(即我们选择哪一行来观察),第十天的概率总是相同的。马尔可夫设计的这个试验,彻底证明了涅克拉索夫的观点是错误的——从长期犯罪统计数据来看,罪犯决意犯罪是由个人自由意志决定的,这个论点是站不住脚的。
1700517209
1700517210
1700517211
1700517212
1700517213
马尔可夫决定使用一首在俄国家喻户晓的著名诗歌——普希金(Pushkin)的《尤金·奥涅金》(Eugene Onegin)来阐释他的模型。他所做的分析并不是要给这首诗提供新的文学见解,而只是用它作为一个数据集来分析元音和辅音的出现概率。他提取了这首诗的前20 000个字母(大约占整首诗的1/8),计算了元音和辅音出现的次数。虽然计算机可以在一瞬间完成这项工作,但是马尔可夫坐下来,自己一个一个地计算元音和辅音出现的次数。他最终得出的结论是,元音占总数的43%,辅音占总数的57%。如果随机提取一个字母,那么很大可能它是一个辅音。他感兴趣的是,知道前一个字母是辅音还是元音是否会改变你对当前字母的猜测。换句话说,下一个字母是辅音的概率是否取决于前一个字母是不是辅音?
1700517214
1700517215
经过对文本的分析,马尔可夫发现,一个辅音后面会跟着另一个辅音的概率是34%,而辅音后面会跟着一个元音的概率是66%。尽管前几个字母在很大程度上取决于起始字母的选择,但是马尔可夫证明,从长远来看,字母的分布是一种模式。因此,即使是相互依赖的事件,如果它们受到固定概率的影响,也是一致的。这其实并不令人意外,因为大多数单词的拼写往往都是辅音和元音交替出现的。经过统计计算,他发现元音后接元音的概率只有13%。因此,可以说《尤金·奥涅金》为马尔可夫提供了一个完整的模型,帮助他阐释了自己的想法。
1700517216
1700517217
马尔可夫链的一个重要性质就是其是无记忆的:在当前状态下,你可能需要一切可用的事件来预测下一个事件。这种无记忆性也叫马尔可夫属性。有时可以通过考虑前两种状态如何影响下一种状态来改进模型。(以《尤金·奥涅金》试验为例,了解前两个语音元素,可能有助于增加推测下一个语音元素的正确概率。)但在某种程度上,这种依赖性是不存在的。
1700517218
1700517219
1700517220
1700517221
1700517223
天才与算法:人脑与AI的数学思维 “续作者”:第一个人工智能即兴爵士作曲演奏者
1700517224
1700517225
帕切特决定用帕克的作品来替代普希金的诗。他的想法是,对爵士音乐家的即兴演奏片段进行分析,给定一个音符,分析下一个音符出现的概率。现在,让我们想象一个由上行和下行音阶组成的即兴重复乐段。如果演奏一个特定的音符,那么下一个音符上行或是下行的概率都是50%。基于这样的事实,该算法将在音阶上进行随机抓取。给予算法的即兴演奏次数越多,它分析的数据就越多,某一种特定的演奏风格就会出现越多。帕切特发现,仅仅回溯一个音符是不够的,可能需要几个音符才能知道下一个音符是什么。但是,我们不希望算法生成与训练数据雷同的东西,所以回溯过多是没有好处的。
1700517226
1700517227
帕切特算法的优点是你可以向其提供实时数据。比如,你可以在钢琴上即兴弹奏,该算法会统计分析你在做什么,当你停下来的那一刻,它会继续以同样的风格进行弹奏。这种问句和答句的形式在爵士乐中很常见,因此该算法可以和音乐家进行现场的旋律问答。正因为该算法可以生成与训练数据相同风格的输出内容,所以被称为“续作者”。
1700517228
1700517229
“续作者”会根据它刚刚演奏的内容以及训练数据,来计算下一个特定音符出现的概率,然后以掷骰子的随机模式做出选择。在另一个版本的算法中,帕切特没有选择问句与答句的“问答模式”,而采用了一种“合作模式”:算法会根据演奏的一段旋律,利用它的概率演算来推测出正确的伴奏和弦,就像真人在伴奏一样。
1700517230
[
上一页 ]
[ :1.700517181e+09 ]
[
下一页 ]