打字猴:1.704422377e+09
1704422377
1704422378
1704422379
1704422380 (a)
1704422381
1704422382
1704422383
1704422384
1704422385 (b)
1704422386
1704422387 图9 大型配子生产的生存可能性曲线。(a)图表示不稳定的情形,而(b)图表示稳定的情形。图中符号的说明与图7和图8一致。
1704422388
1704422389 合子最优的大小,那么一个这样一半大的合子生存的概率几乎为零。在图9a中,给定的更为似是而非的函数S(x)的形式,δ配子生产者就可以侵害整个种群。另外,如果条件(4.8)是不正确的,于是一个由δ配子生产者所构成的种群也可以被侵害,那么小型合子生产者和大型合子生产者就将共同存在,这样种群将是异配生殖的。
1704422390
1704422391 图10展示了生存可能性曲线S(x)的三种形式,曲线10a表示小型配子的同配生殖,并且我认为是原始状态;曲线10b表示异配生殖的情形;曲线10c表示大型配子生产中选择得到的同配生殖,但这在现实中可能永远不会出现。
1704422392
1704422393
1704422394
1704422395
1704422396 图10 三条生存可能性曲线S,以合子大小为自变量。曲线(a)表示小型配子生产稳定状态;曲线(b)表示异配生殖稳定性状态;曲线(c)表示大型配子生产稳定状态。其中,δ表示可能存在的合子大小的最小值。
1704422397
1704422398
1704422399
1704422400
1704422401 演化与博弈论 [:1704421348]
1704422402 演化与博弈论 第五章 ESS策略
1704422403
1704422404 Dawkins(1980)曾强调了ESS和“发育稳定策略(DSS)”以及“文化稳定策略(CSS)”之间的相似性。一个CSS背后的思想非常简单,那就是代与代之间的关联可能是文化上的而不是基于遗传:儿童总是从他们的父母那里,或是从上一代的其他亲属那里学习怎么做事情,而不是向控制他们行为的基因学习。Feldman和Cavalli-Sforza(1976)以及Lumsden和Wilson(1981)正式地分析了文化遗传问题。在本书的第十三章中,我们将从博弈论的角度来考虑这个问题。而这一章则致力于考察发育稳定策略的问题,在这种策略中,其与遗传相类似之处便是学习,而不是文化传播。
1704422405
1704422406 Dawkins曾用来阐释DSS的思想的例子是那么的切中要害以至于我在此无法不借来使用。Baldwin和Meese(1979)研究了在一个斯金纳箱(skinner box)中两只猪的行为,试验是这样设计的:当按下箱子一端的控制开关时,食物便会在箱子的另一端分发。他们发现在那些试验中,两只猪逐渐形成了一种固定的行为模式,占优势地位的那只大猪总是踩下控制开关后再奔向食物的分发口,而居于从属地位的那只小猪则一直等在食物的分发口。这样稳定的行为模式的形成主要基于以下理由:假设在每一次按下控制开关后都能分发足够的食物,以保证在大猪到达的时候仍有剩余,这样大猪由于按了开关而受到了奖励,但更显然的是,小猪则由于在事物分发口处等待而受到了奖励。如果将两只猪的行为调换过来,那么这将是不稳定的。小猪不会由于按控制开关而受到奖励,因为大猪会挡住小猪让它吃不到食物。更令人感到矛盾的是,即使所分发的食物使得小猪比大猪吃得更多,所观察到的上述行为仍然是稳定的。
1704422407
1704422408 我们很容易构建一个虚拟的例子,在这个例子中相似的行为是由遗传决定而不是从学习中获得。Harley(1981)对学习和演化之间的相似性问题做过更为深入的研究,本章的剩余部分就基于他的研究工作。因为在学习和演化之间不但存在某种形式的类似(analogy),而且还存在一种因果联系,所以问题变得较为复杂。学习也是不断演化的,于是我们可以问:怎样的学习规则将是演化稳定的。Harley的核心结论就是,对于一个相当一般性的模型,那些演化的学习规则正是能够在一个世代的时间内将一个种群引致ESS频率的那些规则。
1704422409
1704422410 我们假设一个动物在其一生的时间内参与了许多种类的博弈,并且每一种博弈都进行很多次,就像人类一样,一个人会参与下棋、打网球以及玩单人纸牌游戏,每一种博弈都会进行很多次。这样一个动物参与了“饲料博弈”、“交配博弈”、“啄食顺序博弈”等等。因为在只玩一次的博弈中很可能不存在学习效应,我们只关注那些经常碰到的博弈类型。这些博弈有很多个种类,如下所述:
1704422411
1704422412 (1)频率独立型博弈。那就是“与自然的博弈”,在这种博弈中,采取一个策略所得的回报独立于这个策略被采取的频率。
1704422413
1704422414 (2)频率依赖型博弈。
1704422415
1704422416 (a)个人博弈,即这些博弈的回报都不依赖于种群中其他成员所采取的行动,但的确依赖于参与博弈的个体采取不同行为的频率。
1704422417
1704422418 (b)种群博弈,即这些博弈的回报的确依赖于种群中其他成员所采取的行动。
1704422419
1704422420 虽然这些不同种类的博弈背后的逻辑千变万化,但我们没有理由去假设一个动物能够知道它所参与的是哪种类型的博弈。于是,一个动物只知道自己是在争夺食物、争偶交配,还是在竞争主导地位,但是不知道所参与博弈的支付矩阵是否是频率依赖的。用拟人化的语言讲,一个争夺食物的动物将根据以前争夺食物的经验来调整自身的行为,而不是根据以前争夺配偶交配的经验,但是在这两种情形下,它都会使用相同的规则进行调整,即相同的“学习规则(learning rule)”。
1704422421
1704422422 种群博弈可以采取多种多样的形式。在Harley的模型中,他假设个体随机地进行配对,参与一对一的竞争,并根据它们所获得的回报及其学习规则来调整它们的策略,然后再随机地配对与新的对手展开竞争,这个过程将一直持续下去,直到个体所选策略的概率分布达致一个稳定的状态为止。正如在演化的情形中一样,如果一个个体是“全面树敌”的,则动态变化情况是相似的。一个例子就是Brockmann等人(1979,见第51页)所研究的掘土蜂自己“挖掘洞穴”与“入侵其他掘土蜂洞穴”的博弈,虽然令人感到惊奇的是,看上去在这个博弈中个体并没有进行学习。
1704422423
1704422424 我怀疑Harley的模型应用在全面树敌的博弈中比起应用在成对的竞争中来得更为合适,这个猜想基于以下一些理由:在一个成对的竞争中,正如Baldwin和Meese的大猪和小猪间的博弈,个体常常将与同一个对手进行多次博弈。如果对个体差异的识别是可能的,那么一个动物可以把与不同的对手竞争看成不同的博弈,并且形成针对不同对手的有差异的策略。因此,现在我们可以把种群博弈看成全面树敌的,或者是面对了一列随机的对手。以后(第45页),当我们发现了适合于这样的种群博弈的学习规则时,我将讨论都采取学习规则的两个动物在参与它们两者间的一系列竞争中所会发生的情况。
1704422425
1704422426 首先,我们必须清晰地区分两个概念:“演化稳定学习规则(ES learning rule)”和“演化稳定策略的学习规则(rule for ESS’s)”。
[ 上一页 ]  [ :1.704422377e+09 ]  [ 下一页 ]