打字猴:1.704422536e+09
1704422536
1704422537 图14 Milinsky(1979)刺鱼试验的结果。●表示11次实验的平均值,每次实验有6条刺鱼;图中的短横线表示了标准差。实心箭头表示开始喂食的时刻;空心箭头表示变换两端喂食频率的时刻;虚线表示根据“理想自由分布”预测的位于初始较低收益端的刺鱼数量。
1704422538
1704422539 Harley假设这些鱼具有RPS学习规则,模拟了Milinsky的刺鱼试验并得到了极其相似的结果。图15表示了对实验序列进一步的模拟,表明了剩余值相对于期望回报变化的效应。当剩余值很小时(如图15b),动物个体会非常快地把位置固定于一端或另一端;当剩余值较大时(如图15c),动物个体将保持较长时间的探索与尝试。但是,在所有的情形下,种群的平均值总是逐渐地向ESS靠拢。这幅图阐明了一种预测,这种预测可以在如同Milinsky那样设计的刺鱼实验中得到检验。饥饿刺鱼的行为必然如图15b所示,而喂饱刺鱼的行为必然如图15c所示。虽然,Milinsky未曾检验过他的预测,但是仍然存在与其预测结果相吻合的数据(Heller和Milinsky,1979)。
1704422540
1704422541 (4)同时发生的可变间距博弈。这个博弈一般在鸽子与实验心理学家之间发生。和两个武装强盗的博弈一样,存在两个可能的策略选择,比如“左端”策略和“右端”策略。每一个策略在每一次试验中,递送一个食物的概率是固定不变的。但是如果在任何试验中动物都选择“左端”策略,右端仍将以其固定的概率递送食物,虽然这一食物对动物而言,既难以获得又不可见。但食物将保存在那里,并在动物下一次选择“右端”策略时获得该食物。并且一旦食物在某一端出现,将没有更多的食物会递送到这一端,直到这些食物被吃掉为止。
1704422542
1704422543
1704422544
1704422545
1704422546
1704422547
1704422548
1704422549
1704422550
1704422551
1704422552 图15 使用RPS学习规则的种群竞食博弈的模拟。实现表示个体行为的平均值;虚线表示种群行为的平均值;☆表示ESS状态。期望回报率由剩余值给出,分别为(a)中等、(b)较小、(c)较大(After Harley,1981)。
1704422553
1704422554 这是一个频率依赖类型的个体博弈,尝试这些策略的时间越长,所获回报的概率也就越高。如果补充食物的概率为p1和p2,且数值较小,那么很容易得到ESS,那就是以概率p1/(p1+p2)采取策略1。事实上,动物的确达致了ESS状态,且它们的行为与选择策略的概率与其所获得回报成正比这一理论依据相一致(Heyman,1979)。正如所预料的那样,计算机模拟也显示RPS学习规则能够使博弈达致ESS状态。这一点需要与两个武装强盗博弈中的“概率匹配(probability matching)”区别开来,“概率匹配”就是说选择某个武器的概率与到目前为止的选择该武器所带来的回报成正比。这显然是非效率的,而且也不会有动物采取这样的策略。
1704422555
1704422556 计算机模拟显示RPS学习规则很好地说明了在很大范围内存在的学习情形下的动物行为,包括种群博弈、频率依赖的个体博弈以及频率独立的个体博弈。但是,仍存在另外两个需要被考虑的内容,那就是非对称博弈和面对同一对手的重复博弈。Harley在其文章中没有报告这种竞争的模拟行为,但是在之后展开了对它们的研究(私人交流)。
1704422557
1704422558 首先,考虑一个进行鹰鸽博弈的种群,个体面对的对手是一个随机序列,并带有一个附加假设,每一场竞争都是非对称的,参与者时而处于A角色,时而处于B角色。参与这类博弈并具有RPS学习规则的动物构成的种群的模拟行为表示动物学习并取得了ESS,即处于角色A,则采取鹰策略;处于角色B,则采取鸽策略(或者,由于回报和所处角色并不相关,学习效应可能等概率地导致所有动物都采取与上述相反的策略)。
1704422559
1704422560 如果一个动物与每一个对手都进行过多次的博弈,假设个体识别是可能的,那么动物便会在不同的博弈场合中对不同的对手进行有区别的对待。对单个对手的一系列重复博弈的模拟显示,在一段时间之后,其中一个竞争者总是选择鹰策略,而其对手则一直选择鸽策略。所以在种群的情况下,一个参与竞争的动物个体对某些对手将采取鹰策略,而对另一些对手则采取鸽策略。在这样的情形下,对每一对对手,一个采取鹰策略而另一个采取鸽策略,那么相互搏斗的竞争场合会变得非常罕见。
1704422561
1704422562 但仍遗留了一个疑难的问题:在证明ES学习规则是ESS学习规则的必要条件中,我们假设博弈的回报对应于适应度的变化。如果我们愿意,我们便可将此用定义的形式予以明确,那就是,我们可以把一个特定行动的回报定义为由这个行动导致的期望后代数量的变化。于是我们留下的问题便是,参与者如何将某个行动的直接结果转化为适应度单位?这等于问,在图11(第62页)的模型中,某些化学物质的合成是怎样使其和适应度的变化成正比?在普通的演化博弈理论中,不会出现这样的难题,正是适应度的变化导致了在种群中表现型的相对频率的变化。与之相反的是,一个会学习的动物知道的是它是否处于饥饿,口渴或疼痛的状态,而不知道这些状态可能会对其未来的生育产生影响。
1704422563
1704422564 有两个一般性的结论如下所述。第一,上述难题并不是学习行为所特有的。如果某种动物的行为适合于其生存,那么不论这样的行为是学习而得还是本能所致,根据从适应度角度所言的特定种类行为的效用(McFarland,1974),都必然存在一个从外部感觉向内在动机状态的合适转换;第二点便是必然存在有利于那些能够最成功地运用这样的转换的动物的自然选择机制。一个能够执行“正确”行动的动物——从最大化适应度角度而言的正确——当同时经历饥饿、口渴和性冲动时,那么根据定义,它将留下最多的后代。当然,并不存在这样理想的转换系统,无论在什么情形下,能够一直保证正确的行为:飞蛾扑火、人类吸食海洛因而上瘾以及芦笛莺饲养杜鹃幼鸟。当所有回报都用同一货币单位去衡量,我们可以期望获得学术理论和实际观测的最好拟合,比如,如果在竞食理论中我们忽略掠夺行为的风险,就属于这种情形。
1704422565
1704422566
1704422567
1704422568
1704422569 演化与博弈论 [:1704421349]
1704422570 演化与博弈论 第六章 混合策略Ⅰ——对机制的分类
1704422571
1704422572 演化博弈论中最有把握的预测之一便是,在对称博弈中,只要竞争的潜在成本相比竞争胜利所带来的好处来得大,则混合ESS的出现总在预期之中。对这个预期是否能够被验证,且同样重要的是,在我们可以将特定的博弈情形合理地解释为一个混合策略之前,我们必须知道些什么呢?这些问题决不是那么容易回答的,这主要是因为在产生稳定的混合策略的过程中存在很多种不同的方式,在这些方式中,遗传演化的过程以及个体学习的效应能够相互作用。
1704422573
1704422574 在这一章中,我将用一些具体例子的帮助讨论种群产生可变行为的一些不同方式。这一讨论将作为后文对机制分类的准备,这些机制都隐藏在这些变异行为的背后,第79页的表10给出了具体的分类情况。
1704422575
1704422576 在一个混合ESS中,对不同行动的回报是相等的,而在形如“在情形1下采取A策略,在情形2下采取B策略”的一个纯ESS中,一些参与竞争的个体被迫尽力对付不利形势。有一个例子很好地解释了混合策略和纯策略之间的区别。Rohwer(1977)在研究冬季哈里斯麻雀种群时发现,麻雀羽毛的颜色从黑色变为白色,同时这一变化与雀群中的侵略性与优势(显性)等级相关,且较深颜色的麻雀占据越来越大的优势。根据鹰鸽博弈的逻辑,这可以被解释为一个混合ESS。但是同样可以这样来解释:或许是由于环境的原因,个头较小的麻雀采取鸽策略并且在秋季换毛时期开始生长相应的白色羽毛,这是因为如果它们试图变得具有侵略性,它们将在相互进攻的竞争中落败。这样我们可能会观察到一个混合ESS,但同样地,麻雀也可能是实施着纯策略:“如果个头较大,则采取鹰策略;如果个头较小,则采取鸽策略”。
1704422577
1704422578 我将在下一章中回到哈里斯麻雀这个具体的例子中来,并且将探索哪一种解释更好地拟合了事实情况。而在这里,重要的一点便是,每当遇到动物行为的可变模式时,我们必须问哪一类解释最为合适:是混合ESS还是由于动物发现自己所处的不同境遇而作出不同行为的纯策略?主要的判定标准在于:第一,在一个混合ESS中,不同的行为将具有同样的回报;第二,回报必须在一种正确的方式下是频率依赖的,即随着频率的下降适应度得到提高。
1704422579
1704422580 或许最为清晰地阐明这一类型的基于不同境遇的不同行为的纯策略的例子发生在个体在不同的年龄具有不同行为的事实。例如,在英国的河流中,有75%的雄性鲑鱼在移栖大海之前性功能就已经成熟(Jones,1969)。成熟鲑鱼聚集一起准备成对交配,当雌性开始产卵时,雄性便射出具有活力的精子。似乎有一些鱼卵是由那些早熟的雄性鲑鱼受精完成的,虽然还没有对这类受精卵占总体的比例做出估计,年轻的雄性个体通过采取不同于当它们成熟时将采取的策略而试图使卵受精的行为模式在脊椎动物中非常普遍。重要的是,这可以看作是一个纯策略:年轻的雄性个体采取偷偷摸摸地使卵受精的策略,因为此时它们采取成熟雄性的策略是不会成功的。然而,还存在另外两种可能性:
1704422581
1704422582 (1)这个早熟的寄生策略可能只是局限于一些个体。为什么在英国鲑鱼中,只有75%的雄性能够成功早熟?早熟行为的成功可能性似乎随着年轻随体(satellites)的增加而减少。所以,提早成熟存在一个成本的话,那么就可能存在一个频率依赖的均衡:即一个ESS。在鲑鱼的例子中这纯粹是一种推测,但在本书第52页所描述的一个例子中,存在一个ESS的解释将被更有力地支持。
1704422583
1704422584 (2)即使当所有的个体在年幼时采取一种策略而在成熟时采取另一个策略,我们仍旧视为是一个ESS。这样我们设想某一种鸟,其个体处于相互竞争中——比如竞争地盘——在这一情景中,对不同行为的支付,如采取鹰或鸽的行为,将会导致混合演化稳定性策略。一种可能性是这一种鸟将达致遗传多态。另一种可能性是,年龄小于n年的年幼的鸟将采取一种策略,而年龄在n年及以上的鸟将采取另一种策略。自然选择将一直作用到n,直到回报变得相等为止,作为结果的生命历史策略将成为一个ESS。
1704422585
[ 上一页 ]  [ :1.704422536e+09 ]  [ 下一页 ]