1701038582
纳什均衡与博弈论:纳什博弈论及对自然法则的研究 附录 纳什均衡计算
1701038583
1701038584
考虑一下第二章中提到的简单博弈,爱丽丝和鲍勃竞争来看看鲍勃该还给爱丽丝多少债。这是一个零和博弈;爱丽丝得到的正是鲍勃所失去的,反之亦然。在这个博弈矩阵里,收益是鲍勃付给爱丽丝的总和,因此鲍勃在每种条件下得到的“收益”是所显示的数字的负值。
1701038585
1701038586
1701038587
1701038588
1701038589
想要计算纳什均衡,你必须找到一种对每个玩家来说,当其他人也选择最佳混合策略时,他的期望收益最高的混合策略。在这个例子中,爱丽丝选择巴士的概率是p,步行的概率为1-p(因为概率加起来必须等于1)。鲍勃选择巴士的概率为q,而步行的概率为1-q。
1701038590
1701038591
爱丽丝可以计算她选择巴士或步行的“期望收益”,方法如下。她选择巴士的期望收益是以下的总和:
1701038592
1701038593
当鲍勃选择巴士时她选择巴士的收益,乘以鲍勃会选择巴士的概率,或表示为3×q
1701038594
1701038595
加上
1701038596
1701038597
当鲍勃选择步行时她选择巴士的收益,乘以鲍勃选择步行的概率,或表示为6×(1-q)
1701038598
1701038599
她选择步行的期望收益是以下的总和:
1701038600
1701038601
当鲍勃选择巴士时她选择步行的收益,乘以鲍勃会选择巴士的概率,或表示为5×q
1701038602
1701038603
加上
1701038604
1701038605
当鲍勃选择步行时她选择步行的收益,乘以鲍勃选择步行的概率,或表示为4×(1-q)
1701038606
1701038607
加起来,
1701038608
1701038609
爱丽丝选择巴士的期望收益=3q+6(1-q)
1701038610
1701038611
爱丽丝选择步行的期望收益=5q+4(1-q)
1701038612
1701038613
用相似的推理来计算鲍勃的期望收益可以得到:
1701038614
1701038615
鲍勃选择巴士的期望收益=-3p+[-5(1-p)]
1701038616
1701038617
鲍勃选择步行的期望收益=-6p+[-4(1-p)]
1701038618
1701038619
现在,爱丽丝在这个游戏中的总期望收益是她选择巴士的概率乘以她选择巴士的期望收益,加上她选择步行的概率乘以她选择步行的期望收益。对鲍勃来说也是相似的。要达到纳什均衡,他们做两种选择的概率必须使得对这两个概率的任何改变都无法带来更多收益。换句话说,对每种选择的期望收益(巴士或步行)必须是相等的(如果对一种选择的期望收益比另一种大,那么多做这种选择就会更好一些,那样,就增加了做这种选择的概率)。
1701038620
1701038621
对鲍勃来说,他不该改变策略如果
1701038622
1701038623
-3p+[-5(1-p)]=-6p+[-4(1-p)]
1701038624
1701038625
运用一些基础的代数运算,方程可以被表示为:
1701038626
1701038627
-3p-5+5p=-6p-4+4p
1701038628
1701038629
或者
1701038630
[
上一页 ]
[ :1.701038581e+09 ]
[
下一页 ]