打字猴:1.701038581e+09

1701038581 纳什均衡与博弈论：纳什博弈论及对自然法则的研究 [:1701036556]

1701038582 纳什均衡与博弈论：纳什博弈论及对自然法则的研究附录　纳什均衡计算

1701038583

1701038584 考虑一下第二章中提到的简单博弈，爱丽丝和鲍勃竞争来看看鲍勃该还给爱丽丝多少债。这是一个零和博弈；爱丽丝得到的正是鲍勃所失去的，反之亦然。在这个博弈矩阵里，收益是鲍勃付给爱丽丝的总和，因此鲍勃在每种条件下得到的“收益”是所显示的数字的负值。

1701038585

1701038586

1701038587

1701038588

1701038589 想要计算纳什均衡，你必须找到一种对每个玩家来说，当其他人也选择最佳混合策略时，他的期望收益最高的混合策略。在这个例子中，爱丽丝选择巴士的概率是p，步行的概率为1－p（因为概率加起来必须等于1）。鲍勃选择巴士的概率为q，而步行的概率为1－q。

1701038590

1701038591 爱丽丝可以计算她选择巴士或步行的“期望收益”，方法如下。她选择巴士的期望收益是以下的总和：

1701038592

1701038593 当鲍勃选择巴士时她选择巴士的收益，乘以鲍勃会选择巴士的概率，或表示为3×q

1701038594

1701038595 加上

1701038596

1701038597 当鲍勃选择步行时她选择巴士的收益，乘以鲍勃选择步行的概率，或表示为6×（1－q）

1701038598

1701038599 她选择步行的期望收益是以下的总和：

1701038600

1701038601 当鲍勃选择巴士时她选择步行的收益，乘以鲍勃会选择巴士的概率，或表示为5×q

1701038602

1701038603 加上

1701038604

1701038605 当鲍勃选择步行时她选择步行的收益，乘以鲍勃选择步行的概率，或表示为4×（1－q）

1701038606

1701038607 加起来，

1701038608

1701038609 爱丽丝选择巴士的期望收益＝3q＋6（1－q）

1701038610

1701038611 爱丽丝选择步行的期望收益＝5q＋4（1－q）

1701038612

1701038613 用相似的推理来计算鲍勃的期望收益可以得到：

1701038614

1701038615 鲍勃选择巴士的期望收益＝-3p＋［-5（1－p）］

1701038616

1701038617 鲍勃选择步行的期望收益＝-6p＋［-4（1－p）］

1701038618

1701038619 现在，爱丽丝在这个游戏中的总期望收益是她选择巴士的概率乘以她选择巴士的期望收益，加上她选择步行的概率乘以她选择步行的期望收益。对鲍勃来说也是相似的。要达到纳什均衡，他们做两种选择的概率必须使得对这两个概率的任何改变都无法带来更多收益。换句话说，对每种选择的期望收益（巴士或步行）必须是相等的（如果对一种选择的期望收益比另一种大，那么多做这种选择就会更好一些，那样，就增加了做这种选择的概率）。

1701038620

1701038621 对鲍勃来说，他不该改变策略如果

1701038622

1701038623 -3p＋［-5（1－p）］＝-6p＋［-4（1－p）］

1701038624

1701038625 运用一些基础的代数运算，方程可以被表示为：

1701038626

1701038627 -3p－5＋5p＝-6p－4＋4p

1701038628

1701038629 或者

1701038630

[ 上一页 ] [ :1.701038581e+09 ] [ 下一页 ]