打字猴:1.701032482e+09
1701032482
1701032483 无知的博弈:有限信息下的生存智慧 [:1701029697]
1701032484 无知的博弈:有限信息下的生存智慧 不完美信息扩展式博弈
1701032485
1701032486 直观例子
1701032487
1701032488 博弈论的许多初学者搞不清楚不完全信息和不完美信息(inperfect information)的区别。我想这样简单地告诉大家:不完全信息是针对存在自然(Nature)或上帝(God)作为参与人进行选择的情况,不完美信息针对参与人的记忆而言(若完整地观察到先行动者的各个行动,则信息是完美的,否则信息就是不完美的)。以此而言,不完全信息一定是不完美的,因为自然的率先选择没能被观察到;但是不完美的信息不一定是不完全的,没有自然的选择而仅仅只是个人记忆力太差,也可以有不完美信息,但这样的情形并非信息不完全。
1701032489
1701032490 既然与记忆有关,不完美信息一定是针对动态博弈而言的。通常我们仍可以用博弈树来加以表示,这就是不完美信息的扩展式。如下的赌牌博弈,是一个典型的不完美信息博弈(图A-7)。
1701032491
1701032492 定义一个不完美信息动态博弈,需要有参与人、行动及其顺序、信息结构、赢利。图A-7中,参与人是运气(chance)、1和2。首先由运气来决定参与人1拿到一张大牌或小牌(概率各1/2),然后由1决定是直接摊牌还是追加赌注;若直接摊牌则博弈结束,1若拿大牌则赢得1单位(2就输掉1单位),否则参与人1输掉1单位(2就赢得1单位)。若1加注,则参与人2决定是埋牌还是开牌,若埋牌,无论如何都输掉1单位(1赢得1单位),若开牌则视1的牌大小而失去或赢得2单位。
1701032493
1701032494
1701032495
1701032496
1701032497 图A-7
1701032498
1701032499 博弈中的信息结构是,一旦运气选择了1的牌大小之后,1立即获得这个信息,但是2并不知道。所以对于2来说,他的信息是不完全的──但是在这里,不完全信息被转化为了不完美信息,就好像2的记忆力很不好,运气刚选择完1的牌大牌小,2马上就忘记了运气是如何选择的。
1701032500
1701032501 信息集
1701032502
1701032503 在不完美信息动态博弈中,信息结构主要是依赖于信息集来定义的。信息集中的元素是博弈的历史,如果一个信息集中只有一个博弈历史,那么这个信息集提供的信息就是完美的,如果一个信息集中有不止一个历史,那么这个信息集提供的信息就是不完美的──因为,参与人将不知道该信息集中究竟是哪个博弈历史发生了。
1701032504
1701032505 以图A-7为例,参与人1有两个信息集(在图中分别标记为I11和I12),其中I11={大},I12={小}。因此,参与人1的信息是完美的,一旦他到达某个信息集,他就可以清楚地知道究竟是“大”的历史还是“小”的历史发生了。参与人2只有一个信息集,即图中I2,这里I2={(大,加注),(小,加注)},即它包含了两个博弈历史,一个历史是(大,加注)[1],另一个历史是(小,加注)。[2]在图中,这两个历史以虚线联系表示它们处于同一个信息集(这是不完美信息博弈树的惯用做法)。此时,2的信息是不完美的,因为一旦博弈到达I2,参与人2只知道信息集I2发生了,但是却不知道I2中哪个历史发生了。或者说,他只观察到参与人1加注了,却不知道对方是拿着大牌加注,还是拿着小牌加注。
1701032506
1701032507 策略的定义
1701032508
1701032509 不完美信息动态博弈中,策略可以按如下方式定义:某个参与人的一条完整的(纯)策略,就是在其每个信息集上赋予一个行动而形成的行动计划。一定要牢记的是,这里的策略要求对参与人的每一个信息集赋予一个行动。
1701032510
1701032511 顺便提一句,由于策略是针对每个信息集赋予的一个行动,因此,若有几个博弈历史处于同一信息集,那么这几个历史中任意一个历史发生,轮到其行动的参与人可采取的行动都将是一样的。比如,在图A-7中,信息集I2中,两个历史点后的行动都是埋牌或开牌,我们绝不允许出现在一个历史点上可以选择埋牌或开牌,而在另一个历史点上只能选择开牌之类的情况。为什么要做这样的规定?这本不是一个难以理解的问题,但要说清楚也得费一番口舌,而且把话题又扯远了,姑且让读者自己去思考吧。这里只要求你记住这个规定就可以了。
1701032512
1701032513 回到策略的定义上来。图A-7的参与人1有几个(纯)策略?请一定记住,这里的策略要求对其每一个信息集赋予一个行动。现在参与人1有两个信息集,每个信息集都有两个可选行动,因此他的(纯)策略实际上有如下四个(见表A-1):
1701032514
1701032515
1701032516
1701032517
1701032518 图A-7中参与人2有几个策略?因为他只有唯一的信息集I2,该信息集上只可以选择埋牌或开牌,因此他的策略只有两个:埋牌或开牌。
1701032519
1701032520 混合策略和行为策略
1701032521
1701032522 不完美信息动态博弈中,参与人的混合策略就是为其纯策略集指定一个概率分布。比如对于参与人1,他可以以概率x选择其1#策略,以概率y选择2#策略,以概率z选择3#策略,以概率1-x-y-z选择4#策略。(读者可思考一下,这里为什么用1-x-y-z表示4#策略被采取的概率?)因此,我们可用向量(x,y,z)表示参与人1的混合策略(mixed strategy)。
1701032523
1701032524 行为策略(behavioral strategy)的定义与混合策略有所差别,它是指参与人在其每个信息集上随机选择该信息集所允许的行动。比如,参与人1的一个行为策略可以是:他在信息集I11以概率p选择加注,以概率1-p选择摊牌;在信息I12以概率q选择加注,以概率1-q选择摊牌。这个行为策略可以向量(p,q)表示。
1701032525
1701032526 在有限的不完美信息博弈中,混合策略和行为策略是等价的,也就是说,它们只不过是同一策略的不同表现方式而已。但是,我们发现在分析中以行为策略代替混合策略是有好处的,因为前者可以节省一些变量。比如,参与人1的混合策略需要三维向量来表示,而其行为策略只需要二维向量就可表示。另外,一旦考虑到有限信息动态博弈中也需要用到逆推的思想,那么利用行为策略就可以更方便我们检验策略均衡中的信念一致性(后面会讲到,信念一致性是序贯均衡的必要条件)。
1701032527
1701032528 信念的修正
1701032529
1701032530 不完美信息动态博弈中,博弈的行动常常会蕴涵着一些信号,而参与人也就必须实时根据获得的信息更新自己的信念。
1701032531
[ 上一页 ]  [ :1.701032482e+09 ]  [ 下一页 ]