博弈论(2)—纳什均衡
如果想观看相关视频可以在西瓜视频(账号zidea)或者哔哩哔哩(账号zidea2015)找到我发布视频解说,注意头像和使用头像一致。
又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。 在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作 最佳应对 。 如果两个博弈的局中人的策略组合分别构成各自的 最佳应对 ,那么这个组合就被定义为纳什均衡。
在给出纳什均衡解释前,我们先得把一个概念说清楚最佳应对。
纳什均衡是刻画局势,如果一个局势下,每个局中人的策略都是相对其他局中人当前策略的最佳对应,则称该局势是一个 纳什均衡
如果一个局中人的某个策略对其他局中人的任何策略都是最佳对应,那么这个策略就是该局中人的 占优策略
在纳什均衡下,局中人没有人会想要改变改变,因为谁改变谁就可能在博弈中处于不利地位。
首先我们来看一看在囚徒困境中纳什均衡,对于囚徒困境的问题的纳什均衡是 双方都坦白 ,属于占优策略
其实不管局中人 2 是抗拒还是坦白,对于局中人的最佳应对都是坦白。从而可以看出纳什均衡点并不一定是整体的最优解。有人可能会说那么为什么不是对于两个人都有利的(抗拒,抗拒)呢,这里最佳应对是无论对手进行策略对自己都是最佳策略,在最后 maxmin 时候就更会了解为什么他们会做出坦白选择,这是一个规避风险的策略。
<img src="./image_003/005.jpg">
这就是纯策略纳什均衡,混合策略下纳什均衡,女生看舞蹈概率 p 看足球的概率就是 1 - p,男生看舞蹈概率 q 看足球的概率就是 1 - q
妻子随机性的目的: 使丈夫无机可乘,不管丈夫选择哪个策略,其期望收益均相同
当丈夫给出概率分布不会让妻子在看足球和看,关于
以我对丈夫了解他更喜欢看足球,
局中人 1 的策略选择分布记为 , 局中人 2 的策略选择分布记为 。假设局中人 1 的策略分布不变,局中人 2 策略选择的效用为
剪刀—石头—布的混合 纳什均衡态
任何有限博弈(参与人与策略数目均为有限)都至少存在一个纳什均衡,这个均衡可能是纯策略纳什均衡(例如剪刀-石头-布),也可能是混合策略均衡,纳什均衡的多重性(例如性别之战)