囚徒困境与纳什均衡

大众日报 2020-04-01 17:13 大字

“囚徒困境”反映的是个人理性与集体理性之间的矛盾,核心往往在于合作双方缺乏互信基础与缺乏交流,且没有规则的制约,所以才导致合作无法进行。

□ 王琛 胡洋洋

疫情之下,国际原油市场贸易停摆,油价开启暴跌模式,由此也导致股市动荡不休。这一“黑天鹅”事件源于沙特阿拉伯和俄罗斯两大石油生产国之间的博弈,双方都不愿意减产以提振油价,反而大打价格战,抢占市场份额,谈判也陷入僵局,由此上演了一出“囚徒困境”。

“囚徒困境”是一种带有博弈性质的心理活动,当行为主体面临选择的两难境地时,往往会趋向于考虑相对利己但是不利于集体最大利益的方式,反映出的是个人最佳选择并非团体最佳选择。

顾名思义,“囚徒困境”的名称来自于一个经典案例。警方逮捕了甲乙两名犯罪嫌疑人,但却缺乏足够的证据指控二人犯罪,于是警察分开囚禁两人,并向二人提供了几个相同的选择:若一人坦白罪行而对方保持沉默,坦白者将立即释放,沉默者将获刑10年;若二人都保持沉默,则都获刑1年;若二人都坦白罪行,则都获刑2年。

以甲为例,在他的心理博弈中会产生这样的判断:假如乙选择坦白,则自己选择坦白则获刑2年,选择沉默则获刑10年,此时坦白是最佳选择;假如乙选择沉默,则自己选择坦白则会立即释放,选择沉默则获刑1年,此时坦白仍然是最佳选项。所以,不论乙怎样,对甲来说选择坦白都是最好的策略,这对乙来说也同样如此。这样一来,警察将会毫无悬念地得到两个囚徒的坦白。

从案例来看,明明两人都沉默是最优策略,但当他们因缺乏信任而只能从自身出发考虑问题的时候,坦白反而成了最优策略。

回到两大石油生产国的博弈中,与甲乙两囚徒的处境类似,明明减产以提振油价稳定市场才是全局最佳策略,但危机之下,两国却只能“自扫门前雪”。在这场“游戏”中,双方都陷入了困境,明明有“双赢”的可能,但结果偏偏是“损人不利己”。

这种状态,在博弈论中即是“纳什均衡”,其得名于著名诺贝尔经济学奖获得者——约翰·纳什。“纳什均衡”是一个稳定的状态,系统中包含多个互相影响的参与者,在这个状态下,系统中任何人在其他人都保持策略不变时,改变策略都无法获取任何好处。

在经济与生活中,“囚徒困境”的影响数不胜数。很多人都会有“免费搭车”的心理,比如走廊里的灯泡坏了,大家都在忍受黑暗的痛苦,明明花钱换上灯泡就能解决问题,但人们各自的优势策略都是等别人花钱而自己“搭车”,当大家都这样想时,“光明”也就永远不会到来;还有现在一些商家间的价格战、广告战等不良竞争,由于各方无法完全信任对方,都担心自己被设计而陷入困境,所以即使各方签订了合作协议,最后仍然不免失信于人。

“囚徒困境”反映的是个人理性与集体理性之间的矛盾,核心往往在于合作双方缺乏互信基础与缺乏交流,且没有规则的制约,所以才导致合作无法进行。在这里特别要指出的是,只有当事件表现为单次“囚徒困境”,比如像甲乙两囚徒间的“一锤子买卖”时,事情才往往面临无解局面。若假定各方的合作是长期的话,那么各方就会从长远利益来综合考量,只要其中一方表现出友善与诚意,还是有合作成功的可能。

新闻推荐

全球 新冠肺炎确诊病例超过80万 中国专家组抵达委内瑞拉

3月30日,在委内瑞拉首都加拉加斯西蒙·玻利瓦尔国际机场,中国抗疫医疗专家组全体成员走下专机。(新华发萨尔戈多摄)全球数据...

 
相关推荐