本文目录一览:
- 1、博弈论里的囚徒困境怎么解决
- 2、怎样解决囚徒困境?
- 3、囚徒困境的生活例子是什么?
- 4、怎样走出囚徒困境?
- 5、“囚徒困境”有哪些破解方法?
- 6、如何摆脱“囚徒困境”
博弈论里的囚徒困境怎么解决
你没不知道囚徒困境的前提吗?
打破前提,就可以破解囚徒困境了!
很简单,不断重复!不断重复!一提到囚徒困境,很多人只知道,两个囚犯都会坦白,因为这样对个人收益最大!并且这种选择只有一次!两个人进行这次试验后,不会再相遇!就算我出卖你,那我也没什么后顾之忧!是吧?OK,那我们增加一个条件,进行100次这样的实验,而且在同样的两个人身上!哈哈,经典来了!
随着实验次数的增加,他们就会发现,合作对于他们而言,才是最好的选择!你出卖我,那么我以后就都出卖你!这是一种惩罚机制!同时,因为他们还要被继续试验下去,实验者会一直选择合作!而不是单方面的坦白!
怎样解决囚徒困境?
从所给条件,我们可以判断出该博弈为一个完全信息的静态重复博弈。(这肯定是个反复进行的重复博弈,因为单次的囚徒困境只会导致双方选择纳什均衡,即均不合作)
题设条件告诉我们彼此信息不透明也不能互相了解,我们将其理解为双方在每次决策之前是不能交流的,但是双方对于在上一轮次决策之后的得益是知道的,这就是完全信息,双方可以根据自己的选择和得益分析对方的选择及想法。
如果我们排除完全信息的假设,这道题应该是无解的。
既然双方知道博弈会进行多次,所以会觉得进行具有风险性的合作决策也无妨,当然这与博弈的次数也有关系。
当一方选择合作时,如果裁判告诉他这轮的得益是最好的得益,那么他便知道对方也选择了合作,如果裁判告诉他这轮他得到了比双方不合作时更差的收益,则他会明白对方选择的是不合作。
这个原理明白之后,我们就该讨论到底双方该采取怎样的策略原则去进行他们的策略选择从而使双方合作的机会增加。
答案是先人给出的,经过多年的计算机测试以及各种研究发现,
最优的策略叫做tit for tat,一报还一报策略。
即决策方在第一轮选择合作,其后每轮决策与对手的上轮决策相同,对手合作,我下轮就合作,对手背叛我下轮就背叛。
这样的报复性决策其实目的是为了警告对手,让对手趋于多选择合作。
说的比较粗略,例子也来不及举了,要睡觉了。
推荐你看冯诺依曼的《囚徒的困境》一书,其中对该问题有十分详细的叙述。
囚徒困境的生活例子是什么?
一、广告战。
两个公司互相竞争,两个公司的收益很大程度靠广告的影响,即一公司的广告更被顾客接受则会夺取对方的部分收入。
但若两家公司同时发出质量类似的广告,收入增加很少但广告成本增加很大。但若不提高广告质量,生意又会被对方抢走。
所以两个公司都会面临两个选择:
1、互相达成协议,减少广告的开支。(合作)
2、增加广告开支,设法提升广告的质量,压倒对方。(背叛)
若两家公司不信任对方,无法合作,背叛成为支配性策略时,两家公司将陷入广告战,而广告成本的增加损害了两者的收益,这就是陷入囚徒困境。而恰恰在现实中,两家互相竞争的公司要达成合作协议是较为困难的,多数都会陷入囚徒困境中。
二、碳排放。
这几年比较火的碳排放话题,降低碳排放可能会直接导致国家发展降速,但如果不降,温室效应会越来越严重,到时影响整个地球生态,结局更严重。
那么谁先带头把这个碳排放降下来?每个国家都会思考,如果我们降下来,其他国家不降怎么办呢?其他国家如果搭我们的便车,我这边降低了,他那边烧,那他财富增加得比我快得多,我这边成本高了很多怎么办?这时候该怎么样带领全世界的人走出囚徒困境,是各个国家领导人所要思考的问题了。
还有很多此类的例子,滴滴与快的在初期打价格战,不补贴就被淘汰,所以都在拼背后的资本,大家都知道是亏本,但为了抢夺市场都陷入了囚徒困境,与之一致的还有,美团-饿了么,ofo-摩拜单车,风口来的时候各类妖魔鬼怪。
然而与之不同的是,中国的各大快递公司,因为各个快递公司的老板基本都是亲戚或者是老乡,所以在发展过程中达成了一致,就没有这种恶性竞争,也就没有陷入囚徒困境。
如何破解囚徒困境:
囚徒困境,说到底是一个承诺问题、信任问题,双方承诺了,并彼此信任对方会信守承诺,那么困境也就解开了。信任,是破解囚徒困境的关键。
美国著名的行为分析及博弈论专家阿克塞尔罗德通过重复囚徒困境博弈计算机程序奥林匹克竞赛实验研究,提出了互惠策略:即一方首先以合作的姿态对待他者,之后便根据对方的反应而做出选择,如果对方合作,则合作;如果对方背叛或欺骗,则惩罚或威慑。所以在囚徒困境中,彼此守诺,双方得到的结果都是最好的。
怎样走出囚徒困境?
走出“囚徒困境”的唯一方法就是“重复博弈”。普遍化“囚徒困境”,就是两个人在一起合作,或共同从事一件事情。
“囚徒困境”有哪些破解方法?
由于囚徒困境是基于人性里最自私的一面而难以破解,因此有人曾经说自己找到了破解囚徒困境的方法,那就是学着信任别人。很明显,这是一个伪命题!正所谓害人之心不可有,防人之心不可无。
除却至亲之外,人们是很难完全相信他人的,更别说陌生人了。因此,“信任”这个方案根本就行不通。而《墨菲定律》中给出了真正的破解之道,那就是反复博弈!
反复博弈是相对于单次博弈来讲的,也就是说要“囚徒”双方在一次博弈之后,还要继续发生别的关系,进行再一次的博弈。
其实,日常生活中也有类似的场景,比如你和同事由于某种原因要去揭发领导的错误,你们虽然约定好了,但其实已经陷入了囚徒困境——虽然你们很清楚一起去揭发肯定会得到最大的利益和最好的结果,但是,你们无法完全信任对方,于是就会犹豫,最终可能都不会去这样做。
这时,你们就需要引入“重复博弈”来确保这个约定能够生效,比如你们可以威胁对方,或者说如果有人背叛将会被供出来。
如此一来,你们就注定还要继续发生别的关系,眼前的囚徒困境自然而然就被破解了。
囚徒困境其实在日常生活中比比皆是,我们一定不能局限于当前,而应该将单次博弈扩展,如此才能得到彼此的绝对信任,达成最好的结果。
如何摆脱“囚徒困境”
从所给条件,我们可以判断出该博弈为一个完全信息的静态重复博弈。(这肯定是个反复进行的重复博弈,因为单次的囚徒困境只会导致双方选择纳什均衡,即均不合作)
题设条件告诉我们彼此信息不透明也不能互相了解,我们将其理解为双方在每次决策之前是不能交流的,但是双方对于在上一轮次决策之后的得益是知道的,这就是完全信息,双方可以根据自己的选择和得益分析对方的选择及想法。
如果我们排除完全信息的假设,这道题应该是无解的。
既然双方知道博弈会进行多次,所以会觉得进行具有风险性的合作决策也无妨,当然这与博弈的次数也有关系。
当一方选择合作时,如果裁判告诉他这轮的得益是最好的得益,那么他便知道对方也选择了合作,如果裁判告诉他这轮他得到了比双方不合作时更差的收益,则他会明白对方选择的是不合作。
这个原理明白之后,我们就该讨论到底双方该采取怎样的策略原则去进行他们的策略选择从而使双方合作的机会增加。
答案是先人给出的,经过多年的计算机测试以及各种研究发现,
最优的策略叫做tit for tat,一报还一报策略。
即决策方在第一轮选择合作,其后每轮决策与对手的上轮决策相同,对手合作,我下轮就合作,对手背叛我下轮就背叛。
这样的报复性决策其实目的是为了警告对手,让对手趋于多选择合作。
说的比较粗略,例子也来不及举了,要睡觉了。
推荐你看冯诺依曼的《囚徒的困境》一书,其中对该问题有十分详细的叙述。