有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯,由地方检察官分别和每个人单独谈话。检察官说:“由于你们的偷盗罪已有确凿的证据,所以可以判你们一年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你三个月的监禁,但你的同伙要被判十年刑。如果你拒不坦白,而被同伙检举,那么你就将被判十年刑,他只判三个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判五年刑。”
囚徒困境(逗号前表示A的损失,逗号后表示B的损失) |
B |
||
坦白 |
抵赖 |
||
A |
坦白 |
-5,-5 |
0,-10 |
抵赖 |
-10,0 |
-1,-1 |
斯卡尔菲丝和那库尔斯该怎么办呢?他们面临着两难的选择——坦白或抵赖。
显然最好的策略是双方都抵赖,结果是大家都只被判一年。
但是由于两人处于隔离的情况下无法串供,所以,假设每一个人都是从利己的目的出发,他们选择坦白交代是最佳策略。因为坦白交代可以期望得到很短的监禁——三个月,但前提是同伙抵赖,显然要比自己抵赖而坐十年牢好。这是种损人利己的策略。
不仅如此,坦白还有更多的好处。如果对方坦白了而自己抵赖了,那自己就得坐十年牢。太不划算了!因此,在这种情况下还是应该选择坦白交代,即使两人同时坦白,至多也只判五年,总比被判十年好吧。所以,两人合理的选择是坦白,原本对双方都有利的策略(抵赖)和结局(被判一年刑)没有出现。
假如他们在接受审问之前有机会见面好好谈清楚,那该有多好,因为彼此一定会同意拒不认罪。
不过,接下来他们很快就会意识到,无论如何,那样一个协议都不见得管用。一旦他们被分开,审问开始,每个人内心深处那种企图通过出卖别人而换取一个更好的判决的想法就会变得非常强烈。
这么一来,他们最终还是逃脱不了被判刑的命运,这就是博弈论里经典的囚徒困境的例子,又称之为囚犯的两难选择。
虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。
囚徒困境假定每个参与者都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可以完全按照自己意愿选择策略。
以全体利益而言,如果两个参与者都保持沉默,两人都只会被判刑一年,总体利益更高,结果也比两人背叛对方、判刑五年的情况好。但根据以上假设,两人均为理性个人,且只追求个人利益。均衡状况会是两个囚徒都选择背叛,结果总体利益较合作为低。这就是困境所在。
它其中的一个目的,是揭示亚当斯密“”(市场总是有效的)理论的局限性:个体追求利益最大化,并不一定带来全体利益最大化!
囚徒困境的主旨为,囚徒们虽然彼此合作,坚不吐实,可为全体带来最佳利益,但在信息不明的情况下,因为出卖同伙可为自己带来利益。
单次发生的囚徒困境,和多次重复的囚徒困境结果不会一样。在重复的囚徒困境中,博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时,合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁克服,从而可能导向一个较好的、合作的结果。
其实,破解囚徒困境的解决方法应该在困境本身之外。最重要的条件是,策略必须“友善”,这就是说,不要在对手背叛之前先背叛。然后是要学会宽恕,如果对手不继续背叛,他们会一再退却到合作,这就会使两人同时走出困境,实现利益最优化。
有话要说...