警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人有罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
若二人都保持沉默(相关术语称互相“合作”),因为警方没有证据,故二人同样判监半年。
若二人都互相检举(互相“背叛”),则二人同样判监2年。支付矩阵见下表:
两个嫌疑犯面临艰难的选择,若对方沉默、我背叛,那么我获释,所以我会选择背叛。若对方背叛指控我,我也要指控对方,这样只获得两年的刑期,背叛的结果是要么释放,要么获得两年刑期。二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。
因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳,这种结果叫做帕累托最优,在不损害他人利益的情况下,使得自己的利益最大化。
但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判监均比合作为高,总体利益较合作为低。这就是“困境”所在。在这种情况下没有一个参与者可以通过独自行动而增加收益,例如,如果甲独自改变策略进行合作,乙仍然是背叛,那么他的收益会从-2下降到-10,这与他的初衷增加收益相悖,所以他不会改变策略。这就是经典的“囚徒困境”。
在社会交往中,我们会面临各种各样的合作,例如公司与公司的合作,公司内部的团队合作,以及朋友之间的合作,都有可能出现背叛,我们采用什么策略才合适呢?下面有几种策略可供选择。
冷酷策略:只要对方合作,我就合作,但如果对方背叛了一次,我就会永久地采取背叛行为。这种策略不给背叛者一次机会,对背叛行为零容忍。
以牙还牙:总是怀着对对方充满信任的态度开始博弈,之后便模仿对方上一步的动作,只有当对方背叛时,才会采取背叛行为。如果博弈双方都采取同样的“以牙还牙”策略,就会引发永无止境的报复行为。这是因为“以牙还牙”策略只会对背叛者进行反击,因此一旦出现干扰信号或疏忽,就可能令“以牙还牙”的行为陷入恶性循环。
一牙还两牙:“以牙还牙”策略的变种。除非对方接连两次采取背叛行为,否则就一直保持合作态度。这种策略可以宽恕对方一次背叛,大家还可以再合作下去。
永远背叛:不论对手策略如何,总是采取背叛行为。
无条件合作:不论对手策略如何,总是与其进行合作。
宽宏以牙还牙:“以牙还牙”策略的变种。永远以合作的态度来回报对方的合作。当遇到背叛时,以某一概率(根据实际情况给出概率)与对方进行合作。
赢定输移:如果我们在上一轮中都采取合作行为,那么我会再次选择合作。如果我们在上一轮中都采取背叛行为,那么我会以某一概率与对方合作。如果我们在上一轮中采取了不同的行为,那么我会选择背叛。
在不同的情景中,游戏参与者往往会根据实际情况采用不同的策略。如果是一次性合作,参与者受到短期利益的诱惑,可能会选择背叛,但如果是长期博弈,合作会更有利于双方。
例如上面故事中两个嫌疑人刑满出狱后,再次被抓,重复以上博弈,那么,甲乙会考虑做出背叛行为后可能遭到的报复,所以,最有可能进行合作,在无数次重复博弈之后,他们的纳什均衡会趋向于帕累托最优。
在持续的“重复囚徒困境”中,要想获得最大的收益,建议遵循以下四个简单的建议:
1.不要嫉妒。因为在一个非零和博弈的世界里,你没有必要吹灭别人的灯,来让自己的灯更亮。其他人的成功可以成为你自己成功的前提。
2.不要首先背叛。首先背叛可能会遭到更大的报复。
3.对合作与背叛都要给以回报。对于合作我们要给予回报。对于背叛我们可以根据实际情况采用以牙还牙,或者一牙还二牙,而不是一味的宽恕,太多的宽恕会助长背叛者的气焰,欺负老实人。
4.不要耍小聪明。不要以为对方“傻”,不要存在侥幸心理。
以上四大建议是罗伯特·阿克塞尔罗德在《合作的进化》一书中提到的,它还提出了非常重要的理论:“合作的基础不是真正的信任,而是关系的持续性。”当条件具备了,对策者能通过对双方有利的可能性的试错学习、通过对其他成功者的模仿或通过选择成功的策略剔除不成功的策略的盲目过程来达到相互的合作。从长远来说,双方建立稳定的合作模式的条件是否成熟比双方是否相互信任来得重要。
一、合作的进化意义1、生物层面:生命起源于合作。
《超级合作者》作者马丁·诺瓦克是哈佛大学数学与生物学教授,进化动力学中心主任,与著名生物学家理查德·道金斯和爱德华·威尔逊齐名的科学巨星。他是继达尔文之后为进化论作出突破性贡献的第一人。诺瓦克用数学和博弈论模型作为研究的工具,将整个生物世界的合作作为研究对象,为进化论填上了浓墨重彩的一笔。
达尔文的进化论在科学史上具有划时代的意义,其基本内涵可以概括为两句话:遗传变异;适者生存。这是进化论的底层逻辑,在100多年的时间里已经得到了实证,目前没有被证伪。马丁·诺瓦克及其团队在大量研究基础上改写了达尔文的理论,他们认为,遗传变异、竞争选择和合作共赢共同构成了生物进化发展的三大动力之轮,三者缺一不可。一味地强调竞争偏离了世界的真实。他的理论已经得到了社会主流科学的认同,丰富了达尔文的进化论思想。
马丁·诺瓦克在《超级合作者》一书中写道,拥有生命、呼吸的生物,并不需要某种生命的推动力或者生命精华来完成进化,而只需要分子之间保持非凡的合作水平。其中一些分子源于原始地球的大气,在紫外线和其他辐射的作用下,分解、融合,形成了简单的有机分子,譬如碳氢化合物。
闪电所提供的高能量,能够进一步增加分子的种类。碳氢化合物为单氨基酸(连在一起形成蛋白质)和碳水化合物(单糖)等更为复杂的有机物提供了给养。这些分子以某种方式结成形体,构成了细胞的祖先,它们有着确定的形状、统一性和各种属性,带有生命的特征。
生机勃发的生命体之中的细胞,通过DNA复制来进行生命传承。除了少数几种病毒之外,如今地球上的所有生命都要依靠DNA来存储生息繁衍所需要的信息。但是,最初的生命游戏之中最有可能出现的玩家,却是与此相关的遗传物质——RNA分子。这种分子比DNA更富有灵活性,因为它既能将信息传递给子孙后代,又能对化学反应起到催化和加速的作用,非常便捷有效。而且,RNA还带有DNA在生物体中的所有关键职责,包括人类也是如此。
1986年,哈佛大学诺贝尔奖得主沃尔特·吉尔伯特提出了“RNA世界”的说法,他认为在蛋白质加入到生命这场游戏之前,是RNA以某种方式主宰了生命的起源。
我们每天的日常行为,从吃饭、喝水到说话,都依赖于身体中大量细胞的完美协作。从眼睛中的视觉细胞,到下颚处的肌肉细胞,再到大脑中负责传输电脉冲的神经细胞,等等。
为了维持这些协调性活动,我们的身体必须拥有自我生长和修复的能力。我们的器官需要不停地进行细胞更替。每天,我们都要产生几千亿个新的血细胞。皮肤的外表层也需要不断地替换,这样一个人体中体积最大的器官,是处于不断的修复状态之中的。
同样,肺衬里、肠以及女性乳房的乳导管细胞,也处于不断更替之中。而当这些结构之中的细胞决定散伙的时候,就会在细胞层面出现合作的瓦解。当细胞突变对其运行程序作出更改之时,以癌症为表现形式的反叛行为就会出现。从某种意义上说,生命就是细胞之间的精密合作,生命体的死亡就是细胞之间的不合作结果。
从生命进化的维度,我们对于合作有了全新的理解,此前,人们所公认的基本进化原则只有两项——突变和选择,前者产生基因的多样化,后者选出对环境最适应的个体。如果从更具创造性的视角来看待进化,我们必须将“合作”接受为第三条进化原则。从基因到有机体,从语言到复杂的社会行为。
合作才是进化的总设计师
2、文化层面:语言成就了人类
文化是什么?文化就是一套人类生存体系图谱。文化的传承是通过语言和文字来完成。
想想自然界,为什么只有人类进化出了语言?从进化的角度讲,只有语言带来的收益高于学习成本时,语言才能保留。自然界的不同物种,平时的沟通都非常简单,无外乎就是前方有敌人,快点逃跑,我要交配等,只需要喊几声就可以解决。而人类作为社会性动物,需要大量的合作,这时候沟通就不能通过喊几声解决,而是需要更复杂的表述。这时语言就产生了,全世界共有6000多种语言,虽然很多语言并没有文字,但并不影响复杂的沟通。
语言的载体是大脑新皮层,新皮层展开大约4张A4纸那么大,里面布满了890万亿个神经元。而人类的近亲黑猩猩的大脑新皮层只有一种A4纸大小,神经元也少得可怜,自然处理信息的能力也很弱。而人类大脑的信息处理能力非常强大,只需要极少的能量便可以处理复杂的沟通交流。
因为语言的出现,刺激了新皮层。新皮层的不断增大,才让人类成为了人,超越的大猩猩等其它物种,正如诺瓦克所说,合作成就了语言,语言成就了人类。
二、合作的五种机制1. 直接互惠
通俗的解释就是“我给你挠挠背,你也给我挠挠背。”由直接互惠引起的合作进化,需要参与者有能力识别出眼前的同伴,并回忆起之前与之打交道的结果。也就是直接互惠有个前提,你需要一张脸或者一个标签,让对方能够记住你。不然,我给你挠挠背,你不知道我是谁?怎么来报答我呢。
正如18世纪伟大的苏格兰哲学家大卫·休谟在1740年的《人性论》中说的那样:“我学会为他人服务,但并非对他心存善意。因为我可以预见,他会报答我的服务,而且他期待着我再次为他服务。”这就是人性。
总的来说,只有当两个个体再次碰面的概率高于无私行为的成本收益比时,直接互惠才能引领合作的进化。如果两个人未来碰面的概率很小,那么无私的行为就很难发生。就像旅游景点的摊贩,因为他知道你下次来景点的概率很小,所以可能就会采用高价格来获得短暂的高收益。但在你家小区门口的商店,低头不见抬头见,商店的老板就不会采取欺骗行为来获得短暂的高收益。
2. 间接互惠
“我给你挠挠背,就会有其他人来给我挠挠背。”这就是对间接互惠的最好解读。我们付出成本与某个人合作,不指望这个人给予直接的回报;相反,这种行为相当于购买了一个名声,确保将来你能从其他人那里得到回报。只要期望的未来收益超过所需付出的成本,利他行为就会产生。
在一个群体社会里,群体人员众多,你不可能和每一个人都合作过,如果需要和陌生人达成合作,这就需要借助与别人的经验(别人曾经合作过),别人的经验日积月累就形成了一个人的“名声”。合作就意味着为了让他人得到收益而付出成本。从本质上讲,我们就是在购买一个名声。
社会能够发展出更大规模、更为复杂的结构,以及彼此间更紧密的相互连结。正是因为“名声”的力量。一个人在闲聊、八卦和玩笑的帮助下,我们能够对某人的名声进行判定,对某人的能力进行估计,以此来决定是否要与他打交道。这就是为什么人们这么喜欢八卦的原因。
莎士比亚在《奥赛罗》中写道:
如果有人偷了我的钱袋,他不过偷走了一些废物;那不过是些毫无价值的东西罢了;以前是我的,现在是他的,也曾做过成千上万人的奴隶。可是谁若偷去了我的名誉,虽然不能因此而富足,但却令我一贫如洗。
莎士比亚给我们启示是:名声比金钱更重要。社会性死亡就是名声的崩塌。明星、网红以及每一个人,都应该维护好自己的名声,不能因为一时意念,败坏了一世英名。
3. 空间博弈
空间博弈是原胞自动机的一种,所有博弈个体受到空间距离的限制,只能和自己最近邻的个体展开博弈,通过博弈获得的收益决定个体策略保持(策略生存)或是转换为周围某更高收益获胜方的策略(策略死亡)。
这就像一张棋盘,棋子代表每个人,弈棋规矩就是我们所谓的自然法则。“空间博弈”很好地再现了生物的进化过程:不需要复杂的策略和聪明的思想,合作与生命仍可诞生。尽管群体中合作与背叛的结构一直处于动态演化之中,研究结果表明:在充满不确定性的混沌世界中,合作者的平均出现频率是31.78%。
人们之所以决定以聚居的方式生活在一起,而不是随机分散在各处,目的就是为了合作。人类在有限的空间和社会网络中,个体之间通过互惠结盟形成的群体,该群体中个体生存竞争力的平均水平高于离散型个体生存竞争力的平均水平。就像非洲有句格言:一个人可以走的更快,但一群人会走的更远。就像一个人加入社团或者宗教团体,往往能够获得更高的生存度。
4. 群体选择
空间博弈所关注的问题是个体结盟而构成群体比孤立者更易于竞争和生存,而群体选择机制更进一步,它是指合作者组成的群体比背叛者组成的群体以更快的速度发展壮大。
达尔文在1871年出版的《人类的由来》一书中指出,个体为了群体利益而行动,群体就能在个体成本的基础上兴旺发展。假设有两支敌对的部落。其中一支部落的成员都是自私的,只会为自己考虑。另一支部落的成员则会为了其他成员的利益而牺牲自我。第二支部落拥有“勇敢、富有同情心、忠诚的成员,随时准备相互帮助、相互保卫,这样一支部落会不断扩张,并战胜其他部落。借助群体选择的力量,这支部落最终一定会崛起。
企业里如果充满了勇敢无私和愿意奉献的员工,那么企业一定能兴旺发达。企业如果出现了自私自利,相互背叛的员工,那么企业一定会走向衰败。企业如此,国家亦如此。国家兴亡,匹夫有责。爱国精神、奉献精神就是优秀国家文化的根本。
5. 亲缘选择
打虎亲兄弟,上阵父子兵。与谁的血缘关系越近,我们就越愿意努力与谁达成合作。这种形式的合作关系之所以得到进化,是因为我们可以用这种方式增加传到下一代的基因数量,从而扩大我们未来的遗传规模。这就是第5个合作机制亲缘选择。
亲戚之间的关系往往是一辈子的关系,因为这种持续的关系才会让亲戚之间紧密合作。有些原本不是亲戚的陌生人,为了达成长期的合作关系,通过建立亲缘关系来实现,例如桃园三结义,刘备、张飞、关羽结成兄弟,不求同年同月同日生,但求同年同月同日死。本质上是想证明,我们的关系一直持续到死,要合作,不要随意背叛。
三、促进合作的三个方法1、增加未来的影响
如果未来相对于现在是足够重要的话,双方的合作就会是稳定的。因为每个对策者可以用隐含的报复来威胁对方。延长接触时间和增加接触频率可以使双方的合作更稳定。因为只要这种接触是短暂的不是重复的,合作就非常困难。
例如酒吧里的“酒托”,因为是一次性合作,往往采用欺骗的方式让对方付出高昂的费用。而结婚就是一种长久性的承诺,结婚代表着两个人的接触时间和接触频率是所有人中最高的。婚礼就是一个用来庆祝和促进持续关系的公共行为。
2、改变收益值
“公地悲剧”告诉我们,所有人都能免费使用的资源,必定无法长久维持。如果大海可以任意捕鱼,很快海里的鱼就会枯竭。如果草原可以无限制放牧,草原终究会退化成沙漠。如果工厂的废水可以任意排放,河流将会变成污流。如果工厂可以任意排放二氧化碳,那么气候将会变暖,最终人类走向灭亡。
解决公地悲剧的办法就是改变收益值,让合作者获得奖励,让背叛者付出代价。例如碳排放少的企业,可以通过出售碳指标获得利润。碳排放多的企业,要么购买碳指标,要么节能减排,总之要为自己的碳排放付出代价。
3、教育人们合作技能
教育人们要相互关心,知恩图报,宽恕别人并远离背叛者。一个优秀的社会需要优秀的文化,教育要贯彻始终。从幼儿开始就要教育孩子学会关心别人,学会和其他成员的合作。长大后更要处理好同事朋友的关系,对于别人偶尔的冒犯,要学会宽恕,要不然冤冤相报何时了。同时要给予多次背叛者惩罚,让他知道背叛的代价,不然就会增加社会后期改造他的成本。如果你没有办法惩罚背叛者,那就远离他,让他孤独而死。
总结合作是生物进化的第三法则,合作是生命进化的设计师,合作是人类生存的底层法则。合作代表着你需要付出成本,但他会为你带领直接恩惠或者名声,自私和喜欢背叛的人,虽然可以获得短暂的高收益,但长期来看收益为负。而喜欢帮助别人的人虽然短时间内可能收益为负,但从长期来看收益为正。就像一句谚语所说:“没有人因为捐赠而变得贫穷”。
中国人讲究“和为贵,和气生财”,本质上是一种合作。因为每个人的成功都是建立在别人的成功之上。在大城市,你只要掌握一门手艺,就可以生存。而在原始部落,你需要学会几十种技能才能生存下去。分工合作让城市和经济得到快速发展,残化和牺牲是必须付出的代价。分子的残化促进了生命体的进化,个体的牺牲带来了整体的生命力。
参考资料:
《合作的进化》
作者:[美]罗伯特·阿克塞尔罗德
有话要说...