如何利用囚徒困境,让选择的利益最大化?
人在江湖走,于利益众多的权衡与博弈中,什么样的选择是相对好、相对优质的呢?本文或许对你有所启发。
1. 精英律师
又是岁末年初。
南方的城市里,虽未至严冬,已颇有寒意,正是三两知己一边火锅一边畅谈的相聚好时机。
青子看着电视里正在放着的《精英律师》,说道:
“这集看过了,说的是富豪百亿遗产争夺案,富豪弟弟和富豪老婆,争来争去,到最后选了个和解方案,谁也没有成功独吞全部财产。”
【精英律师-剧照】
未待众人接话,青子像是突然想起了什么,对着唐寂大声说道:“有利有弊,互相猜忌,最后两边折衷和解,这是不是你以前跟我讲的那个什么…..什么罪犯案例?”
唐寂看了一眼电视,答道:“是囚徒困境。”
2. 囚徒困境
2.1“囚徒困境”理论简介
囚徒困境(Prisoner’s Dilemma),是博弈论的非零和博弈中极具代表性的例子。
非零和博弈是指博弈中各方的收益或者损失的总和不是零,区别于零和博弈(例如“你”赢就一定“我”输的对赌),是一种合作下的博弈。
囚徒困境指出,个人的最佳选择可能并非团体最佳选择,或者说,在一个群体中,个人做出理性选择(个人利益最大化)时,却可能导致集体的非理性(集体利益非最大化,甚至集体利益最小化)。
囚徒困境的故事,可简述为:
警方逮捕了甲、乙两名嫌犯,但并没有足够证据指控二人入罪。于是,警方分开囚禁甲、乙,并分别和二人见面,且向双方提供以下相同选择:
- 若一人认罪并作证检举对方,而对方保持沉默,则此人即时无罪获释,沉默者判刑10年;
- 若二人皆沉默不检举,则二人同时判刑1年;
- 若二人相互检举,则二人同时判刑7年。
最终,甲乙二人在以下合理前提条件下:
- 被隔断无交流
- 均获知惩罚的确实有效性
- 确认抉择后对方无报复手段
- 双方皆为理性人,会最大限度为自己争取利益
最终选择“相互检举”,导致”二人同时判刑7年”。
2.2《精英律师》案例分析
在《精英律师》案例中,富豪孙浩瀚留下了百亿遗产,孙超越(孙浩瀚亲弟)与蓝红(孙浩瀚妻子)针对继承权问题对簿公堂。
围绕是否存在合法有效的遗嘱,双方面临的情况是:
- 若存在合法有效的遗嘱,孙超越为合法继承人;
- 若不存在合法有效的遗嘱,蓝红作为配偶,是法定继承人。
因此,在诉讼与和解的抉择面前,二人的博弈是:
但最终,二人没有走到“让对方零继承”的最坏局面。
通过双方律师和当事人的正确判断与有效博弈,在基于“孙浩瀚既不希望亲弟零继承,也不希望妻子零继承”的情理之上,二人最终达成“相互体谅”的和解。
【精英律师-剧照,来源:爱奇艺】
“百亿家产啊,如果是我,我就赌一局!”
“那我可提醒你,相比于翻倍叫地主,这刺激程度可能更接近于俄罗斯轮盘赌。”
“按50-50的概率算,理论上的数学期望,应该跟和解方案相近。”
“哈哈,那还是不要赌这一局了。”
“还有类似的案例吗?”
“再给你说个候选人投票的故事吧。”
3. 三中选一
候选人投票故事:
现有甲乙丙评委三人,需对ABC候选三人进行投票,投票规则如下:
- 评委每人对ABC三人进行排序,排序一二三分别对应计分3、2、1;
- 三位评委的排序投票求和,总计分最高者,胜出;
- 如三位评委的投票排序皆为ABC,则A计9分,B计6分,C计3分,A胜出。
已知以下情况:甲欣赏A,乙欣赏B,丙态度不明。
请问:甲是否存在一种策略,最大概率使A胜出?
……
“既然甲想选A,A得3分,乙想选B,B也得3分,那关键就是丙想选谁,因为丙的第一顺位也是3分。”
“那也不一定,排第二也有2分,两个2分,跟一个3分一个1分,都是4分。”
“对啊,你也说了,问题就在于只有三个人进行321排序,只要拿到一个3分,另一个至少有一个1分,那也是立于不败之地了。”
“问题是没说丙一定会给A投3分啊?”
“那这个问题,是不是可以先讨论到底需要多少分才能保证不被淘汰!”
“在数学上,这确实是排列组合的概率和期望问题。”
3.1 囚徒困境下的概率问题
先回到上面《精英律师》里的案例,若假设有:
- 遗嘱有效的的概率为50%;
- 诉讼胜利获得全部遗产,100亿;
- 诉讼失败则零继承,0收益。
那么,蓝红和孙超越在博弈中的数学期望,应该是:
E=100*0.5+0*(1-0.5)=50(亿)
因此,折衷和解,于情于理,符合双方预期利益。
再看“三选一”案例,其数学本质更接近于如下条件中的排列组合问题。
假设有:甲已将3分赋予A,乙已将3分赋予B
则请问:甲将2分赋予给B和C中的哪位,可使得A得到最多分的概率最大?
本文不展开探讨具体的概率计算问题,感兴趣的读者,可以留言探讨——A需要至少得多少分,才能保证胜出?
3.2 囚徒困境下的博弈问题
“我倒觉得可以简单一些,既然甲选A乙选B丙态度不明,那就可以认为是甲乙在博弈,也就是说,甲的排序必须是ACB。另外,故事里的甲,跟我想的是一样吗?”
“不,他输了。”
囚徒困境中,核心的博弈条件之一,就是理性人。
理性人的两大特点是:
- 趋利避害,利己;
- 完全理性,能够根据趋利避害原则针对成本-收益采取一切机会和手段进行优化选择。
因此,如果博弈双方中,存在非理性的一方,比如认为对方与自己利益一致,或认为对方将为集体利益牺牲个人利益,则很可能导致决策失误,使得自己陷入困境,而对方打破困境。
反之,对局中人的启示是,重要的不是在困境中抉择,而是要尝试引导对方,使之为本方利益或集体最大利益服务,才能打破困境。
4. 六中选二
“故事里的甲,不是你吧?。”
“是与不是,又有何妨?”
“那还有甲最终获胜的故事吗?”
“有。如下所示:
现有甲乙丙评委三人,需对甲团队ABC、乙团队DEF候选六人进行投票,投票规则如下:
- 评委每人投票选择三人,被选者每人计得1票,不计分;
- 甲、乙可在本方团队选两人且在对方团队选一人;
- 丙可在候选六人中任选三人;
- 三位评委的投票求和,得票最高的前两位,胜出;
- 如三位评委的投票皆为ABD,则ABD各计3票,需进行二次投票。
已知有以下情况:
- 甲倾向ABC,乙倾向DEF,丙态度不明;
- A为甲团队实力干将,业绩优异;
- B为甲团队多年骨干,兢兢业业;
- C为甲团队新鲜血液,成长迅速;
- D为乙团队实力干将,业绩良好;
- E为乙团队多年元老,稳定输出;
- F为乙团队拼命三郎,低调老实。
请问:甲是否存在一种策略,最大概率使AB胜出?”
……
“六选二,这个我更加不想算了。”
“不见得更难算啊,毕竟只计票不计分。”
“那也是三个3票在六个人身上的排列组合问题……”
“正向推算若太麻烦,为何不试试逆向?”
“何为逆向?”
“算自己多,不如算对方少。”
事实上,如若甲乙丙为同一团队,ABCDEF为同一团队下的六位伙伴,所有人互信互利,将有如下隐性条件:
- 甲乙丙的抉择以团队利益最大化为目的
- 从ABCDEF六名候选人中任意选择两名的利益差异过小
则此情形下不存在囚徒困境的博弈。
继续遵循“囚徒困境”的条件作进一步假设:
- 甲乙为完全理性人,趋利避害;
- C、F存在一定短板,例如群众基础相对薄弱,不能服众,我们称之为“劣势候选人”。
此情形下,甲乙面临的情况有:
- 对方都会力求保住自己的优势候选人
- 尽量控制对方优势候选人的总票数
那么,二人的博弈将转变为:
到此,可以非常清晰地看到,在“六选二”案例中:
- 为求己方团队利益最大,甲乙可能会高概率投对方劣势候选人;
- 最严重的后果是“劣币驱逐良币”,双方团队的优势候选人皆无法胜出;
- 丙的态度不明确,将进一步加剧此态势。
这便是真正的囚徒困境。
5. 天下无囚
“所以故事里的甲,赢了?”
“不是你自己要听胜利的案例么?”
“是你的风格?”
“充分利用规则获得胜利,有什么不好?掌握主动后说不定还可以卖个人情。”
“不是你的风格。”
“乙之砒霜,甲之蜜糖。”
“那也不是你的风格。”
“In me the tiger sniffs the rose.“
“Whaaaaat?”
“心有猛虎,细嗅蔷薇。”
“说人话!”
“菩萨心肠,雷霆手段。”
囚徒困境,作为经典的博弈论案例,对所有面临抉择的商业谈判、沟通策略、人生选择,都有着值得深思借鉴的价值,无论是作为对自己的警醒,还是作为对他方的预防。
但是,在囚徒困境中抉择得再好,也是囚徒的抉择。打破囚徒困境的唯一出路,就是不要成为囚徒。毕竟,高手人抬人,低手人踩人。毕竟,最重要的不是技巧,而是人心。
愿天下无囚!
唐寂看了一眼手表,站起身,举起杯子,说道:
“来来来,再过几天就新年了,大家一起~”
“新年快乐!”
“大吉大利!”
“长命百岁!”
“精神!”
“富强!”
“哈哈哈哈!”
“天下无囚!”
END
欢迎查阅更多精彩文章
产品经理方法论系列文章:
- 常识/逻辑/业务能力——《从“汽水兑换”案例,看你能不能当产品经理?》
- 期望管理“七步法则”——《七步法则,从容应对老板期望“出尔反尔”》
车联网生态应用建设战略系列文章:
- 第一篇,聚焦收入模式分析——《车载应用付费下载,你动了谁的奶酪?》
- 第二篇,聚焦产业格局分析——《车载应用产业格局,谁是你的同路人?》
作者:唐寂;微信公众号:刀法入兵(ID:daofajia)。品牌车企车联网生态产品负责人,智慧出行行业十年产品人,“影子评审团”评委,曾主导车企多款重量级产品的定义重构和互联网超级应用融合上车。
本文由 @唐寂 原创发布于人人都是产品经理,未经作者许可,禁止转载。
题图来自Unsplash,基于CC0协议
这样的表达不能算称职的产品经理吧?80%的篇幅在举例子,结论归纳篇幅不到20%,这样恐怕很难与人沟通吧?
???黑人问号脸?