背景介绍:11位年轻人参与集体生活,所需要的货币为:博弈币。在长达21天的时间里,11位年轻人要解决大家遇到的种种问题,通过竞争与合作,最终决出胜者。每人初始金额1000,有两个账户,私人账户与公共账户,私人账户对自己的获胜与否至关重要,公共账户要应付大家集体的开支。每个人都要平衡好个人利益与集体利益的关系。
第一集
1.不信任问题极大的增加了社会成员之间的交易费用。
交易费用指的是人与人之间发生交流的所有成本,在本例中,由于大家之间彼此不信任,所有会彼此防范对方可能会采取损人利己的行为,增加彼此的猜疑,为了达成目标,不得不增加一定的制度约束减少这种机会主义倾向,从而使得合作进行的成本增多。
2.囚徒困境:个人利益与集体利益之间的冲突
当社会中的每个人按照利己的策略进行社会博弈时,社会往往陷入一个糟糕的结果,实验中当有人(不是全部)采取自私的行为时,在当期的支付中,他会获得比别人更高的收益,但是这种行为,严重损害的其他人的利益。从而,在下一轮博弈中,采取自私的行为的人越来越多,从而导致整体的困境。
3.搭便车难题:
囚徒困境的例子也可以理解为搭便车问题,对于公共物品的特性,既没有竞争性也没有排他性,从而使得部分人可以不支付代价而享受公共物品的收益,搭便车问题会导致公共物品的提供不足。在案例中,出现搭便车问题的关键时缺乏相应的监督,当然监督也大概率无法解决问题,因为每人的支付意愿是不相同的,而支付意愿大家不会真实的暴漏出来。综艺中采取的是平摊的策略,这在某种程度上也算是一种妥协。
4.(交易成本较低时)市场机制会形成一种新的有利于解决问题的新秩序。
这便是科斯定律了。案例中依靠大家自主投票无法解决吃早饭的问题时,11人内部有人站了出来,提出了小组负责制,比较好的解决了这个问题。注意到,在解决问题时,并没有工作人员站出来,而是11人内部就形成了权威,而且基本得到了大家的认可。11人之间形成了3个组长,规模比较较小但可以解决问题。
5.经济学想要改变一个人的行动:激励、技术、信息
这里我们就不会谈论压迫、道德绑架之类的词语,这不是经济学应该使用的词汇。这里也不谈惩罚,激励需要用资本金的,技术是对方想做但是存在某些技术上的困难,这个时候可以通过改进技术,影响对方行为;信息影响对手指的是对方不清楚这么做的好处,把信息告诉他就可以了。
6.利己与利他(竞争or合作)
当大家都处于利己的心态去竞争时,利他行为遭到的损失会更大,利他的行为便会慢慢减少。利他有几种情况,利人损己;利人不损己;利人利己,第一种行为会很快消失,第二三种也可以通过利己的角度去出去。
第二集
1、 关于评价
我们这里讨论对别人的印象的问题,为什么有些人会让人感到很舒服,有些人会让人感到讨厌呢?并且,我们注意到,每个人的评价都有所不同。这当然是由于每个人的异质性问题。除此之外,我也能感明显的感到,太过于精明(自利程度较高)的人,更容易得到大家的反感,在有一致的“敌人”面前,群体内部不会形成激烈的对抗,群体倾向于一致对外。
2、 对于投票制度的思考
在公布了倡议的规则之后,体力比较好的乌兰便提前进入小黑屋提出倡议,并且打算在里面待够30分钟,以求确保自己的提案获得通过。但这样的代价其他人没有机会参与提案。这种行为是符合制度要求的,出于自利,寻求自身的收益最大化无可指责,在陌生人社会甚至更甚之而无不及,理性的制度构建者一定要充分考虑到制度实施的各种寻租可能性。在有投票制度之后,很明显的出现了抱团现象,为了使得群体内部利益得到更好的表达,与之对比,没有形成团体的人在投票时,毫无优势,全然不知投票已经被操纵。我们可以说,从得出投票结果这个角度来看,有团体的效率会更快(交易费用会更低),竞争力会更强,但是代价便是无法反映全体的意志。我们看到比较好的一面是,在获胜后,于有矿选择把自己的收益分享给失败者,虽然不足以弥补所有损失。
3、 拍卖问题:第一价格拍卖(价高者得)、全支付拍卖(所有出价的人都要支付其报价)
基于理性人假设的经济学认为再进行未来决策时,不应该考虑沉没成本(过去形成且未来无法产生收益);美元拍卖里面,每个人的最优策略是出价比对方多一点点,就可以比对方多获得100博弈币,在边际上,收益大于成本(额外的一点点出价),所以在没有考虑其他约束和沉没成本的情况下,理论上出价会无限次。案例中因为参与者会考虑到沉没成本问题,所以出价几次后就会停止了。
现实中,战争中对于军品的种投入是无法停止的,战争两种结果:全赢,全输,最优策略是一直投入,这个角度上,核武器的出现也许不是一件坏事(彼此可以互相摧毁),让大家意识到,再怎么投入,这都是一种全输的行为,就会制止军备竞赛了。
4、 信号博弈
信号博弈其实本质上就是参与者将自身的“信号”作为博弈的策略,可以选择发送“假的信息”迷惑对方,使得对方做出参与者希望其行动的行动。这里,科斯说:要真的看懂一个人想法,只有看他愿不愿意为此出价。简单来说,要看一个人做了什么,而不是看他说了什么。如果存在合谋问题,我们所获得的信息的真实性就会更加难以甄别。
第三集
背景介绍:本集主要有三个博弈游戏,第一个是竞选工作机会,游戏规则是低价胜出,未找到工作的人要惩罚100博弈币;第二个游戏是攻守游戏,每人拥有相同数目的士兵,并且有一次防守机会,对方有三次攻击机会,若防守人数大于攻击人数,则防守成功,并获得对方游戏人数,每人都有一次防守和供给的机会,最终拥有士兵多者获胜。第三个游戏是投票,选出停止继续参与的人。
1、 如何解决无处不在的“囚徒困境”
囚徒困境的基本假设有两个:所有参与人是理性的,并且参与人为理性是共同知识。关于理性,诺贝尔经济学奖获得者罗伯特·约翰·奥曼 (Robert John Aumann) 有一个经典定义:如果一个参与者在既定的信息下最大化其效用, 他就是理性的。但是在我们的博弈中,我们往往无法获得对手的信息集合,而最终的结果不仅取决于自己,还取决于别人。
有限次博弈中,囚徒困境中的参与者之所以难以结盟, 原因之一就在于盟约毫无约束力, 而参与者更倾向于通过选择背叛来获得较大的眼前利益或规避由对方背叛带来的巨大损失。如果选择背叛的参与者会面临事后惩罚, 且惩罚带来的损失大于背叛所产生的利益, 或者选择合作的参与者会得到奖励, 该奖励带来的收益也大于遭受背叛的损失, 那么即使惩罚或奖励要在之后的博弈中才会兑现, 盟约也将显得非常有约束力。因为参与者的理性会使他们追求利益最大化, 在这种情况下选择彼此合作无疑是明智的。
在无限次博弈的过程中,参与者之间更可能会暂时放弃眼前利益,去试探追求长期收益。只要双方相互配合, 长期利益会趋于无穷, 因此博弈双方在心理上都会更偏向于获得长期利益。综上,解决囚徒困境可以建立声誉系统,引入惩罚或者奖励机制(必须可执行)可以达成合作。
在节目中,大家在出价竞选工作时,所面临的就是囚徒困境。出低价50获得工作的往往会被大家视为不合作,虽然在本次博弈中,获得了收益,但是降低了自己的声誉,所付出的代价便是下一次合作(投票)可能得到惩罚。这个也提醒我们,合作很重要,不要太在意一时得失。
2、 演化博弈中策略选择问题
在演化博弈论中,行为主体被假设为程序化地采用某一既定行为,它对于经济规律或某种成功的行为规则、行为策略的认识是在演化的过程中得到不断的修正和改进的,成功的策略被模仿,进而产生出一些一般的“规则”和“制度”作为行为主体的行动标准。在这些一般的规则下,行为主体获得“满意”的收益。
演化博弈认为,行为主体在演化过程中不断修正和改进自己的行为,模仿成功的策略等等,在节目中,火树的行动策略的转变便体现了这一点。这也就是我们通常说的,很多学生来到社会上就变了,由于游戏规则不一样,我们没有办法改变规则,所以变换自己的策略便很重要。当然理想也很重要!
3、 合作与利益集团
经济学基本上是以竞争作为主线,企业的出现(一种合作方式)也被解释为降低交易费用或者对于不确定性的应对,不得不说,解释力很强。现在从合作的角度出发去看待世界,也许会有不一样的视角,已有心理学的证据表面,人们对于集体的归属感或者说被认同感也很重要,基于不同的视角看待问题往往得到很大的启发,当然,这方面目前也没有多大拓展,因为市场经济下,合作也是为了更好的竞争。从这个角度去看,国家之间的竞争中,能否形成全国性的合作就非常重要,在合作的过程中,有人可能忍受暂时的牺牲,而收益是竞争胜利之后才能被支付。
4、 上校博弈
上校博弈涉及到竞争双方对于资源的分配问题,上校Blotto与敌人争夺2个战场,但他们手中的资源都是有限的,他们必须同时决定如何如何将资源分配到战场上。若一方在该战场上分配的资源高于另一方,则赢得该战场的所有价值,若双方投入了相同的资源,则平分该战场的价值。将上述场景抽象出来就得到了上校博弈。这个可以解释军事机密、商业竞争等等问题。
5、 投票的悖论
多数票规则中存在一个明显的投票悖论。这一悖论由法国著名社会学家孔多塞在18世纪80年代发现,所以又称孔多塞悖论。阿罗不可能定理,把这个投票悖论形式化了。
孔多塞悖论/投票悖论:在集体投票时容易出现投票结果随投票次序的不同变化,大部分甚至全部备选方案在比较过程中都有机会轮流当选的循环现象。
假设甲乙丙三人,面对ABC三个备选方案,有如下的偏好排序:
甲A>B>C
乙B>C>A
丙C>A>B
由于甲乙都认为B好于C,根据少数服从多数原则,社会也应认为B好于C;同样乙丙都认为C好于A,社会也应认为C好于A。所以社会认为B好于A。但是,甲丙都认为A好于B,所以出现矛盾。
阿罗不可能定理:随着候选人和选民的增加,“程序民主”必将越来越远离“实质民主”。依靠简单多数的投票原则,要在各种个人偏好中选择出一个共同一致的顺序是不可能的。这样一个合理的公共产品决定只能来自于一个可以胜任的公共权利机关,要想借助于投票过程来达到协调一致的集体选择结果,一般是不可能的。
6、 前景理论
前景理论详细说就比较复杂了,属于行为经济学的研究范畴。简而言之就是,人们再进行决策的时候,会选择一个参照系,参照系不同,行为便不同。预期对于行为的影响很重要。
在节目中,豁免权的拍卖,张宇出了最高价288博弈币,那他选择的参照系是大概率退出游戏,与退出游戏相比,高价购买豁免权就显得合理了。
7、 马克思的“异化”
谈了这么多,感觉到很痛心,本来和谐的关系搞得四分五裂。不仅想到了马克思提出的:“异化”理论。异化在哲学上指:主体发展到了一定阶段,分裂出自己的对立面,变为了外在的异己的力量。马克思认为,原本应该是劳动雇佣资本,现在资本的力量过于强大,反而成了资本雇佣劳动,劳动者受到了剥削。在节目中,博弈币的出现是代表了很多的产品或者服务,博弈币是为大家服务的,但是金钱的力量过于强大,在市场机制下,人与人之间的关系被人与钱的关系所替代,每个人都在算计其他人,想要得到更多的金钱。这样,就由钱为了人变成人为了钱,人与人之间充满了谎言、欺骗。
这个说法其实很理想,在面临激烈的竞争环境中,人们会把希望寄托在理想的天堂中,表现出对现实世界的不满,甚至想要推翻原本这个世界。但仔细想想便会知道,金钱不过是把人们内心的想法显性化了而已。市场化带来了资源的有效配置,使人们得到了更多的产品,但也激发了(本来也有)人性中贪婪的一面(自利)。这还是一个取舍问题,我们不能又要这个又要那个,但我们可以尽量做好平衡。
第四集
背景介绍:
上一集投票得票数最高的张宇首先向王境泽采取了道歉的策略,赢得对方好感。随后众人在博弈空间内进行了一次带阈值的公共物品博弈,连续两轮博弈都以不合作结束,再一次损害了大家之间的信任基础。接下来,众人进行了鹰鸽博弈来选取中秋礼品,在这场博弈中,大家最终达成了合作。
1、 带阈值的公共物品博弈
带阈值的公共品博弈是一个多人参与的博弈,是公共品博弈的一种变体。阈值的加入使得公共品博弈中向公共池投入资金这一行为在公共池中资金总数未达到阈值时不会带来任何收益。
现实生活中参与者的差异会影响合作水平,如在公共品博弈的研究中,初始资金的差异,对合作的项目需求不同,对合作的贡献效率不同等等会对合作水平造成不同程度的影响。同样的,在阈值公共品博弈中,以上因素也会影响群体的合作。
为了更好地促进合作,我们可以在带阈值的公共品博弈中引入奖惩机制,奖励那些向公共池贡献多的玩家,而惩罚那些向公共池贡献低的玩家。奖励和惩罚有多种形式,如同级惩罚,私人惩罚,或引入第三方的惩罚等。如何设计成本低而促进合作效果好的奖惩机制成为了重要的问题。
2、 信心为什么堪比黄金?
在博弈空间的第一次博弈,其实大家对于达成合作还是信心比较高的,但是经历了一次失败之后,对于合作的信心便下降了许多,大胆猜测一下,如果有第三轮出价,大多数人会出0元。在这个例子中,感受到的一点便是群体拥有共同信念的重要性。
在博弈论中,信念被解释成参与人所拥有的共同知识。不论小到一笔交易,还是大到国家民族文化,其实都是基于参与者的共同信念。一笔交易能够成功,基本信念便是买卖双方彼此相信对方会遵守承诺,按时交钱交货;世界上之所以会有不同的国家,而不是一个国家,是因为人们拥有独特的民族文化。共同信念的维持不是一件简单的事情,一旦发生信念的崩塌,后果将极为严重。政府一个很重要的职能是建设并维持国家的共同信念。
3、 异质性与共性
抽象理论框架,遇到的很大的一个挑战就是如何在异质性与共性之间做出权衡。异质性是对象自身所拥有的所有特质,这些特质具有特殊性,与其它对象存在差异,这是我们对世界分类的基础。共性是不同对象之间可能含有某些相同的特质,例如,世界上没有两个一模一样的苹果,但我们可以说红苹果绿苹果都属于苹果,决定苹果是苹果不在于他的颜色如何,而是由某些其他的特质所决定。
实证经济学在进行模型估计的时候,在面板数据估计策略上,一般用截距项代表个体差异,用斜率项代表共性。
在节目中,大家之间有很多共性,但是经常容易忽视的是大家之间的差别,这些差异不仅包含每个人剩余博弈币的数量,还有如性别、认知差异、生活背景等等的不同,基于共同认知做出的决策往往不会考虑到每个人的异质性,或者说没有能力将所有因素考虑在内,从而达成的群体决议对某个人来讲就不是最优的,甚至是不情愿的,这时,他就有动力偏离群体决议。
4、 鹰鸽博弈
鹰鸽博弈是一个博弈论模型,在模型中,鹰代表强硬,鸽代表软弱,当两种不同的鸟相遇时,所产生的收益如下:当两只鹰同时发现食物的时候,天性决定它们一定要战斗,最后会两败俱伤。所以二者的收益都是 -2;当两只鸽子相遇的时候,天性要求它们共同分享食物,所以各自收益都是 1;当鹰和鸽子相遇,鸽子会逃走,鹰独得全部食物,故鹰的收益是 2,鸽子的收益是 0。不难求出,该模型的纯策略纳什均衡为:(鹰,鸽)和(鸽,鹰)。混合策略均衡是两只鸟都以 1/3 的概率成为鹰,2/3 的概率成为鸽子,他们获得的收益相等。
鹰鸽博弈用一句俗语解释就是“欺软怕硬”是个人的最优策略。
5、 集体行动困境的例外(为什么会达成合作)
选自《集体行动的逻辑》-曼瑟尔·奥尔森
第一,如果有一些拥有巨大财富且富有慈善心的人存在,且不管他们在与不在这个集团中,如果他们足够慷慨,就不存在集体行动的困境。他们的慷慨免去了集团中其他成员的互相博弈,避免了他们做出利己的举动而破坏集体行动。需要说明的是,这样的人很少,且他们能提供的集体物品是有限的,如他们能盖一座希望小学但我们却不能期望他为国家提供购买先进武器的费用。
第二,在生存条件受到威胁,人们头脑里普遍存在生存伦理时,这种意识形态能够变成一种有效的外在动力,推动人们做出集体行动。在人民公社时期,很多人面临饥饿死亡的威胁,这时人们将不再为眼前的一点利益愤愤不平,而是迅速行动起来,为避免因饥荒死去而奋斗。
第三,当集体物品对于集团中成员的意义或者价值不平衡时,集体行动可能会产生,这就是典型的“少数强迫多数”。例如,乡间小路要从5户人家的门口经过,其中有一户人家迫切希望有这条路,因为他每天要把蔬菜通过车辆运动到集市销售,破败的路使他的车难以行使,而其他4户人家因为没有相似的需求,所有路修不修对他们而言关系不大。在小路的修筑费用比较小,且修筑后的收益比较大时,集体行动就会产生且产生在第一户人家,因为小路的价值或意义在五户人家之间是不平衡的。
第四,当集体行动的收益很大时,人们“人数多多益善”的心理克服了“搭便车”的心理,从而产生一致的行动。“人数多多益善”的心理指的是在面临重大事件,能够取得重大成果的集团行动中,每增加一个成员行动的力量,行动结果的未知性就越小,获得成功的可能性就越大。虽然“搭便车”可能会使事情成功,但是事件如此重大使得每个成员变得谨慎,负担的行动的实际成本比不行动的心理成本还大,则人们会自愿“不搭便车”。典型的例子是果征地纠纷中农民的团结。相反地,农民组成经济合作组织能否成功,就是未知数了。
第五集
十位参与者俩俩组队,每组需要将拥有的100元券分别投放到六个项目箱中,每轮在项目中投入券的数目最大的参与者获得一分。六轮结束后,积分最高的组获得1000元奖励。
一共五组六个项目,说明至少要拿到两个项目的胜利才能最终胜利。李承壕组在第三轮前声称自己下轮要投99元,其他组投少于99元的钱都没有意义,于是选择不投入,实际上李承壕组只投了15元,获得了这轮胜利。
第六集
博弈空间游戏:
尼姆博弈:
双方轮流抓取,必须在同一行中进行,最少一个 最多一行,最后一个取棋子的参与者获胜。
诀窍:先将每行的棋子数表示为二进制,指任何数都可以被表示为二的不同次方之和,在这里,第五行的五颗棋子等于一个二的二次方+一个二的零次方,然后将各行2的相同次方的个数相加,比如在这个棋盘中:
各行棋子数一共有三个二的三次方,四个二的二次方,五个二的一次方,五个二的零次方,表示为3455,先手的参与者只需要拿走正确数量的棋子,让(3455)这四个数字都是偶数,比如从第十行拿走九个棋子,让局面变成2446。无论对手拿几个棋子,先手参与者让这四个数字永远是偶数,就一定能拿到最后一颗棋子。
(棋子数是三行和七行的话是后手赢)
巴纳姆效应:人很容易相信一个笼统的一般性的人格描述,并认为它特别适合自己并准确地揭示了自己的人格特点, 即使内容空洞。当人们用一些普通、含糊不清、广泛的形容词来描述一个人的时候,人们往往很容易就接受这些描述,却认为描述中所说的就是自己。
第七集
选美博弈:
共有六位选美候选人,分别设有最佳穿搭奖、最佳人气奖、最美代言人奖,每个单项奖投选中得票最多的人获得单项奖。投票时相互不能交流,只要你投的候选人得奖,你就可以和其他投选者共同平分本轮博弈币的奖励,三个奖项投选结束后获得博弈币总和最高的人将获得博弈币翻倍奖励。
这种博弈中多数的一方获得更高收益的任务,本质上是一个“选美博弈”,参与者们需要猜测大多数人的选择,并和他们保持一致。日常生活中最典型的场景就是股市投资,短期投资者在买股票时往往考虑的是哪只股票被最多的人选择,而不是考虑哪只股票有最好的业绩表现。
谢林点:即人们在没有沟通的情况下的自然选择倾向
博弈空间游戏:
数字谜雾弹:参与者各持有两套牌面为1-5的纸牌,和两张仅能使用一次的技能牌(乘和除),双方每轮从牌库抽出两张牌,分别为仅自己可见的隐藏牌和仅对方可见的公示牌,这时参与者可选择使用使对方公示牌数额除以二,或使我方公示牌乘二的技能牌。在双方讨论后闭眼选择是否使用技能牌,然后互相明牌,牌面相加数值较大的一方获胜。本次挑战一共五轮,五局三胜。(这个游戏属于“不完全信息博弈”)
三方对决中,次强者策略一定是联合弱者对付强者,反过来强者想要胜出,需要设法拉拢对自己威胁最小的一方。实力不决定输赢,博弈中能否获胜,更取决于实力造成的成员间制约关系。
枪手博弈:大家都会挑战对自己威胁最大的人,相对弱的参与者反而较少被挑战,这种情况下,强者需要故意放水,即示弱欺敌来获得生存机会。
第八集
(感觉有点像《游戏的法则》的欺诈赛马)
盲盒拍卖:场上共有20个盲盒,其中两个盲盒分别装有300和500元博弈币,其余18个是空盒。拍卖一共五轮,每轮参与者需要将30元博弈币投给最多三个盲盒,可以集中投一个。第一轮开始前,每个参与者随机抽取一张关于博弈币盲盒的线索,每轮竞拍前可以相互沟通线索,每轮竞拍结束后其中四个空盒会被回收。五轮竞拍结束后,盲盒上累计竞拍价最高的参与者获得此盲盒。
线索1:2号箱会留到最后一轮但是是空箱
线索2:500博弈币箱的数字大于10
线索3:500博弈币箱的号码是单数
➡️500博弈币箱在11、13、15、17、19
线索4:两个博弈币箱数字之差小于15
线索5:两个博弈币箱数字之和大于15
线索6:300博弈币箱的号码是双数(已可以排除2号箱)
线索7:300博弈币箱比500博弈币箱的箱子号码数小
(???(感觉有点道理但细想不通)从出题者的逻辑考虑,2为什么要留到最后,因为它会构成一个符合所有条件的干扰项,在500博弈币箱可能的箱子数字里,11+215,所以很大可能可以把11、13、17和19排除掉)
第十集
三位参与者分别拥有两张标有其他参与者姓名的卡片,然后三人从另外三张卡片中抽取反击卡,反击卡仅有一张,未抽到的会得到一张空白卡。抽完反击卡后每位参与者有与其他人一对一私聊的时间。
决议开始后,三位参与者同时出示各自的一张卡片,若出示姓名卡,则姓名卡对应的参与者累计一票;若出示反击卡,则所有投给自己的票将无效,并且可以指定一位投票给自己的参与者淘汰,但如果出示反击卡时没有其他参与者给自己投票,则本人淘汰,若反击卡拥有者未出示反击卡,那么得票最高者淘汰。
宇宙以及一切问题的终极答案:42(来自道格拉斯·亚当斯的科幻小说《银河系漫游指南》)
在一个情况下该如何取舍,不是去争每样东西,而是拿自己该拿的那部分,去把适合别人的东西让给别人。恺恺:你有没觉得你教我的事情我都一一学会了。火树:我觉得愿意去学习,去思考,这个点让我看到了她对知识的尊重。
发表评论