作为习惯权利的形成和演化论文参考
【摘要】对民俗的田野观察与对人类学文献的深入研究无疑为习惯和习惯法研究提供了洞察力的源泉。但一个根本性的问题是被观察或发现的习惯已经存在了。对于研究者来说习惯是既定的,习惯究竟是如何产生的则并不清楚。如果不能揭开习惯产生的“黑箱”,习惯法一直依赖既定习惯的状况在逻辑上可能会导致一直追溯历史的无限递归。新制度经济学和演化博弈论的结合使得揭开制度“黑箱”成为可能。因此这一融合后的理论也许是习惯法研究的一种新进路。
【关键词】小费博弈;重复博弈;习惯
一、引言
在欧美社会,一个人在诸如餐馆之类的消费场所消费后一般会给侍者一些小费,后者也不会有任何觉得不好意思的地方。消费者给服务者一定的小费,服务者提供优质服务,这在很多场合成为了一项清晰的习惯,并具有规范效力。
任何习惯的生成固然有自己的历史,但这并非说我们要了解某一习惯的内在演化机理就必须回到它当初的历史当中。从理论上说,如果我们理解了习惯的内生机理,那么不仅可以解释既存的习惯,而且可以了解某一习惯产生的条件,甚至可以在一定程度上预测习惯的变迁。
二、小费博弈:习惯的演化
(一)小费博弈的构建
我们构建一个小费习惯博弈模型来说明该习惯产生的过程。根据博弈理论,一个博弈是由参与人、规则、信息、策略、效用函数和时间等要素构成的结构化系统,或者说一个博弈就是一个制度。但演化博弈论不是从既定规则出发,而是经过博弈产生规则。这和我们欲求的习惯生成机制是完全兼容的。
假设1:假定存在一个封闭的社区,有一个不大的小餐馆,服务方和消费者几乎全是该社区的成员。这样交易就是在人格化关系的社会网络中展开的。
假定消费者来这里就餐有两种需求:一是消费到价廉物美的美食;二是服务员的优质服务,也就是说他们就算很满意餐馆提供的美食也仍然希望享受到“微笑”服务。
那么没有规则的博弈是从偶然开始,毕竟有无数的事物的产生和发展都是源于历史的偶然。小费博弈也同样开始于历史的偶然。
我们假定:一个女服务员获得了爱情,在她服务时对顾客露出了迷人的微笑,这使顾客如沐春风,获得了异乎寻常的美好就餐体验。他也十分偶然的用“小费”[1]来表示自己的补偿,就是说在支付价格之外又给了她一张小额钞票作为对她服务的额外支付。这次偶然的巧合对服务交易双方来说均是一次十分愉快的经历。由于这是一个封闭的社区,交易是在人格化的社会关系网络中进行的,因而顾客和服务员可能会记住彼此的行为。如果这样的巧合只发生一次,或者虽然再一次发生但间隔期太长以至于上一次的巧合已被完全遗忘,那么的确小费博弈不能开始进行。如果巧合又一次发生了,间隔还在记忆容许的范围内,那么双方就可能对小费和微笑的交易有一个模糊的初步认识。
在接下来的日子里当他们再次相遇时,服务员可能会想如果我微笑顾客是否会支付小费,而如果顾客不支付小费我为什么要微笑。同样顾客也可能会想如果我支付小费服务员是否会微笑,而如果她不微笑我为什么要支付小费。于是现在的问题就是对小费和微笑的交易已经有了初步认识的交易双方如何选择行为策略的问题。
一个类似囚徒困境的小费博弈可以建构了。下面是该博弈策略组合矩阵:
小费博弈
小费博弈
观察这个博弈,可以发现有两个纳什均衡:(5,5)和(0,0)。代表小费习惯的(5,5)是我们想要的均衡,代表维持原状的(0,0)是我们不想要的均衡。那么小费习惯有可能演化出来吗,答案似乎令人沮丧。因为在该博弈中(0,0)是双方占优策略组合的均衡,当然也就是说更有可能是维持原状了。
(二)小费博弈的重复博弈
演化经济学家罗伯特?萨格登在论证交通博弈[3]时说明因为偶然原因走上了任一个均衡路径就会在重复博弈的过程中通过反馈而自我强化,所以即便存在一些干扰,但从长期趋势来说,习惯是自我实施的、稳定的,因而可以获得规范的效力。
萨格登解决偶然因素对习惯的演化使用了一个发人深省的概念――突出性。萨格登借用突出性这个概念想要说明的是像交通博弈的这类博弈,有着两个均衡发展路径,具体往哪一个方向发展则可以通过突出性解决。所以像“靠左或右行使”的交通规则在经过重复博弈后究竟是靠右行驶的习惯演化出来还是靠左行使的习惯演化出来,则依赖某一地区人民自身当中的突出性因素。
这里引入突出性的原因要表达的意思是试图对习惯进行分类,毕竟小费习惯只是众多的习惯之一。交通博弈代表的习惯是一种类型,它要求在博弈的重复进行条件上求解,通过参与人的社会学习来使习惯自发演化出来。而小费博弈代表的小费习惯是另一种类型,它的困境的解决不仅需要博弈重复进行,还需要参与人通过社会学习发现和接近这类博弈困境的解决机制――一报还一报(tit-for-tat)的策略组合。这是博弈论专家阿克赛洛德发现的解决有效率比较囚徒困境的策略机制。
接下来就讨论小费博弈的重复进行过程中参与人是否能发现并内化一报还一报的策略机制。不过这要求我们把参与人的策略类型进行分类。利用萨格登的策略类型分类,稍微加以变通后,我们假定顾客和服务员的策略有下面几个类型:
第一种是完全理性型[4]。这种类型的参与人,或者是天使或者是魔鬼,小费习惯或者一下子就演化成功或者永远不能成功。这是因为完全理性的人需要的只是理性、信息和逻辑,不需要任何习惯。 第二种是无知自私型。只要有一方是自私的且只“俯视脚下”,那么另一方就算是天使也可能无济于事。只有在天使自觉选择低效用的策略、无知自私的参与者选择高效用的策略时才能避免(0,0)的策略均衡。如果没有天使,上面的支付矩阵表明,不论是(0,8)还是(8,0)的策略组合都不可能在普通人中演化成稳定的习惯。
第三种是自利型。这样的人一方面是自私的,但同时是理智的,也就是说尽管他们可能会尽可能地利用一切机会投机牟利,不过当需要与他人合作甚至需要利他才能更好地满足自己的需求的时候,他们也是会毫不犹豫地去利他,目的只是惟利是图。
这样的策略类型对于习惯的演化来说,习惯是否能形成就取决于严格的初始条件和惊人的好运,也就是说这个封闭社区内的顾客和服务人员一开始就选择了(小费,微笑)并一直持续保持,因而不断自我强化,最后演化成清晰普遍有效力的规范。
第四种类型是自利包容型。这是对自利型假定的放宽(普通人性要求的类型),也就是说这种策略类型允许随机的偏离,因为错误、试验、变异等有限理性条件下不可避免地会出现这些问题。那么这种策略类型是否可能使欲求的习惯形成呢?博弈论专家阿克赛洛德对重复囚徒困境的研究表明,一报还一报的策略组合是可以被重复博弈的参与人学习后发现和掌握的,从而在近似无限期的重复博弈中演化出某一习惯,不过它在帕累托意义上是次优的。
假定获得爱情的女服务员因为爱情力量在博弈开始的几个周期比如5期内是不求小费回报的,即不管顾客是否给予小费,她总是在服务时向顾客微笑。这样对于前5期的博弈来说,顾客的最优策略是选择不给小费以使自己的效用最大化。而当服务员的爱情发烧期退热后,她发现自己的微笑并没有换来应有的回报(小费)后,她就决定在下一次的博弈中板起脸来让顾客尝尝惩罚的滋味。而在下一次博弈时顾客看到她的冷脸后觉得更没有理由支付小费了。于是这期博弈的结果是(无小费,不微笑)。在紧接下来的再次博弈中,如果双方记忆只有上一期的结果并以之为决策的根据的话,那么从此每期博弈结果就都是(无小费,不微笑),习惯不可能形成。
发烧期内女服务员总是选择微笑,顾客如果每一期都选择给小费,这样双方博弈结果总是帕累托最优。如果一直不偏离的话,那么(小费,微笑)的美好体验持续强化一段时间后就会使小费习惯比较快速地演化出来。
如果前5期内顾客总是选择不给小费,情况就比较复杂了。这需要顾客和服务员双方都认识到博弈中存在惩罚和回报的一报还一报的策略机制才可能形成。我们假定在前5期内女服务员总是选择微笑,顾客总是选择不给小费。现在假定在第6期女服务员还是选择微笑(爱情发烧和退热的过渡期不明确),而顾客可以选择给小费或者不给小费。如果顾客不给小费,那么本期博弈结束后他的效用是8单位而她是0单位。如果接下来连续几期他仍然像以前一样选择不给小费,那么爱情已经退热的她就不会再选择无偿的微笑了。假定这发生在博弈的第10期,那么本期博弈结束后双方的效用都为0。这对她来说倒没什么损失,但对他来说大不一样,前10期他的每期效用都是8单位,现在从8单位下降到0单位,损失很明显啊。如果(无小费,不微笑)的结果再连续发生几期,损失明显就更加确定。如果他还有记忆能力的话,他也许就要停下来问问为什么了。通过回忆以前的好日子他可能会想到每期8单位的效用不是免费的午餐,而是她选择微笑的结果。那么她现在不微笑了的同时他的效用明显下降了,这是否是她对自己的惩罚呢?
认识到惩罚的他在接下来的博弈中就要看看是否有承担责任的精神了。如果没有这样的精神而继续选择不给小费,因而她也继续不微笑的话,那么从此进入恶性循环,小费习惯不可能形成。
假定认识到了惩罚的他愿意承担责任或者说虽然没有承担责任的意识但他(有限理性的人)在连续的博弈中无心地犯了错或者试验等而在博弈的第12期选择了给小费。博弈结果是他的效用为0单位,而她的效用为8单位。这使她立即意识到从第1期到第10期的所有微笑终于有了回报,而(小费,不微笑)的策略组合导致的结果连续发生几次的话,她的回报意识就增强了,使她可能认识到博弈中存在回报。假定这发生在博弈的第14期。
所以认识到惩罚的她在接下来的博弈中就要看看是否有承担责任的精神了,这和上面对顾客惩罚――责任机制的分析是一样的。但不一样的是在她选择承担责任甘愿接受惩罚的同时,他的每期效用是8单位,因而这使他能够认识到回报。
至此顾客和服务员都认识到了无限重复的博弈中存在着惩罚和回报机制,在继续的博弈中社会学习可能使他们认识到惩罚的限度,用后验的观察修正自己主观的估计,从而无限接近博弈内在逻辑决定的客观的惩罚限度。当主观惩罚限度客观化后,一报还一报的策略组合就形成了。
当这个策略组合被认识到并在持续的博弈中被接近和利用后,小费习惯最终就可能演化出来。
(三)小费习惯在封闭社区的扩展
这个过程却容易且比较迅速。小费习惯一旦先在某两个人中形成,对于没有秘密的封闭社区来说,就会迅速传播。假设小费习惯在服务员张三和顾客李四之间形成。当服务员王五问张三为什么每次对李四都微笑的时候,张三告诉王五说,微笑有小费收的时候,王五会怎么样?如果王五对小费感兴趣或者考虑到心情好的时候会让顾客得到免费的微笑,那么王五选择微笑而让顾客用小费来换取就是合乎情理的。同样如果顾客麻六问李四为什么张三每次都对他微笑的时候,李四说那是因为自己总是给张三小费的时候,麻六会怎么样呢?麻六如果想小费数额并不多而微笑服务值得追求的话,就可能会选择用小费换取微笑。如果麻六不想给小费,那么服务员也可能微妙地把相当于小费的数额转移到食物的价格中,这样还不如自己给小费呢。这样小费习惯在封闭社区的人格化关系网络中可能迅速传播并形成稳定的社区公共知识。偶尔的外来者面对这一公共知识时不单不能干扰它,反而有强大的压力要入乡随俗,调整自己的行为策略来适应这个习惯。 三、习惯的扩展:新小费博弈和旧小费博弈
假设2:开放社区,这是一个类似现代大都市的生活社区,即使社区内成员人数在一定时期内是有限的且规模较小,但由于边界是开放的,社区成员的共同体意识仍然不强。社区成员缺少对社区的认同和归属感使得即使居住在同一社区内的成员之间的交易也是以匿名的非人格化关系形式进行的。
(一)我们需要在新社区内建构新小费博弈
这次我们不需要借助偶然的巧合了,新居民已经有了小费习惯,且他们的行为会被老居民观察和认识到。这就能够保证博弈可以开始。
我们假定老居民在刚开始对新居民有一个心理上排斥的过程,因此尽可能地不与他们接触,这样新小费博弈主要是在对小费和微笑的交易有了模糊的初步认识的老居民之间进行的。
这个新小费博弈结构和旧小费博弈结构是相同的。如果只进行一次博弈,那么有两个可能的结果,一个是(无小费,不微笑),另一个是(小费,微笑),效用分别是(0,0)和(5,5)。从理性人的角度来说获得(0,0)效用的(无小费,不微笑)的结果的可能性很大,因为这是参与人占优策略的纳什均衡。
(二)新小费博弈的重复博弈
因此我们假定小费博弈在新社区也将无限期地重复进行。如果老居民一直不与新居民接触,而是在老居民之间进行博弈,那么这个重复博弈的过程和封闭社区内进行的过程基本一样,不同的是开放社区成员的流动性和弱归属感可能使小费习惯更加难以演化出来。
但当老居民和新居民接触后,小费习惯可能更快演化出来。我们现在先把开放社区内的居民分为两类,一类参与人是老居民,他们没有小费习惯的知识,只有与新居民接触后才能获得这种知识;另一类是新居民,他们是从具有小费习惯的封闭社区新迁入的,小费习惯对他们而言不仅是知识而且是规范。
这个新博弈的结构仍然和小费博弈结构大体一致。区别在于社会学习机制会大大得到强化。新居民参与人已经把小费习惯视为规范。这样事先已经对博弈结构有了明确认识的新居民参与人因信念的力量会使其有意识地引导老居民参与人向形成一报还一报的策略组合机制靠近,从而使小费习惯演化出来。
当博弈参与人发现并接近一报还一报的策略机制时,小费习惯就可能在他们中间自发地演化出来。
(三)小费习惯的扩展
当小费习惯首先在开放社区内一部分人中间演化出来后,习惯会自然地在社区内逐渐普遍清晰地形成。这个过程同时就是关于小费习惯的知识传播的过程,与小费习惯在封闭社区内的传播过程大体相同。不同的是在封闭社区的人格化关系网络中习惯知识的传播速度较快[7],习惯形成后稳定性较强,不容易受到其它冲击的袭扰,因而对封闭社区内的人来说习惯的规范效力更强,是一种客观的存在,并不单纯是无形的强制。在开放社区内习惯的演化过程较短,稳定性相对较低,面对更大程度上的袭扰,因而规范效力较低。但并不是说开放社区内习惯不能自我实施,这是任何习惯的本质,只是说在开放社区内习惯的自我实施确实在成员的社区身份意识较差的情况下面临搭便车的困境[8],这的确是一个令人难以乐观的问题。但这不单是习惯的困境,作为公共物品的成文法也同样面临这一困境,因此不能依此为根据说要加强政府的渗透和控制。相反,解决习惯法和成文法在开放社区的困境需要更加开放的社会结构,以便多层次的立体的社会治理机制的发育和成长。家庭、社区、职业、协会、媒体、社团等各种社会治理机制的成长本身可以减少对法律的需求,也会使得成文法的硬度下降,所以罗豪才教授提出了软法与公共治理的关系问题。 四、结语
小费习惯的形成起源于偶然的巧合,在封闭社区的人格化关系网络内经过无限期的重复博弈后形成。形成后它可以扩展到开放社区的非人格化关系网络中去,从而使习惯的范围扩大。
小费习惯在封闭和开放社区的居民之间的互动中自发产生,这说明无需政府的干预,这类习惯在调整和规范人际关系时就会产生欲求的效果。相反,政策会引发难以预料的后果,袭扰已经存在的自发秩序,使其稳定性受到影响,反过来又加深了对政府干预的需求。
小费习惯是自发产生的,是自我实施的,它的规范效力来源于自身。这和成文法的逻辑清楚区别开来。
注释:
[1]严格说来在小费习惯产生之前使用小费概念是不合适的,但笔者要建构博弈也似乎没办法不使用,这可能是一个“语言悖论”。
[2]具体的赋值是武断的,但只要这些代表效用的数字之间的关系符合博弈结构的内在逻辑要求,那就是合理的。
[3]萨格登建立交通博弈的目的是要论证说像“靠左或右行驶”这样的交通规则是可以在博弈参与人中间自发演化出来,政府制定的交通法规不过是对已经形成的习惯的“盖章”认可。这个案例的特殊性在于交通博弈有两个均衡,但彼此之间不存在效用上的帕累托最优次优或者无效率的比较。可能的靠左行使和靠右行驶两个习惯本身无所谓优劣,重要的是任何一个这样的习惯要从无到有的演化出来。但本文的小费博弈则有效率的比较,因此更为困难。
[4]完全理性指的是参与人的完全的计算和推理能力,博弈中有完全且完美的信息分布,并且参与人不会犯错误。对博弈来说,完全理性的参与人或者是天使,或者是魔鬼,只要参与人都不犯错误则大家都是天使,优良的习惯或规则演化出来没有任何问题,但只要有一个人哪怕只是在博弈进行的第一步无心的犯了错误,则大家马上都变成魔鬼,并从此恶性循环。
[5]也可以相反的对称假设。相反假设可能更容易展开论证,因为小费由具有小费习惯的参与人支付时稳定性和可预期性更高。
[7]习惯在默会知识的意义上说在封闭社区内传播较快;精确知识在开放社区传播较快。
[8]对于社区治理来说,习惯也是一种公共物品,有着搭便车的问题。
【参考文献】
[2]青木彦昌著,周黎安译.比较制度分析[M].上海:上海远东出版社(第一版),2001.
[3]约翰?梅纳德?史密斯著,潘春阳译.演化与博弈论(第一版)[M].上海:复旦大学出版社,2008.
[4]罗伯特?阿克赛尔罗德著,吴坚忠译.合作的演化(第一版)[M].上海:上海人民出版社,2007.
[5]张峰.博弈逻辑(第一版)[M].北京:中国社会出版社,2008.
本文标签:
[!--temp.ykpl--]