为何关羽被奉为圣人?   [杂思 经济学]

最近《赤壁》热映,继易中天教授之后给三国历史又烧上一把火。我今天想谈谈三国之中最被神话的一个人物——关羽。是的,最大的神话不是多智近妖的诸葛亮,而是我们的武圣关二哥。在正史《三国志》中功绩平平(实在是一介武夫)的关二哥最终成为了武圣,在民间香火不断的关帝庙中接受了近千年的顶礼膜拜,这被神化的根源是什么呢?

在大多数人三国知识来源的演义小说《三国演义》中,武功并非天下第一(或许前五都排不上)的关羽被当作最大的英雄。因为关羽的行为是遵循“投桃报李,以牙还牙”的典型,所谓忠义二字挂心间。关羽是世俗中国的图腾,他的这一特质便是中华文明在几千年文明演化中习得的朴素智慧。无独有偶,孔圣人也有类似的话:“以德报怨,何以报德?以直报怨,以德报德。”一个历史悠久的文明,会在长期的不断进行的重复博弈过程中找出优势的竞争策略,这是不足为奇的。

老祖宗所说的“投桃报李,以牙还牙”用一个经济学时髦说法是“一报还一报”策略。这和主流经济学的一些理论相冲突。主流经济学假定参与人是理性人,他们的决策过程都是按照追求效用最大化的目标来进行的。其实如果这样假定,就相当说参与人是上帝而不是人了。理性假定是说,参与人都是能够掌握足够的信息和具有足够的计算能力,从而找出实现其效用最大化的具体途径。但是,我们知道,人不是上帝,人的计算能力是有限的,是有成本的,而获得信息的途径也是有限的。人是进化而来的,即使是现在,人类仍然处于进化的过程之中。处于进化过程中的人类行为具有进化特征,许多人类的行为并不简单地遵循所谓效用极大化的规定,而是遵循进化优势的规则或者策略。

所谓的进化优势策略,是说在进化中可以获得竞争成功的策略。进化博弈理论已经发现,在进化博弈中,某些策略可以使得参与人取得竞争优势,从而成功繁衍自己的后代。不具有竞争优势的策略会使得参与人在竞争中失败,从而导致自己物种的灭绝。人是亿万年长期进化的结果,在人与人之间的竞争中,也一定有其行为方面的优势竞争策略。这样的策略是什么呢?大家很可能想到的是,这样的竞争优势策略就是追求效用最大化的策略。

主流经济学家会说,尽管人类行为有多样性,但是,如果不是追求个人效用最大化,在激烈的生存竞争中,这样行为的个人会因为缺乏竞争优势而被淘汰;所以,理性人假设是针对那些能够在生存竞争中获得生存能力来说的。那些非理性人从长久看来是不存在的了,所以经济学假定理性人是合理的,优势竞争策略就应该是追求效用最大化策略。

这样的辩护逻辑也就是1960年代那场发生在罗伯特. 西蒙与米尔顿.弗里德曼之间的著名辩论中后者提出的关键性观点。前者提出经济学理性人假定的非现实性,并建议用有限理性假定去取代理性人假定,而后者就从这样的逻辑去为理性人假定进行辩解。当时普遍认为弗里德曼在这场大争论中获得胜利。但是,现在看来说这场辩论中谁是最后的赢家还仍然为时过早,尽管这两位诺贝尔经济学奖得主都已过世了,但是硝烟还未散尽!(学工科的朋友请联想波尔和爱因斯坦的大辩论)。

近年来不仅在行为经济学和心理学领域的进展不断发现不利于理性人假定的证据,而且,进化博弈方面的研究更加有力地使得理性人假定陷入困境。董志强博士最近在我校985学术创新论坛上宣读的一篇论文,通过数字仿真模拟实验,发现在生存进化中取胜的不仅不是那些追求个人效用最大化的理性行为人,而且反而是追求公平效用的非理性行为人。

在我看来,弗里德曼失误在没有考虑人类的策略性行为。在一次性博弈中,理性行为是具有生存优势的;但是,如果是长期的重复性多次博弈,追求公平目标的策略可能会给人带来更加多的竞争优势。这是因为,公平行为会使得个人在重复博弈中获得他人的公平回报,而自私自利的理性人却反而会因为过去因为与他人进行利益争夺遭受到他人“以牙还牙”的报复。从长期看来,目光短浅的理性人其实是吃亏的,因而不具有生存竞争优势。不同的个人之间形成策略性合作其实比只考虑个人短期利益的理性人来说是更加具有生存能力的。

其实,来自心理学家,生物学家和博弈论经济学家的大量模拟实验结果都表明,在长期而不是短期的重复性博弈中,采取“一报还一报”的策略是优势策略。为什么“一报还一报”会成为优势策略呢。计算机模拟只是告诉我们有这样的结果,凡是采用“一报还一报”策略的参与人都会在进化博弈中获胜,而采用其他策略的参与人会失败。但是,计算机模拟并不告诉我们为什么是这样。这个任务要由行为博弈专家来完成。

Rabin(1993)在J.Geanakoplos,D.Pearce和E.Stacchetti(文献中简称为GPS)所提出的“心理博弈”框架基础上,构造了一个引入公平偏好的博弈论体系。他的关键性工作是通过对“公平”概念加以严密的定义来改造传统博弈论中的支付函数,从而发现了一些新的均衡。他得到的结果是,除了传统博弈论中已知道的纳什均衡之外,还出现新的“公平均衡”。这个工作还发现了许多“合作性均衡”,它们并不象传统博弈论那样要求无限次重复博弈或甚至重复博弈。这种结果对利他行为和合作现象的解释是强有力的。

Rabin的方法可以带来两种博弈均衡,即合作的(互惠的)和不合作的均衡(互损的)。投桃报李均衡是合作的,而以牙还牙均衡是不合作的。这可以解释现实中我们的观察,现实里是既有合作又有不合作的,无论是在经济的,政治军事的以及一般的人际交往里都是如此的。

虽然“一报还一报”对行为主体来说这是优势策略,社会却不会直接倡导它,因为合作的均衡可以为所有的参与人带来比不合作均衡更多的收益。故而,导致合作性行为的“投桃报李”策略更受到大家的推崇,这是一个社会的文明内涵,是规范人们行为的标准。所以中华文明将一贯遵循“投桃报李”的关羽关云长推上了神坛(神话他的部分基本是投桃报李而非他的以牙还牙),奉为武圣世世代代接受世人的膜拜。其实这个关羽已非历史中的关羽,我们膜拜的是古老中华文明的智慧。

Tags: ,

读者评论 25

  1. Jo :

    好文。

    不过,这句话“在我看来,弗里德曼失误在没有考虑人类的策略性行为。”有证据吗?

    人作为一个有相当持续期的生命体,考虑中总会带有长期的因素的。比如农民喜欢养儿子。而即便有些新生事物出现时,人们用短期利益最大化来指导行为,比如冲广告,忽视产品研发升级;但他们也被意识到应该用更长期的理性来竞争的对手干掉了。

    这些案例的普及,就是市场教会所有的人应当更长期地思考问题的方法。

    2008年8月05日 10:02:01
  2. Jo :

    并且似乎没有特别的证据表明与周遭保持和谐友好的关系独独是中华文明的智慧。

    谁不喜欢朋友多呢?比如,西方国家的大多数朋友关系不是建立在崇敬“以德报怨”之上的。但我们不能说他们的朋友关系就不和谐,或者没有我们的和谐。

    2008年8月05日 10:05:17
  3. 李二 :

    此文是由我一篇演讲稿前面部分改写而成,目的是阐述传统理性经济人假设的局限。有限理性在我看来能很好的解释这个世界。故而既然我认为“一报还一报”是人类社会普遍的优势策略,那自然不仅仅是中华文明所独有,关羽只是这个策略在中华文明背景下的一个例子。

    至于我认为弗里德曼是没有考虑人类的策略性行为,是因为我觉得如果考虑这个,就应该发现有限理性比传统理性经济人假设更能解释这个世界。我很看好经济学这这一点上的突破:)

    2008年8月05日 16:09:21
  4. Jo :

    传统理性经济人假设只考虑当下那个动作的效用最大化吗?有证据吗?这是疑问句,我真不知道。

    2008年8月05日 16:19:12
  5. 李二 :

    当下怎么定义?主流经济学数理化的基础,就是求解效用函数的最大值。然而人不是上帝,人只能推演有限的步骤。在信息不充分的重复性博弈情况下,人可以策略性的放弃可计算的效用最大化。

    2008年8月05日 17:08:42
  6. Jo :

    “在信息不充分的重复性博弈情况下,人可以策略性的放弃可计算的效用最大化。”

    有证据说明,策略性地放弃可计算的效用最大化是好策略吗?

    其实我想说的是,没法被证伪,因为我们生活在一个世界,没有“廉价宇宙”多个世界的支持。

    2008年8月05日 21:50:10
  7. Jo :

    而引用的关羽的例子只是说,这种类型的策略在这个人身上获得了成功,但并不说明在其他人身上也成功了,同样不能说明不用这种策略的人就成功不了。

    而中国本来弘扬的就是这种类型,所以关羽被颂扬也就没什么奇怪的了。

    2008年8月05日 21:52:26
  8. 李二 :

    举例子说明吧。

    比如你现在经营一家网站,理性经济人会假设你会自动追求效用最大化。事实上呢?由于信息不对称,你在实际操作中会遵循一些道德规范(你并非是通过精确计算后决定遵循的,因为你并不拥有全部信息),而放弃效用最大化。弗里德曼用的终身效用函数并不存在。

    在这里,需要避免的是对效用最大化在逻辑上的循环定义。

    2008年8月06日 10:01:37
  9. 李二 :

    至于“一报还一报”策略,先看这个:

    “合作与信任是人类社会得以存在和发展的基础,但它们总会被自私所侵蚀。霍布斯认为,无论人与人还是国与国的关系,随着资源稀缺的加剧,都会变得更接近狼与狼的关系。但是,现代社会终究没有沦为原始丛林,有合作善意的人群还没有灭绝,人与人之间的温情和信任也没有消失——自私和克制自私,似乎同样属于人类本能。
      由此,密歇根大学政治学家罗伯特·阿克塞尔罗德(Robert Axelrod)开始思考:在现代复杂社会中,何种行为规则才是个人收益最大化的最优竞争策略?
      上世纪80年代,他写信给不同学科的学者,让他们提供自以为最佳的行为规则,然后编成电脑程序,相互竞赛。第一场锦标赛,他共收到14个程序,在捉对厮杀中,程序运转了十多万次,最后按照总得分排出名次。胜出的程序,竟是其中最简单明了的“一报还一报”(Tit for Tat)。
      “一报还一报”是人类最古老的行为规则之一。它要求我们最初总以善意待人,在没有被欺骗之前,永远不要主动欺骗他人;但一旦发现他人的欺骗,下次交往时要毫不犹豫地报复、惩罚;惩罚过后,又回到起点,继续善意待人。这种行为规则中,永远只需记忆最近一次的对方行为,宽容看待对方的过往行为,除了上一次背叛。
      很快,阿克塞尔罗德又组织了第二场锦标赛。这次他收到了62个程序,其中还有不少程序针对“一报还一报”做了专门改进。一场混战的结果是,“一报还一报”再次排名第一。
      这两次锦标赛充分证明了“一报还一报”策略的威力。阿克塞尔罗德后来曾公开征集可能打败它的策略程序,但20多年过去,还没有程序能做到这一点。”

    于是结合现实社会,经济学所做的就是解释这个世界。很明显,理性经济人假设无法解释这个。

    我的本意是说关羽是这种策略抽象出的图腾。为何中国要弘扬这种类型?传统的统治者愚民的解释,我觉得不够本质。

    2008年8月06日 10:07:04
  10. Jo :

    我是这样认为的。

    所谓的遵循道德规范行事首先是一种无奈的行为,并不是放弃效用最大化,而是没法效用最大化。我没听说过哪个完整的理性人假设是只针对单次博弈的。

    之后,究竟是遵循道德规范行事是最好的策略还是其他方法是更好的策略,我不知道。因为同样有许多不那么道德的人活得好好的。

    而崇尚遵循道德规范行事的风气并不奇怪,这从心理学实验里一定可以找出一堆有力的数据结果。因为这是符合一些人类社会的“下意识”反应的。类似别人朝你微笑,你也会报以微笑或其他友好的举动一样。

    2008年8月06日 19:50:03
  11. Jo :

    关于哪种策略更好实际上也是个无解的命题,因为好是相对于价值观来的,这不是客观标准,说不清楚。

    2008年8月06日 19:51:42
  12. 李二 :

    我们不做策略“好”“坏”的判断。只判断那种策略更具优势。

    你承认了你行事时“无奈”了,因为没法效用最大化,那你不是“放弃”了效用最大化吗?你无法做到只能无奈的放弃嘛。所以我说是“有限理性”。如果要想符合传统的那种经济人假设,只能是单次或可控的有限次博弈,还是那句话,人不是上帝。

    至于道德规范,我说的是经济学中的概念,比如法律可以视为是道德规范。如果你很不能接受这个词,我换个表述:你很多时候的行事是有限理性的。

    不道德的人活的好好的,和一个理性经济人活的很差,都不足以对理论构成反驳。我们讨论的是进化优势策略,而非“万能成功宝典”。

    2008年8月07日 09:53:01
  13. Jo :

    “之后,究竟是遵循道德规范行事是最好的策略还是其他方法是更好的策略,我不知道。因为同样有许多不那么道德的人活得好好的。”

    这里的“好”就是优势的意思。

    我承认“无奈”,是不愿意做那票生意:我预期要达到效用最大化的无法优化的成本太大(策略能提供帮助的地方是优化那些可优化的成本)。

    我想说的是,并没有足够证据说明“完全符合道德规范行事”是更具优势的策略。有吗?

    我没有人所共知的案例,但根据我的观察,“适度道德”或者说“声称道德”或者说“将道德作为表现价值的工具”似乎是更优势的策略。

    2008年8月08日 12:00:45
  14. 李二 :

    JO,我什么时候说“完全符合道德规范行事”是更具优势的策略?
    你似乎误解了我的意思,我从未为道德辩护,相反我是个道德虚无论者,我认为道德是信息不充分条件下理性决策的部分替代品。

    另,你不计成本也无法按照效用最大化行事,你只能有限理性。这不仅仅是成本的问题,你不是上帝才是根本原因。

    “同样有许多不那么道德的人活得好好的”我对这句话的反驳逻辑不清楚,在我看来,这句话类似于拿“有人不吃药照样战胜了病魔”来反驳“生病时吃药比不吃药好”。

    2008年8月08日 18:18:44
  15. Jo :

    ?

    歌颂关公的高尚品质不是在倡导完全符合道德规范行事吗?同时,就凭此文,我就当然不会认为你是声称道德的人了!

    是成本问题,成为上帝就是成本 :D 正确的解释是:信息的成本。

    以下这段话不对的:
    “同样有许多不那么道德的人活得好好的”我对这句话的反驳逻辑不清楚,在我看来,这句话类似于拿“有人不吃药照样战胜了病魔”来反驳“生病时吃药比不吃药好”。

    我觉得我可以找出的道德与不道德活得好的比例和吃药与不吃药战胜病魔的比例是不一样的。并且后者某种程度上是科学,前者不能算是。

    2008年8月09日 08:06:30
  16. 李二 :

    歌颂关公是潜意识倡导“一报还一报”的策略,本文如此解读关羽封圣。

    即使不计成本,人也成为不了上帝,除非你能决定你的博弈对手如何行事,除非你能超越时间。你花再多的成本,你也不知道我接下来如何回应你,你不是上帝,你花100000000亿你也不知道。

    拿出比例那另说,拿个体事例来证伪非全称肯定命题,在逻辑上是行不通的。

    2008年8月09日 19:49:24
  17. Jo :

    即使不计成本,人也成为不了上帝,除非你能决定你的博弈对手如何行事,除非你能超越时间。你花再多的成本,你也不知道我接下来如何回应你,你不是上帝,你花100000000亿你也不知道。

    我当然知道你会如何回应我,因为你有价格。

    ————————

    拿出比例那另说,拿个体事例来证伪非全称肯定命题,在逻辑上是行不通的。

    莫非你能拿出数据?

    2008年8月09日 21:21:47
  18. Jo :

    回归一下,以免渐行渐远。

    我的观点是:本文是好文。但是一些事情上,比如理性人假设的问题,我认为并没有提出更好的方案。理性人假设是一种分析基础或框架,而不是具体策略,相应的,符合道德规范行事似乎更像是一种策略。

    另,即便是在提出一种更实用更优势的策略(因为实际情况中,重复博弈的问题的确难以求解效用最大化的值),这里也缺乏一些证据。换言之,也许精明算计是更优势的策略也说不定。

    另,我还说了,认为符合道德行为这是一种更优势的策略,符合一定的心理学原理和人类社会的普遍共性,也许这的确是一种更优势的策略,只是少了一些证据而已。

    到此,我不讨论啦!嘿嘿

    2008年8月09日 21:28:17
  19. 李二 :

    拿出比例那另说,拿个体事例来证伪非全称肯定命题,在逻辑上是行不通的。

    莫非你能拿出数据?

    ==========================

    JO,你不认为在博弈的情况下,一个策略是否能实现“效用最大化”同样依赖于博弈的对手么?

    理性人假设当然有合理性,但是我认为“有限理性”更能解释这个世界,这是对原理论的扩充和修正。个人相信这会是经济学的发展方向:)

    另外,我根本无意谈道德,我说的是“有限理性”。

    2008年8月10日 23:57:33
  20. Jo :

    有限理性对”有限”很难标准化啊

    2008年8月12日 15:19:15
  21. 李二 :

    关键是分析思路的改变啊,比如数理经济模型的一些假定需要重新设定,这是一个大进步呢。

    当然,没有数学的进步,也没有杨小凯的新型古典主义,也没有博弈论的兴盛。

    2008年8月12日 17:41:31
  22. Jo :

    如果数学真的比市场里的人有用,还会有次贷危机? 数学模型无法包含全部要素, 我们甚至连全部要素列都列不出来, 而且还都是在变动中的.

    另外, Adxonist有位作者Aris, 他就是干这个的, 我倒是希望他来说说现在世界上关于数学来分析经济的水平究竟几何.

    我怎么感觉你又回去了. 文章的意思好象是说不要也不能”分析穷尽”. 打住打住

    2008年8月13日 10:10:25
  23. 李二 :

    经济学只负责解释世界,类似物理学。改造世界是工程学的事情。

    2008年8月14日 11:01:27
  24. 李二 :

    其实面对宇宙,人类除了数学,还有什么别的凭借?

    2008年8月14日 11:02:38
  25. Jo :

    所以不可知啊,很高兴我们终于回归到一起了。

    因为不可知,所以没有真正的优势策略,再本质也得顺着泡沫走,不用说人的寿命,哪怕是人类的物种存续期都毕竟是有限的时间啊。

    2008年8月14日 19:13:43

评论