博弈论与霍布斯问题　　——兼答陈晓平教授的批评

簡體傳統

　　〔中图分类号〕B08 〔文献标识码〕A　〔文章编号〕1000—0763（2000）05—0085—05
　　伦理学有几个经久不衰的问题，这就是：（1 ）休谟价值问题：事实与价值的关系如何？我们能够从事实判断推出价值判断吗？（2 ）霍布斯问题：经济人与伦理人的关系如何？我们能够从经济人的论述中推出伦理人的论述即伦理规范的论述吗？（3 ）罗尔斯问题：功利与正义的关系如何？我们能够从功利原则推出正义原则吗？因而有比功利主义更高的原则吗？（4）爱因斯坦问题：在伦理学中能建立公理体系吗？如果能够，伦理学的公理体系和理论结构有什么特点呢？（5 ）维持根斯坦问题：各种人类伦理行为，有共同的本质吗？它们组成什么样的家族类似类或它们是什么样的类似的家族呢？所有这五个问题是相互关联的，它们分别由休谟、霍布斯、罗尔斯、爱因斯坦和维持根斯坦这些着名的西方哲学家和科学家以尖锐明确的方式提出来的，不过中国古代的哲学家们也都曾以不同方式和不同程度上接触到这些问题；尤其是在中国改革开放的伟大实践中，在经济体制改革和政治体制改革的探索中，在物质文明和精神文明建设中，我们在理论上又不断面临这五个问题。因此研究这些问题必定体现出某种东方与西方，传统与现代的思想冲突的思想的交融。本文的目的是试图创立一种新的观点和新的视野来讨论上述这些问题。不过，国内杂志限制论文字数一般不超过一万字，所以本文不可能全面讨论上述问题，只讨论第二个问题即霍布斯问题。
　　人们常说，我们不应也不能超越社会经济状况来考察道德问题。其实，这个问题对于我们来说，更准确地说应该是这样一个问题：我们不能越过人类的基本经济事实即人类基本行为来讨论伦理问题。那么，基本的经济事实或人类基本行为是什么呢？这就是：每一个人都是自利的（Self-interested），即要实现自己利益最大化或最优化的“理性人”或“经济人”。现在绝大多数经济学家都承认全部经济学的出发点就是自利的经济人，它通过市场“看不见的手”的调节而有利于并不是他们想去追求的公共利益。现在我们的问题是：自利的个人之间怎样能够通过相互的交往，建立健全的伦理规范而自觉成为一个高尚的人、一个纯粹的人、一个有道德的人、一个脱离低级趣味的人和一个有益于人民的人呢？这个百思不得其解的问题就是“经济人”怎样能够变成“伦理人”的问题，在历史上首先由霍布斯以最尖锐的方式提出来，在讨论市场经济与精神文明建设时我们又千百次地遇到这个实质上的霍布斯问题。“霍布斯问题”（Hobbesian Problem ）这个提法是社会学家帕森斯于1949年和哲学家哈贝马斯于1981年首先使用的，它可以表述为“社会秩序（以及伦理规范）是怎样可能的问题”（〔1〕，p.280）也可以表述为个人利益的价值判断如何能够推出社会义务价值判断？简单地说就是“经济人”怎样能够变成“伦理人”的问题。历史上有一些哲学家，如亚当·斯密、洛克、帕森斯和哈贝马斯认为，经济人是不能推出伦理人的，“义务……是不能仅仅从目的理性的论述中推论出来”。（〔1〕，p.282）因此伦理规范应该另寻它的出发点。亚当·斯密找到了“社会同情心”洛克找到了“人类天生的平等”，某些马克思主义者找到“公有制”和“阶级友爱”等等。
　　但是，许多哲学家还是认为霍布斯问题有解，可以从经济人的前提中推出伦理人的结论，这样来解决霍布斯问题的，可以找出三个有代表性的理论模型。这就是，近代的霍布斯“自然状态”模型；现代的罗尔斯“原始状态模型”和最新的“博弈论模型”。
　　　　　　一、霍布斯的“自然状态”模型
　　霍布斯（T.Hobbes,1588—1679）认为，在伦理规范出现之前，人类之间处于自然状态：（a）自然创造人类，人类在能力上大致平等，这就产生希望的平等，若两人欲求相同的排他的事物，这事物不能为他们共享，于是他们便成了敌人。（b）每个人都有这样的自然权利，为了保全自己的生命和为了自己利益得到满足，对世界上每一样事物，甚至包括别人的身体在内，都有处置的权利，将它们当作达到自己目的的手段，而不当作目的本身。这样人们彼此必然相互摧毁、相互掠夺，包括剥夺别人的生命、财产与自由，就发生了“一切人反对一切人的战争”。于是人类的生命是“孤独的、贫穷的、凶残的、充满恐惧的和短促的”。
　　问题如何解决呢？人们为了自己个人的利益，必须订立防范人们之间过度相互竞争的社会契约。正是导致一切人反对一切人的那个同样的自利驱动力，即对生命安全和舒适生活的渴望与欲求以及对“死的恐惧”（它的作用如同牛顿万有引力对物体的作用一样），导致人们走出自然状态，达成和平共处、相互合作的协议：每个人放弃别人同样愿意放弃的那一部分权利，满足于具有他所答允给别人同样多的自由。这就产生所谓平等权利、平等自由的正义原则。理性能帮助我们制定这样的原则。当然这里暗含了一个前提，那个协议的各方都是自由人，没有人能将自己的意志强加于他。这样权利的平等转让就是社会契约。由此而产生“公道（正义）”、“互惠”、“和顺”、“宽恕”、“正直”、“慈爱”、“平等”等道德信条。总之，霍布斯力图从自利的个人（Self-intersted individals）即生命自我保全（Slef-preservation）这个公理中推出一切道德原则，正像物理学家从牛顿的万有引力中推出一切行星运动规律一样。
　　但人是自利的，谁来保证人们不为了自己的利益而撕毁协议？霍布斯认为，这就需要一个有绝对权威能使臣民绝对服从于它的政府来监督协议的执行，对违反协议者进行惩罚与制裁。他称这个政府为“利维坦”，即圣经记载的“海上怪兽”，是至高无上的“上帝代理人”。可是组成政府的那些人也是自利的，他们有了权力更加可以胡作非为，谁又来监督政府秉公办事并尊重人权？霍布斯没有回答这个难题，他陷入困境，用系统论的语言来说他由于只相信“他组织”不相信“自组织”，便不能解决这个问题。而用逻辑学的语言来说，自利的个人或“经济人”这个前提是不能单独地、完全地推出各种伦理原则或伦理人的论述的，必须附加上某些辅助前提或辅助假说才能解释人类的基本的伦理现象。自利的个人是道德推理的必要而非充分的条件，是第一的原则而非唯一的原则。霍布斯强调这个前提是完全正确的。他的错误在于当他不能由“经济人”单独导出“伦理人”的时候加进了一个强权政府，不但不能消除这个逻辑鸿沟，而且加深了这个鸿沟。
　　荀子的《礼论》与霍布斯的《利维坦》有异曲同工之妙，都视自利的个人为伦理礼义的出发点。荀子曰：“礼起何也？曰：人生而有欲，欲而不得，则不能无求，求而无度量分界则不能不争。（这就是霍布斯所说的“两人欲求相同的事物而成为敌人”）争则乱，乱则穷。（这就是霍布斯的“一切人反对一切人的战争”，结果导致“人类的生命的孤独、贫穷、凶残、恐怖和短促”）先王恶其乱也，故制礼义以分之，以养人之欲，给人之求。使欲必不穷乎物，物必不屈从于欲，两者相持而长，是礼之所起也”。荀子在这里也和霍布斯一样强调从个人长期利益出发来看礼义伦理，强调君主政府在维护伦理的作用，不过中国古代哲学没有西方近代哲学那种论证的严密逻辑的推理，因而它的缺点与矛盾并没有暴露得那么明显。
　　　　　　二、罗尔斯的“原初状态与无知之幕”模型
　　美国哲学家约翰·罗尔斯（John Rawls,1921—）于1971 年写了划时代的伦理学着作《正义论》。《正义论》可以看作是解决霍布斯问题的又一个理论模型。它的基本概念是原初状态与无知之幕。所谓“原初状态”是这样的一些初始条件，由此可以推出伦理关系的正义原则。这些初始条件主要有三个：①有限的资源，即“资源的中等程度的匮乏”。②人们只关心自己的利益不关心他人利益，这就是存在着“互相冷漠”（mutually disinterested）的理性人。③这些理性人在“无知之幕”（the veil of ignorance ）遮盖下要对建构社会基本制度的原则进行理性选择。
　　理性选择：所谓无知之幕就是假定每个人都不知道自己的出身和社会地位，也不知道自己的财富、能力和智慧，以及将来自己在社会上落入什么处境的概率。在这种不确定性的因而任何个人都没有什么优越性也没有什么偏见的公平竞争条件下对社会构造的正义原则进行选择，人们都必然倾向于思想保守，按决策论中的“最大最小原则”（ Maximin rule）进行选择。就像如果你在“无知之幕”的遮盖下，不知道自己是男人还是女人，你大概会选择男女平等的原则而不会选择男人可以压迫女人的社会，因为你也有50％的概率做女人。
　　这样，选择的结果，必定是两个正义原则：（1 ）所有的社会基本价值，包括自由和机会、收入和财富、自尊的基础都要平等地分配；（2 ）除非对其中一些价值（如社会的和经济的价值）的不平等分配大体上有利于社会上处于最不利地位的人。
　　罗尔斯模型的优点在于，他用一个假想的“无知之幕”代替了霍布斯的现实的强权政府，作为辅助假说从理性的、自利的个人出发。推出了一系列基本的道德原则，如平等的自由、机会平等、最不利者也受益，应帮助弱者，也许还有功利效率原则等。在内容上比霍布斯更加具体，在论证上和辩护上比霍布斯更加严格。但揭开了无知之幕的现实人为何能接受这些原则呢，这仍然是一个没有很好解决和解释的问题，而且特别值得一提的是，罗尔斯将他的（A）平等的自由，（B）机会平等，（C）最不利者也受益（福利原则）和（D）功利原则等几个原则机械地对立起来，将它们按字典式进行排序，认为平等的自由原则永远优先于机会功利原则，而机会平等原则又永远优先于福利原则，而福利原则永远优先于功利原则。“前者对于后者来说就毫无例外地具有一种绝对的重要性”。（〔2〕，p.40）用优先逻辑的符合（P表示优先）来表示，这就是：

├（APB）∧（BPC）∧（CPD）

　　
　　把它作为一个公理与他的两个正义原则相并列以解决几个正义原则之间可能发生的价值冲突问题。字典式排序在实际上与社会的许多实际情况不相符合，因而造成许多不能消化的反例。而在理论上，罗尔斯的伦理系统带有强烈的本质主义的倾向，认为人类伦理行为一定存在着一个最高的原则或本质，这就是两个正义原则，其他的原则都可以唯一地由它推出或受它支配。这一点与功利主义的方法论没有两样，只不过功利主义认为一切伦理原则都只能由功利原则作为最高原则加以推出。用系统论的语言来说，罗尔斯的伦理自组织系统，没有足够的灵活性与多元化，没有几个不同的价值序参量（例如功利、正义、仁爱等）的竞争与协同的变化。
　　罗尔斯的正义原则与中国传统哲学中的“义”的概念属于同一种类型，而功利原则的中国传统哲学的“利”的概念比较接近。儒家的“重义轻利”，孔子的“君子喻于义，小人喻于利”，孟子的“王！何必曰利！亦有仁义而已矣”以及荀子的“以义制利”，都类似于罗尔斯的正义原则以字典式序列优于功利原则。他们与罗尔斯同样提出了类似的问题，有比“利”（功利）更高的道德原则吗？他们的回答是：有！这就是“义”（正义的原则）。
　　　　　　三、博弈论模型
　　二次世界大战后兴起的博弈论，讨论的是理性人的选择与相互对策问题，被誉为“社会科学的统一场论”。运用它来解决霍布斯问题，可以看出经济人是怎样能够变成伦理人的。本文的主要工作，就是运用博弈论来解决经济人变成伦理人的问题，运用博弈论力图将功利主义和道义论、功利原则和正义原则统一起来。
　　案例：典型的案例是囚犯困境。不过该案例讨论的是二人合作作案被缉捕后的招供还是不招供的理性选择问题，用以讨论伦理关系的形成虽没有逻辑障碍但有心理障碍，我将它改为A、B两个原始人合作捕杀猛兽。如A在战斗中逃跑待B擒得猛兽后又可坐享其成，因而对A 的利益来说这个对策的得分可记为10分。而B留下孤军作战，虽也有捕获猛兽之机会但也有被猛兽咬伤之危险，权衡得失这个对策对B 的利益来说可记为0分。A、B同时逃跑，利用这段时间去采集野果、野菜之类，虽然没有肉食但也不是一无所获，故二人在记分上均记为2分。而如果A、B 都坚守阵地合作战斗，可将猛兽打死，均分其肉，各记得分为6分。这样在这个不确定的博弈中，A与B均有两种对策：1.逃跑，2.合作。他们的支付矩阵如下：

　　　　　A[,1]（逃跑）　　A[,2]（合作）B[,1]（逃跑）│（2，2）　　　（10，0） │B[,2]（合作）│（0，10）　　　（6，6） │

　　
　　这在博弈论中叫做二人不确定性非零和博弈。
　　就个人来说，最优选择是什么？是逃跑还是合作呢？以A为例，如果B逃跑，A当然要选择逃跑（即方案A[,1]，这里A可得2分），否则他会得到0分。如果B采取合作态度，坚持战斗，则A 还是采取逃跑方针为佳。因为我逃跑此时可得10分，比坚持战争时得分6分还要大。同理B也采取了同样的方针，同样的对策。结果：A也逃跑，B也逃跑，大家只各得2分。很明显，从这个矩阵来看，如果A、B都采取合作的方针，大家都会得到6分。显然后者才是最佳的（optimal）选择方案。这就是说，从个人角度看的最优方案，从整体角度看不是最大而是比较差的方案。这就是困境Dilemma就是“悖论”（系统论将它称为“整体悖论”）。这里个人理性与整体理性发生矛盾。个人理性的结果，导致整体非理性，即支付函数值为（2，2），不是最优。而要获得整体的理性（6，6）导致个人的非理性（不是最优）的选择。这里，逃跑的方案代表A、 B 不受任何约束可以为所欲为，相当于霍布斯的自然状态。其结果是人类处于一种悲惨世界，即霍布斯所形容的贫穷、孤独、凶残、恐惧和短命的人生。当然它的得分很低，相当于这里的（2，2）。而A、B都坚持合作表示形成道德规范的状态，道德规范约束大家走向共同合作，其结果，整体利益达到最大化，即6＋6＞10＋0＞2＋2，相当于一种功利主义的目标。而不采取一方逃跑一方合作的方地，则相当于不采取损人利己的“解”，即不平等不正义方案A[,1]B[,2]或A[,2]B[,1]，这相当于“平等的自由”和“平等的权利”，和将别人看作是目的而不只是看作手段的原则。
　　这样，“囚犯困境”或“合作狩猎”的支付矩阵的各个值的组合便有了它的伦理意义，可以写成如下的定性形式：

A　　　　　　 A[,1]　　　　　　　　　　 A[,2]　BB[,1]　个人理性:自然状态　　　　不正义的选择:权利　　　 或原始状态　　　　　　　　的不平等状态B[,2]　不正义的选择:权利　　　　集体理性:功利主义　　　 的不平等状态　　　　　　　和正义原则

　　
　　现在的问题是：如何解决个人理性与集体理性的矛盾，使具有个人理性的人过渡到具有集体理性的人呢？如何从选择A[,1]B[,1]方案进展到A[,2]B[,2]的方案呢？博弈论的现代成就证明，这就是自利的个人经过重复多次的博弈的结果。这时自利的个人追求的并不是在某一次博弈中期望的得分最大，而是多次博弈中期望得分的总和为最大。1980年博弈学家罗伯特·艾克罗特用电脑计得在二人多次博弈中，对于个人来说最优方案不是“总是不合作”而是“第一次合作，以后各次依对方的对策，一报回一报”即这次你合作了，下次我回报以合作，上次你“逃跑”、不合作，我也回报以不合作。不过，从理论上讲，这里所谓“多次博弈”指的是“无限次博弈”。不过从实际上讲，无限次博弈是不可能的。只要足够地多，就会接近这个极限。在这里，个人采取这个方案，有一个摸索、学习，包括思想境界的提高的过程，一旦大家摸索到这个方针，就相当于大家在A[,2]B[,2]的决策上稳定下来。这样个人理性就转化为集体理性。“经济人”就变成了“伦理人”，伦理规范便因此而形成。为什么这样说呢？
　　（1）通过多次博弈，人们通过学习，认识到必须采取基于回报的合作方针，通俗地说，这就是从合作的愿望出发，人不利我，我不利人；人若利我，我必利人。当然，人不利我，我不利人，这句话并没有利他主义的含义。但是从合作愿望出发，人若利我，我必利人，这句话就包含了互惠性的利他主义、仁爱思想的出现。没有这种互惠利他主义，个人的长远利益的实现是不可能的，社会的和平与合作是不可能的。
　　（2）通过多次博弈，人们的相互关系的对策在A[,2]B[,2] 区稳定下来，就意味着人们从追求自己的短期利益最大化的目标转变到追求长期利益最大化的目标，再转变到追求共同利益最大化的目标，这里包含了一个从手段转变为目标的过程。共同利益最大化本来是达到个人利益最大化的手段，现在手段变成目的。这就是功利主义和集体主义的产生。
　　（3）通过多次博弈，人们相互之间默契了不采取A[,2]B[,1]与A[,1]B[,2]的方案。这就意味着摒弃不正义的原则。这就是正义的原则和平等的人权的起源。
　　当然，以上的典型案例，说明功利原则与正义原则在同一个案例中同时被选择。博弈的案例是很多的，我们也可以设计一些案例说明理性人在这里只选择正义原则。例如在“合作狩猎”案例中，如果A[,2]B[,2]方案的支付函数值为（4.5，4.5），则这个选择只是正义原则，而不是功利原则，因为既然A[,2]B[,1]与A[,1]B[,2]的总功利10＋0＞4.5＋4.5，即大于A[,2]B[,2]方案的总功利值。按功利原则应选择A[,1]B[,2]或A[,2]B[,1]，但从上表可见它现在作为不正义的方案被摒弃了。可见不同的伦理原则，可以通过不同的博弈而被选择。
　　这样从理性的、自主的自利个人的前提出发，不需要附加政府的外部作用，也不需要附加无知之幕等其他的辅助假说，只需要附加上多次不确定性博弈的条件便可以推出“伦理人”的各种伦理规范论断。伦理的社会契约是通过多次博弈而产生的。多次博弈的理论模型将功利主义、仁爱主义和正义论三者统一起来，这个集体理性和伦理规范的统一起源并不是依靠政府的外部强制（当然外部强制不是没有必要，它加速了一种客观必然性的实现），而是通过博弈过程的一系列学习和自我教育的内部过程而实现的。霍布斯问题就这样解决了。当然伦理学并不是数学的问题，博弈论伦理模型概括了现实生活中通过自组织而形成伦理规范的各种社会系统。如通过核军备竞赛而达到的核裁军形成国际核伦理规范；通过国家之间的政治、经济和军事较量而形成和平共处的国际关系；通过企业之间污染环境的博弈而形成保护环境的伦理规范，终于使功利原则、仁爱原则与环保原则四项基本原则统一起来。这些都是博弈论的关于“伦理人”形成过程的活生生案例。在改革开放中，我们常常埋怨市场经济（及其“经济人”）导致道德滑坡或道德沦丧。其实这是“经济人”通过多次博弈而转变为“伦理人”的道德爬坡过程，这是一个自发的又是自觉的过程。这个在寻求个人长期利益最大化的博弈中不断摸索、不断学习而进入伦理新境界的过程，显然包含了一种新的伦理关系临产的痛苦，我们不应该一概将这个过程出现的负面现象说成是改革开放和市场经济带来的沉重社会代价。马克思说：“一个社会即使探索到了本身运动的自然规律，它还是既不能跳过也不能用法令取消自然的发展阶段。但是它能够缩短和减轻分娩的痛苦。”
　　在中国古代文化中，有许多博弈论的思想。比较突出的是孙子兵法。孙子认为，在国家之间的利益冲突中，最佳的决策并不是一方将对方消灭，而是求得长治久安，要避免两败俱伤的局面。孙子说“夫用兵之法，全国为上，破国次之；全军为上，破军次之；全旅为上，破旅次之；全卒为上，破卒次之；全伍为上，破伍次之。是故百战百胜，非善之善者也。不战而屈人之兵，善之善者也”。孙子的说法可以理解为通过博弈达到和平与合作是国家采取的最佳决策。
　　最后，借此机会我要感谢陈晓平教授，他在《自然辩证法通讯》杂志1999年第5期上，撰文批评了我的《现代科学与伦理世界》（1999 年湖南教育出版社版）一书，特别是批评了我所主张的环保原则、功利原则、正义原则和仁爱原则不能相互还原而组成相互独立的健全社会的四项基本伦理原则这个论点，认为这是一种“整体的非本质主义”、“用不一致原则作为一个系统的公理或出发点，这个‘系统’已经不成其为系统了”。不过，陈晓平教授在他的论文中并没有指出四项基本原则之间有任何不可消解的逻辑矛盾，相反，他也同时承认这四项基本原则，只不过他认为这四项原则都可以从功利原则推出罢了。我不知道他的“不一致原则”这句话是什么意思，是指内容上的不一致呢？还是指逻辑上不相容呢？如果是后者，则我不知道四项原则“不一致”的结论从何而来，而且既然“不一致”，陈晓平教授又怎样能够从功利原则将它们统统推出？这样他的功利主义一元论岂不“也不成其为系统了”吗？我觉得他的一元功利主义伦理学在逻辑地位上并不比我的多元系统主义伦理学好多少。现在我进一步用博弈论说明了四项基本伦理原则在发生学上的统一起源，似乎有利于理解四项基本伦理原则的一致性与相容性，并有助于建立包容功利主义和道义论而由超越功利主义和道义的统一伦理理论。
　　〔收稿日期〕1999年11月
自然辩证法通讯京85～89B2科学技术哲学张华夏20002000博弈论是当代数学的一个很重要学科。它应用于社会科学，被誉为“社会科学的统一场论”，而霍布斯问题是伦理学和科学伦理学的关键问题。本文的目的，是力图运用博弈论来解决霍布斯问题，说明经济人怎样能够成为伦理人，说明功利、正义、仁爱、环保等道德原则怎样通过理性人之间的博弈而产生，并由此指出多元的系统主义的伦理学在逻辑地位上并不亚于一元论的功利主义伦理学，以此来回应陈晓平教授对我的批评。霍布斯问题/原初状态与无知之幕/博弈论张华夏，山西大学，太原030006　　张华夏（1933—），山西大学科学技术哲学研究中心教授。作者：自然辩证法通讯京85～89B2科学技术哲学张华夏20002000博弈论是当代数学的一个很重要学科。它应用于社会科学，被誉为“社会科学的统一场论”，而霍布斯问题是伦理学和科学伦理学的关键问题。本文的目的，是力图运用博弈论来解决霍布斯问题，说明经济人怎样能够成为伦理人，说明功利、正义、仁爱、环保等道德原则怎样通过理性人之间的博弈而产生，并由此指出多元的系统主义的伦理学在逻辑地位上并不亚于一元论的功利主义伦理学，以此来回应陈晓平教授对我的批评。霍布斯问题/原初状态与无知之幕/博弈论

网载 2013-09-10 20:58:29

[新一篇] 華文文學研究的新趨勢　　——關于第九屆世界華文文學國際研討會的思索

[舊一篇] 歷史小說創作筆談寫出歷史人物的精神世界