1792年3月,乔治·华盛顿行使了美利坚合众国历史上第一次总统否决权。我怀疑你是否能猜到他和国会在吵什么,除非你已经知道了。他们争执的问题至今仍有争议。事后看来,人们可能觉得这个问题是不可避免的,因为就像我将要解释的那样,其根源在于有关人类选择的本质的深远误解,这种误解在今天依然很普遍。

从表面上看,这似乎只是个技术性问题:每个州在美国众议院里应该分配到多少个议席? 它称为席位分配问题 ,因为美国宪法规定席位“在各州中……根据各自的数量[即它们的人口数]分配”。因此,如果你的州占美国人口的1%,它在众议院有权占1%的席位。这是为了实施代议制政府 的原则——即立法机构应该代表人民。不过,这只是众议院的情况。(与此相反,美国参议院代表联盟的各州 ,因此每个州不论人口多少都有两名参议员。)

目前众议院有435个席位。如果占美国1%的人口生活在你的州,那么严格按比例分配时该州有权获得的众议员名额——称为其配额 ——将是4.35个。当配额不是整数时(理所当然,它们几乎就没有过是整数的时候),就要用某种方法对它进行舍入。这种办法被称为分配规则 。“美国宪法”没有详细说明分配规则,把这些细节问题留给了国会,几个世纪的争议因此开始。

如果分配规则给一个州分配的席位与该州的配额相差不超过一整个席位,该规则就称作“与配额相符”。例如,如果一个州的配额是4.35个席位,为了“与配额相符”,规则应该给该州分配4个席位或5个席位。规则可以考虑各种各样的信息来在4与5之间作出选择,但如果它能给该州分配其他数目的席位,就称为“违反配额”。

当一个人第一次听说分配问题时,似乎能解决这个问题的妥协方案会毫不费力跳进脑海。每个人都问“为什么他们不干脆……?”我问的是:为什么他们不干脆把每个州的配额四舍五入成最近的整数?根据这样一条规则,4.35个席位的配额将舍入成为4个,4.6个席位舍入成5个。在我看来,由于这样的舍入绝不会增减超过半个席位,它将把每个州的席位数量保持在与其配额相差不到半个席位的范围内,做到“与配额相符”绰绰有余。

我错了:我的规则违反了配额。用它处理一个有10个席位的虚构众议院,就能看出这一点。假如有一个州的人口略低于总人口的85%,另外三个州每个都略高于5%。于是最大的州的配额略低于8.5,我的规则会把它舍入成8;三个小州每个州的配额略高于半个席位,我的规则把它舍入成1个。但现在我们分配了11个席位而不是10个。这本身没有什么要紧,国家要比原计划多养一名立法者而已。真正的问题在于,这一分配已经不具代表性:11的85%不是8.5,而是9.35。最大的州只有8个席位,比它的配额少了一整个席位还多。我的规则使得85%的人口未被充分代表。由于我们打算分配10个席位,确切的配额加起来必定等于10;但舍入之后的配额加起来等于11。如果众议院有11个席位,代议政制的原则以及宪法都要求每个州得到11个席位中公平的一份,而不是我们打算的10个席位中的份额。

又有许多“为什么他们不干脆……”的想法跳进脑海。为什么他们不干脆再设立3个席位并把它们分给大州,从而使整个分配与配额相符?(好奇的读者可以确认一下,实现这一目标至少需要3个额外的席位。)或者,为什么他们不干脆从其中一个小州拿出1个席位来给大州?也许应该从人口最少的那个州拿出来,使得受到不利影响的人最少。这不仅能使分配方案与配额相符,还能把总席位数目恢复成原定的10个。

这样的策略称为再分配方案 ,它们确实能做到与配额相符。那么,它们有什么问题?用这个主题的行话来说,答案是分配悖论 或者,用日常语言来说是不公平 和不合理 。

例如,我上面所说的最后一种分配计划是不公平的,它对人口最少的州的居民不利,让他们承担纠正舍入误差的全部成本。在这种情况下,他们受代表的程度被舍入成零。不过,在最小化与配额的偏差这个意义上,它几乎完全公平:此前,85%的人口在配额范围以外,现在所有的人口都在配额范围以内,95%的人口代表席位是与他们的配额最近的整数。确实有5%的人没有被代表——于是他们根本无法在国会选举中投票——但他们仍然处在配额范围内,实际上与准确配额的距离只是比原来远了一点点儿。(对于略高于0.5的配额,0和1与它几乎等距离。)然而,由于这5%的人完全被剥夺了公民权,大多数提倡代议制政府的人会认为这个结果的代表性比原来的方案低得多。

这必定意味着,“与配额的最小总偏差”不是衡量代表性的正确标准。但是正确的标准是什么?在对大多数人稍不公平与对少数人极其不公平之间,什么才是正确的权衡?美国的开国元勋们认识到,有关公平性或代表性的不同概念可能相互冲突。例如,他们为民主辩护的理由之一是,除非每个人都依法在立法者中间拥有一位权力平等的代表,否则政府就是不合法的。他们的口号“无代表,不纳税”表达了这种观点。他们的另一个愿望是取消特权 ,希望政府系统不带内置的偏见。这就要求按比例分配代表席位。由于这两个愿望可能相互冲突,宪法中有一项条款对此进行了明确裁决:“每个州至少有一名众议员。这就偏重“无代表,不纳税”意义上的代议制政府原则,胜过废除特权的代议制政府原则。

开国元勋们对代议制政府的论述中另一个经常出现的概念是“人民的意志”。政府应当体现人民的意志。但这是更多不一致的一个根源。因为在选举中,只有选民 的意志算数,但并不是所有“人民”都是选民。在当时,选民只占很少一部分:只有21岁以上的男性公民。针对这一点,宪法里所指的“数目”包含一个州的全部人口,包括妇女、儿童、移民和奴隶等非选民。宪法试图以这种方式通过不平等地对待选民 来平等地对待人口 。

因此,对非选民比例比较高的州,其选民每人分配到的代表更多。这会产生一种很不妥的影响,那就是在选民已经在州内部 拥有最高特权(即选民占特别少数)的州,他们现在又额外得到一项相对于其他州选民的特权:他们在国会分配到的代表更多。在奴隶主方面,这成为一个热点政治问题。为什么要给蓄奴的州在国会分配更多的政治影响力,与他们拥有的奴隶数量成正比?为了减少这一影响,人们达成妥协,在分配众议院议席时,把一名奴隶按五分之三个人计算。但就算这样,五分之三的不公平在很多人看来仍然是一种不公平 [1] 。在非法移民方面,同样的争论今天仍然存在,在分配议席时,他们也算作人口的一部分。因此,有着大量非法移民的州在国会得到更多席位,而其他的州就相应地吃亏了。

在1790年美国第一次人口普查之后,虽然新宪法要求按比例分配,但众议院议席是按一条违反配额的规则分配的。这条规则是由未来的总统托马斯·杰弗逊提出的,也对人口较多的州有利,使这些州的人均代表数量更多。因此,国会投票废除这条规则,代之以一条由杰弗逊的主要竞争对手亚历山大·汉密尔顿提出的规则,后者可以保证与配额相符,同时在州与州之间没有明显偏见。

这就是华盛顿总统否决的那项更改。他给出的原因很简单,就是这涉及再分配:他认为所有的再分配方案都是违宪的,因为他对“分配”这个词的解读就是用一个合适的数值因子来除 ,然后舍入,没有其他。不可避免地有人怀疑,其中真实原因是他像杰弗逊一样来自人口最多的弗吉尼亚州,该州在汉密尔顿的规则下会吃亏。

从那时起,美国国会一直在对分配规则进行争论和修补。杰弗逊的规则最终于1841年废止,代之以参议员丹尼尔·韦伯斯特提出的规则,该规则确实进行了再分配。它也违反配额,但违反的时候极少;而且它像汉密尔顿的规则一样,被认为对各州不偏不倚。

十年后,韦伯斯特的规则也被废止,汉密尔顿的规则取而代之。后者的支持者相信代议制政府原则现在得到了完全实施,也许还希望分配问题就此最终解决。但他们失望了。汉密尔顿的规则很快引起了比以往更多的争议,因为虽然它不偏不倚而且遵从比例,却开始产生一些看上去极其不妥的分配方案。例如,它对后来被称为人口悖论 的现象非常敏感:一个自上次人口普查以来人口增长的州,可能会输掉 一个席位给人口减少了的州。

那么,“为什么他们不干脆”设置新的席位,分配给那些因为人口悖论而输掉席位的州?他们这样做了,但不幸的是,这会导致分配超出配额范围。它还导致了另一个历史上重要的分配悖论:阿拉巴马悖论 ,即增加众议院的总席位导致某些州失去一个席位。

还有其他的悖论,它们未必是有偏见或不遵从比例方面的不公平 。他们之所以被称为“悖论”,是因为一条显然很合理的规则导致一次分配与下一次分配之间发生了显然不合理的变化。这类变化实质上是随机的,源于舍入误差的变幻莫测,并非由任何偏见导致,并且长远来看会相互抵消。但长远的 公平不能达到代议制政府的预定目标。完美的“长远的公平”甚至无须选举就能达成,只需要从全体选民中随机挑选立法者。但是,正如一枚硬币随机抛掷一百次的话不太可能刚好出现五十次正面和五十次反面,随机挑选的435位立法者实际上永远不会在任何情况下具有代表性:从统计学上看,与代表性之间的典型偏差将是八个席位。这些席位在各州之间的分配也将有很大浮动。我所描述的分配悖论会产生类似效果。

悖论涉及的席位通常很少,但它并不会因此而不重要。政治家们对此感到担心,是因为众议院投票中支持票数与反对票数往往非常接近。法案的通过与否决往往是由于一票之差,政治交易经常取决于个别代表加入这一派还是那一派。因此,分配悖论一旦导致政治分歧,人们就试图发明一条在数学上不可能导致这个特定悖论的规则。特定的悖论看起来总是让人觉得,只要“它们”作出某种简单改变就没事了。但悖论总体上有一种让人恼火的特性,不管人们怎样坚定地把它们从前门踢出去,它们马上就会从后门溜回来。

汉密尔顿的规则在1851年被采纳后,仍有很多人支持韦伯斯特的规则。因此,国会至少有两次试图用一种技巧来进行合理折衷:调整众议院的议席数量,直到两条规则一致。这当然会让所有人都满意的!但结果是,1871年有一些州认为分配结果如此不公,随之而来的妥协法案如此混乱,以至于弄不清楚到底是根据哪条规则在分配,如果有规则的话。所实施的分配方案(包括在最后一刻没有明显理由就增设几个席位)既不符合汉密尔顿规则,也不符合韦伯斯特规则,许多人认为这是违宪的。

1871年之后的几十年,每次人口普查时都要么采用一条新的分配规则,要么对议席数量作出改变,希望能在不同的规则之间达成妥协。1921年根本没有进行分配,他们完全保留了上一次的分配方案(这种做法也可能违宪),因为国会无法就规则达成一致。

分配问题被多次提交到杰出的数学家手中,包括两次提交到国家科学院,每次这些权威们都给出不同的建议。然而,他们都不曾指责前辈们在数学方面 有错误。这本应该让大家警醒,这个问题实在不是数学问题。每次专家们的建议得到落实,悖论和纠纷都会继续产生。

人口统计局在1901年发表了一份表格,对议席数量在350至400之间的每一个取值,都给出了汉密尔顿法则的分配方式。一种在分配中常见的算术上的怪现象,导致科罗拉多州总是得到3个席位,只有在总数为357席时得到2个席位。当时众议院分配委员会的主席(来自伊利诺伊州,我不知道他是否对科罗拉多州有任何意见)提出,议席数量可以改为357,并且使用汉密尔顿规则。这一提议遭到猜疑,最终国会拒绝了该提议,采用了386个议席以及韦伯斯特规则,该方案使科罗拉多获得了它那“公正的”的3个席位。但这种分配方案真的比运用汉密尔顿规则的357席方案更公正吗?用什么标准衡量?难道是在分配规则之间进行多数表决吗?

计算出大量不同分配规则的分配方案,给每个州分配大多数计划为该州分配的席位数,这到底有什么错?主要问题在于,这样做本身就是一条分配规则。同样,像他们在1871年那样试着把汉密尔顿规则和韦伯斯特规则结合起来,实际上就成了采用第三种计划。这样一个计划的好处是什么?组成它的每个计划设计出来都是为了实现某些可取的属性。一个并非为这些属性而设计的综合计划将不具备这些属性,除非巧合。因此,它未必会继承组成它的那些计划的优点。它会继承一些优点和一些缺点,还会有自己额外的优点和缺点——但如果它不是为了有益而设计 出来的,它为什么要有益?

唱反调的人可能会问:如果在分配规则之间进行多数表决是个坏主意,为什么在选民 之间进行多数表决是个好主意?在有些方面——比方说科学上使用多数表决,会带来灾难性的后果。占星家的人数比天文学家多,相信“灵异”现象的人经常指出,宣称看到此类现象的人比大多数科学实验的见证人数量要多得多。于是他们要求按比例决定可信程度。然而科学拒绝这样评判证据:它固守好解释的标准。那么,如果采用“民主”原则对科学来说是错的,为什么对政治来说就是对的?难道只是像丘吉尔说的那样,“在这个罪恶和苦难的世界上,人们尝试了并且还将尝试许多形式的政府。没有人假装民主是完美的或完全明智的。实际上曾有人说过,民主是最坏的政府形式,除了所有那些已经被不时尝试过的其他形式之外。”这确实是一个充分理由。但另外还有令人信服的正面原因,它们也与解释有关,我在下面会解释。

政治家们有时为分配悖论极端有悖常理感到非常困惑,以至于沦落到指责数学本身。得克萨斯州的众议员罗杰·Q·米尔斯在1882年抱怨道:“我以为……数学是一门神圣的科学。我以为数学是唯一与灵感对话、其表达万无一失的科学,[但是]现在有一个数学系统,它显示真理是虚假的。”1901年,席位受到阿拉巴马悖论威胁的缅因州众议员约翰·E·李德菲尔德说:“当数学向缅因州伸手要把她打倒的时候,求上帝帮助缅因州。”

事实上,不存在数学“灵感”之类的东西(灵感指数学知识来自一个不会犯错的来源,传统上是上帝):就像我在第8章解释的那样,我们的数学知识并非不会出错。但如果米尔斯众议员是指数学家是社会上对于公平的最佳裁判,或者某种程度上应该是最佳裁判,那他就完全弄错了 [2] 。美国国家科学院1948年向国会报告的小组里,有一位成员是数学家兼物理学家约翰·冯·诺伊曼。小组确定,由统计学家约瑟夫·阿德纳·希尔发明的一条规则(该规则至今仍在使用)在各州之间最为不偏不倚。但后来数学家迈克尔·巴林斯基和佩顿·杨得出结论说,这条规则对小州有利。这再次说明,不同的“公平”标准偏向于不同的分配规则,到底哪一种标准才是正确的,不能由数学来决定。事实上,如果米尔斯众议员的本意是带讽刺意味地抱怨一下,实际上是说不公平不可能仅由数学产生,也不可能仅由数学解决,那他倒是正确的。

然而,有一个数学发现永远改变了分配争论的本质。我们现在知道,一条分配规则既想按比例分配又想不产生悖论,这样的追求永远不会成功。巴林斯基和杨在1975年证明了这一点。

巴林斯基和杨的定理

每个与配额相符的分配规则都会遭遇人口悖论。

这个强大的“不可行”定理解释了历史上解决分配问题的一长串失败。不管有多少其他条件看起来对一条分配规则的公平性至关重要,都没有哪一条分配规则能满足按比例分配并避免人口悖论的基本要求。巴林斯基和杨还证明了涉及其他经典悖论的不可行定理。

这项成果的背景比分配问题广阔得多。在20世纪,特别是第二次世界大战之后,大多数主要政治运动达成一种共识,即人类未来的福祉将取决于更多地在社会范围内(最好是全世界范围内)进行计划和决策。西方的这个共识不同于对应的极权主义观念,区别在于其预期目的是满足公民个人的喜好。因此,西方提倡社会范围决策的人被迫面对一个极权主义者不会遇到的根本问题:当社会作为一个整体面临选择、公民对于不同备选方案的偏好不同时,哪个方案对社会来说是最好的选择?如果人们意见一致,就不成问题——但也就不需要规划者了。如果人们意见不一致,哪个方案可以合理地说成是“人民的意愿”——是社会“想要”的方案?这又引发第二个问题:社会应该怎样组织其决策,使得它确实会选中“想要”的方案?这两个问题从现代民主的开端就一直存在,至少是隐含地存在。例如,美国独立宣言和美国宪法都谈到了“人民”做某些事的权利。这些问题现在成了数学博弈论中一个称为社会选择理论 的分支的核心问题。

博弈论从前是数学的一个不起眼并且多少有些古怪的分支,这下子突然窜到人类事务的中心,就像曾经的火箭技术和核物理学那样。包括冯·诺伊曼在内的许多世界最优秀的数学头脑一起来应对这样一个挑战:对博弈论进行发展,以满足正在设立的无数集体决策体系的需求。他们将开发新的数学工具,在已知社会中所有个人的意愿或需求的情形下,提炼出社会“想要”做什么,实现“人民的意愿”这一抱负。他们还将确定,什么样的投票和立法系统能使社会得到它想要的东西。

他们取得了一些有趣的数学发现,但其中极少(如果有的话)能满足以上愿望。相反,各种“不可行”定理(类似巴林斯基和杨的定理)一再证明,社会选择理论背后的假设是不连贯而且不一致的。

因此,消耗了立法者们无数时间、精力和热情的分配问题,原来只是冰山之一角。这个问题完全不像表面上那么狭隘。例如,立法机构越大,舍入误差就成比例地越小。那么他们为什么不干脆把立法机构弄得非常大——比如说有1万名成员,这样一来所有的舍入误差都无足轻重?理由之一是,这样一个立法机构将在内部进行组织才能作出决策。立法机构内部的派系必须选择自己的领导人、政策、战略等。这样,社会选择的所有问题都会在一个党派在立法机构内部的团队“小社会”里出现。而且,问题不仅关系到人们的首要偏好:一旦我们考虑大型团体的决策细节(立法机构、党派、党派内部的派系怎样组织自身,使他们的愿望体现在“社会的愿望”中),就必须考虑到他们的第二和第三选择。然而,设计时考虑到这些因素的选举系统,无一例外会产生更多的悖论和不可行理论。

最早的不可行定理中,有一条是经济学家肯尼思·阿罗在1951年证明的,这为他赢得了1972年的诺贝尔经济学奖。阿罗的定理看起来否认社会选择的存在,并打击代议制政府的原则、分配、民主本身,还有许多其他的东西。

阿罗所做的工作是这样的。他首先提出5个基本公理,是任何定义“人民的意愿”(团体的偏好)的规则都必须满足的,并且这些公理第一眼看上去十分合理,简直不值得说出来。其中一条是,规则必须只用一个团体的成员的偏好来定义该团体的偏好。另一条是,规则不能在不考虑其他人想要什么的情况下把某个特定人员的观点指定为“团体的偏好”,这称为“不要独裁者”公理。第三条是,如果团体成员对某件事意见一致,即他们全都对它有着相同的偏好,那么规则必须认为该团体也有这样的偏好。在这种情况下,上述三条公理都是在表达代议制政府的原则。

阿罗的第四条公理是这样的:假设根据一个给定的“团体偏好”定义,规则认为该团体有一个特定的偏好,比方说喜欢比萨饼胜过汉堡包。于是它还必须认为,如果某些此前与团体不一致(即更喜欢汉堡包)的成员改变了主意、现在更喜欢比萨饼,则该偏好仍是团体的偏好。这个约束类似于排除人口悖论。一个团体如果朝着与成员意见相反的方向改变“主意”,就是不合理的。

最后一条公理是,如果团体有某种偏好,然后部分成员对别的事情 改变主意,那么规则必须继续认为团体保有原来的偏好。例如,如果某些成员改变了他们在草莓与树莓之间的偏好,但是没有改变自己在比萨饼和汉堡包之间的偏好,那么喜欢比萨饼胜过汉堡包的团体偏好也不应该改变。这个约束也可以看作合理性问题:如果团体成员都不改变他们对特定比较的意见,则团体对该问题的意见也不能改变。

阿罗证明了,我上面列出的几条公理虽然表面上合理,逻辑上却互相不一致。没有哪种途径能构想出满足全部5条公理的“人民的意愿”。这甚至可以说是在比巴林斯基和杨的定理更深的层面上打击了社会选择理论背后的假设。首先,阿罗的公理不是针对明显狭隘的分配问题,而是针对所有我们希望构想有偏好的团体的情形。其次,所有5条公理直观上都不仅仅是一个系统做到公平所必需的,也是使系统合理所必需的。然而它们不一致。

由此似乎可以推断出,一群共同决策的人必定会有这样那样的不合理。也许独裁,也许受某种武断规则支配。或者,如果它满足所有3个代表性条件,则必定有时会朝着批评和说服无法起作用的方向改变“主意”。于是它将作出悖理的选择,不管对其偏好进行阐释和实施的人可能有多么明智和充满善意——除非也许其中有一个人是独裁者(见下文)。因此,没有“人民的意志”这回事。没有办法把“社会”当成有着自我一致的偏好的决策者。这完全不是人们料想社会选择理论会回报给世界的结论。

对于分配问题,有人企图用“为什么他们不干脆……”的想法去修补阿罗的定理的隐含意义。例如,为什么不考虑人们的偏好有多强 ?因为,如果有略微超过一半的选民在X和Y之间没有多大偏好,而剩下的人认为必须是Y且此事生死攸关,那么大多数代议制政府的直观想法是把Y指定为“人民的意志”。但就像快乐一样,偏好的强度极其难以定义,更不用说测量,特别是不同人之间的强度差异,或同一个人在不同时候的强度差异。而且,不管怎样,把这些东西包括进去也不会有什么区别,还是会有不可行定理。

对于分配问题,看起来只要用一种方式给某决策系统打一个补丁,它就会通过另一种方式变得矛盾。许多决策体系有一个更严重的问题,那就是它们会刺激参与者对其偏好说谎。例如,如果有两个备选方案,你略微偏爱其中一个,就有动机去把你的偏好说成是“强烈”。也许市民的责任感会阻止你这样做,但一个由市民责任感调节的决策系统会有这样的缺陷:对那些缺乏 市民责任感、愿意说谎的人的意见给予比例不相称的权重。另一方面,在一个人人都对别人充分了解、很难说这种谎的社会里,不可能进行有效的秘密投票,系统就会对那些最有能力威逼摇摆分子的派系给予比例不相称的权重。

一个常年存在争议的社会选择问题,是怎样设计一个选举制度。这样一个制度在数学上与分配计划相似,但它不是以人口为基础把席位分配给各州,而是以票数为基础把席位分配给候选人(或党派)。然而,它比分配计划更矛盾,有更严重的后果,因为在选举中,说服 的元素对整个过程至关重要:选举就是为了确定哪些选民被说服了。(相反,分配并不是各州试图说服人们从其他的州迁移过来。)因此,选举制度可以对社会的批评传统作出贡献,也可能起到抑制作用。

例如,一个选举制度中,如果席位全部或部分按各党派所得票数的比例分配,该制度就称为“成比例代表”制度。我们从巴林斯基和杨的理论中知道,如果一个选举制度过于依赖比例,它将出现类似于人口悖论及其他的悖论。实际上,政治学家彼得·库里尔德—科利加德研究了丹麦的最近8次(根据其成比例代表制度进行的)大选,发现每一次都产生了悖论。其中包括“更偏爱更少席位悖论”,大多数选民偏爱X党胜过Y党,但Y党却得到比X党更多的席位。

这还只是成比例代表的诸多不合理属性中最小的一种。还有一个更重要的不合理属性,就算是最温和的成比例制度也会有,那就是它们会在立法机构中给第三大党派 分配不成 比例的权力,经常对更小的党派也这样做。问题是这么来的:(不管在什么制度下)单一政党得到总体多数票的情况很罕见。因此,如果投票在立法机构中得到成比例的反映,那么除非一些党派合作通过法案,否则就没有法案可以通过;除非一些党派结成联盟,否则也无法组成政府。有时最大的两个党勉强达成合作,但最常见的结果是第三大党的领导人掌握着“权力的平衡”,决定了两个最大党派中的哪一个能够进入政府,哪一个要靠边站,时间多长。这意味着,全体选民 相应地更难决定哪个党派应该下台、哪些政策应当废止。

在1949年至1998年间的德国,自由民主党(FDP)是第三大党 [3] 。虽然它从未得到过超过12.8%的选票,而且通常要少得多,但成比例代表系统使它拥有了不易受选民意见变化影响的权力。有几次的情形是,在选择两个最大的政党谁该执政时,自由民主党两次改变了立场,三次选择了让两者之中不太受欢迎(根据选票衡量)的那个政党上台。作为联盟协议的一部分,自由民主党的领导人通常在内阁中担任部长,这使得德国在这段时期的最后29年时间里只有两个星期的外交大臣不是自由民主党成员。1998年,自由民主党被绿党挤到第四大党的位置时,它立刻被赶出政府,绿党接替了拥立者的位置,并同样掌握了外交部。成比例代表体制给予第三大党这样不成比例的权力,对一个全部目的是按比例分配政治影响并理当以此为其道德合理性所在的体制来说,是一个极为尴尬的特征。

阿罗的定理不仅适用于集体决策,而且也适用于个人决策,如下所述。试想,一个理性的人需要在几个选项中选择一个。如果这个决策需要思考,那每个选项必定有一个相关的解释(至少是暂定的解释),说明它为什么可能是最好的。选择一个选项,就是选择它的解释,那么怎样决定采纳哪个解释呢?

常识说,选择的方式是对不同解释进行“衡量”或对它们在主张中提出的证据进行衡量。这是一个古老的比喻。自古以来,正义女神的形像就是手持一杆秤。最近,归纳主义把同样的模式套在科学思考上,说科学理论是根据对它们有利的“证据分量”选择出来、得到确证和相信的,有时甚至是据此事先创造出来的。

考虑一下假定中的衡量过程。每一个证据,包括每一种感觉、偏见、价值、公理和论证等,依据它在当事人头脑中的“分量”,对这个人在不同解释之间的“偏好”作出相应的贡献。因此,对于阿罗的定理,每一个证据都可视作一个参与决策过程的“个体”,总体上的人就是“团体”。

现在,在不同解释之间进行裁决的过程,如果要合理,就必须满足一定的约束条件。例如,如果人在确定了某个选项最好之后,得到了给该选项增加分量的进一步证据,那么这个人的总体偏好仍然应该是这个选项,依此类推。阿罗的定理说这些要求互相不一致,因而似乎暗示着所有的决策——所有的思考——必定都是不合理的。除非也许有某个内部因素是独裁者,能够凌驾于所有其他因素的综合意见之上。但这是一个无穷回归:对于最好压倒哪些因素,“独裁者”本身怎样才能在相关的不同解释中作出选择?

这样的整个传统决策模型有些地方错得离谱,对于社会选择理论假设的个人决策和群体决策都是如此。它把决策当成是根据固定公式(例如分配规则或选举制度)在现有选项中作出选择的过程。但事实是,只有在决策的最后 阶段——不需要创造性思维的阶段才是这样的。用爱迪生的比喻来说,这个模型只涉及汗水阶段,没有认识到决策是解决问题,如果没有灵感阶段,就什么也不能解决,也没有什么东西可供选择。决策的核心是创造新的选项,摒弃或修改现有选项。

要合理地选择一个选项,其实是选择相关的解释。因此,合理的决策所包含的不是对证据进行权衡,而是在解释世界的过程中对证据进行解释。人把主张作为解释而非确证来评判,有创造性地做这件事,使用猜想,接受各种批评的锤炼。好解释的性质——难以改变——决定了好解释只有一个。人在创造出好解释之后,就不会再受其他替代方案的诱惑。这些替代方案并不是在分量上被超过,而是被驳倒、推翻、舍弃。人在进行创造性过程时,不是在无数差不多一样好的不同解释中竭力进行区分,通常需要费力的过程只是创造一个好解释,一旦成功,就可以很高兴地摆脱其他解释。

通过权衡来进行决策的理念有时会导致另一种错误观念,认为问题可以通过权衡来解决,尤其是对于不同解释的支持者之间的纠纷,可以通过对他们的提议进行加权平均来解决。但事实是,一个好解释很难在不失去解释能力的前提下发生改变,因而很难与对立的解释混合:对两个解释进行折衷,往往比其中任意一个更糟。把两个解释混合在一起创造出一个更好 的解释,需要额外的创造性行动。这就是为什么好解释是离散的(即由坏解释相互分隔开),也是为什么在对解释进行选择时,我们面临的是离散的选项。

在复杂决策中,创造性阶段后面往往跟着一个机械的汗水阶段,用来敲定解释的细节,这些细节本来不是难以改变的,但可以通过非创造性的方法变得难以改变。例如,当客户询问一座摩天大楼在特定限制条件下可以建多高时,建筑师并不仅仅是根据公式算出这个数字来。决策过程可能以这样的计算结束 ,但开始阶段是创造性的,始于构思怎样用新设计最好地满足客户的优先考虑及限制条件。在此之前,客户必须创造性地决定,这些优先考虑和限制条件应该是什么样的。在这个过程开始时,他们还不清楚自己最终将告知建筑师的所有偏好。同样,选民可能会查看不同政党的政策,甚至可能会为每个问题设一个“权重”来代表其重要性,但在此之前 ,人必须先思考自己的政治哲学,对于不同的问题按自己的政治哲学来说有多重要、不同政党对这些问题可能采取哪些政策等,给出让自己满意的解释。

社会选择理论考虑的“决策”类型,是根据已知、固定、一致的偏好,对已知、固定的选项作出选择。典型例子是一个选民在投票站的选择,不是选择偏向哪位候选人,而是选择在哪个框框里打钩。正如我解释过的,对人类的决策来说,这是一个相当不合适也不准确的模型。事实上,选民是在解释之间选择,而不是框框之间选择。而且,虽然很少有选民会通过亲自参选来影响框框,但所有理性的选民都会对他们个人应该选择哪个框框创造自己的解释。

所以,决策过程并非必定要承受这些天然的不合理——不是因为阿罗的定理或任何其他不可行定理有什么错,而是因为社会选择理论本身是以关于思考和决策由什么组成的错误假设为基础的。这正是芝诺的错误,错误地把一个它将其命名为 决策的抽象过程当成了有着同样名称的现实过程。

同样,阿罗定理的“独裁者”未必是一般意义上的独裁者。他只是一个代理,社会的决策规则给予他单独作出一项决策、无视其他人偏好的权力。因此,每条需要个人赞同的法律(例如反对强奸或反对非自愿手术的法律)都建立了阿罗定理的技术意义上的某种“独裁”。每个人都是自己身体的独裁者。反对盗窃的法律建立一种对个人财产的独裁。根据自由选举的定义,每个选民都是支配自己选票的独裁者。阿罗定理本身假设,所有参与者都单独控制着他们对决策过程的贡献 。更普遍地说,合理决策(诸如思想自由、言论自由、容忍异见、个体自决)最重要的条件,全都需要阿罗的数学意义上的“独裁”。他选择这个术语是可以理解的,但这与那种你批评政府就会有秘密警察半夜找上门的独裁毫无关系。

几乎所有的评论者在回应这些悖论和不可行定理时都用了一个错误的而且很说明问题的方式:他们对此感到遗憾 。这显示了我所指的混乱。他们希望这些纯数学定理是错的 。他们抱怨说,要是数学允许,我们人类本可以建立一个能做出合理决策的公平社会。但是由于不可能做到,我们剩下能做的只有决定哪些不公平和不合理是我们最喜欢的,把它们供奉在法律里。韦伯斯特写道,分配问题“虽然做不到完美,也必须用尽可能接近完美的方式去进行。如果事物的本质决定了做不到完全准确,也应该采用最接近准确的可行办法”。

但什么样的“完美”会是一个逻辑矛盾 ?逻辑矛盾就是无稽之谈。真理比这更简单:如果你对于公正的概念与逻辑或合理的需求冲突,那么它是不公正的。如果你对于合理的概念与一条数学定理(或者,在这种情况下是许多定理)冲突,那你的合理概念就是不合理的。顽固地坚持逻辑上不可能的价值,不仅必定会在永远也得不到这些价值的狭义意义上招致失败,还会迫使人放弃乐观主义(“所有的恶都是缺乏知识导致的”),从而剥夺人取得进步的手段。盼望某种逻辑上不可能的东西,标志着有更好的东西值得盼望。而且,如果我在第8章中的猜想是正确的,一个不可能实现的愿望最终也是无趣 的。

我们需要一些更好的东西用来盼望,一些不会与逻辑、理性或进步不相容的东西。我们已经见过它。它是政治体系能够持续取得进步的基本条件:波普尔的标准,要求系统能够不用暴力就废除坏政策、罢免坏政府。这就要求放弃把“应该由谁来统治”作为一个评价政治体系的标准。关于分配原则和社会选择理论中所有其他问题的全部争议,传统上都被相关人等放在“应该由谁来统治”的框架里:每个州或每个党应该拥有的正确席位数量是多少?团体(假定它有权支配其子团体和个人)“想要”什么?什么样的制度能使团体获得它“想要”的东西?

因此,让我们用波普尔的标准来重新考虑集体决策。我们不去认真思考那些不证自明但互相不一致的公平、代表性等标准里哪些最不证自明从而可以确立,而是对这些标准以及其他实际或假想的政治体制进行评价,评价依据是它们促进废除坏政策、罢免坏政府的能力。为了做到这一点,它们必须实现对统治者、政策和政治体制本身进行和平的批评性讨论的传统。

说民主过程只是一种询问人们的意见、弄清应该由谁来统治或实施什么政策的方法,任何这样的诠释按前述观点来看都没有抓住事情的要点。选举在一个理性社会里所起的作用,不同于询问先知或祭司、服从国王的命令在早先的社会里所起的作用。民主决策的实质不在于系统在选举过程中作出的选择,而在于在历次选举之间创造出的思想观念。有许多体制的功能是允许对这样的思想观念进行创造、检验、修改和舍弃,选举只是其中之一。他们试图解释世界从而改善世界,在此过程中容易犯错。在个体和群体层面上,他们都在追求真理,或说如果他们是理性的,就应当追求真理。而且,对于这个问题确实 存在着一个客观真理。问题是可以解决的。社会不是一场零和博弈:启蒙运动文明发展到今天的程度,并不是靠对财富、选票或其他起初存在争议的东西进行聪明的分配而取得的,而是靠无中生有 地创造。特别是,选民在选举过程中所做的事,并不是合成一个超级人类即“社会”的决策。他们选择下一步要进行什么样的试验,以及(原则上)哪些试验应该舍弃,因为不再有解释可以说明它们为何最好。政治家和他们的政策就是这些试验。

当一个人用阿罗定理之类的不可行定理去模拟真实决策时,必须相当不切实际地假定,团体中的决策者没有人能说服其他人改变偏好,或者创造出更容易达成共识的偏好。现实情况是,不管是偏好还是选项,在决策过程结束时都无须与过程开始时相同。

为什么他们不干脆……通过在决策的数学模型中加入解释和说服等创造性过程来修补社会选择理论?因为人们不知道怎样对创造性过程建立模型。这样一个模型本身就会是 一个创造性过程:人工智能。

各种社会选择问题中设想的“公平”条件是类似经验主义的错误观念,它们谈的全都是决策过程的输入 ——谁参与,他们的意见怎样整合形成“团体偏好”。理性分析应该改而重点关注规则和体制怎样有助于去除 坏政策和坏统治者、创造新方案。

有时这样的分析的确支持一个传统要求,至少是部分支持。例如,团体中的任何成员都不应在代表性方面拥有特权或被剥夺权利,这一点的确很重要。但这并不表示所有的成员都能对答案作出贡献。原因是这样的差别对待会在系统中面对潜在的批评 巩固一个偏好。在新决策中把所有人偏爱的政策或其中一部分都包括 进去,是毫无意义的。进步需要的是把经不起批评的观念排除 掉,防止它们被巩固,并促进新观念的创造。

人们为成比例代表制辩护时经常使用的一个理由是,它会带来联合政府和妥协的政策。但是妥协(各贡献者的政策的混合)不应该享有这么高的声誉。虽然妥协肯定比直接的暴力要强,但正如我解释过的,它们一般都是坏政策。如果谁也不认为一个政策会有效,那它为什么要有效?但这还不是最糟糕的。妥协政策的关键缺陷是,如果这么一个政策得到实施然后失败了,谁也不会从中学到什么,因为本来就没有人同意过这个政策。所以,妥协政府掩护了那些确实 至少看上去对某些派系有利的潜在解释,使其免于被批评和舍弃。

在大多数采用英国政治传统的国家里,用来选择立法机构成员的体制是,国家的每个区域(或“选区”)在立法机构中都有一个席位,该席位属于该区域获得最多选票的候选人。这称为多数投票 制(“多数”表示“最多票数”),经常也称为“胜者通吃”制,因为第二名什么都得不到,也不会举行第二轮投票(而其他选举制度为了增强结果的比例性,通常都会考虑这两项)。在多数投票制下,与所得选票比例相比,两个最大的政党通常会得到“过度代表”。而且,它并不能保证避免人口悖论,甚至能在一个党派得票总数高得多的情况下让另一个党派上台。

这些特点经常被人当作论据来反对多数投票制而赞成一种更成比例的体制,不管是字面意义的成比例代表,还是其他能够使选民在立法机构里的代表更成比例的制度,诸如可转让投票制或决胜选举制。然而,根据波普尔的标准,鉴于多数投票制能更有效地去除坏政府和坏政策,这些弱点都微不足道。

让我更明确地追溯一下这种机制的优势。经过一次多数投票选举,通常的结果是得票最多的党派在立法机构中总体上占多数,从而得以单独掌权,所有其他竞选失败的党派都被排除在权力之外。这种情况在成比例代表制度下很罕见,因为旧联盟里的某些党派通常也是新联盟所必需的。所以,多数投票制度的逻辑是,政治家和政党如果不能说服相当一部分人口投票支持他们,就没有机会获得权力。这刺激所有的政党都去寻找更好的解释,或者至少是去说服更多的人接受他们现有的解释,因为一旦失败,他们在下次大选中就会被扔到一边,毫无权力。

在多数投票制中,胜出的解释得以接受批评和检验,因为它们在实施时无须与反对议程中的最重要主张进行混合。同样,获胜的政治家 也要单独为他们作出的选择负责,因而如果事后这些选择被认为是错的,他们就没找借口的余地了。如果到下次大选的时候,他们对选民的说服力不如从前,那不管怎样,通常都不会有达成交易把他们留在台上的余地。

在成比例体制下,民意的微小变化很少能有什么价值,权力可以轻松地朝与民意相反的方向转移。在权力变化中,最重要的是第三大党派领导人的意见。这不仅保护了这位领导人,还保护了大多数 在任的政治家和政策,使他们不会因投票而被免去权力。他们失去权力的原因往往是失去党派内部的支持,或者党派之间的联盟发生改变。在这个方面,该体制按波普标准来说完全不及格。在多数投票体制下,就是另外一种情形了。选区选举的胜者通吃特性,以及由此导致的小党派代表程度低,使得整个结果对民意的微小变化很敏感。如果民意稍微偏离执政党,通常就会使它面临完全失去权力的实在危险。

在成比例体制下,存在很强的动机使系统特有的不公平保持下去,甚至随时间推移而变得更严重。例如,如果一个小派别从一个大党中背叛出来,其政策得到实施的机会,可能会比支持者留在原来的政党里时更高。这导致立法机构中小党派林立,反过来又增强了对联盟的需求,包括与小党派的联盟,从而进一步扩大了它们本来就不成比例的权力。在有着世界上最成比例的选举制度的国家——以色列,上述效应已经非常严重,以至于在作者写下本文时,就算最大的两个政党加起来也无法形成整体上的多数。这个系统牺牲了所有其他考虑,专门为比例的公平性着想,然而就算比例本身也不是总能实现:在1992年大选中,右翼政府总体获得了多数选票,但左翼政党获得了多数席位。(这是因为,连一个席位都没有拿到的边缘小党大多是右翼党派。)

相比之下,多数投票体制的纠错属性倾向于避免系统在理论上可能遭遇的悖论,并且能在悖论出现时迅速使其消失,因为所有刺激都朝着与悖论相反的方向。例如,在1926年的加拿大马尼托巴省,保守党获得了比任何其他党都多一倍以上的选票,却没有 获得该省分配到的17个席位中的任何一个。结果,该党也失去了在全国议会中的权力,尽管它在全国范围内获得的票数也最多。但是,就算是在这样一个罕见、极端的情况下,两个主要党派在议会中的代表不成比例的程度也没有那么大:平均说来,自由党选民在议会中获得的代表人数,是保守党选民的1.31倍。然后呢?在下一次大选中,保守党再次在全国范围内获得最多选票,但这一次使它在议会里掌握了总体多数。它的选票增幅是全体选民的3%,但代表程度增幅是所有席位的17%,使它的席位份额重回到大致符合比例的状态,并且非常成功地满足了波普尔的标准。

出现这种情况,部分是由于多数投票制的另一个有益特性,那就是选举结果通常差异很小,不仅是票数相差很小,而且政府所有成员都面临着被赶下台的严重威胁。在成比例体制中,选举很少出现以上任一种情况。如果席位数量第三的党派不管怎样都可以把第二大党推上执政党的位置,从而达成一个完全没有人投票赞成过的妥协平台,那为什么要给得票最多的党派分配最多的席位?多数投票制几乎总是会产生这样的情况:投票的微小变化就能在谁组建政府方面产生相对较大的变化(朝着相同方向变化!)。体制越是成比例,所得的政府及其政策因投票而改变的敏感度就越低。

不幸的是,有些政治现象可以比坏选举制度更严重地违背波普尔的标准——例如,根深蒂固的种族划分或各种政治暴力的传统。因此,我无意使有关选举制度的上述讨论成为对多数投票制的全面背书,把它当成唯一真正的民主体制、适合所有情况下的所有政体。在有些情况下,连民主本身都是不切实际的。但在有着启蒙运动传统的先进政治文化里,知识的创造是而且应该是最重要的,认为代议制政府取决于在立法机构成比例代表的观念则毫无疑义地是个错误。

美国政府体制要求参议院以与众议院不同的方式进行代表,每个州 的代表程度等同,为的是彰显这样一个事实:每个州都是一个独立政治实体,有着自己独特的政治和法律传统。每个州都有权在参议院拥有两个席位,无论人口多少。由于美国各州人口数差别很大(目前人口最多的加利福尼亚州比人口最少的怀俄明州多将近70倍的人口),参议院的分配规则造成了相对于人口比例的巨大偏差,比众议院激烈争论过的偏差还要大得多。然而历史上,选举结束后,很少出现参议院和众议院由不同党派控制的情况。这意味着,在这个巨大的分配和选举过程中发生的事远远不止是“代表”——立法机构忠实地反映人口分布。情况是不是多数投票体制促成的问题解决方式,在于通过说服持续改变选民的选项 ,以及他们在各选项中的偏好 ?而且观点和偏好是趋同 的(尽管在表面上不是),这不是指分歧更少(因为解决方案会带来新的问题),而是指创造出共享程度更高的知识。

在科学上,如果一个团体里的科学家一开始有不同的希望和期待,持续就各种相互竞争的理论进行争辩,逐渐在稳定的一连串问题上达成近乎一致(不过一直还有分歧),我们不会感到惊讶。这并不奇怪,因为在这种情况下,有观察到的事实可以用来检验他们的理论。他们在任何特定问题上趋同,都是因为他们都在趋近客观真理。政治上的习惯是对出现的这类趋同进行冷嘲热讽。

但是这是一种悲观看法。在整个西方,有许多哲学知识眼下几乎被所有人看作理所当然,比方说奴隶制是可憎的,妇女应有外出工作的自由,尸体解剖应该是合法的,军队中的晋升不应该取决于肤色,但它们在仅仅几十年前还极具争议,最初被看作理所当然的是与此相反的观点。一个追求真理的成功体制致力于达成广泛的一致或接近一致,也就是民意不会产生决策理论悖论、“人民的意志”有意义的状态。因此,相关各方逐渐消除其立场中的错误、趋向客观真理,使得随时间推移趋于广泛一致成为可能。在满足波普尔标准的同时促进这一过程,比两个相互竞争、支持率接近的党派谁能赢得某次特定的大选更加重要。

关于分配的问题也是一样。自从美国宪法颁布以来,关于“代议制”政府意味着什么的流行概念发生了巨大的变化。例如,承认女性的投票权使选民的数量翻了一倍,并隐含地承认,在此前的每一次选举中,有一半的人口被剥夺了选举权,另一半人口则得到了相对于公平代表来说的过度代表。从数值上看,这种不公平使得几个世纪以来消耗了大量政治精力的席位分配不公都相形见绌。但这是因为,政治体制、美国人民和总体上的西方人民虽然在为了州与州之间几个百分点的代表程度变化吵得不可开交,但也在争论中促成这些重大改善。他们也变得没有争议了。

分配制度、选举制度和其他人类合作体制,很大程度上是设计或演化出来对付日常争议的,为的是在大家对于什么最好的看法存在极大分歧的情况下,拼凑出不用暴力的行事方法。其中最好的方法不仅实施了,还取得了成功,原因是采取了有巨大延伸范围的解决方案(经常是无意中做到的)。因此,应对当前争议变得只是一种达成结果的手段。在民主体制中服从多数,目的应该是在未来接近一致,通过鼓励相关各方抛弃坏的思想观念、猜想更好的思想观念来达成。创造性地改变选项 ,允许人们在现实生活中以不可行定理认为不可能的方式进行合作,并从根本上允许独立的头脑进行选择。

人们对知识主体的增长达成一致,并不意味着争论终结。相反,人类的不一致永远不会比现在更少,这是一件大好事。如果那些体制确实像看上去那样满足人们的期望,使变得更好成为可能,那么总体而言,随着我们从错误观念走向更好的错误观念,人类生活就能够无限改善。

术语

代议制政府 ——一种政府体制,立法机构的组成或意见反映着人民的组成或意见。

社会选择理论 ——研究怎样用社会成员的愿意来确定“社会的愿望”、什么样的社会体制能使社会实现其意愿,这样的学问称为社会选择理论。

波普尔标准 ——良好的政治体制是使以下行动尽可能容易的体制:检测出统治者或政策是否错误,在它们确实错误时不使用暴力就将其去除。

“无穷的开始”在本章的意义

——涉及创造新选项而不是对现有选项进行权衡的选择。

——符合波普尔标准的政治体制。

小结

把选择和决策过程想象成按照固定公式在现有选项中进行选择,是一种错误的做法。这忽略了决策的最重要元素,即创造新的选项。良好的政策是很难改变的,因此互相冲突的政策是离散的,不能随意混合。正如理性思维不仅包括对相互竞争的理论的理由进行权衡,还要使用猜想和批评来寻求最佳解释,所以,联合政府不是选举制度的可取目标。选举制度应通过波普尔标准来评价,评价依据是去除坏统治者和坏政策的容易程度。这表明,在先进的政治文化中多数投票制度是好的。

* * *

[1] 这条规则经常被错误诠释成,它体现了奴隶怎样被视作比完全的人低等。但它与这个问题完全无关。当时人们确实广泛认为黑人比白人低等,但这条特定措施设计出来是为了削弱蓄奴州的权力(与把奴隶与其他所有人同等看待时的情形相比)。——原注

[2] 当然应该是物理学家。——原注

[3] 为当前目的,我把基督教民主联盟(CDU)和地方性的拜仁基督教社会联盟(CSU)算成一个党。——原注

第一时间更新《无穷的开始:世界进步的本源》最新章节。

相关阅读

原稿零枚日记

小川洋子

地球星人

村田沙耶香

备用栏目5

铃木大拙

一日之计

斯帕