理论和实验的故事

时间：2023-02-14 理论教育版权反馈

【摘要】：照牛顿的力学和引力理论，假如宇宙除了太阳和一颗行星而外没有别的东西，那么行星将围绕太阳在一个理想的椭圆轨道上运行。）但牛顿理论预言水星的轨道应该在100年进动532秒，差43秒。水星轨道的反常和光线的偏转，不过是故事的一部分，当然也是重要的部分。我们来看牛顿理论与观测的水星运动之间的矛盾。任何一个像牛顿引力理论那样有着广泛应用的理论，总是被实验的反常困扰着。所有这些都表现出不符合牛顿理论的行为。

当我们老了，

世界更加陌生，复杂了

生与死的花样。

那隔绝的没有从前和以后的

不是激情的瞬间，

而是每一刻都在燃烧的一生。

T.S·艾略特，东科克^[76]

现在，我要讲20世纪物理学进展的3个故事。故事里有一个令人惊奇的事实：物理学家一次次靠美的感觉发展新理论，也一次次靠美的感觉来判决那些理论的有效性。仿佛我们一直在学习如何在最基本的水平期待自然的美。最激动人心的是，我们确实正在以那样的方式走向终极理论。

我要讲的第一个故事关系着广义相对论，也就是爱因斯坦的引力理论。爱因斯坦发展这个理论是在1907〜1915年，向世界公开它的是1915〜1916年的一系列论文。简单地说，广义相对论把引力描述为物质和能量产生的时空曲率的效应，从而取代了牛顿的两个有质量的物体相互吸引的引力图景。到20世纪20年代中叶，这个革命的理论成了公认的正确的引力理论；从此以后，它一直占据着那个地位。这是如何发生的呢？

还在1915年，爱因斯坦就立刻意识到，他的理论解决了太阳系观测与牛顿理论之间的一个老矛盾。从1859年开始，水星轨道在牛顿理论框架下总是难以理解。照牛顿的力学和引力理论，假如宇宙除了太阳和一颗行星而外没有别的东西，那么行星将围绕太阳在一个理想的椭圆轨道上运行。椭圆的方向——长轴和短轴的指向——永远不会改变；行星轨道仿佛就固定在空间。因为太阳系实际上包含着大量不同的行星，它们对太阳的引力场会有小小的干扰，所有行星轨道都在进动——就是说，在太空缓慢地摆动。^[1]19世纪，人们已经知道水星轨道的方向在100年里会产生约575秒的角度改变。（1度等于3600秒。）但牛顿理论预言水星的轨道应该在100年进动532秒，差43秒。换一种说法，你等待225000年后，会看到那个椭圆轨道摆过360度，绕一圈回到原来的方向；而照牛顿理论的预言，你得等244000年——这原不是什么可怕的差别，但天文学家为它困惑了半个多世纪。爱因斯坦1915年得出新理论的结果时，发现它能解释水星轨道那多余的每个世纪43秒的进动。（在爱因斯坦的理论中，多余进动的来源之一是引力场本身的能量产生的引力场。在牛顿理论中，引力只是质量产生的，没有那个能量的引力场。）爱因斯坦后来回忆，他曾为这场胜利狂喜了好多天。

第一次世界大战以后，天文学家让广义相对论经历了进一步的实验检验。在1919年的日食中，他们测量了光线经过太阳的偏转。在爱因斯坦理论中，光线里的光子会被太阳的引力场偏转。光子仿佛一颗遥远的彗星，进入太阳系，在绕过太阳时，在太阳的引力场中拐一个弯，然后远远离去，回到星际空间。当然，光线的偏转比起彗星来要小得多，因为光飞行太快；如果彗星跑得更快，偏转也会小一些。假如广义相对论是正确的，掠过太阳的光线应该偏转1.75秒，即万分之五度。（只有等日食来了，天文学家才能观测光线的偏转。因为他们需要寻找来自遥远恒星的光线从太阳近旁掠过时的偏转，而太阳附近的恒星，只有等日食的时候月亮遮住太阳，才容易看见。于是，天文学家在日食前6个月测量几颗恒星在天球的位置，那时太阳在天球的另一端；等日食来了，他们测量从太阳身边经过的光线偏转了多少，这可以从恒星在天空显现的位置的移动看出来。）1919年，英国天文学家分别远征去巴西东北的一座小城和几内亚湾的一个小岛观测日食。他们发现几颗恒星的光线的偏转，在实验不确定性的范围内，等于爱因斯坦预言的数值。于是，广义相对论赢得了世界的欢呼，成了鸡尾酒会和街谈巷议的话题。

那么，广义相对论取代牛顿引力论不是很显然了吗？广义相对论解释了一个老的反常现象，那多余的水星轨道进动；成功预言了一个惊人的新效应，光线经过太阳的偏转。还需要说什么吗？

水星轨道的反常和光线的偏转，不过是故事的一部分，当然也是重要的部分。但是，跟科学史上的任何事情一样（我想，其他任何历史也是这样的吧），如果走近去看，就没有那么简单了。

我们来看牛顿理论与观测的水星运动之间的矛盾。假如没有广义相对论，它是不是就不能清楚地说明牛顿的引力理论存在某种问题呢？未必。任何一个像牛顿引力理论那样有着广泛应用的理论，总是被实验的反常困扰着。没有哪个理论不面对这样那样的实验矛盾。太阳系的牛顿理论的历史就是不断从各种天文学观测的矛盾中走出来的。到1916年，它面对的问题不仅有水星轨道的异常，哈雷彗星和恩克彗星运动的反常，还有月亮运动的反常。所有这些都表现出不符合牛顿理论的行为。我们现在知道，对彗星和月亮运动的反常的解释，与引力理论的基础没有一点儿关系。哈雷彗星和恩克彗星不像牛顿理论的计算所预想的那样运动，是因为彗星从太阳旁边经过而加热，气体从飞行的彗星逃逸出来，而我们不知道怎么正确地把那些气体所产生的压力包括到计算中去。同样，月亮运动之所以复杂，是因为月亮很大，从而受各种复杂的潮汐力的影响。在今天看来，牛顿理论在这些现象的应用一定会遇到困难，那是一点儿也不奇怪的。同样，如何在牛顿理论下解释水星运动的反常，也有几个不同的建议。20世纪初人们当真的一种可能是，在水星和太阳之间存在某种物质，对太阳引力场产生了小小的干扰。在任何一次理论与实验的碰撞中，都看不到有什么东西站出来摇旗呐喊：“我就是那重要的反常。”19世纪末叶和20世纪头10年的科学家们，也没有可靠的办法去审视那些数据，从太阳系那些反常中找出重要的东西。哪些观测重要，还需要理论来解释。

到了1915年，爱因斯坦的计算证明，广义相对论赋予水星轨道的多余进动等于观测到的每百年43秒时，它才理所当然地成了他的理论的重要证据。实际上，我在后面要讲，它本可能受到更多重视的。也许因为可能存在其他形式的水星轨道的扰动，也许因为人们不喜欢用以前的数据来证明新的理论，也许仅仅因为那场战争——不管怎么说，爱因斯坦水星进动的解释一点儿也不像1919年的日食远征报告那么轰动——那报告证明了爱因斯坦预言的光线经过太阳所发生的偏转。

所以，我们现在来看光线经过太阳的偏转。1919年后，天文学家继续通过后来的大量日食检验爱因斯坦的预言。1922年在澳大利亚，1929年在苏门答腊，1936年在苏联，1947年在巴西，这些日食观测里有些似乎确实得到了跟爱因斯坦理论一致的结果，但其他几个结果却严重偏离了爱因斯坦的预言。而且，尽管1919年的远征基于10多颗恒星的观测所报告的偏转有10%的实验不确定性，大约在90%的精度上符合爱因斯坦的理论，但后来的几次日食远征虽然观测了更多的恒星，却连那个精度也没达到。当然，1919年的日食在这类观测中确实起着异乎寻常的作用。不管怎样，我还是愿意相信1919年的远征队员们在分析数据时，被广义相对论的激情淹没了。

实际上，那时有些科学家也怀疑1919年的日食数据。1921年，阿里留斯（Svante Arrhenius）在给诺贝尔委员会的报告里曾提到许多对光线弯曲结果的批评。^[77]在耶路撒冷，我遇到过一位老教授萨穆布尔斯基（Sambursky），1919年曾是爱因斯坦在柏林的同事。他告诉我，在柏林的物理学家和天文学家都怀疑英国科学家真能那么精确地检验爱因斯坦的理论。

这一点儿也不是想说那些观测里混进了什么不老实的东西。你可以想象，测量光线被太阳偏转有多少恼人的不确定性。在天空寻找出被月亮遮住的太阳圆盘边缘的恒星，在照相图版上比较那颗星相隔6个月的位置；两次观测时望远镜的焦点可能不同，相片本身在那半年里也可能扩张或者收缩；等等。所有实验都一样，需要所有类型的校正。天文学家总是尽最大可能做那些校正。不过，如果知道答案，这些校正当然会一直做下去，直到出现那个“正确”答案。实际上，人们曾批评1919年日食远征的天文学家，说他们带着偏见拋弃了可能跟爱因斯坦预言发生矛盾的一张照片的数据，他们怨那结果是因为望远镜换了焦距。^[78]现在看来，我们可以说英国天文学家做对了，但如果他们一直校正下去，经过校正的结果最终符合爱因斯坦的理论，我也一点儿不会觉得惊讶。

一般认为，一个理论的真正检验在于它的预言与实验的对比。不过，从今天的观点看，我们可以说，爱因斯坦1915年对从前测得的水星轨道反常的成功解释，比起他的光线偏转的计算被1919年和后来的日食观测所证实来，是广义相对论更为坚实得多的检验。就是说，在广义相对论情形，实际上“追认”^[79]——计算闻名已久的水星运动的反常，比真正的预言——光线在引力场中偏转的新现象，提供了更可靠的理论检验。^[80]

我想，人们在检验理论时强调预言，是因为过去科学评论家们的权威态度是不相信理论家。他们怕理论家为了迎合所有已知实验事实而调整自己的理论，所以理论与那些事实的符合不能作为理论的可靠检验。

但是，就算爱因斯坦1907年就知道了水星轨道多余的进动，任何知道广义相对论是如何发展起来的人，只要完全跟随爱因斯坦的逻辑，都不可能认为他是为了解释那个进动才创立广义相对论的。（过一会儿我再来讲爱因斯坦自己的思路。）其实，成功的预言才常常是不该轻信的。对一个真正的预言，如爱因斯坦关于光线被太阳偏转的预言，理论家在提出它的时候的确不知道实验结果。但另一方面，实验家在做实验的时候却知道那个理论结果。这样，有可能真的在历史上导致许多像我们过分相信成功“追认”的情况。我再重复一遍：这并不是说实验家们在伪造数据。据我所知，在物理学中还从没发生过公然伪造数据的重大案例。但是，知道理论猜想结果的实验家，在没得到结果时难免会不停地去寻找观测误差，在得到结果时却难得再去寻找误差。然而，实验家并不总能得到他们期待的结果，这恰好成为他们品格力量的证明。

讲了这么多，总的说来，我们看到，广义相对论的早年实验证据归结为一个成功的追认和一个新效应的预言。^[2]它追认了水星运动的反常，预言了光线经过太阳的偏转；那追认也许没能受到应有的重视，预言的成功则产生了巨大的轰动，尽管它实际上并不像那时一般认为的那样是决定性的，而且至少遭到过某些科学家的怀疑。等到第二次世界大战结束后，新的雷达和射电天文学的技术才为这些广义相对论的实验检验精度带来了显著的进步。^[81]我们现在可以说，广义相对论的预言——光经过太阳的偏转（和时间的延迟），水星、伊卡鲁斯（Icarus）小行星以及其他自然或人造天体的轨道运动——都在1%的实验不确定性之内得到了验证。不过，它们姗姗来迟了。

不论广义相对论当年的实验证据多脆弱，爱因斯坦的理论从20世纪20年代开始直到今天，还是标准的引力理论的教科书，尽管20年代和30年代的日食没有给理论带来更肯定的证据。我记得，我50年代学广义相对论时，雷达和射电天文学还没有为理论提供新的动人的证据，我理所当然地认为广义相对论多少总该是对的。也许我们那时都太天真，也很侥幸，不过我想不是那样的。我相信，大家接受广义相对论的主要原因是理论本身的吸引力——简单地说，就是它的美。

爱因斯坦创立广义相对论时走过的思想路线，还指引着打算学那理论的后代物理学家，它那诱人的特色仍像当年首先吸引爱因斯坦那样吸引着他们。我们的故事可以回溯到1905年，爱因斯坦惊天动地的一年。那一年，在解决光的量子理论和小颗粒在液体中的运动问题的同时，^[3]爱因斯坦提出了一个关于空间和时间的新观点，就是现在所说的狭义相对论。这个理论很好地符合了公认的电磁理论：麦克斯韦的电动力学。以不变速度运动的观测者会看到因他的运动而改变了的空间、时间间隔和改变了的电磁场——改变的方式恰好使麦克斯韦方程在任何运动状态下都依然成立（这一点儿不奇怪，因为狭义相对论就是为了满足这个要求发展起来的）。但是，狭义相对论跟牛顿的引力理论符合得不好。首先的一点，在牛顿理论中，太阳与行星间的引力依赖于两者同时的位置，而在狭义相对论中，没有绝对意义的同时性一它取决于运动状态，一个事件与另一个事件是否同时发生，或者哪个在前，哪个在后，不同观测者会有不同的判断。

牛顿理论可以通过几种方式的修正来符合狭义相对论，爱因斯坦在得到广义相对论之前，至少试验过一种方法。^[82]1907年引他走上广义相对论长路的线索，是引力的一个众所周知的特殊性质：力的大小正比于它所作用的物体的质量。爱因斯坦发现，这正如我们以变化的速度或方向运动时，作用在我们身上的所谓惯性力——就是飞机在跑道上加速时把乘客推回座位的那个力。使地球不致落向太阳的离心力也是一种惯性力。所有这些惯性力都跟引力一样，正比于它所作用的物体的质量。我们在地球上感觉不到太阳的引力场，也感觉不到地球绕太阳运行所产生的离心力，因为两个力彼此抵消了，但是假如一个力正比于它所作用的物体的质量，而另一个力不是，则那平衡将被打破，有些物体将脱离地球飞向太阳，还有些物体将被拋出地球进入星际空间。一般说来，引力和惯性力都正比于被作用物体的质量而与物体其他性质无关，这个事实使我们有可能在任何引力场中的任何一点，确定一个“自由下落的参照系”，在这个参照系里，感觉不到引力和惯性力，因为对所有物体而言它们都是完全平衡的。假如真的感觉到引力或惯性力，那是因为我们不在自由下落的参照系里。举例来说，地面上自由下落的参照系以大约9.81米/秒2的加速度向着地心落下，我们只有恰好在以相同加速度下落的时候才可能感觉不到引力。爱因斯坦在逻辑上跳跃了一步，猜想引力与惯性力在本质上是同一样东西。他把这一事实称做引力与惯性等效的原理，或者简称等效原理。根据这一原理，任何引力场都完全通过自由下落的参照系来描述——它告诉我们在空间和时间的每一点，哪个参照系是自由下落的。

1907年后，爱因斯坦花了几乎10年的时间为他的那些思想寻找恰当的数学框架。最后，他找到了他需要的东西，原来引力在物理学中的角色，跟曲率在几何里的角色存在着深刻的相似。在引力场中任何一点附近的小区域里，通过引进一个恰当的自由下落参照系，可以消除那里的引力，这一事实恰似曲面的性质，不管曲率多大，我们都可以画一张地图来正确反映任何一点邻近的距离和方向。假如是一个曲面，没有哪一个地图能正确表现所有地方的距离和方向；任何大区域的地图都不过是中庸的做法，以这样或那样的方式扭曲了距离和方向。大家熟悉的地图常用的麦卡托（Mercator）投影，在赤道附近保持了很好的距离和方向，但在两极却产生了可怕的扭曲，如格林兰岛比实际大了好多倍。同样，假如没有一个能处处消除引力和惯性力效应的自由下落参照系，那就说明我们处在某个引力场中。^[4]

从引力与曲率的这点类比出发，爱因斯坦得到一个结论：引力恰好就是空间和时间的曲率效应。为实现这个思想，他需要一个曲率空间的数学理论，它超出了我们熟悉的地球表面的二维球面几何。爱因斯坦是牛顿以来世界上最伟大的物理学家，他跟那时大多数物理学家一样了解很多数学，但他自己不是数学家。最后，在黎曼和其他数学家在上个世纪建立的弯曲空间理论中，他发现自己需要的东西原来早就准备好了。广义相对论的最终形式，不过就是以引力重新解释了弯曲空间的数学，以一个场方程决定一定物质和能量产生的曲率。值得注意的是，在太阳系的小密度低速度情况下，广义相对论得出的结果跟牛顿引力理论恰好是一样的，两者的差别仅在于一些小效应，如行星轨道的进动和光线的偏转。

关于广义相对论的美，在后面我还要讲更多的东西。现在，我想已经说得够多了，你也一定感觉到了那些思想的魅力。我相信，正是因为这些内在的魅力，在日食远征的证据一次次令人失望的那几十年里，物理学家还能一直抱着对广义相对论的信心。

当我们回过头来看1919年日食远征前，广义相对论在最初几年被人接受的情景，会对刚才讲的有更深的印象。最重要的是爱因斯坦自己如何看他的广义相对论。日食远征3年前，1916年2月8日，在给老理论家索末菲（AmoldSommerfeld）的一张明信片里，爱因斯坦写道，“只要你研究它，你会相信那个相对论的一般理论的。所以我不用为它多说一句话。”我无从了解水星轨道计算的成功在多大程度上增强了爱因斯坦1916年对广义相对论的信心，但在那之前，在他计算之前，一定已经有过什么东西给他带来了足够的对广义相对论基本思想的信心，才使他能坚持为它奋斗下去，而那样的东西只能是理论本身的魅力。

我们不要低估这初始的信心。在科学史上有数不清那样的例子：科学家有过好的思想，但他们当时没有追寻下去；等到多年以后，（常常是其他人）发现这些思想产生了重大的进步。通常人们错误地认为科学家一定是自己理论的热烈鼓吹者。更多的时候，第一个相信某个新思想的科学家总让它经受毫无根据和过分的批评，因为，他需要经过很长时间的艰苦工作，而且（也更重要），假如这个思想值得认真追求下去，他不得不放弃其他的研究。

事实上，物理学家确实被广义相对论震惊了。还在1919年日食以前，在德国和其他地方的专家们听说广义相对论时，就认为它有希望而且很重要。那些专家不仅包括慕尼黑的索末菲，哥廷根的波恩、希尔伯特（David Hilbert），莱顿的洛伦兹（Hendrik Lorentz）——爱因斯坦在战争年代有过交往的人，还包括法国的郎之万（Paul Langevin）和英国的爱丁顿（Arthur Eddington，1919年鼓动日食远征的人）。自1916年以来关于爱因斯坦的诺贝尔奖提名也有助于我们的讨论。1916年，埃伦哈夫特（Felix Ehren-haft）因他的布朗运动理论和狭义相对论提名；1917年，哈斯（A.Haas）因他的广义相对论提名（以水星轨道进动的成功计算为依据）；同年，瓦尔堡（Emil Warburg）因他的各种贡献（包括广义相对论）提名。1918年，以相同原因的提名更多。到了1919年日食远征前4个月，现代物理学奠基者之一的普朗克也因广义相对论提名爱因斯坦，评价他“迈出了超越牛顿的第一步”。

我并不是说全世界的物理学家从一开始就都一致无保留地相信广义相对论的有效性。例如，1919年的诺贝尔委员会报告就建议等到5月29日的日食后再来评价广义相对论，而即使在1919年以后，爱因斯坦最终获得1921年诺贝尔奖的时候，也不是特别因为狭义和广义相对论，而是“因为他对理论物理学的贡献，特别是光电效应定律的发现”。

什么时候有多少物理学家相信广义相对论，75%、90%还是99%，这些都不是真正重要的。对物理学的进步来说，重要的不在于评判一个理论是对还是错，而在于判断它是否值得认真对待一值得教给研究生，值得写教科书。当然，首先要值得纳入自己的研究。从这个观点看，跟在爱因斯坦本人后面，向广义相对论皈依的最重要的人物是那些英国天文学家，他们不是相信广义相对论正确，而是相信它是一个合理的美妙的理论，值得将自己的研究生涯贡献出来检验它的预言。于是，他们从不列颠远征万里，去观测1919年的日食。其实，在广义相对论还没完成、水星轨道进动还没计算出来的时候，爱因斯坦那美妙的思想就激发了柏林皇家天文台的弗伦德里希（Erwin Freundlich），他依靠克鲁伯（Krnpp）基金的资助，远征克里米亚去看1914年的日食。（战争阻断了弗伦德里希的观测，他辛苦一场，还被当时的俄国拘留了几天。）

广义相对论为大家所接受，既不单靠实验数据，也不单靠理论的内在性质，而是依赖于理论和实验交织的一张复杂的网。我已经强调了故事的理论一方，以平衡对实验质朴的过分强调。科学家和科学史家很早就扬弃了培根（Francis Bacon）的老观念，说什么科学假说应该通过对自然耐心和无偏见的观察发展起来。显然，爱因斯坦的广义相对论不是在天文学的数据里成长的。不过，我们仍然可以看到穆勒（John Stuart Mill）的观点在广泛流传：只凭观察就能我们的理论。但是，如我们在这里看到的，在接受广义相对论时，美学判断和实验数据是分割不开的。^[83]

从某种意义说，支持广义相对论的实验数据一开始就有好多——那就是地球绕着太阳、月亮绕着地球以及太阳系其他活动的观测数据，它们可以回溯到第谷（Tycho Brahe）和更早的时代，而且已经被牛顿理论解释过了。乍看起来，这是一些非常特殊的证据。这些在广义相对论出现以前测量的行星运动，我们现在不但拿它的计算来作为广义相对论“追认”的事实；我们所讲的那些天文观测，也发生在爱因斯坦创立他的理论之前，而且已经有其他理论（即牛顿理论）解释过了。对这样一些现象的预言或者“追认”，怎么能够当做广义相对论的胜利呢？

为理解这一点，我们需要更近地来看牛顿和爱因斯坦的理论。牛顿理论确实解释了太阳系的所有观测到的运动，但代价是引进来一些多少有些随意的假设。例如，引力定律说，任何物体产生的引力随离开物体的距离的平方反比例地减小。在牛顿理论中，没有什么特别的需要平方反比律的东西。牛顿提出平方反比律的思想是为了解释太阳系的一些已知事实，如开普勒的行星轨道大小与行星环绕太阳1周所需时间的关系。除了这些观测事实而外，在牛顿理论中，我们可以用立方反比律或2.01次方反比律取代平方反比律，那一点儿也不会改变理论的概念框架，只是可能改变理论的一些次要的细节。^[5]爱因斯坦理论严格得多，远没有那么自由。对于在引力场中缓慢运动的物体，即我们可以在寻常意义上谈论引力的情形，广义相对论要求力必须以平方反比的形式减小。在广义相对论中，如果想调整理论得出平方反比律以外的什么东西，不可能不违背理论的基本假设。

另外，像爱因斯坦在他的著作里特别强调的，作用在小物体的引力正比于物体质量而与物体其他性质无关，这在牛顿理论中显得很随意。在牛顿理论中，引力本来还可能依赖于其他东西，如物体的形状、大小或化学组成，这也不会破坏理论的概念基础。在爱因斯坦的理论中，作用在任何物体的引力必然是正比于物体质量而同时与任何其他性质无关的。^[6]假如不是这样，不同物体的引力与惯性力会以不同方式实现平衡，也就不可能谈什么自由下落的参照系了，在那种参照系里，没有东西能感觉到引力；假如不是这样，引力也不可能解释为时空曲率的几何效应。因此，爱因斯坦理论具有牛顿理论所缺乏的刚性，因为这个理由，爱因斯坦才感觉他已经用牛顿不曾有过的方法解释了太阳系的寻常运动问题。

遗憾的是，物理学理论的刚性很难彻底说明白。牛顿和爱因斯坦在建立他们的理论之前，都知道一些行星运动的一般特征。而且，爱因斯坦知道，为了在理论中重现牛顿的成功，他需要某种类似平方反比律的东西。他还知道，他不得不归结到一个正比于质量的引力。从理论的最终发展来看，只有这个时候，我们才能说爱因斯坦的理论解释了平方反比律，也解释了引力与质量的正比关系，但这种判断是兴趣和直觉的事情——它纯粹是这样一个判断：假如爱因斯坦理论可以修正来允许另外的什么反比律或者引力不跟物体质量成正比，那它一定会变得丑陋不堪。于是，在我们判别数据的意义时，我们又一次拿起我们的美学判断和我们理论的所有遗产。

我的下一个故事讲的是量子电动力学——关于光与电的量子力学。在某种程度上，它是第一个故事的镜像。尽管广义相对论的证据有些脆弱，40年里它一直是作为正确的引力理论被大家接受的，因为它有着动人的美。另一方面，量子电动力学很早就得到了大量实验数据的支持，但在20年里却没人相信，因为它内部存在的矛盾，似乎只有通过丑陋的方式才能解决。

在关于量子力学的第一批论文里，波恩、海森伯和约当1926年的“三重唱”（Dreimannerarbeit），就把量子力学用到电和磁上来了。他们那时能够算出，光线里的电磁场能量和动量是像粒子那样一束束出现的，从而证明了爱因斯坦1905年引进的所谓光子。^[7]量子电动力学的另一个主要部分是狄拉克在1928年带来的。狄拉克理论的原始形式说明了如何用跟狭义相对论协调的波函数来对电子做量子力学的描述。狄拉克理论的一个最重要结果是，相应于每一种带电粒子（如电子），必然存在一种质量相同而电荷相反的粒子，也就是它的反粒子。电子的反粒子在1932年发现了，就是今天大家知道的正电子。20世纪20年代末和30年代初，量子电动力学曾被用来计算大量不同的物理学过程（如光子与电子碰撞的散射，一个电子与另一个电子碰撞的散射，电子与正电子的湮灭和产生），计算结果一般与实验惊人地相符。

然而，到20世纪30年代中叶，人们普遍认为，不应该把量子电动力学太当真，它不过是一个近似，只有在光子、电子和正电子的能量足够低的相互作用下它才可能有效。这个问题不像一般科学史中经常出现的那样，是理论预期与实验数据间的矛盾，而是物理学理论自身内部不断的对抗，那就是无穷大问题。

海森伯、泡利和瑞典物理学家瓦勒（Ivar Waller）看到了问题的不同形式，不过问题最清楚而令人困惑地出现在1930年年轻的美国物理学家奥本海默（Julius Robert Oppenheimer）的一篇文章里。奥本海默想用量子电动力学计算某个微妙效应对原子能量的影响。原子里的电子可以发出一个光粒子（光子），继续在原来的轨道停留一会儿，然后重新吸收那个光子。光子走不出原子，只能通过它对原子诸如能量和磁场等性质的影响而间接表现出来（这样的光子叫虚光子）。根据量子电动力学的法则，这个过程产生的原子状态的能量移动可以通过无限多的能量贡献的总和来计算，^[84]每个贡献对应于虚光子可能获得的一个能量值，而光子的能量没有任何极限。奥本海默在计算中发现，因为求和包括来自任意高能的光子的贡献，因而结果成为无限大，导致原子能量的无限移动。^[85]高能对应于短波，因为紫外线的波长比可见光的短，所以这个无限的疑难变成了有名的紫外灾难。

在20世纪30年代和40年代初，物理学家中流行着一种普遍看法：奥本海默和其他类似计算出现的紫外灾难说明，现有的电子和光子的理论对于能量超过几百万伏特的粒子来说是完全不能相信的。奥本海默自己就是最重要的抱着这种观点的人，部分原因是他在领导着宇宙线的研究——就是那些自外太空穿过大气来到地球的高能粒子。他对这些宇宙线粒子与大气相互作用的研究说明，高能粒子在发生着某些奇怪的事情。确实有些事情很奇怪，但它们一点儿也不能说明电子和光子的量子理论失败了，其实那不过是新粒子生成的信号，今天我们称那些粒子为u子。不过，即使在1937年u子的发现澄清了那一切以后，还有人固执地认为量子电动力学用于高能电子和光子时会产生问题。

无穷大问题的解决靠的是一种“蛮横的”方式：规定电子只能吸收和发射能量低于一定数值的光子。量子电动力学在20世纪30年代成功解释的都是与低能量光子相关的电子和光子的相互作用，所以，只要假定光子的极限能量足够小（例如1000万伏），它仍然是成功的。为虚光子带上这个能量极限，量子电动力学能预言很小的原子能量的移动。那时没人以足够精度测量过原子能量，说不清是否真会出现那个小小的能量移动，所以没有与实验不一致的问题。（实际上，人们对量子电动力学太悲观，甚至没人想过去计算那能量移动是什么。）无穷大问题的解决也伴随着烦恼，那不是因为与实验的矛盾，而是因为方法太随意，也太丑陋。

在30年代和40年代的物理学文献里，我们能看到好多别的关于无穷大问题的解决办法，味道也不怎么样。例如，在有些理论中，高能光子的发射和吸收产生的无限是通过其他负概率事件来消除的。负概率当然是毫无意义的，它的出现表明，人们对无穷大问题已经感到绝望了。

最后，40年代末叶出现的无穷大的解决办法自然得多，而革命性也较小。^[86]问题的出现是1947年6月初在长岛外的希尔特岛公羊头酒店召开的一个会上。会议的组织是为了让在战后准备重新思考物理学基本问题的物理学家能走到一起来。事实证明，这是爱因斯坦和玻尔争论量子力学未来的那个索尔未会议15年后最重要的一次物理学盛会。

来希尔特岛的物理学家中，有一个是哥伦比亚大学的年轻物理学家兰姆（Willis Lamb）。兰姆利用战时发展起来的微波雷达技术，刚成功地精确测量了奥本海默在1930年计算过的那类效应：光子的发射和重吸收产生的氢原子能量的移动。^[8]从此，这种移动被称为兰姆位移。测量本身与解决无穷大问题没有一点儿关系，但是为了解释兰姆位移的数值，物理学家不得不再去把握这个问题。他们找到的解决办法注定要决定后来的物理学进程。

在希尔特岛会上，几个理论家已经听说了兰姆的结果，如何用量子电动力学的原理来计算兰姆位移（不管无穷大问题），他们来开会时就有了想法。他们认为，光子的发射和再吸收产生的原子能量移动不是真正的可观测量。惟一能观测的是原子的总能量，它等于这个能量移动加上狄拉克1928年计算的能量。总能量依赖于电子的裸质量和裸电荷，即我们考虑光子的发射和吸收之前出现在理论方程里的电子质量和电荷。但是，不论原子里的电子还是自由电子，总是会发射和吸收影响电子质量和电荷的光子，所以裸质量和裸电荷跟列在基本粒子表里的测量的质量和电荷是不同的。实际上，为了说明观测的电子质量和电荷的数值（当然是有限的），裸质量和裸电荷本身必须是无限的。这样，原子的总能量就是两个无穷大项的和：裸能量是无限的，因为它依赖于无限的裸质量和裸电荷，奥本海默计算的能量移动也是无限的，因为它接受了无限能量的虚光子的贡献。这就引出一个问题：这两个无限的量能抵消出有限的总能量来吗？^[87]

乍看起来，答案似乎是否定的。但奥本海默在他的计算里忽略了某些东西。能量移动不仅源于电子发射和吸收光子的过程，还源于另一个过程：正电子、光子和第二个电子从虚空中自发生成出来，然后光子在正电子和原来电子的湮灭中被吸收。实际上，为了让原子最终的能量以狭义相对论所规定的方式依赖于原子的速度，这个奇异的过程必须包括在计算里。（这是早在狄拉克以前就发现了的一个结果：只有当量子力学包含了电子的反粒子正电子时，它才能与狭义相对论保持一致。）在希尔特岛的理论家中，有个韦斯柯夫（VictorWeisskopf），他在1936年就计算出了这个正电子过程产生的能量移动，发现它几乎抵消了奥本海默发现的无穷大。^[88]不难猜想，假如考虑了正电子过程，而且考虑裸质量和裸电荷与观测的质量和电荷的区别，那么能量移动中出现的无穷大将完全消失。

尽管奥本海默和韦斯柯夫在希尔特岛，第一个计算兰姆位移的理论家却是贝特（Hans Bethe）。他因为核物理的研究，包括20世纪30年代提出的恒星发光的链式核反应，那时已经很出名了。根据岛上流行的那些思想，贝特在回家的火车上对兰姆测量的能量移动做了简略的计算。他还是没有切实有效的工具能把正电子和其他狭义相对论效应包括进那种计算，在火车上的计算差不多就是紧跟奥本海默17年前所做的事情。区别在于，在遇到无穷大时，贝特这回忽略了高能光子的发射和吸收产生的能量移动（他有点随意地将光子的能量极限当做电子质量的能量），于是得到了有限的结果，完全符合兰姆的测量。那样的计算，奥本海默在1930年几乎就可以完成了；不过，最后还是因为实验解释的需要以及希尔特岛上流传的那些思想的激励，计算才彻底完成了。

不久以后，物理学家就对兰姆位移做了包括正电子和其他相对论效应在内的更精确的计算。^[89]这些计算的重要不在于得到了更精确的结果，而在于消除了无穷大的问题；没有随意丢弃高能虚光子的贡献，无穷大就消失了。

尼采（Friedrich Nietzsche）说过，“杀不死我们的，使我们更强壮。”^[90]量子电动力学几乎要被无穷大问题抹杀，却又通过电子质量和电荷的重新定义或重正化而复活了。但是，为了这样来解决无穷大的问题，计算里的无穷大只能以某些确定的方式出现，那只有在一类特别简单的量子场论才可能。从这个意义说，这种最简单形式的量子电动力学是可重正化的，但理论的任何一点小小的修改都可能破坏这个性质，导致不能通过理论常数的重新定义来消除的无穷大。于是，这个理论不仅在数学上令人满意，还跟实验相符；不过它自己似乎应该解释为什么会是那样的；理论的任何微小改动都不但会引出与实验的矛盾，还会得出荒唐的结果——绝对合理的问题，无穷大的答案。

1948年，兰姆移动的计算仍然复杂得吓人，现在，这些计算尽管包括了正电子，得到的兰姆位移却是一些违背狭义相对论的项的和，只有最后的答案才符合相对论。同时，费曼、施温格（Julian Schwinger）和朝永振一郎在独自发展简单得多的计算方法，每一步都跟相对论一致。他们用这些工具进行了其他计算，结果跟实验符合得很精彩。例如，电子有小小的磁场，最早在1928年由狄拉克根据他的相对论量子理论计算过。希尔特岛会议刚过，施温格发表了一个近似计算的结果，那是虚光子的发射和吸收过程引起的电磁场强度的改变。那以后，计算一直在不停地修正，^[91]现在的结果是，光子的发射和吸收以及类似的效应使电子的磁场是狄拉克原来预言的1.00115965214倍（最后一位数的不确定性大约为3），狄拉克原先的计算没有考虑光子的发射和吸收。就在施温格做他的计算时，拉比和他哥伦比亚的伙伴们的实验揭示出电子的磁场实际要比狄拉克的老数值大些，大约跟施温格的计算差不多。最近的实验结果是，电子磁场是狄拉克的1.001159652188倍，最后一位数的不确定性大约为4。这里，理论与实验在数值上的一致程度也许是一切科学里最令人惊奇的。

有了这样的成功，最简单的可重正化形式的量子电动力学成为普遍接受的正确的光和电子的理论，就一点儿也不奇怪了。不过，虽然理论在实验上成功了，理论中的无穷大在恰当处理下也全都消除了，但无穷大仍然在不断出现，因而量子电动力学和类似理论也在不停地惹人抱怨。狄拉克总是特别爱说重正化是在掩藏无穷大。我不赞成狄拉克的话，我在珊瑚顶和康士坦茨湖的会上同他讨论过这一点。考虑裸电荷和裸质量与它们的测量值之间的差别，并不只是摆脱无穷大的一个技巧，即使一切都是有限的，我们可能还是要做那样的事情。这个过程没有一点儿任意和特设的东西，它只不过正确认识了我们在实验室所测量的电子质量和电荷到底是什么。只要最终的物理量是有限而确定的，是与实验一致的，我看不出裸质量和裸电荷中的无穷大还有什么可怕的。^[9]在我看来，一个像量子电动力学那样辉煌成功的理论多少总该是正确的，尽管我们也许没有通过正确的途径来建立它。但是狄拉克听不进这样的话。我不赞同他对量子电动力学的态度，但我想他也不是在固执；呼唤一个完全有限的理论，跟许多其他的美学判断是一样的，理论物理学家总是需要做出那些判断的。

我的第三个故事要讲核的弱相互作用力理论的发展和最后的接受。这个力不像电磁力或引力那样重要地表现在日常生活中，但在原子核的链式反应里，它却起着根本的作用。在恒星的中心，链式反应产生了能量，也生成了各种化学元素。

弱核力第一次表现在1896年贝克勒尔发现的放射性现象中。20世纪30年代，人们懂得了在贝克勒尔发现的那种特殊放射性（即著名的β衰变）中，原子核里的中子变成了质子，同时生成一个电子和另一种粒子，也就是今天所谓的反中微子，然后，这些粒子都从原子核里跑出来。这种事情，通过其他任何类型的力都不可能发生。把质子和中子束缚在原子核内的强力以及试图将核内质子分开的电磁力，都不可能改变粒子的本性，而引力当然不会与这些事情发生关系。所以，如果我们看到中子变成质子或质子变成中子，就说明自然出现了一种新类型的力。正如那名字说的，弱核力比电磁力和强力更弱。一个根据是，原子核的β衰变太慢了；最快的β衰变平均也要百分之一秒，与强力引发的过程相比，真的是软弱无力；强力过程的典型时间尺度大约是亿亿亿分之一（10-24）秒。

1933年，费米（Enrico Fermi）向着这种新力的理论迈出了重要的第一步。在他的理论中，弱核力不像引力和电磁力那样作用得很远；它在瞬间把中子变成质子，生成电子和反中微子，几乎是在空间的同一点完成的。为了把费米理论松散的尾巴收紧，又经过了20多年的实验努力。那松散尾巴的一个主要问题是，弱力如何依赖于参与粒子的自旋的相对方向。1957年，问题解决了，费米的弱核力理论得到了它的最终形式。^[92]

经过1957年的突破以后，我们才可以说在弱核力的认识中没有反常的东西。可是，尽管我们有了能够解释弱力的一切实验事实的理论，物理学家却普遍发现那理论很不令人满意，许多人都努力试着去澄清它，让它有意义。

费米理论的问题不出在实验，而出在理论。首先，虽然理论很适合β衰变，但当它用于其他更奇异的过程时，会得出没有意义的结果。理论家要问的是一些非常合理的问题，如中微子被与它碰撞的反中微子散射的几率是多大；他们计算时（考虑中子和反中子的发射和吸收），答案是无穷大的。大家知道，这些实验是不会做的，但计算的结果不可能跟任何实验结果一致。我们已经看到，像这样的一些无穷大，20世纪30年代初在奥本海默等人的电磁力理论中就出现过了，而40年代末理论家发现，如果恰当定义（或“重正化”）电子的质量和电荷，量子电动力学里的所有无穷大都将消除。当我们对弱力懂得更多，才越来越明白费米理论的无穷大不能通过那种方法来清除；理论是不可重正化的。

弱力理论的另一个问题是它有太多的随意性。弱力理论的基本形式总是或多或少地直接受实验的干扰，它可以不违背任何已知的物理学原理而具有迥然不同的样子。

从研究生开始我就陆续在研究弱力的理论，不过1967年我改为研究强核力（那个把质子和中子束缚在原子核内的力）。我试图通过与量子电动力学的类比发展一个强力的理论。^[93]我想，强核力与电磁力的区别也许可以用所谓对称破缺（我将在后面解释）的现象来解释。结果不是那样的。我发现自己研究的理论一点儿也不像在实验里表现的强力。这时候，我突然想到，尽管这些思想就强力而言毫无意义，却为弱核力的理论提供了数学基础，可以做我们想做的任何事情。我看到，一个类似于量子电动力学的弱力理论可能会出现在眼前。两个分离的带电粒子间的电磁力是通过光子的交换生成的，同样地，弱力也不会（像费米理论那样）立刻作用在空间的某一点，它的产生是通过在不同位置的粒子间交换类似于光子的粒子。这些新的光子类粒子不应像光子那样没有质量（首要的一点，假如没有质量，它们早该发现了），但是它们走进理论跟光子在量子电动力学里的出现却是那么相似，我想它也应该能像量子电动力学那样重正化——就是说，理论中的无穷大可以通过质量和其他物理量的重新定义来消除。而且，理论将被它背后的基本原理高度约束，这样就避免了以前理论中的许多随意性。

我得到过一个特殊具体的理论，就是说，它是一组方程，决定着粒子相互作用的方式，而且以费米理论做它的低能近似。我在研究中发现，虽然那完全不是我起初的想法，但结果的确是一个理论，不单是跟电磁学类似的弱力理论，实际上还是一个关于弱力和电磁力的统一理论。它说明，两个力不过是后来叫做弱电力的不同方面。光子跟另外的像光子的粒子紧密结合成一个粒子族；光子通过交换产生电磁力，其他理论预言的光子类粒子则通过交换产生弱力：带电荷的W粒子的交换产生β衰变的弱力，而中性的我所谓的“Z”粒子，等到后面再讲。（在关于弱力的猜想中，W粒子是一个老故事了；W代表“弱（weak）”。我拿字母Z来称它的新伙伴，是因为那个粒子只有零（zero）电荷，还因为Z是字母表的最后一个，我希望那个粒子也是这一族的最后一个。）根本说来，在的里雅斯特（Trieste）工作的巴基斯坦物理学家萨拉姆（AbdusSalam）于1968年也独立发现了这个理论。理论的某些方面，在萨拉姆和瓦尔德（John Ward）的工作中，甚至在格拉肖（Sheldon Glashaw，我在中学和康乃尔大学时的同班同学）更早的工作中，就已经出现过。

弱力与电磁力的统一，从它的运行来看，是很正确的。人们总是喜欢以尽可能少的思想去解释尽可能多的事实，虽然我起初并没能意识到自己正在走近它。不过，在1967年，理论对弱力物理学里的实验反常，绝对什么解释也拿不出来。以前费米理论没能解释的实验东西，现在的理论也一点儿都解释不了。开始，新的弱电理论也几乎没引起一点儿注意。不过，我认为理论激不起其他物理学家的兴趣，还不仅是因为它缺乏实验的支持。理论本身的内在协调性问题也同样是重要的。

萨拉姆和我都发表了意见，我们说那个理论能清除弱力中的无穷大问题。但是我们没能证明这一点。1971年，我收到乌得勒支（Utrecht）大学一个名叫霍夫特（Gerard't Hooft）的研究生寄来的一篇稿子，他宣布证明了那个理论确实解决了无穷大问题：可观测量计算中的无穷大事实上将像量子电动力学那样完全消除。

起初，我不相信霍夫特的文章。我从没听说过他，论文所用的费曼发展的数学工具也是我以前不相信的。不久以后，我听说理论家李昭辉（B.Lee）采纳了霍夫特的思想，而且在尝试用更传统的数学方法来获得同样的结果。^[94]我认识他，也很尊重他——既然他看重霍夫特的工作，我也应该。（李后来成了我最好的朋友和物理学合作者。1977年他不幸因车祸去世了。）那以后，我更加仔细研究了霍夫特做的事情，发现他真的找到了证明无穷大会消除的关键。

霍夫特论文以后，弱电理论才开始作为物理学寻常工作的一部分而成长起来，尽管那时候理论还没有一点儿新的实验支持。在这个例子中，我们可以看到科学理论的兴趣究竟有多大。碰巧，科学情报研究所（ISI）发表了我的第一篇弱电理论论文被引用的次数，以此说明引用分析对认识科学史的作用。论文写于1967年，当年没人引用。^[10]在1968年和1969年两年中，还是没人引用。（这时，萨拉姆和我在试图证明霍夫特实际证明过的东西：理论没有无穷大。）1970年，论文被引用过1次（我不知道引用者是谁）。1971年，霍夫特论文那年，我那篇文章被引用了3次，其中1次是霍夫特。1972年，还是没有新的实验证据，但论文一下子被引用了65次。1973年，引用数达到165次，到1980年，又逐渐上升到330次。根据ISI最近的研究，^[95]我那篇文章是前半个世纪里基本粒子物理学论文中引用频率最高的一篇。^[11]

理论最初激起物理学家兴趣的重大突破，是大家认识到它解决了粒子物理学的一个内在的概念性问题：弱核力的无穷大问题。在1971年和1972年，还没有一点儿实验证据说明这个理论比旧的费米理论更好。

接着，实验证据真的开始到来了。粒子的交换将产生一类新的弱核力，那就是有名的弱中性流，在中微子束被普通原子核散射时就会表现出来。（之所以叫“中性流”，是因为这些过程没有核与其他粒子间的任何电荷交换。）寻找那种中微子散射的实验在CERN和（芝加哥外的）费米实验室准备好了。（CERN是一个缩写，原文是Centre Européen de Recherches Nucléaires，欧洲核子研究中心，是在日内瓦的一个泛欧研究机构。）实验需要好多仪器，每个实验需要三四十个物理学家来做。如果头脑里不知道要做什么，那实验是很难做下去的。1973年，CERN首先宣布发现了弱中性流，费米实验室经过短暂犹豫，也宣布了他们的发现。1974年后，当两家实验室都一致认为中性流存在时，科学世界也普遍相信了弱电理论是正确的。斯德哥尔摩的一家报纸（DagensNyheder）甚至在1975年宣布萨拉姆和我将赢得那年的诺贝尔物理学奖（我们没有）。

也许有人会问，为什么弱电理论那么快就被广泛承认了。是啊，当然了，中性流是它预言的，而且后来发现了。其他理论不也是这样树立起来的吗？不过我想人们不会那么简单去看它。

首先，中性流在弱力的思想里一点儿也不新鲜。我追溯过中性流理论的源头，盖莫夫（George Gamow）和特勒（Edward Tel-ler）1937年的一篇文章，在几乎猜想的基础上预言了中性流的存在。60年代，甚至还出现过中性流的实验证据，不过从来没人相信；发现那些弱力证据的实验家们总拿它作为报告的“背景”。在实验家看来，1973年的创新而特别重要的东西，是理论预言了中性流的强度只能落在一定范围内。例如，在某一类中微子反应中，它们产生的效应的强度只是寻常弱力强度的15%～25%。这个预言为在实验里寻找这些力提供了一个指南。但是，真正使1973年不同寻常的，是出现了一个有着诱人特征的理论，一个有着内在的和谐与刚性的理论。于是，物理学家有理由相信，接纳这个理论比等着它从眼前走过，能使他们在各自的科学工作中取得更大的进步。

从某种意义说，弱电理论在发现中性流以前就得到了实验的支持，因为它正确“追认”了从前费米理论解释过的弱力的所有性质，甚至包括量子电动力学解释过的电磁力的所有性质。于是，像在广义相对论的情形那样，可能又有人要问，为什么“追认”也拿来当做一个成功呢？它不是已经由以前的理论解释过了吗？费米理论借助一定数目的任意因素解释了弱力的性质，那些任意的因素跟牛顿引力理论中的平方反比律是同一性质的东西。弱电理论以动人的方式解释了那些任意因素（例如弱力对参与粒子的自旋的依赖性）。但是关于这些判断，不可能说得更精确；那是一个兴趣和经验的问题。

1976年，中性流发现3年后，危机突然降临了。中性流虽然不会再有人怀疑，但当年的实验却说明理论预言的某些性质是那些弱力所没有的。在西雅图和牛津的实验，也出现了这种反常。那些实验是看极化的光通过铋蒸气如何传播。自1815年毕奥（Jean-BaptisteBiot）的研究以来，人们就知道通过一定糖溶液的极化光将沿极化方向发生向左或向右的旋转。例如，极化光通过普通葡萄糖D溶液时会向右旋转，而通过葡萄糖L溶液时会向左旋转。这是因为葡萄糖D的分子与它的镜像葡萄糖L不同，就像左手的手套不同于右手的手套（不同的是，不论直接看还是在镜子里看，帽子或领带都是一样的）。一般认为，极化光在通过单一原子的气体（如这里说的铋蒸气）时不会发生这类旋转。但是弱电理论预言，在电子和原子核间通过交换Z粒子而产生的弱力存在左右不对称性，这样原子就被赋予某种像手套或糖分子那样的“手性”。（这种效应预期在铋原子会特别显著，因为那种原子的能级很特殊。）计算表明，铋原子的左右不对称性会使通过它的蒸气的光的极化缓慢向左旋转。令人惊讶的是，牛津和西雅图的实验家们没能发现这种旋转，他们报告说，假如有那样的旋转，它一定比预言的慢得多。

这简直是一颗炸弹。这些实验似乎说明萨拉姆和我于1967〜1968年得到的那个特别理论在细节上可能是错误的。但是我不想放弃弱电理论的一般思想。自从霍夫特1971年的论文以来，我已经深信理论的框架是正确的，不过我也认为萨拉姆和我构造的那个特殊形式的理论只是一种可能。例如，也可能有光子、W粒子和Z粒子或其他与电子和中微子相关的粒子形成的粒子族。迪昂（Pierre Duhem）和奎因（W.Van Quine）早就指出，科学理论不可能绝对用实验数据来排除，因为总能通过一些方法来调整理论或辅助假设以达到理论与实验的一致。从某种意义说，我们要决定的是，那些为了摆脱实验矛盾而不得不做的雕琢是不是太丑陋，从而太不可信。

实际上，在牛津和西雅图的实验之后，我们许多理论家就在继续寻求弱电理论的某些小修正，希望它能解释为什么中性流的力没有期望的那种左右不对称性。我们起初认为，把理论做得丑一点儿就可能适合所有的数据。那年我正在帕洛阿尔托，我想起B·李要来，于是，我打消了去约塞米蒂长途旅行的计划，想跟他一起来修正弱电理论，使它能满足最新的数据（包括来自高能中微子反应的其他令人疑惑的偏离线索）。但是似无济于事。

问题之一在于，CERN和费米实验室的实验已经为我们提供了大量关于中微子与质子和中子碰撞的散射的数据，几乎所有数据都证实了原来形式的弱电理论。很难理解会有任何其他理论能做到这一点，而且还能以自然的方式符合铋原子的结果——就是说，不需要为了适应数据而精心弄出许多复杂的东西，也能满足那个反常的结果。回到哈佛不久，乔基（Howard Georgi）和我提出一个一般性的论证：不存在那样的自然方式，使弱电理论既符合牛津和西雅图的数据，也符合以前的中微子反应的数据。这当然阻止不了一些理论家去构造极不自然的理论（这些活动在波士顿很流行，被人叫做“反常行为”），根据最原始的科学进步法则，做总比不做好。

到1978年，斯坦福的新实验以完全不同的方式测量了电子和原子核间的弱力，它没有用铋原子的电子，而是通过氘核来散射斯坦福高能加速器产生的电子束。（氘核的选择没有特别的意思，只不过因为它是一种传统的质子和中子源。）这回实验发现了期望的左右不对称性。在这个实验里，不对称性表现为左旋和右旋的电子有不同的散射率。（对一个运动粒子，我们伸出右手，竖起姆指指向运动方向，如果握起的手指恰好指向自旋方向，我们就说粒子是右旋的。否则，它就是左旋的。）散射率之差的测量结果大约是万分之一，那正是理论所预言的。

于是，每个地方的物理学家都一下子觉得，原来形式的弱电理论毕竟还是对的。不过应该看到，这时候仍然存在那两个与理论的中性流弱力预言相矛盾的实验，而支持那些预言的实验却只有一个，而且背景还不一样。为什么那个跟弱电理论相容的实验一出现，物理学家就相信理论一定正确了呢？原因之一当然是我们都觉得轻松了：我们不会去跟原始形式的弱电理论的任何不自然的“变种”打交道了。美学的自然性准则帮物理学家在矛盾的实验数据间做出了抉择。

弱电理论在继续经受着实验检验。斯坦福实验没有重做，不过几个原子物理学家小组在寻找左右不对称性，不但在铋原子找，也在铊和铯等其他原子找。（其实，斯坦福实验之前，新西伯利亚的一个小组就曾报告在铋原子里看到了期望的不对称性，这个报告在斯坦福结果出来前没人注意，部分原因是西方人不大相信前苏联实验物理学家的实验精度。）伯克利和巴黎出现了新实验，牛津和西雅图的物理学家也重复了他们的实验。^[12]这时，在理论家和实验物理学家中间都形成了共识：预言的左右不对称性效应确实存在着，不仅存在于原子，也存在于斯坦福加速器实验做过的高能电子散射，它们的大小也是我们所期待的。弱电理论最动人的检验当然还是鲁比亚（CarloRubbia）在CERN领导的实验。1983年，他们发现了W粒子，1984年，又发现了Z粒子，这些粒子的存在和性质是原始形式的弱电理论已经预言了的。

回头来看这些事情，我感觉有些后悔，我竟花了那么多工夫去修补弱电理论来满足牛津和西雅图实验的数据。我真希望1977年的时候照原来的计划去了约塞米蒂；直到今天我也没去过那儿。故事很好地说明了爱丁顿的一句半认真的格言：在理论没有证实之前，绝不要相信任何实验。^[96]

我不希望给读者留下这样的印象：仿佛实验与理论总是像那样相互影响的，科学也总是那样进步的。我不过是在这儿强调理论的重要性，因为我想反驳一种普遍流行的在我看来似乎太过经验主义的观点。实际上，如果走过物理学实验的历史，我们可以发现那些重要的实验扮演着不同的角色，理论与实验也以不同的方式在相互影响。历史好像在告诉我们，如果谁说什么实验与理论可能怎样相互影响，那他很可能是对的；如果谁说什么实验与理论必须怎样相互影响，那他多半是错的。

CERN和费米实验室寻找中性流的实验，代表着那样一类为了检验尚未被普遍接受的理论思想而进行的实验。这些实验有时证明理论家的思想，有时也否定它。几年前，维尔切克（Frank Wilczek）和我独立预言了一种新粒子。^[13]我们都同意把这个粒子叫做轴子（axion），并不知道它是一种清洁剂的品牌。实验家寻找轴子，但是没能找到——至少没找到具有我们期待的性质的粒子。我们的思想要么错了，要么需要修正。^[14]确实，我曾收到一群在阿斯本聚会的物理学家的来信，告诉我“我们找到它了！”不过那信贴在那种清洁剂的一个盒子上。

也有些实验像一个个巨大的奇迹出现在我们面前，是理论家们谁也不曾想到的。这些实验包括X射线和所谓奇异粒子的发现，实际上，水星轨道的反常进动也可以说是这样的。我想，这些实验为实验家和新闻记者带来了极大的乐趣。

还有些实验几乎也像一个个巨大的奇迹出现在我们面前——就是说，它们发现了曾经作为一种可能而讨论过的效应，但那只是一种逻辑可能，而没有动人的出现的理由。那些实验发现了所谓时间反演对称性的违背，发现了某些新粒子，如“底”夸克，还发现了一类非常重的电子，如τ轻子。

还有一类很有趣的实验，它们发现了理论家预言的效应，然而那发现却是偶然的，因为实验家并不知道那预言——这要么是因为理论家对他们的理论还没有足够的信心，不能向实验家宣扬；要么是因为科学交流的渠道太混乱了。这些实验包括自大爆炸留下的宇宙背景无线电噪声的发现和正电子的发现。^[15]

还有一些实验，尽管我们已经知道答案了，尽管理论预言已经确立了，理论没有任何怀疑了，我们还是要做，因为现象本身太迷人了，而且很可能带来进一步的实验，我们只需要往前走，去发现。我想，这些实验应该包括反质子和中微子的发现，更近些的W和Z粒子的发现。寻找广义相对论预言的各种奇异效应，如引力辐射的实验，也该包括进来。

最后，我们来看那样一类实验，它们拒绝了大家已经接受了的、成了物理学标准认识的一部分的理论。在过去的100年里我找不到属于这种类型的任何一个例子。当然，很多时候确实发现理论的应用范围远不如原来想的那样广阔。牛顿的运动理论不适用于高速运动。宇称（即左右对称性）不存在于弱力的作用，等等。但是，在过去的一个世纪里，物理学世界普遍接受的理论，没有哪个像托勒密（Ptolemy）的行星运动的本轮理论，或像热作为一种热量流体的理论那样，后来证明是完全错误的。不过，在那百年里，正如我们在广义相对论和弱电理论的情形所看到的，往往在理论的实验证据令人相信之前，人们就根据美学的判断喜欢了某个物理学理论。我从这里看到，在肯定或有时在否定实验证据的重要性中，物理学家对美的感觉起着多么巨大的作用。

正如我讲的，科学发现和认同的进程看起来很像一团疑云。在这点上，战争史和科学史之间倒有着很大的相似。在两种情况下，历史学家们都在寻求获得最大胜利机会的系统法则——也就是，为了战争的科学或科学的科学。这可能是因为不论在科学史还是战争史，胜利与失败之间可以画出一条清楚的界线，这在很大程度上不同于政治、文化和经济史。我们可以没完没了地争论美国南北战争的起因和影响，但谁也不能怀疑米德的军队在葛底斯堡战胜了李。^[97]同样，谁也不会怀疑，哥白尼的太阳系图景比托勒密的好，达尔文的进化论比拉马克的好。

即使没有建立什么战争的科学，军事史家们还是会说将军的失败是因为他们没有遵守某些很好确立了的军事科学的法则。例如，南北战争期间，联军就有两个挨骂的将军，麦克莱伦（Ge-orge McClellan）和伯恩赛德（Ambrose Burnside）。人们骂麦克莱伦不积极去消灭李在北弗吉尼亚的部队；骂伯恩赛德草率用兵进攻防守坚固的弗雷德里克斯堡。你大概注意到了，麦克莱伦挨骂是他没有伯恩赛德那么积极，而伯恩赛德挨骂是因为他不像麦克莱伦那样谨慎。两位都是犯了大错的将军，但并不是因为他们没有服从已有的军事法则。^[98]

最好的军事史家确实发现很难说清做将军的法则。他们不说战争的科学，而说军事行动的模式，那是不能言传也说不准确的东西，但有时候却能为赢得战争胜利发挥某种作用。这就是所谓兵法或战争的艺术。^[16]在这样的精神下，我想我们也不应该指望有一个科学的科学，关于科学家如何工作或应该如何工作，那样的法则是确立不起来的；我们只能希望把在历史上曾经带来科学进步的那些活动写下来——那就是科学的艺术。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈