理论经济学家应从爱因斯坦独辟蹊径思维中得到一些启示
【荐文说明】 从物理学的研究方法来看,爱因斯坦之前的物理学家的研究路径是:实验——归纳理论——发现本质性规律(对称性):首先去做各种实验,去测量各种数据,然后去研究这些数据里的规律,最后用一组数学公式来“归纳”这些数据,如果归纳得好,就认为得到了描述这种现象的物理定律,然后顺带发现隐藏在理论里的某些性质,比如某种对称性。但是,爱因斯坦把这个过程给颠倒了,他发现上面的过程在处理比较简单的问题的时候还行,但是当问题变得比较复杂,当实验不再能提供足够多的数据的时候,试图从实验去归纳出理论的方式根本行不通的。靠实验不可行,那么爱因斯坦就要找更可靠的东西,这个更可靠的东西就是“对称性”!于是爱因斯坦在物理学的研究方式上来了一场革命:他先通过观察分析找到一个十分可靠的对称性,然后要求新的理论具有这种对称性,从而直接从数学上推导出它的方程,再用实验数据来验证他的理论是否正确。在这里,原来的“实验——理论——对称性”路径变成了“对称性——理论——实验”路径。爱因斯坦利用这样思路,先确定了广义坐标不变性,然后从这个对称性出发得到了广义相对论。后面的物理学家对这一思路发扬光大,从整体规范对称性得到电荷守恒;从局域规范对称性得到了整个电磁理论(包括麦克斯韦方程组);杨-米尔斯理论则提供了一个精确的数学框架,在这个框架里,只要选择了某种对称性,其相互作用就被完全确定了,这就是此后物理学家能直接从强力和弱力理论里预言那么多还未被发现的粒子的原因。以前是实验物理学家发现了新粒子,理论物理学家要琢磨着怎么去解释,现在是理论物理学家预测粒子,实验物理学家再去找,爱因斯坦颠倒研究物理的方法现在从独辟蹊径成了主流。
在当下的经济学界,经济学家群体普遍以繁复的计量模型为根本的研究手段。经济学家们,是不是应当从爱因斯坦的认识中——“当实验不再能提供足够多的数据的时候,试图从实验去归纳出理论的方式根本行不通的。靠实验不可行,那么就要寻找更可靠的东西——对称性” 得到一些启示呢?特此推荐下文。
本文转摘自长尾科技《杨-米尔斯理论说了啥?》 ,转摘自中科院物理所公众号。推荐人:钟茂初,南开大学经济研究所教授。
杨-米尔斯理论说了啥?
长尾科技
01物理学的主线
物理学家到底在研究什么?
大自然中有各种各样的现象,有跟物体运动相关的,有跟声音、光、热相关的,有跟闪电、磁铁相关的,也有跟放射性相关的等等。物理学家们就去研究各种现象背后的规律,然后他们得到了一堆关于运动啊,声学、光学、热学之类的定律,然后物理学家们就满意了么?
当然不满意,为啥?定律太多了!
想一想,如果每一种自然现象都用一种专门的定律来描述它,那得有多少“各自为政”的定律啊。于是物理学家们就想:我能不能用更少的定律来描述更多的现象呢?有没有可能有两种现象表面上看起来毫不相关,但是在更深层次上却可以用同一种理论去描述?有没有可能最终用一套理论来描述所有的已知的事情?
物理学家的统一之路,也是这样开始的。
牛顿统一了天上和地上的力,麦克斯韦统一了电、磁、光。到了19世纪,随着人们对微观世界研究的深入,许多在宏观上风牛马不相及的东西,在微观层面上却很好的统一了起来。比如我们熟悉的支持力、弹力、摩擦力之类的东西,在宏观上它们确实是不同的东西,但是到了微观一看:这些杂七杂八的力全都是分子间作用力造成的,而分子间作用力本质上就是电磁力。并且,这些分子、原子运动的快慢,在宏观层面上居然体现为温度,然后热现象就变成了一种力学现象。
于是,到了19世纪末,人类所有已知现象背后的力就都归结为引力和电磁力,其中引力由牛顿的万有引力定律描述,电磁力由麦克斯韦方程组描述。但尴尬的是,麦克斯韦方程组和牛顿力学这套框架居然是矛盾的,于是爱因斯坦升级了一下牛顿的这套框架,在新框架下跟麦克斯韦方程组很融洽,这套升级后的新框架就叫狭义相对论。
02被颠倒的物理学
在物理学的统一史里,有一个人的工作至关重要,他就是爱因斯坦。是他颠倒了物理学的研究方式。以他为分水岭,物理学家探索世界的方式发生了根本的改变。正是这种改变,让20世纪的物理学家们能够游刃有余的处理比之前复杂得多得多的物理世界,让他们能够大胆的预言各种以前想都不敢想的东西。
那么,爱因斯坦究竟发现了什么,以至于颠倒了物理学的研究方式呢?
大家先想一想,爱因斯坦之前的物理学家是怎么做研究的?他们去做各种实验,去测量各种数据,然后去研究这些数据里的规律,最后用一组数学公式来“解释”这些数据,如果解释得非常好,他们就认为得到了描述这种现象的物理定律,然后顺带发现隐藏在理论里的某些性质,比如某种对称性。在这里我们能清晰的看到实验-理论-对称性这样一条线,这也符合我们通常的理解。
但是,爱因斯坦把这个过程给颠倒了,他发现上面的过程在处理比较简单的问题的时候还行,但是当问题变得比较复杂,当实验不再能提供足够多的数据的时候,按照上面的方式处理问题简直是一种灾难。
比如,牛顿发现万有引力定律的时候,开普勒从第谷观测的海量天文数据里归纳出了行星运动的三大定律,然后牛顿从这里面慢慢猜出了引力和距离的平方反比关系,这个还马马虎虎可以猜出来。我们再来看看牛顿引力理论的升级版-广义相对论的情况——
广义相对论的引力场方程,这种复杂的方程要怎样从实验数据里去凑出公式来?怎么可能从中归纳出广义相对论的场方程?经过一连串的深度碰壁之后,爱因斯坦意识到:当理论变得复杂的时候,试图从实验去归纳出理论的方式是行不通的。靠实验不可行,那么爱因斯坦就要找更加可靠的东西,这个更加可靠的东西就是对称性!
于是爱因斯坦在物理学的研究方式上来了一场哥白尼式的革命:他先通过观察分析找到一个十分可靠的对称性,然后要求新的理论具有这种对称性,从而直接从数学上推导出它的方程,再用实验数据来验证他的理论是否正确。在这里,原来的实验-理论-对称性变成了对称性-理论-实验,对称性从原来理论的副产品变成了决定理论的核心,实验则从原来的归纳理论的基础变成了验证理论的工具。理解这一转变非常的重要,后面的物理学家都是这么干的!
爱因斯坦利用这样思路,先确定了广义坐标不变性,然后从这个对称性出发得到了一套新的引力理论,这就是广义相对论。爱因斯坦是第一个这么反过来干的,广义相对论大获成功之后人们才发现原来理论研究还可以这么干,这种思想后来被发扬光大,并形成了“对称决定相互作用”这样的共识。
03规范不变性
我们再来理一理爱因斯坦的思路:爱因斯坦把对称性放在更加基础的位置,然后从对称性导出新的理论。他从洛伦兹不变性导出了狭义相对论,从广义坐标不变性导出了广义相对论,现在我们试图统一引力和电磁力,那么,有一个问题就会很自然地被提上日程:究竟什么样的一种对称性会导出电磁理论呢?
麦克斯韦方程组是从前人的实验经验定律总结出来的,并没有指定什么具体的对称性,那要怎么办呢?不着急,诺特定理告诉我们对称性跟守恒定律是一一对应的,我现在不是要找导出电磁理论的对称性么?那么我就去看看电磁理论里有什么守恒定律。
说到电磁理论里特有的守恒定律,那肯定就是电荷守恒。在外尔的研究得出:跟电荷守恒相对应的对称性是波函数的相位不变性,(在量子力学里粒子的状态是用波函数来描述的,既然波那肯定就有相位),但是由于历史原因,这个相位不变性我们一直称为规范不变性,也叫规范对称性。
这个相位不变性,或者说规范不变性,我们怎么理解呢?为什么麦克斯韦的电磁理论里会有规范不变性呢?如果从公式里看就非常的简单,就是我给它这里做了一个相位变换,它另一个地方就产生了一个相反的相位,总体上刚好给抵消了;如果从直觉上去感觉,你可以想想,在量子力学里,波函数的模的平方代表在这里发现该粒子的概率,你一个波函数的相位不论怎么变,它的模的平方是不会变的。
总的来说就是:规范不变性导致电荷守恒。
但是事情还没完,外尔接着发现了一件真正让人吃惊的事:我们上面说规范不变性导致电荷守恒,这里说的规范不变性指的是整体规范不变性。但如果我们这个规范不变性是局域的呢——
04整体对称和局域对称
整体对称,顾名思义,如果一个物体所有的部分都按照一个步调变换,那么这种变换就是整体的。打个比方,舞台上所有的演员都同步地向前、向后走,或者全都做同样的动作,观众看着演员都整整齐齐的,觉得所有人都像是一个人的复制品一样,这样的变换就是整体的。如果经过这样一种整体的变换之后,它还能保持某种不变性,我们就说它具有整体对称性。
有了整体对称的概念,局域对称就好理解了,类比一下,如果一个物体不同的部分按照不同的步调变换,那么这种变换就是局域的。还是以舞台为例,导演为了使表演更具有个性,他想让演员表现出波浪的样子,或者是千手观音那样,再或者是形成各种不断变化的图案,这种时候每个人的动作变换就不一样了吧,也不会说所有人都像一个人的复制品一样了,这时候这种变换就是局域的。因为它不再是所有的人按照一个规则变换,而是局部的每个人都有他局域特有的变换规则。同样的,如果经过这样一种局域的变换之后,它还能保持某种不变性,我们就说它具有局域对称性。
从上面的例子我们看出来,整体变换要简单一些,所有的地方都按照同样的规则变换,而局域变换就复杂多了,不同的地方按照不同的规则变换。所以,很明显,如果你要求一套理论具有某种局域对称,这比要求它具有整体对称复杂得多,局域变换对物理定律形式的要求就更加严格一些。但是,你一旦让它满足局域对称了,它能给你的研究回报也会多得多。
还是电磁理论的例子:整体规范对称性下我们只能得到电荷守恒,但是一旦要求它具有局域规范对称性,整个电磁理论,甚至麦克斯韦方程组都直接得到了。
05杨-米尔斯理论
由此,一个大胆的想法就产生了:在电磁理论里,整体规范对称性对应着电荷守恒,但是我一旦要求这个整体规范对称性在局域下也成立,我立马就得到了整个电磁理论。那么我可不可以把这种思想推广到其他领域呢?比如强力、弱力,有没有可能同样要求某种整体对称性在局域成立,然后可以直接产生强力、弱力的相关理论呢?这是一个十分诱人的想法,杨振宁从他读研究生的时候就在开始琢磨这个事,但是一直到十几年后的1954年才有结果,这个结果就是大名鼎鼎的非阿贝尔规范场论,也叫杨-米尔斯理论。
既然试图通过找到某种新的局域规范对称性来找到强力、弱力的理论,那么关键就是要找到这种对称性。但是怎么找这种对称性呢?当然还是按照诺特定理,去看看强力、弱力之中有什么守恒定律。
杨-米尔斯理论给我们提供了一个精确的数学框架,在这个框架里,只要选择了某种对称性(对应数学上的一个群),或者说你只要确定了某个群,后面的相互作用几乎就被完全确定了。这就是为什么后来大家能直接从强力和弱电理论里预言那么多还未被发现的粒子的原因。以前是实验物理学家发现了新粒子,理论物理学家要琢磨着怎么去解释,现在是理论物理学家预测粒子,实验物理学家再去找,爱因斯坦颠倒研究物理的方法现在终于从蹊径成了主流。