当前位置: 华文星空 > 知识

如何通俗地解释爱因斯坦的广义与狭义相对论?

2015-11-03知识

讲狭义相对论首先是绕不开电动力学或者起码说电磁学的,只在运动学里打转转就有点「玄学」了。

按照日常经验,如果一个物体A速度为 \boldsymbol{u} ,另一个速度B相对A的速度为 \boldsymbol{v} ,那么B的速度自然是 \boldsymbol{v}^{\prime}=\boldsymbol{u}+\boldsymbol{v} 。。。这能有啥不对,牛顿等科学巨匠也是这么认为的。直到19世纪,电动力学得到飞速的发展。

事情是这样的,我们知道真空中两个距离为 r 静止的电荷 q_1,q_2 之间的作用力即库仑力满足

F=k_e\frac{q_1q_2}{r^2}=\frac 1 {4\pi\varepsilon_0}\frac{q_1q_2}{r^2}

然后我们知道真空中一段长为 l 电流为 I_1 的导线,受距离 r 处一条与之平行的无限长电流大小为 I_2 导线的作用力满足

F=\frac {\mu_0} {2\pi}\frac{I_1 I_2}{r}l

然后我们知道电磁感应,电生磁,磁生电。

好依据以上这些「静止」场景下压根就没有所谓高速运动的影子的实验规律,麦克斯韦等人一番操作,预言了电磁波的存在,并且从这些静止实验就可以测得的物理常数中 [1] 得出真空中电磁波的速度 c=\frac 1{\sqrt{\mu_0\varepsilon_0}} ,而1849年费索通过旋转齿轮法测得的光速 3.13\times10^8m/s ,和这里计算出来的值差不多,于是自然地猜测光就是电磁波,以下电磁波速度称光速。

这里注意一点,各个方向的光速都是这个速率,这也很自然,物理规律的空间对称性嘛。

到这里矛盾就来了,假设一个参考系中具有各向相同的光速 c ,那么对于同该参考系相对速度为 \boldsymbol{v} 的另一参考系,显然就不可能有各向相同的光速,其中,同运动方向相同的方向是 c+v ,相反的则是 c-v ,垂直的是 \sqrt{c^2+v^2} 等等。

那么是地球足够特殊才能得出各向相同的光速吗,这是容易排除的,虽然上文中我用的是静止,可众所周知,地球绕着太阳转,太阳绕着银河系中心转动。换言之,我们脚下的地球怎么看也不可能具备物理上的特殊性,是个「天选之地」吧。

那么理论有没有问题呢,或者说这个漂亮的理论只是在某个特殊的参考系中成立的,在其他参考系需要修正呢?但迈克尔逊莫雷实验,确确实实得出了光各向同速。于是大家就开始思考怎么打补丁,怎么让电磁规律变得普适,或者说看上去普适。

这里有很多人已经快摸到门道了,譬如庞加莱,也有洛伦兹,他假设电磁规律只在某个特殊的参考系「以太参考系」成立,但是当我们相对于这个「以太参考系」的运动导致了时空变化,也就是洛伦兹变换,所以我们做实验测不出来相对速度。

但最终是爱因斯坦的【论动体的电动力学】横空出世,它以光速不变为前提,不需要所谓的「特殊参考系」,而使不同参考系之间的变换规律就是洛伦兹变换。这个理论不引入所谓的「天选之地」这样超然的概念,更具有对称性。(当然,物理规律还是需要实验检验的,这里不作展开)。

关于如何得到光速不变的变换,有很多种方法,下面这个方法从我们熟悉的空间对称性出发:

看二维情形,众所周知,旋转变换,能够使长度保持不变也即 \left(x_1-x_2\right)^2+\left(y_1-y_2\right)^2 保持不变。

\begin{cases} x^{\prime}&=&x\cos{\theta}-y\sin{\theta}\\ y^{\prime}&=&x\sin{\theta}+y\cos{\theta} \end{cases}

那么如果我们要令 \left(x_1-x_2\right)^2-\left(y_1-y_2\right)^2 保持不变呢,这也容易,我们只要上式的正余弦换成双曲正余弦,即从 \cos^2{\theta}+\sin^2{\theta}=1 变成 \cosh^2{\theta}-\sinh^2{\theta}=1

\begin{cases} x^{\prime}&=&x\cosh{\theta}-y\sinh{\theta}\\ y^{\prime}&=&-x\sinh{\theta}+y\cosh{\theta} \end{cases}

那光速不变呢,考虑使 \left(c\Delta t\right)^2-\Delta x^2 保持不变,这样 \left(c\Delta t\right)^2-\Delta x^2=0 即光速运动经变换后仍是光速。

\begin{cases} ct^{\prime}&=&ct\cosh{\theta}-x\sinh{\theta}\\ x^{\prime}&=&-ct\sinh{\theta}+x\cosh{\theta} \end{cases}

虽然说到这我们已经得到使光速不变的变换,不过变换和参考系相对速度 v 的关系尚不明晰:先有速度变换公式:\frac{u^{\prime}}{c}=\frac{\mathop{}\!\mathrm{d} x^{\prime} }{\mathop{}\!\mathrm{d} ct^{\prime}}=\frac{-\sinh\theta \mathop{}\!\mathrm{d} ct+\cosh \theta \mathop{}\!\mathrm{d} x}{\cosh\theta \mathop{}\!\mathrm{d} ct-\sinh \theta {\mathop{}\!\mathrm{d} x}}=\frac{\frac{u}{c}-\tanh\theta }{1-\tanh\theta \frac u c} ,也可以写成 \beta^\prime=\beta-\theta,\tanh\beta=\frac u c,\tanh{\beta^\prime}=\frac {u^\prime} c ,如此也很容易同旋转场景对照起来。

若新参考系相对旧参考系的运动速度是 v ,即 u^\prime=0 时, 有 u=v ,应有 \tanh{\theta}=\frac v c ,即 \cosh \theta=\frac 1 {\sqrt{1-\frac{v^2}{c^2}}},\sinh \theta=\frac {\frac v c} {\sqrt{1-\frac{v^2}{c^2}}} 。

这里有一个值得注意的点,在经典力学或者说伽利略变换那里,时间间隔 \Delta t 不随参考系变换改变。而在狭义相对论里,如前所述 \Delta s ^2=\left(c\Delta t\right)^2-\Delta x^2-\Delta y^2-\Delta z^2 不随参考系变换而改变,也就是说 \Delta s 替代了 \Delta t 的地位。我们也可以写成微分形式 \mathop{}\!\mathrm{d} s^2=c^2\mathop{}\!\mathrm{d} t^2-\mathop{}\!\mathrm{d} x^2-\mathop{}\!\mathrm{d} y^2-\mathop{}\!\mathrm{d} z^2 。

实际上,这个不变量也确实在相对论体系下动力学的推演中扮演着关键角色。

譬如,我们知道两点之间直线最短,或者说给定起点和终点 \boldsymbol{x}_0,\boldsymbol{x}_1 ,使 \int_{\boldsymbol{x}_0}^{\boldsymbol{x}_1} \mathop{}\!\mathrm{d} s 最小的即是直线,其中 \mathop{}\!\mathrm{d} s^2=\mathop{}\!\mathrm{d} x^2+\mathop{}\!\mathrm{d} y^2+\mathop{}\!\mathrm{d} z^2 。而在四维时空中,有一点小小区别的是 \int_{\boldsymbol{x}_0}^{\boldsymbol{x}_1} \mathop{}\!\mathrm{d} s 取得最大,或者使 -\int_{\boldsymbol{x}_0}^{\boldsymbol{x}_1} \mathop{}\!\mathrm{d} s 取得最小的是直线。而这四维时空中所谓的直线,刻画的是匀速直线运动——这正是牛顿第一定律。

狭义相对论,把真空中的经典电磁理论讲清楚了,但是电磁理论带来的不止这些。上面的冲突本质上是什么,是一个非超距作用同经典的伽利略相对性原理(也就是简单的速度叠加)的矛盾。假设一个作用是非超距的,也就是它有一个有限的传播速度,那么另一个参考系就不是这个速度了。特别是,由空间对称性得出的各向相同的传播速率,在另一个参考系下不再具有。

反过来,一旦采用了狭义相对性原理,首先,超距作用的所谓同时性会被轻易得破坏掉。其次,狭义相对论所表现出来的时空对称性不应仅仅是光独有的物理性质,其中的物理常数光速不应仅仅是光的速度。

这就不由得让人们把目光转向另一种相互作用——万有引力。按照狭义相对论的要求,万有引力似乎也应该纳入有限传播速度的范畴,但是非超距的万有引力可不仅仅只是同伽利略相对性原理有矛盾。

引力一旦不是超距的,由平方反比律推出的圆周运动可就不复存在了。对于经典的电子绕原子核模型的一个否定,是圆周运动的电子会辐射能量,这条同样适用于经典引力身上。并且光速虽然快,可在引力的作用尺度面前就是个弟弟,太阳到地球光就需要走8分钟。因此根据拉格朗日等的计算,即使引力不是超距的,其传播速度也应远远大于光速,否则星体轨道无法稳定存在。

以上的这些问题,说明经典的引力理论虽然同库仑力一样具有平方反比的形式,但它并不像电磁相互作用一样能直接同狭义相对论相融合。而广义相对论正是为解决这个狭义相对论的有限速率和引力看似所需要的「超距属性」的矛盾而诞生的。

让我们回顾抛物运动:

m\boldsymbol{a}=m\boldsymbol{g}

约去 m ,得 \boldsymbol{a}=\boldsymbol{g} 。。。到这里,就变成了纯粹的运动学问题。

但是尽管我们约去的都是 m , 但在牛顿力学那里,左边的 m 来自于牛顿第二定律 \boldsymbol{F}=m\boldsymbol{a} ,而右边则来自于经典引力 \boldsymbol{F}=-G\frac{Mm}{r^2}\hat{\boldsymbol{r}} 。换言之,两者有着不同的物理含义,我们称之为惯性质量、引力质量。

在牛顿力学里,惯性质量等于引力质量。。。

但是,换个角度想,我们可以认为 \boldsymbol{a}=\boldsymbol{g} 才是更本质的一个方程,而把它回代到牛顿力学体系里,自然产生了惯性质量等于引力质量的要求或者说「巧合」。或者说,我们把以下 这个性质 看成是引力场的本质:初始运动状态相同,就会有相同的运动,而与物体的质量无关(也就是纯粹的运动学问题)。

这个性质,惯性系和非惯性系也都具有。从这个角度,我们可以认为在忽略引力场的不均匀性的情形下,非惯性系和引力场是等效的。因此,在宇宙中「自由」运动的物体局部譬如空间站,尽管可能有着复杂的运动轨迹,实际上却是个比地表还要理想的惯性系。而我们也可以用自由落地来模拟——现实中也确实是这么干的。

而如果我们再沿着狭义相对论的思路分析非惯性系,具有这样性质的场可以由时空的变化来刻画。

即\mathop{}\!\mathrm{d} s 不再满足 \mathop{}\!\mathrm{d} s^2=c^2\mathop{}\!\mathrm{d} t^2-\mathop{}\!\mathrm{d} x^2-\mathop{}\!\mathrm{d} y^2-\mathop{}\!\mathrm{d} z^2 。这样,引力场中,牛顿第一定律不再成立,而物体在引力场中的「自由」运动即沿着变化后时空的测地线——譬如在地表这个曲面上,从赤道上一点到该点东1000公里再向北1000公里的点,其最短路径并不是向东北45°,更夸张的例子从赤道上一点向东跨越90经度,再向北90跨越纬度,没错这是北极,那么到北极去直接往北走不就完事了。。。而这一最短路径就是地表这个曲面的测地线(实际上这也是测地线这一名称的由来),只不过在这里如前所述,这个测地线不是最短而是最长。

当然,如果说狭义相对论还只是线性变换,那么这里就涉及到更进一步的数学工具——微分几何等等。因此这里不做进一步地展开了。

爱因斯坦于1907年灵光乍现后,经过8年的长跑于1915年完成了广义相对论(当然中间有一段时间他主要在折腾量子理论),确切地说,是得出爱因斯坦方程,也就是引力理论的另一部分,物体(源)和其「引发」的引力场的关系。并成功解释了经典引力理论关于水星近日点进动的误差。

这其间还有个插曲,在爱因斯坦完成了理论的框架和大部分工作后,大数学家希尔伯特在听了爱因斯坦的演讲后,最终于1915年11月20日先推出了爱因斯坦方程,而爱因斯坦则晚了五天。这也造成两人之间一度有点小紧张。不过希尔伯特承认爱因斯坦是广义相对论的唯一创始人「哥廷根街上的孩子,都比爱因斯坦更懂四维几何,但发现相对论的仍然是物理学家。」。爱因斯坦也于一个月后提出和解。

参考

  1. ^ 注:容易看出以上物理常数的数值本身同物理单位的大小有关,譬如在2019年前的国际单位制中,是规定μ_0来确定电流单位的,而2019年后,改为规定电子电荷e,这样一来μ_0就成了需要实验测量的量,另人们规定光速来确定长度单位了。