狭义相对论和广义相对论是爱因斯坦的其中两个主要成果,一个描述运动,一个描述引力。狭义相对论包含在广义相对论中,但是广义相对论适用范围比狭义相对论小。狭义相对论虽然说是爱因斯坦发现的,但洛伦兹已经发现了洛伦兹变换,爱因斯坦是在这个基础上抛弃了以太并提出了质能方程,发现了时空统一和质能统一。而广义相对论是爱因斯坦花了10年独自发现的,其他人只是提供了数学方法。 对于狭义相对论和广义相对论,很多人都能说出不少,很多人都能读懂狭义相对论的公式,但读不懂广义相对论的场方程。狭义相对论不需要微积分就能给出,所以小学生就能学会,完整学习要极其基础的微积分,初中就能学会,不排除极个别人小学就掌握。但是广义相对论的张量偏微分方程的复杂程度远不是狭义相对论的数学要求能比的,中学生很难掌握,一般高中或大学才能掌握。我学习的比较晚,初三写作业划水期间看了3bule1brown的视频(通过知乎传送门过去的,当时很多人都是),学会了基础微积分和线性代数,在大学才学会广义相对论场方程。现在我自己理解了一下,希望以后学起来会简单一些。另外我推荐一下油管的scienceclic和b站柚叶说,虽然不够完整。 度规张量 研究时空弯曲,首先要研究歪的坐标系,也就是斜直线坐标系,从笛卡尔坐标系到斜直线坐标系,最后才是弯曲的坐标系。而度规张量就是描述斜直线坐标系的。 首先,是张量。张量是一类物理量,特点是不随坐标系的变化而变化。例如一根木棍,横着看和纵着看不一样长,但长度一样,这个木棍的长度就是一个张量,还有一个物品,重量按千克,斤,盎司不一样,但质量一样,这就是一个张量。也有的量不是张量,例如物品的价格,虽然在不同货币可以换算,但在不同国家能换取的东西不一样,这就是随坐标改变了,不是张量。最简单的是标量(数学上常称为数量),只是一个数就包含了所有,物理上还一般带有一个量纲;然后是矢量(数学上常称为向量),有一个方向,例如速度、力、动量、角动量、电场强度等;还有的量需要有多个方向,例如应力,也就是压强的推广,是单位面积上的力,挤压拉伸的力和横向剪切的力不一样,必须同时应用力的方向和面积的方向才行,\(\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \leftrightarrow $}} \over P}=\frac{\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over F}\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over {\hat{S}}}}{S}\)二阶张量一般用矩阵表示。人们根据张量的方向数量,划分了张量的阶数,几个方向就是几阶,标量零阶,矢量一阶,以此类推,实际上还有分数阶,但这是旋量不是张量,有复数。人们为了描述向量组成矩阵,发明了并乘运算,写法是两个向量并在一起,就是以一个向量为行,一个为列,元素逐个相乘\(\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over a} \mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over b}=\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \leftrightarrow $}} \over c}\),\(a_ib_j=c_{ij}\),并乘的结果叫并矢,可以点乘向量,左右点乘具有矩阵的性质,但并矢的分量很不自由,所以就有了一般的二阶张量,可以理解为并矢的和。 在笛卡尔坐标系中,有一个公式,\(\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over a}\cdot \mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over b}={\scriptsize\sum\limits_{\tiny i=1 }^{\tiny n}} a_ib_i\)。另外说一下爱因斯坦发现求和的指标相同,指标相同一定是求和,所以就把求和的符号省略了,\(\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over a}\cdot \mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over b}=a_ib_i\),这就是爱因斯坦求和约定,求和的指标叫哑指标,可以替换。但是这个公式在斜直线坐标系失效了,因为在笛卡尔坐标系中,向量的分量可以用两种方法定义,一种是按基矢量线性组合\(\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over a}=a_i\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over g_i}\),一种是按点乘基矢量,\(\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over a} \cdot \mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over g_i} =a_i\),在笛卡尔坐标系中,两者是一样的,但是斜直线坐标系不行。人们发现,用第一种方法定义的分量可以用点乘另一种坐标系基矢来表示,这组基矢与原有的基矢方向垂直,大小为原基矢的倒数,人们管这种坐标系叫逆变坐标系,因为这个坐标系可以逆向出第一种定义的分量,而原有的坐标系就叫协变坐标系,两者互为协逆坐标系。所以,第一种分量叫逆变坐标分量\(a^i\),第二种叫协变坐标分量\(a_i\),所以协变基编织了逆变分量,逆变基编织了协变分量。某种意义上协变基和逆变基就是内部视角和外部视角的关系。协变坐标基和逆变坐标基的点乘和笛卡尔坐标系一样,都是单位矩阵,指标相同1不同0,或者说克罗内克符号\(\delta^i_j\),笛卡尔坐标系的坐标基既是协变基又是逆变基。 所以人们为了计算点乘,就去用更常见的逆变分量求协变分量,而这个过程是一个坐标变换,用矩阵可以完成,矩阵可以认为就是坐标变化,用的就是度规张量。度规张量是坐标系的性质,但在不同坐标系之间可以进行线性变换,所以与坐标系无关是张量。要想获得度规张量,只要先知道基矢量的点乘就行,因为\(a^ib_i= \mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over a} \cdot \mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over b} = a^i \mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over {g_i}} \cdot b^j \mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over {g_j}}=a^ib^j\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over {g_i}} \cdot \mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over {g_j}}\),所以度规张量就是\(g_{ij}=\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over {g_i}} \cdot \mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over {g_j}}\),这种把分量变成协变分量的叫协变度规张量,指标也是协变的下标,同理也有逆变度规张量\(g^{ij}=\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over {g^i}} \cdot \mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over {g^j}}\),也就是协变度规张量的逆矩阵。可以理解度规张量就是把点乘的规则存储了起来,计算的时候调用,也可以理解为是把歪的坐标系拉回正常。因为点乘的交换律,所以度规张量的下标可以随意互换。所以度规张量可以升降指标\(a^ig_{ij}=a_j\)。 度规张量可以计算长度,\(a=\sqrt{|\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over a}|}=\sqrt{a^ia_i}=\sqrt{a^ia^jg_{ij}}\),度规张量在根号下,某种意义上就是比例尺的平方,这也是度规张量的名字的由来。因为矩阵的行列式就是n维体积的变换,或者说矩阵中的列或行矢量张成的n维体积,所以度规的行列式是最接近比例尺的平方的标量形式,用g表示。但是行列式是有正负的,也就是左右手性,而时间和空间本质上有区别,时间维是虚数维,平方带负号,所以导致整个行列式为负,所以比例尺是\(\sqrt{-g}\)。 测地线 测地线是弯曲空间上的“直线”,也就是最短的线。测地线的例子很多,例如飞机为什么会在地图上“绕远”不走地图上的直线,也就是大圆航线,这就是因为大圆航线是地球表面的测地线。地球表面是个近似球面,这种表面上画一个三角形,内角和大于180°,画不出平行的测地线,这种几何叫黎曼几何,是黎曼提出的,而马鞍面三角形内角和小于180°,有无数条平行测地线,这种几何叫罗氏几何,由罗巴切夫斯基提出。对于不同曲面,曲率可以由截线最大和最小的曲率相乘得到(数学家已经证明了两种截面垂直),这叫高斯曲率。高斯证明了曲面的高斯曲率在不伸缩的条件下守恒,这就是绝妙定理。绝妙定理告诉我们把平的东西卷一下就不容易弯折了,吃披萨的时候就会卷起来一点。高斯曲率为正的平面,两个截线同向弯曲,球面就是,这是黎曼几何的研究范围;而马鞍面的两个截线反向弯曲,有负曲率,这是罗氏几何的研究范围;平面和柱面是零曲率,符合欧氏几何。有人测过宇宙中的大三角形内角和,几乎为180°,宇宙难以想象的平坦,这很有趣。 为了描述时空的弯曲,就要描述基矢的变化,更准确的说是单位长度空间的基矢量变化。因为要向多个方向求导,所以是偏导数,结果是一个矢量,所以人们用一个量叫做克里斯托夫符号\(\mathit{ \Gamma}^k_{ij}\)(量纲是\(\rm [L^{-1}]\))来表示偏导数矢量的系数,也就是\(\frac{\partial g_i}{\partial x^j} = \mathit{ \Gamma}^k_{ij}g_k\)。这个符号是三维矩阵但不是张量,因为坐标的弯曲是坐标系的性质,随坐标系变化而变化。克里斯托夫符号的下标可以交换,因为不同路径走出的距离应该封闭,也就是说求导基矢对距离求导的上下可以互换。 (蓝色和绿色箭头表示图形闭合与下标交换,绿色是具体计算的边) 为了描述测地线运动,要研究速度随坐标的变化而变化,也就是\(\frac{\partial v_i}{\partial x^j} = \mathit{ \Gamma}^k_{ij}v_k\),这就是速度随着坐标系的弯曲而变化。利用链式法则可以得到加速度,\(\frac{\partial v_i}{\partial x^j} \frac{{\rm d} x^j}{{\rm d} t}= \mathit{ \Gamma}^k_{ij}v_k\frac{{\rm d} x^j}{{\rm d} t}=\mathit{ \Gamma}^k_{ij}v_kv^j\),或者\(\frac{{\rm d} v_i}{{\rm d} t}= \mathit{ \Gamma}^k_{ij}v_kv^j\),换一下坐标系,用度规张量升降一下指标\(g^{ik} \frac{{\rm d} v_i}{{\rm d} t}= g^{ik} \mathit{ \Gamma}^k_{ij}v_kv^j\),但这是外部视角,公式不正确,在坐标系内,坐标弯曲的偏转是类似离心力的惯性力形式,也就是$$\frac{{\rm d} v^k}{{\rm d} \tau }=- \mathit{ \Gamma}^k_{ij}v^iv^j$$ 这就是测地线方程。可以理解为“引力加速度”只是速度随着运动被不同地方的时空扭曲了而已。也可以理解为是一种误差修正,因为\(\frac{{\rm d} \mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over v}}{{\rm d} x^i }=\frac{{\rm d} v^k\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over {g_k}}}{{\rm d} x^i }=\frac{\partial v^k}{\partial x^i}\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over {g_k}} +\frac{\partial \mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over {g_k}}}{\partial x^i}v^k =\frac{\partial v^k}{\partial x^i}\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over {g_k}} + \mathit{ \Gamma}^k_{ij}\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over {g_k}}v^j\),所以可以定义\(\frac{{\rm D} v^k}{{\rm D} x^i }=\frac{\partial v^k}{\partial x^i} + \mathit{ \Gamma}^k_{ij}v^j\),这种导数叫逆变导数,让它是在对时间求导时等于0也可以得到测地线方程。 克里斯托夫符号与基矢的导数有关,自然而然也就和度规张量的导数有关。 逆变导数有对应的协变导数,\(\frac{{\rm D} v_i}{{\rm D} x^j }=\frac{\partial v_i}{\partial x^j} - \mathit{ \Gamma}^k_{ij}v_k\)协变导数就是逆变导数换了一下坐标系,所以带负号。因为二阶张量是并矢的推广,所以分量具有乘积的性质,也就符和乘法的导数法则,克里斯托夫符号有两项,也就是\(\frac{{\rm D} w_{ij}}{{\rm D} x^k } = \frac{{\rm D} w_iw_j}{{\rm D} x^k } = w_i\frac{{\rm D} w_j}{{\rm D} x^k } + \frac{{\rm D} w_i}{{\rm D} x^k }w_j = w_i\frac{\partial w_j}{\partial x^k} - w_i\mathit{ \Gamma}^l_{jk}w_{l} +\frac{\partial w_i}{\partial x^k}w_j - \mathit{ \Gamma}^l_{ik}w_{l}w_j=\frac{\partial w_{ij}}{\partial x^k} - \mathit{ \Gamma}^l_{jk}w_{il} - \mathit{ \Gamma}^l_{ik}w_{lj}\)。取度规张量的协变导数为0,可以得到\(\frac{\partial g_{ij}}{\partial x^k} = \mathit{ \Gamma}^l_{jk}g_{il} + \mathit{ \Gamma}^l_{ik}g_{lj}\),也可以理解是\(\frac{\partial g_{ij}}{\partial x^k} =\frac{\partial (\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over g_i} \cdot \mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over g_j}) }{\partial x^k} = \mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over g_i} \cdot \frac{\partial \mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over g_j} }{\partial x^k} + \frac{\partial \mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over g_i} }{\partial x^k} \cdot \mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over g_j} = \mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over g_i } \cdot \mathit{ \Gamma}^l_{jk}\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over {g_l}} + \mathit{ \Gamma}^l_{ik}\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over {g_l}} \cdot \mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over g_j} = \mathit{ \Gamma}^l_{jk}g_{il} + \mathit{ \Gamma}^l_{ik}g_{lj}\),这就是用克里斯托夫符号表示度规张量。所以替换指标就可以获得几个不同的式子:$$\frac{\partial g_{li}}{\partial x^j} = \mathit{ \Gamma}^k_{ij}g_{lk} + \mathit{ \Gamma}^k_{lj}g_{ki}$$ $$\frac{\partial g_{jl}}{\partial x^i} = \mathit{ \Gamma}^k_{li}g_{jk} + \mathit{ \Gamma}^k_{ji}g_{kl}$$ $$\frac{\partial g_{ij}}{\partial x^l} = \mathit{ \Gamma}^k_{lj}g_{ik} + \mathit{ \Gamma}^k_{li}g_{kj}$$ 把这三个式子组合一下:$$\frac{\partial g_{li}}{\partial x^j} + \frac{\partial g_{jl}}{\partial x^i} - \frac{\partial g_{ij}}{\partial x^l} =( \mathit{ \Gamma}^k_{ij}g_{lk} + \mathit{ \Gamma}^k_{lj}g_{ki} )+( \mathit{ \Gamma}^k_{li}g_{jk} + \mathit{ \Gamma}^k_{ij}g_{lk} )-( \mathit{ \Gamma}^k_{lj}g_{ki} + \mathit{ \Gamma}^k_{li}g_{jk} )=2 \mathit{ \Gamma}^k_{ij}g_{lk}$$ $$\mathit{ \Gamma}^k_{ij}g_{lk} = \frac{1}{2} (\frac{\partial g_{li}}{\partial x^j} + \frac{\partial g_{jl}}{\partial x^i} - \frac{\partial g_{ij}}{\partial x^l})$$ 运用逆变度规张量,可以得到;$$\mathit{ \Gamma}^k_{ij}g_{lk}g^{lk}= \frac{g^{lk}}{2}( \frac{\partial g_{li}}{\partial x^j} + \frac{\partial g_{jl}}{\partial x^i} - \frac{\partial g_{ij}}{\partial x^l})$$ $$\mathit{ \Gamma}^k_{ij} = \frac{g^{lk}}{2}( \frac{\partial g_{li}}{\partial x^j} + \frac{\partial g_{jl}}{\partial x^i} - \frac{\partial g_{ij}}{\partial x^l})$$ 可以看见,这里出现了一个2,是线性组合来的,是因为有度规张量的导数有两项,本质上这又是度规张量是二阶张量的体现,这个2之后会出现。 时空的曲率 要想研究时空的弯曲,就要又一个张量,用来表示在不同方向上的时空弯曲,如果把一个向量沿着不同的路径平移,因为时空的弯曲,向量会不同,这个差值就可以表示曲率,这种曲率就是黎曼曲率,运用了黎曼曲率张量\(R^{\alpha}_{\mu \beta \nu}\)(量纲是\(\rm [L^{-2}]\))。这种不同顺序的平移就是单位时间基矢量的变化量,也就是导数,不同顺序就是不同求导顺序。$$R^{\alpha}_{\mu \beta \nu}g^{\nu}=\frac{\partial }{\partial x^{\mu}} \frac{\partial g^{\alpha}}{\partial x^{\beta}}- \frac{\partial }{\partial x^{\beta}}\frac{\partial g^{\alpha}}{\partial x^{\mu}}$$ 可以把这个定义展开成克里斯托夫符号表示黎曼张量。$$R^{\alpha}_{\mu \beta \nu}g^{\nu}=\frac{\partial \mathit{ (\Gamma}^{\alpha}_{\beta\gamma}g^{\gamma})}{\partial x^{\mu}} - \frac{\partial (\mathit{ \Gamma}^{\alpha}_{\mu\gamma}g^{\gamma})}{\partial x^{\beta}} = \frac{\partial \mathit{ \Gamma}^{\alpha}_{\mu\gamma}}{\partial x^{\beta}}g^{\gamma} + \mathit{ \Gamma}^{\alpha}_{\mu\gamma}\frac{\partial g^{\gamma}}{\partial x^{\beta}} - (\frac{\partial \mathit{ \Gamma}^{\alpha}_{\beta\gamma}}{\partial x^{\mu}}g^{\gamma} + \mathit{ \Gamma}^{\alpha}_{\beta\gamma}\frac{\partial g^{\gamma}}{\partial x^{\mu}})$$ $$= \frac{\partial \mathit{ \Gamma}^{\alpha}_{\mu\gamma}}{\partial x^{\beta}}g^{\gamma} - \frac{\partial \mathit{ \Gamma}^{\alpha}_{\beta \gamma}}{\partial x^{\mu}}g^{\gamma} + \mathit{ \Gamma}^{\alpha}_{\mu\gamma}\mathit{ \Gamma}^{\gamma}_{\beta \delta } g^{\delta} - \mathit{ \Gamma}^{\alpha}_{\beta\gamma}\mathit{ \Gamma}^{\gamma}_{\mu\delta}g^{\delta}$$ $$= \frac{\partial \mathit{ \Gamma}^{\alpha}_{\mu\nu}}{\partial x^{\beta}}g^{\nu} - \frac{\partial \mathit{ \Gamma}^{\alpha}_{\beta \nu}}{\partial x^{\mu}}g^{\nu} + \mathit{ \Gamma}^{\alpha}_{\mu\gamma}\mathit{ \Gamma}^{\gamma}_{\beta \nu } g^{\nu} - \mathit{ \Gamma}^{\alpha}_{\beta\gamma}\mathit{ \Gamma}^{\gamma}_{\mu\nu}g^{\nu}$$ 消掉基矢,得到黎曼曲率张量自身。$$R^{\alpha}_{\mu \beta \nu}= \frac{\partial \mathit{ \Gamma}^{\alpha}_{\mu\nu}}{\partial x^{\beta}} - \frac{\partial \mathit{ \Gamma}^{\alpha}_{\beta \nu}}{\partial x^{\mu}} + \mathit{ \Gamma}^{\alpha}_{\mu\gamma}\mathit{ \Gamma}^{\gamma}_{\beta \nu } - \mathit{ \Gamma}^{\alpha}_{\beta\gamma}\mathit{ \Gamma}^{\gamma}_{\mu\nu}$$ 可以看出来上标和中间的下标、两边的下标可以随意互换,而中间的下标和两边的下标互换要变号。黎曼曲率张量的分量非常多,四维时空有256个,很冗余,实际上只需要知道平移产生的差向量的模就行了。黎曼曲率也是测地线的偏移,因为测地线之间的偏移就可以认为是沿着测地线运动下,向量在两条测地线间微小的平移的差值。可以用测地线偏离方程表示,设测地线偏离矢量是\(\eta^i\),测地线方程是\(\frac{{\rm d} v^k}{{\rm d} \tau }=- \mathit{ \Gamma}^k_{ij}v^iv^j=\frac{{\rm d} v^k}{{\rm d} \tau }=- \mathit{ \Gamma}^k_{ij}v^iv^j=- \mathit{ \Gamma}^k_{ij}\frac{{\rm d} x^i}{{\rm d} \tau }\frac{{\rm d} x^j}{{\rm d} \tau }\),这里我们需要的是对距离(时空间隔)λ求导,也就是:$$\frac{{\rm d^2} x^k}{{\rm d} \lambda^2 }+ \mathit{ \Gamma}^k_{ij}\frac{{\rm d} x^i}{{\rm d} \lambda }\frac{{\rm d} x^j}{{\rm d} \lambda}=0$$ 对于坐标有微小偏移的测地线,是:$$\frac{{\rm d^2} (x^k+\eta^k)}{{\rm d} \lambda^2 }+ \mathit{ \Gamma'}^k_{ij}\frac{{\rm d} (x^i+\eta^i)}{{\rm d} \lambda }\frac{{\rm d} (x^j+\eta^j)}{{\rm d} \lambda}=0$$ 因为不同测地线克里斯托夫符号有变化,所以\(\mathit{ \Gamma'}^k_{ij}=\mathit{ \Gamma}^k_{ij}+{\rm d}\mathit{ \Gamma'}^k_{ij}=\mathit{ \Gamma}^k_{ij}+\frac{\partial \mathit{ \Gamma}^k_{ij}}{\partial x^l}{\rm d}x^l\),运用近似,测地偏移很小,近似等于间距微分\(\eta^i \approx {\rm d}x^i\),所以可以认为\(\mathit{ \Gamma'}^k_{ij} \approx \mathit{ \Gamma}^k_{ij}+\frac{\partial \mathit{ \Gamma}^k_{ij}}{\partial x^l}\eta^l\),可以推出:$$\frac{{\rm d^2} x^k}{{\rm d} \lambda^2 }+ \frac{{\rm d^2} \eta^k}{{\rm d} \lambda^2 }+ (\mathit{ \Gamma}^k_{ij}+\frac{\partial \mathit{ \Gamma}^k_{ij}}{\partial x^l}\eta^l)(\frac{{\rm d} x^i}{{\rm d} \lambda} + \frac{{\rm d} \eta^i}{{\rm d} \lambda})(\frac{{\rm d} x^j}{{\rm d} \lambda}+ \frac{{\rm d} \eta^j}{{\rm d} \lambda})$$$$= \frac{{\rm d^2} x^k}{{\rm d} \lambda^2 }+ \frac{{\rm d^2} \eta^k}{{\rm d} \lambda^2 }+ (\mathit{ \Gamma}^k_{ij}+\frac{\partial \mathit{ \Gamma}^k_{ij}}{\partial x^l}\eta^l)(\frac{{\rm d} x^i}{{\rm d} \lambda}\frac{{\rm d} x^j}{{\rm d} \lambda} + \frac{{\rm d} \eta^i}{{\rm d} \lambda}\frac{{\rm d} x^j}{{\rm d} \lambda}+\frac{{\rm d} x^i}{{\rm d} \lambda}\frac{{\rm d} \eta^j}{{\rm d} \lambda}+\frac{{\rm d} \eta^i}{{\rm d} \lambda}\frac{{\rm d} \eta^j}{{\rm d} \lambda})$$$$=\frac{{\rm d^2} x^k}{{\rm d} \lambda^2 }+ \frac{{\rm d^2} \eta^k}{{\rm d} \lambda^2 }+ (\mathit{ \Gamma}^k_{ij}+\frac{\partial \mathit{ \Gamma}^k_{ij}}{\partial x^l}\eta^l)(\frac{{\rm d} x^i}{{\rm d} \lambda}\frac{{\rm d} x^j}{{\rm d} \lambda} + 2\frac{{\rm d} \eta^i}{{\rm d} \lambda}\frac{{\rm d} x^j}{{\rm d} \lambda}+\frac{{\rm d} \eta^i}{{\rm d} \lambda}\frac{{\rm d} \eta^j}{{\rm d} \lambda})=0$$ 因为测地偏离很小,所以测地偏移的平方更小,其中\(\frac{{\rm d} \eta^i}{{\rm d} \lambda}\frac{{\rm d} \eta^j}{{\rm d} \lambda}\)项太小,可以忽略,还有在涉及克里斯托夫符号的微分项时连\( 2\frac{{\rm d} \eta^i}{{\rm d} \lambda}\frac{{\rm d} x^j}{{\rm d} \lambda}\)项也可以忽略。$$\frac{{\rm d^2} x^k}{{\rm d} \lambda^2 }+ \mathit{ \Gamma}^k_{ij}\frac{{\rm d} x^i}{{\rm d} \lambda}\frac{{\rm d} x^j}{{\rm d} \lambda}+ \frac{{\rm d^2} \eta^k}{{\rm d} \lambda^2 }+ 2\mathit{ \Gamma}^k_{ij}\frac{{\rm d} x^i}{{\rm d} \lambda}\frac{{\rm d} \eta^j}{{\rm d} \lambda}+\frac{\partial \mathit{ \Gamma}^k_{ij}}{\partial x^l}\eta^l\frac{{\rm d} x^i}{{\rm d} \lambda}\frac{{\rm d} x^j}{{\rm d} \lambda} =0$$ $$\frac{{\rm d^2} \eta^k}{{\rm d} \lambda^2 }+ 2\mathit{ \Gamma}^k_{ij}\frac{{\rm d} x^i}{{\rm d} \lambda}\frac{{\rm d} \eta^j}{{\rm d} \lambda}+\frac{\partial \mathit{ \Gamma}^k_{ij}}{\partial x^l}\eta^l\frac{{\rm d} x^i}{{\rm d} \lambda}\frac{{\rm d} x^j}{{\rm d} \lambda} =0$$ 所以,我们可以去求测地偏移的逆变导数\(\frac{{\rm D} \eta^k}{{\rm D} x^j }=\frac{{\rm d} \eta^k}{{\rm d} x^i} + \mathit{ \Gamma}^k_{ij}\eta^j\),\(\frac{{\rm D} \eta^k}{{\rm D} \lambda }=\frac{{\rm d} \eta^k}{{\rm d} \lambda} + \mathit{ \Gamma}^k_{ij}\eta^j\frac{{\rm d} x^i}{{\rm d} \lambda}\),可以求出二阶导数:$$\frac{{\rm D}^2 \eta^k}{{\rm D} \lambda^2 }= \frac{{\rm d}}{{\rm d} \lambda}(\frac{{\rm d} \eta^k}{{\rm d} \lambda} + \mathit{ \Gamma}^k_{ij}\eta^j\frac{{\rm d} x^i}{{\rm d} \lambda}) + \mathit{ \Gamma}^k_{ij}(\frac{{\rm d} \eta^j}{{\rm d} \lambda} + \mathit{ \Gamma}^j_{ml}\eta^l \frac{{\rm d} x^m}{{\rm d} \lambda})\frac{{\rm d} x^i}{{\rm d} \lambda}$$ $$= \frac{{\rm d}^2 \eta^k}{{\rm d} \lambda^2} + \frac{{\rm d}}{{\rm d} \lambda}(\mathit{ \Gamma}^k_{ij}\eta^j\frac{{\rm d} x^i}{{\rm d} \lambda}) + \mathit{ \Gamma}^k_{ij}\frac{{\rm d} \eta^j}{{\rm d} \lambda}\frac{{\rm d} x^i}{{\rm d} \lambda} + \mathit{ \Gamma}^k_{ij}\mathit{ \Gamma}^j_{ml}\eta^l \frac{{\rm d} x^m}{{\rm d} \lambda}\frac{{\rm d} x^i}{{\rm d} \lambda}$$ $$= \frac{{\rm d}^2 \eta^k}{{\rm d} \lambda^2} + \frac{{\rm d} \mathit{ \Gamma}^k_{ij}}{{\rm d} \lambda}\eta^j\frac{{\rm d} x^i}{{\rm d} \lambda}+ \mathit{ \Gamma}^k_{ij}\frac{{\rm d} \eta^j}{{\rm d} \lambda}\frac{{\rm d} x^i}{{\rm d} \lambda}+\mathit{ \Gamma}^k_{ij}\eta^j\frac{{\rm d}^2 x^i}{{\rm d} \lambda^2} + \mathit{ \Gamma}^k_{ij}\frac{{\rm d} \eta^j}{{\rm d} \lambda}\frac{{\rm d} x^i}{{\rm d} \lambda} + \mathit{ \Gamma}^k_{ij}\mathit{ \Gamma}^j_{ml}\eta^l \frac{{\rm d} x^m}{{\rm d} \lambda}\frac{{\rm d} x^i}{{\rm d} \lambda}$$ $$= \frac{{\rm d} \mathit{ \Gamma}^k_{ij}}{{\rm d} \lambda}\eta^j\frac{{\rm d} x^i}{{\rm d} \lambda}+ \mathit{ \Gamma}^k_{ij}\mathit{ \Gamma}^j_{ml}\eta^l \frac{{\rm d} x^m}{{\rm d} \lambda}\frac{{\rm d} x^i}{{\rm d} \lambda}+ \frac{{\rm d}^2 \eta^k}{{\rm d} \lambda^2}+ 2\mathit{ \Gamma}^k_{ij}\frac{{\rm d} \eta^j}{{\rm d} \lambda}\frac{{\rm d} x^i}{{\rm d} \lambda}+ \mathit{ \Gamma}^k_{ij}\eta^j\frac{{\rm d}^2 x^i}{{\rm d} \lambda^2}$$ 运用两个测地线方程的变形\(\frac{{\rm d^2} \eta^k}{{\rm d} \lambda^2 }+ 2\mathit{ \Gamma}^k_{ij}\frac{{\rm d} x^i}{{\rm d} \lambda}\frac{{\rm d} \eta^j}{{\rm d} \lambda}=- \frac{\partial \mathit{ \Gamma}^k_{ij}}{\partial x^l}\eta^l\frac{{\rm d} x^i}{{\rm d} \lambda}\frac{{\rm d} x^j}{{\rm d} \lambda}\)和\(\frac{{\rm d^2} x^k}{{\rm d} \lambda^2 }=- \mathit{ \Gamma}^k_{ij}\frac{{\rm d} x^i}{{\rm d} \lambda }\frac{{\rm d} x^j}{{\rm d} \lambda}\),可以得到:$$\frac{{\rm D}^2 \eta^k}{{\rm D} \lambda^2 }= \frac{{\rm d} \mathit{ \Gamma}^k_{ij}}{{\rm d} \lambda}\eta^j\frac{{\rm d} x^i}{{\rm d} \lambda}+ \mathit{ \Gamma}^k_{ij}\mathit{ \Gamma}^j_{ml}\eta^l \frac{{\rm d} x^m}{{\rm d} \lambda}\frac{{\rm d} x^i}{{\rm d} \lambda}- \frac{\partial \mathit{ \Gamma}^k_{ij}}{\partial x^l}\eta^l\frac{{\rm d} x^i}{{\rm d} \lambda}\frac{{\rm d} x^j}{{\rm d} \lambda}- \mathit{ \Gamma}^k_{ij}\eta^j\mathit{ \Gamma}^i_{lm}\frac{{\rm d} x^l}{{\rm d} \lambda }\frac{{\rm d} x^m}{{\rm d} \lambda}$$ $$= \frac{\partial \mathit{ \Gamma}^k_{il}}{\partial x^j}\eta^l\frac{{\rm d} x^i}{{\rm d} \lambda}\frac{{\rm d} x^j}{{\rm d} \lambda}- \frac{\partial \mathit{ \Gamma}^k_{ij}}{\partial x^l}\eta^l\frac{{\rm d} x^i}{{\rm d} \lambda}\frac{{\rm d} x^j}{{\rm d} \lambda}+ \mathit{ \Gamma}^k_{im}\mathit{ \Gamma}^m_{jl}\eta^l \frac{{\rm d} x^i}{{\rm d} \lambda}\frac{{\rm d} x^j}{{\rm d} \lambda}- \mathit{ \Gamma}^k_{ml}\mathit{ \Gamma}^m_{ij}\eta^l\frac{{\rm d} x^i}{{\rm d} \lambda }\frac{{\rm d} x^j}{{\rm d} \lambda}$$ $$= (\frac{\partial \mathit{ \Gamma}^k_{il}}{\partial x^j}- \frac{\partial \mathit{ \Gamma}^k_{ij}}{\partial x^l}+ \mathit{ \Gamma}^k_{im}\mathit{ \Gamma}^m_{jl}- \mathit{ \Gamma}^k_{ml}\mathit{ \Gamma}^m_{ij})\eta^l \frac{{\rm d} x^i}{{\rm d} \lambda}\frac{{\rm d} x^j}{{\rm d} \lambda}$$ 所以测地偏离方程就是:$$\frac{{\rm D}^2 \eta^k}{{\rm D} \lambda^2 }= R^k_{jil}\eta^l \frac{{\rm d} x^i}{{\rm d} \lambda}\frac{{\rm d} x^j}{{\rm d} \lambda}$$ $$\frac{{\rm D}^2 \eta^{\alpha}}{{\rm D} \lambda^2 }= -R^{\alpha}_{\mu \beta \nu}\eta^{\beta} \frac{{\rm d} x^{\mu}}{{\rm d} \lambda}\frac{{\rm d} x^{\nu}}{{\rm d} \lambda}$$ 可以进行缩并:$$\frac{{\rm D}^2 \eta^{\alpha}}{{\rm D} \lambda^2 }= -R^{\alpha}_{\mu \alpha \nu}\eta^{\alpha} \frac{{\rm d} x^{\mu}}{{\rm d} \lambda}\frac{{\rm d} x^{\nu}}{{\rm d} \lambda}=-R_{\mu \nu}\eta^{\alpha} \frac{{\rm d} x^{\mu}}{{\rm d} \lambda}\frac{{\rm d} x^{\nu}}{{\rm d} \lambda}$$ 这里出现的\(R_{\mu \nu}\eta^{\alpha}\)叫做里奇张量,可以认为是取了黎曼度规张量中差向量的模长,是个精简版,但包含所有信息。负号还是因为坐标变换,而二阶导和\(\frac{{\rm d} x^{\mu}}{{\rm d} \lambda}\frac{{\rm d} x^{\nu}}{{\rm d} \lambda}=-R_{\mu \nu}\eta^{\alpha} \frac{{\rm d} x^{\mu}}{{\rm d} \lambda}\frac{{\rm d} x^{\nu}}{{\rm d} \lambda}\)项就是表示随着沿坐标的运动而变化。 能量动量流 在广义相对论中,因为时空的统一和质能的统一,所以物质的运动和能量的传递是一体的,可以类比成时空中的流体。在流体中,为了描述某一个点的流动,就要运用到密度,还要运用速度。流体的运动很复杂,有流入流出、旋转等,流体的运动是应力推动的,有切应力、剪应力,而速度组成的矩阵就可以很好的描述这些作用,主对角线上是切应力,其他是剪应力。这就可以获得一个张量\(T_{\mu \nu}=\rho v_{\mu}v_{\nu} \),这个张量就是能动张量。在相对论中还会有时间维,其中就出现了对应时间维平方的\(T_{00}=\rho \gamma^2 c^2=\gamma\rho_E\)项和对应时间维与空间维组合的\(T_{\mu0}=T_{0\nu}=-\rho \gamma vc=-\rho_pc\)项,分别对应了能量的动量,所以这个张量名叫能动张量。 能动张量在受力的条件下更复杂,要用压强修正密度,并且加入应力项\(p_{\mu \nu}=pg_{\mu \nu}\),所以就变成了\(T_{\mu \nu}=(\rho +\frac{p}{c^2}) v_{\mu}v_{\nu} + \frac{p}{c^2}g_{\mu \nu}\)。能动张量的量纲是\(\rm [ML^{-1}T^{-2}]\)。能动张量还有一个性质,就是没有应力时质能守恒,所以没有流入和流出,也就是\(\nabla_{\mu}T^{\mu \nu}=0\)。 引力场方程 爱因斯坦最早认为引力场方程是\(R_{\mu \nu}=\kappa T_{\mu\nu}\),κ是正比例系数,但这不正确,因为引力场是有源的,引力源会释放散度在空间中,时空的弯曲有散度\(\nabla_{\mu}R^{\mu \nu}\ne 0\),所以不正确。因此,需要一个无源的张量,也就是爱因斯坦张量\(G_{\mu\nu}\)。要想求出这个张量,因为黎曼曲率张量某种意义上就是导数算符\(R^a_{ijb}=\frac{\partial }{\partial x^i} \frac{\partial }{\partial x^j}-\frac{\partial }{\partial x^j}\frac{\partial }{\partial x^i}\),所以可以得到:$$\frac{\partial R^a_{bij}}{\partial x^k}+\frac{\partial R^a_{bjk}}{\partial x^i}+\frac{\partial R^a_{bki}}{\partial x^j}=$$$$(\frac{\partial }{\partial x^k}\frac{\partial }{\partial x^i} \frac{\partial }{\partial x^j}-\frac{\partial }{\partial x^k}\frac{\partial }{\partial x^j}\frac{\partial }{\partial x^i})+(\frac{\partial }{\partial x^i}\frac{\partial }{\partial x^j} \frac{\partial }{\partial x^k}-\frac{\partial }{\partial x^i}\frac{\partial }{\partial x^k}\frac{\partial }{\partial x^j})+(\frac{\partial }{\partial x^j}\frac{\partial }{\partial x^k} \frac{\partial }{\partial x^i}-\frac{\partial }{\partial x^j}\frac{\partial }{\partial x^i}\frac{\partial }{\partial x^k})=0$$ $$\nabla_kR^a_{bij}+\nabla_iR^a_{bjk}+\nabla_jR^a_{bki}=0$$ 缩并,得到比安基恒等式:$$\nabla_{\mu}R_{\nu\lambda}-\nabla_{\lambda}R_{\nu\mu}+\nabla_{\alpha}R^{\alpha}_{\nu\lambda\mu}=0$$ $$g^{\nu\lambda}\nabla_{\mu}R_{\nu\lambda}-g^{\nu\lambda}\nabla_{\lambda}R_{\nu\mu}+g^{\nu\lambda}\nabla_{\alpha}R^{\alpha}_{\nu\lambda\mu}=0$$ $$\nabla_{\mu}R-\nabla_{\lambda}R^{\lambda}_{\mu}+\nabla_{\alpha}R^{\alpha\lambda}_{\lambda\mu}=\nabla_{\mu}R-\nabla_{\lambda}R^{\lambda}_{\mu}- \nabla_{\lambda}R^{\lambda\alpha}_{\mu\alpha}=\nabla_{\mu}R- 2\nabla_{\lambda}R^{\lambda}_{\mu}=0$$ $$\nabla_{\lambda}R^{\mu}_{\nu}- \nabla_{\lambda}\frac{1}{2}R=0$$ $$\nabla_{\lambda}(R_{\mu\nu}-\frac{1}{2}g_{\mu\nu}R)=0$$ 所以,可以认为爱因斯坦张量\(G_{\mu\nu}=R_{\mu\nu}-\frac{1}{2}g_{\mu\nu}R\)。 除此以外,还可以通过变分法。变分法是运用变分的方法,变分全称变微分,与常微分对应,符号是δ,是泛函的微分。泛函与函数很像,但是输入的不是数值而是一整个函数,函数是变化,泛函自然而然也就描述的是变化的过程,所以这种微分叫做变微分,泛函很常见,例如路程、功、热、冲量、冲量矩等。实际上还有输入是泛函的高价泛函,常数是一阶形式逻辑,函数是二阶,泛函是三阶,以此类推。有一个非常重要的泛函叫做作用量s,可以描述能量的变化,一切物理过程都以作用量最小为法则,这就是最小作用量原理。单位时间的作用量是拉格朗日量L,是动能减势能,与能量有关但又不是能量。时空有收缩趋近于平坦的性质,所以曲率也趋于最小,这与拉格朗日量一致,里奇张量的缩并就是曲率标量,而总拉格朗日量密度可以表述为\(kR+ \rho_L\),\(rho_L\)是物质的拉格朗日量密度,取密度是因为积分的时候可以不分开时间与空间,所以作用量是:$$s=\int (kR+ \rho_L)\sqrt{-g}{\rm d}^4x$$ 实际上这是个四重积分,简写了。其中就包含了“比例尺”项。然后进行变分:$${\rm \delta}s=\int {\rm \delta}[(kR+\rho_L)\sqrt{-g}]{\rm d}^4x=k\int {\rm \delta}(R\sqrt{-g}){\rm d}^4x-\int {\rm \delta}(\rho_L\sqrt{-g}){\rm d}^4x$$ $$\int {\rm \delta}(R\sqrt{-g}){\rm d}^4x=\int \sqrt{-g}{\rm \delta}R+R{\rm \delta}(\sqrt{-g}){\rm d}^4x=\int \sqrt{-g}{\rm \delta}R-\frac{R}{2\sqrt{-g}}{\rm \delta}g{\rm d}^4x$$ $${\rm \delta}R={\rm \delta}R_{\mu\nu}g^{\mu\nu}+R_{\mu\nu}{\rm \delta}g^{\mu\nu}$$ 因为里奇标量本来就是描述度规张量的变化的,所以在变分中\({\rm \delta}R_{\mu\nu}g^{\mu\nu}\)项几乎没有贡献,可以理解为高阶微分,所以\({\rm \delta}R=R_{\mu\nu}{\rm \delta}g^{\mu\nu}\)。 $${\rm \delta}g=\frac{\partial g}{\partial g^{ij}} {\rm \delta}g^{ij}$$ 对应行列式的导数,因为行列是n维有向体积,所以可以认为是底乘高。而一个分量的变化可以认为是一条斜高的变化,这个导数自然也就是投影底n-1维体积,或者说是去除这条高和高上的分量的行列式,也就是去除分量的行和列,或者说余子式。余子式构成了伴随矩阵,这个矩阵与逆矩阵有关,因为用伴随矩阵的转置去乘原有的矩阵,对应项相乘,主对角形成行列式,其他位置抵消。所以伴随矩阵除以行列式就是逆矩阵的转置。$$\frac{\partial g}{\partial g^{ij}}=gg_{ji}=gg_{ij}$$ $${\rm \delta}g=gg_{ij} {\rm \delta}g^{ij}$$ $$\int {\rm \delta}(R\sqrt{-g}){\rm d}^4x=\int \sqrt{-g}R_{\mu\nu}{\rm \delta}g^{\mu\nu}-\frac{R}{2\sqrt{-g}}gg_{\mu\nu} {\rm \delta}g^{\mu\nu}{\rm d}^4x=$$$$\int R_{\mu\nu}\sqrt{-g}{\rm \delta}g^{\mu\nu}-\frac{1}{2}g_{\mu\nu}R\sqrt{-g}{\rm \delta}g^{\mu\nu}{\rm d}^4x=\int (R_{\mu\nu}-\frac{1}{2}g_{\mu\nu}R)\sqrt{-g}{\rm \delta}g^{\mu\nu}{\rm d}^4x$$ 同理可证:$$\int {\rm \delta}(\rho_L\sqrt{-g}){\rm d}^4x=\int (\frac{{\rm \delta}\rho_L}{{\rm \delta}g^{\mu\nu}}-\frac{1}{2}g_{\mu\nu}\rho_L)\sqrt{-g}{\rm \delta}g^{\mu\nu}{\rm d}^4x$$ 可以求出拉格朗日量密度及其变分:$$\rho_L=-\rho_E$$ 忽略量纲:$$\rho_L=-\rho$$ 矩阵化:$${\rm \delta}(\rho^2)=2\rho{\rm \delta}\rho=\rho^2g_{\mu\nu}{\rm \delta}g_{\mu\nu}$$ $${\rm \delta}\rho_L=-{\rm \delta}\rho=-\frac{1}{2}\rho g_{\mu\nu}{\rm \delta}g_{\mu\nu}$$ 进行修正,引入速度:$${\rm \delta}\rho_L=-\frac{1}{2}\rho (v_{\mu}v_{\nu}+g_{\mu\nu}){\rm \delta}g_{\mu\nu}$$ 所以:$$-\frac{1}{2}\rho (v_{\mu}v_{\nu}+g_{\mu\nu})+\frac{1}{2}g_{\mu\nu}\rho=-\frac{1}{2}\rho v_{\mu}v_{\nu}=-\frac{1}{2}T_{\mu\nu}$$ 也可以引入压强修正:\(\frac{{\rm \delta}\rho_L}{{\rm \delta}g^{\mu\nu}}-\frac{1}{2}g_{\mu\nu}\rho_L=-\frac{1}{2}[(\rho+p) v_{\mu}v_{\nu}+pg_{\mu\nu}]=-\frac{1}{2}T_{\mu\nu}\) 可以得到引力场方程:$$k(R_{\mu\nu}-\frac{1}{2}g_{\mu\nu}R)-\frac{1}{2}T_{\mu\nu}=0$$ $$R_{\mu\nu}-\frac{1}{2}g_{\mu\nu}R\propto T_{\mu\nu}$$ $$R_{\mu\nu}-\frac{1}{2}g_{\mu\nu}R=\kappa T_{\mu\nu}$$ 为了在低速弱场兼容牛顿力学,需要求出κ。在牛顿力学成立的条件下,四维速度几乎都是时间上的,所以能动张量只需要\(T_{00}\)分量,近似为\(\rho c^2\)。这里忽略时间与空间量纲,近似为ρ。而爱因斯坦张量也是取\(G_{00}=R_{00}- \frac{1}{2}g_{00}R\)。因为\(R_{\mu\nu}=R^{\alpha}_{\mu \alpha \nu}= \frac{\partial \mathit{ \Gamma}^{\alpha}_{\mu\nu}}{\partial x^{\alpha}} - \frac{\partial \mathit{ \Gamma}^{\alpha}_{\alpha \nu}}{\partial x^{\mu}} + \mathit{ \Gamma}^{\alpha}_{\mu\gamma}\mathit{ \Gamma}^{\gamma}_{\alpha \nu } - \mathit{ \Gamma}^{\alpha}_{\alpha\gamma}\mathit{ \Gamma}^{\gamma}_{\mu\nu}\),所以\(R_{00}= \frac{\partial \mathit{ \Gamma}^{\alpha}_{00}}{\partial x^{\alpha}} - \frac{\partial \mathit{ \Gamma}^{\alpha}_{\alpha 0}}{\partial x^{0}} + \mathit{ \Gamma}^{\alpha}_{0\beta}\mathit{ \Gamma}^{\beta}_{\alpha 0 } - \mathit{ \Gamma}^{\alpha}_{\alpha\beta}\mathit{ \Gamma}^{\beta}_{00}\),因为时空很平坦,所以克里斯托夫符号很小,所以克里斯托夫符号乘积项可以忽略,而克里斯托夫符号的导数项保留,\(R_{00}\approx \frac{\partial \mathit{ \Gamma}^{\alpha}_{00}}{\partial x^{\alpha}} - \frac{\partial \mathit{ \Gamma}^{\alpha}_{\alpha 0}}{\partial x^{0}}\)。用度规张量表示克里斯托夫符号,并且运用度规张量变化小,求导中可以视为常数,时空网格封闭,偏导顺序可以互换(克里斯托夫符号处讲过)化简:$$R_{00}\approx \frac{\partial}{\partial x^{\alpha}}[\frac{g^{\beta\alpha}}{2}( \frac{\partial g_{\beta 0}}{\partial x^0} + \frac{\partial g_{0\beta}}{\partial x^0} - \frac{\partial g_{00}}{\partial x^{\beta}})] - \frac{\partial}{\partial x^{0}} [\frac{g^{\beta\alpha}}{2}( \frac{\partial g_{\beta\alpha}}{\partial x^0} + \frac{\partial g_{0\beta}}{\partial x^{\alpha}} - \frac{\partial g_{\alpha 0}}{\partial x^{\beta}})]$$ $$\approx \frac{g^{\beta\alpha}}{2}( \frac{\partial^2 g_{\beta 0}}{\partial x^0 \partial x^{\alpha}} + \frac{\partial^2 g_{0\beta}}{\partial x^0 \partial x^{\alpha}} - \frac{\partial^2 g_{00}}{\partial x^{\beta} \partial x^{\alpha}}-\frac{\partial^2 g_{\beta\alpha}}{\partial x^0 \partial x^0} - \frac{\partial^2 g_{0\beta}}{\partial x^{\alpha} \partial x^0} + \frac{\partial^2 g_{\alpha 0}}{\partial x^{\beta} \partial x^0})$$ $$=\frac{g^{\beta\alpha}}{2}( \frac{\partial^2 g_{\beta 0}}{\partial x^0 \partial x^{\alpha}}- \frac{\partial^2 g_{00}}{\partial x^{\beta} \partial x^{\alpha}}-\frac{\partial^2 g_{\beta\alpha}}{\partial x^0 \partial x^0} + \frac{\partial^2 g_{\alpha 0}}{\partial x^{\beta} \partial x^0})$$ 因为几乎只有00分量的贡献,所以只要00分量,可以得到\(R_{00} \approx - \frac{g^{\beta\alpha}}{2} \frac{\partial^2 g_{00}}{\partial x^{\beta} \partial x^{\alpha}}\),\(R_{00} \approx - \frac{g^{\beta\alpha}}{2} (\nabla\nabla)_{\beta\alpha} g_{00}\),其中\(\nabla\nabla\)是黑塞矩阵,也就是哈密顿算子(nabla算子/倒三角算子……)自己的并积。黑塞矩阵的缩并就是拉普拉斯算子\(\nabla^2\),所以\(R_{00} \approx - \frac{1}{2} \nabla^2 g_{00}\),一般要取正值保证κ为正\(R_{00} \approx \frac{1}{2} \nabla^2 g_{00}\)。 引力场方程可以变形,因为引力场方程可以左右同时缩并:$$g^{\mu\nu}R_{\mu\nu}-\frac{1}{2}g^{\mu\nu}g_{\mu\nu}R=\kappa g^{\mu\nu}T_{\mu\nu}$$ $$R- \frac{1}{2}\delta^{\mu}_{\mu}R=\kappa T$$ 因为时空是四维的,所以\(\delta^{\mu}_{\mu}=4\),\(R- \frac{1}{2}4R=-R=\kappa T\),对引力场方程可以变形:$$R_{\mu\nu}=\kappa T_{\mu\nu}+ \frac{1}{2}g_{\mu\nu}R=\kappa T_{\mu\nu}-\frac{1}{2}g_{\mu\nu}\kappa T=\kappa(T_{\mu\nu}-\frac{1}{2}g_{\mu\nu} T)$$ 因为能动张量几乎只有能量项有贡献,所以缩并后还是几乎只有能量项\(T \approx T_{00} \approx \rho\),而度规张量很平坦可以认为是1,所以\(R_{00}=\kappa(\rho-\frac{1}{2} \rho)=\frac{1}{2} \kappa \rho\)。$$\frac{1}{2} \nabla^2 g_{00}=\frac{1}{2} \kappa \rho$$ $$\nabla^2 g_{00}=\kappa \rho$$ 可以用测地线方程来获得引力加速度,\(a^k=- \mathit{ \Gamma}^k_{ij}v^iv^j=- \frac{g^{lk}}{2}( \frac{\partial g_{li}}{\partial x^j} + \frac{\partial g_{jl}}{\partial x^i} - \frac{\partial g_{ij}}{\partial x^l})v^iv^j\),速度还是只取时间\(- \mathit{ \Gamma}^k_{tt}v^tv^t\),舍掉其他项,\(a^k=\frac{g^{lk}}{2}\frac{\partial g_{tt}}{\partial x^l}(v^t)^2=\frac{g^{kk}}{2}\frac{\partial g_{tt}}{\partial x^k}(v^t)^2 \approx \frac{g^{kk}}{2}\frac{\partial g_{tt}}{\partial x^k}c^2\),可以求出:$$a^k=\frac{g^{lk}}{2}\frac{\partial g_{tt}}{\partial x^l}(v^t)^2=\frac{g^{kk}}{2}\frac{\partial g_{tt}}{\partial x^k}(v^t)^2 \approx \frac{g^{kk}}{2}\frac{\partial g_{00}}{\partial x^k}c^2$$ 忽略长度与时间量纲差别,然后两边同时求梯度:$$a^k=\frac{g^{kk}}{2}\frac{\partial g_{tt}}{\partial x^k}$$ $$\frac{\partial a^k}{\partial x^k}=\frac{\partial}{\partial x^k}(\frac{g^{kk}}{2}\frac{\partial g_{00}}{\partial x^k})$$ 近似认为时空很平坦,度规张量主对角线接近1:$$\frac{\partial a^k}{\partial x^k}=\frac{\partial}{\partial x^k}(\frac{1}{2}\frac{\partial g_{00}}{\partial x^k})$$ $$\frac{\partial a^k}{\partial x^k}=\frac{1}{2}\frac{\partial}{\partial x^k}\frac{\partial g_{00}}{\partial x^k}$$ $$\nabla_ka^k=\frac{1}{2}\nabla^2g_{00}$$ $$\nabla^2g_{00}=2\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over \nabla} \cdot \mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over a}$$ 在牛顿力学中,引力的场强是力除以引力的“力荷”引力质量,因为引力质量等于惯性质量,引力场强度也就等于加速度,所以可以定义引力势\(\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over a}=\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over \nabla} \varphi_g\),所以\(2\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over \nabla} \cdot \mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over a}=2\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over \nabla} \cdot (\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over \nabla} \varphi_g)=2\nabla^2\varphi_g\)。 牛顿的引力理论可以用散度表示,可以运用高斯定理:$$\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over \nabla} \cdot \mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over a}=\frac{1}{V}{\int\kern{-9pt}\int \kern{-22mu} \bigcirc}_S \mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over a} \cdot {\rm d}\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over S}=\frac{1}{V}\frac{GM}{r^2}4\pi r^2=4\pi G\frac{M}{V}=4\pi G\rho$$ $$\nabla^2\varphi_g=4\pi G\rho$$ 比较牛顿引力和引力场方程近似:$$\nabla^2g_{00}=2\nabla^2\varphi_g=8\pi G\rho=\kappa \rho$$ $$\kappa=8\pi G$$ 因为κ的量纲\(\rm [\kappa]=[R][T]^{-1}=[L^{-2}][ML^{-1}T^{-2}]^{-1}=[M^{-1}L^{-1}T^2]\)和G的量纲\(\rm [G]=[L^3M^{-1}T^{-2}]\)不一致,\(\rm \frac{[\kappa]}{[G]}=[M^{-1}L^{-1}T^2][L^3M^{-1}T^{-2}]^{-1}=[L^{-4}T^4]=[LT^{-1}]^{-4}=[c]^{-4}\),所以κ需要修正\(\kappa=\frac{8\pi G}{c^4}\),这样就求出了引力场方程。$$R_{\mu\nu}-\frac{1}{2}g_{\mu\nu}R=\frac{8\pi G}{c^4}T_{\mu\nu}$$ $$\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \leftrightarrow $}} \over R}-\frac{1}{2}\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \leftrightarrow $}} \over g}R=\frac{8\pi G}{c^4}\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \leftrightarrow $}} \over T}$$ 引力场方程左边是时空的弯曲,右边是物质的运动,所以说时空告诉物质如何运动,物质告诉时空如何弯曲。 对于引力场方程,各项有不同的含义:首先是里奇张量,时空弯曲本身。然后是右边第二项,度规张量表示时空的伸缩对物质运动的贡献,里奇标量去是修正度规张量,在不同曲率下伸缩的影响不一样,平坦空间不会伸缩,没有物质时空不会凭空伸缩。\(\frac{1}{2}\)是可以里奇张量组合来的,也可以是变分根号来的,第一种来源本质上是因为里奇标量是二阶张量,有两个指标,组合中就会产生2,第二种来源本质上是因为度规张量是二阶张量,还是和阶数有关。所以,引力是二阶张量场,才产生了2。而负号的意义很有趣,可以认为是组合来的,也可以认为是变分来的,对应时空的差别,负号还可以理解为坐标变换,度规张量的贡献为负。 这里有两个速度,大小一致,但是所在的空间不均匀。\(\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over v_1}\)通过的坐标很密集,而\(\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over v_2}\)通过的却很稀疏,这就导致了相对于坐标而言\(\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over v_1}\)快\(\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over v_2}\)慢,而度规张量的分量却是\(\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over v_1}\)方向上的小\(\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \rightharpoonup $}} \over v_2}\)方向上的大,这种相反的关系就是负号的意义。 引力场方程的右边有能动张量和系数。能动张量就是质能的流动,也就是物质如何运动。系数中8π可以认为是2和4π的乘积,2是三次体现二阶张量的阶数,除了一次维度的数量4,而4π是三维球的表面积,体现了三维空间,所以这里面包含了三维空间一维时间和二阶张量场,信息量巨大。还有G,是时空的性质,时空的弹性,引力的强度。还有c,是物质在时空中的和速度,也是时空性质。 引力的本质 引力场实际上是时空的弯曲。物体受到引力可以理解为是时间上的速度被偏转到了空间上。也可以理解为是空间在不断收缩,物体随着空间的收缩不断下落。空间在收缩,但是物体大小不变,这是因为物体内部的应力支撑了物体。物体内应力就等于支持力,也等于牛顿力学的重力,所以某种意义上重力加速度就是地面在以\(\rm 9.8m/s^2\)的加速度上升。因为引力对时间有作用,所以引力越强,对时间流速的影响就越大,对牛顿力学的偏移也越大,还有物体运动会拖动时空,这也是与牛顿力学的偏差,还有就是狭义相对论效应。 求解引力场方程 引力场方程的求解非常麻烦,要从度规求克里斯托夫符号,再求里奇张量,然后运用能动张量或者用牛顿近似边界条件,才能解出来。史瓦西在一战的堑壕里解出了史瓦西解,是描述对称静止球体引力的解,其中外部解也可以看作是质点的解,黑洞就与这个解有关。史瓦西外部解(黑洞解)是:$${\rm d}\tau^2=\frac{c^2-\frac{2GM}{r}}{c^2}{\rm d}t^2-(c^2-\frac{2GM}{r})^{-1}{\rm d}r^2-\frac{r^2{\rm d}\theta^2}{c^2}-\frac{r^2\sin^2\theta{\rm d}\varphi^2}{c^2}$$ 其实就是这个矩阵,只有主对角线有数值,其他的度规也是有矩阵形式和微分形式:$$\mathord{ \buildrel{ \lower3pt \hbox{$ \scriptscriptstyle \leftrightarrow $}} \over g}=\begin{bmatrix}g_{tt}&0&0&0\\0&g_{rr}&0&0\\0&0&g_{\theta \theta}&0\\0&0&0&g_{\varphi \varphi}\end{bmatrix}=\begin{bmatrix}-(c^2-\frac{2GM}{r})&0&0&0\\0&(1-\frac{2GM}{c^2r})^{-1}&0&0\\0&0&r^2&0\\0&0&0&r^2\sin^2\theta\end{bmatrix}$$ 内部解(M(r)是r以内的质量,P(r)是r以内的压强)是:$${\rm d}\tau^2=e^{ \int^{r}_{0}\frac{2G[M(r)+\frac{4\pi r^3P(r)}{c^2}]}{r[rc^2-2GM(r)]}{\rm d}r}{\rm d}t^2-(c^2-\frac{2GM(r)}{r})^{-1}{\rm d}r^2-\frac{r^2{\rm d}\theta^2}{c^2}-\frac{r^2\sin^2\theta{\rm d}\varphi^2}{c^2}$$ 这两个解可以处理很多近似问题,而且表明了外部是负曲率,内部是正曲率。如果物体的密度足够大,可以看见外部解有很多特殊的性质。首先是\(r>\frac{2GM}{c^2}\)时,非常正常。然后,在\(r=\frac{2GM}{c^2}\)处\({\rm d}t^2\)的系数变为0,\({\rm d}r^2\)的系数趋于无穷大,所以\({\rm d}t\)趋于无穷大而\({\rm d}r\)为0,所以这里的物体时间静止,空间停止不前,这里是光速物体能向外运动的极限,也是一切物质能向外运动的极限,被称为事件事界。再往里\(0<r<\frac{2GM}{c^2}\),\({\rm d}t^2\)和\({\rm d}r^2\)的系数变为负数,这导致时间维和空间维的实虚发生了互换,时间有了空间的性质,而空间有了时间的性质,时空互换,物体向内运动就和时间的前进一样,永不回头。最后\(r=0\),\({\rm d}t^2\)的系数趋于无穷大\({\rm d}r^2\)的系数趋于0,也就是\({\rm d}t\)为0而\({\rm d}r\)趋于无穷大,距离失去意义时间终结,是时间的终点,被称为奇点。这种黑洞被称为史瓦西黑洞。 广义相对论的证明 广义相对论最早是为了解释水星的近日点进动的偏差。 力学上进动和角动量守恒有关,进动的轴是受力上的重要基准平面的法线,进动是因为旋转轴倾角改变导致进动轴上的角动量分量改变,为了抵消这种改变,也就导致进动轴上物体转动,这就是进动。对于陀螺,重力想让陀螺躺下,角动量分量减小,所以进动与旋转方向一致,而地球受到的潮汐力却是在让地轴立起来,角动量分量增大,所以进动方向与旋转方向相反,这种进动的影响就是恒星年(真正的公转周期,相对背景恒星)和回归年(四季变化的周期,相对地轴方向而言)的不同(岁差)以及春分点的退行、南北极星的改变,被称为岁差运动。对于行星的公转,牛顿力学认为是在让轨道平面趋近于恒星的赤道面所以有进动,这可以认为是公转的岁差,进动方向与公转同向,这与自转相反,因为公转进动是在轨道面内的运动,所以符合要躺下的情况。除了岁差,轨道摄动也有影响,是其他天体引力带来的变化,不只影响进动还影响轨道的形状与倾角。 水星的公转快而且轨道偏心率大,所以进动大,观测是 5600"/世纪 ,但是牛顿力学计算出来是 5557"/世纪 ,这有 43.11"/世纪 的偏差。这时候就要运用广义相对论了。因为顶角θ是直角而且不变,所以dθ=0,sinθ=1,忽略光速c,度规简化为\({\rm d}\tau^2=(1-\frac{2GM}{r}){\rm d}t^2-(1-\frac{2GM}{r})^{-1}{\rm d}r^2-r^2{\rm d}\varphi^2\),可以变形为:$$(1-\frac{2GM}{r})(\frac{{\rm d}t}{{\rm d}\tau})^2-(1-\frac{2GM}{r})^{-1}(\frac{{\rm d}r}{{\rm d}\tau})^2-r^2(\frac{{\rm d}\varphi}{{\rm d}\tau})^2=1$$ 运用守恒的能量\(E=\gamma m(1-\frac{2GM}{r})=\frac{{\rm d}t}{{\rm d}\tau}m(1-\frac{2GM}{r})\)(度规张量分量和守恒量有关,测地线方程可以说明这一点)和角动量\(L=mr^2\omega=mr^2\frac{{\rm d}\varphi}{{\rm d}\tau}\),所以:$$(1-\frac{2GM}{r})^{-1}(\frac{E}{m})^2-(1-\frac{2GM}{r})^{-1}(\frac{{\rm d}r}{{\rm d}\tau})^2-\frac{L^2}{m^2r^2}=1$$ $$[\frac{E^2}{2m}- \frac{1}{2}m(\frac{{\rm d}r}{{\rm d}\tau})^2]=\frac{1}{2}(1-\frac{2GM}{r})(m+ \frac{L^2}{mr^2})=\frac{m}{2}-\frac{GMm}{r}+\frac{L^2}{2mr^2}-\frac{GML^2}{mr^3}$$ 左边类似是总能量减去动能,右边也就类似势能。第一项是静能实际上不是势能,第二项是引力势能,第三项是离心力对应的势能,第四项就是相对论修正。把\(\frac{1}{r}\)换元成倒数K,对φ求导,因为\(\frac{{\rm d}r}{{\rm d}\tau}=\frac{{\rm d}(\frac{1}{K})}{{\rm d}\tau}=-\frac{1}{K^2}\frac{{\rm d}K}{{\rm d}\tau}=-r^2\frac{{\rm d}\varphi}{{\rm d}\tau}\frac{{\rm d}K}{{\rm d}\varphi}=- \frac{L}{m}\frac{{\rm d}K}{{\rm d}\varphi}\),可以得到:$$- \frac{m}{2}\frac{{\rm d}}{{\rm d}\varphi}(\frac{{\rm d}r}{{\rm d}\tau})^2=-GMm \frac{{\rm d}K}{{\rm d}\varphi}+\frac{L^2}{2m}\frac{{\rm d}K^2}{{\rm d}\varphi}-\frac{GML^2}{m}\frac{{\rm d}K^3}{{\rm d}\varphi}$$ $$- \frac{m}{2}\frac{{\rm d}}{{\rm d}\varphi}[\frac{L^2}{m^2}(\frac{{\rm d}K}{{\rm d}\varphi})^2]=- \frac{L^2}{2m}\frac{{\rm d}}{{\rm d}\varphi}[(\frac{{\rm d}K}{{\rm d}\varphi})^2]=- \frac{L^2}{2m}2\frac{{\rm d}K}{{\rm d}\varphi}\frac{{\rm d}^2K}{{\rm d}\varphi^2}=- \frac{L^2}{m}\frac{{\rm d}K}{{\rm d}\varphi}\frac{{\rm d}^2K}{{\rm d}\varphi^2}$$$$=-GMm \frac{{\rm d}K}{{\rm d}\varphi}+\frac{L^2}{2m}\frac{{\rm d}K^2}{{\rm d}\varphi}-\frac{GML^2}{m}\frac{{\rm d}K^3}{{\rm d}\varphi}=-GMm \frac{{\rm d}K}{{\rm d}\varphi}+\frac{L^2K}{m}\frac{{\rm d}K}{{\rm d}\varphi}-\frac{3GML^2K^2}{m}\frac{{\rm d}K}{{\rm d}\varphi}$$ 同时除以\(\frac{L^2}{m}\frac{{\rm d}K}{{\rm d}\varphi}\):$$-\frac{{\rm d}^2K}{{\rm d}\varphi^2}=-\frac{GM}{L^2}+ K-3GMK^2$$ $$\frac{{\rm d}^2K}{{\rm d}\varphi^2}+K-\frac{GM}{L^2}=3GMK^2$$ 牛顿力学是\(\frac{{\rm d}^2K}{{\rm d}\varphi^2}+K-\frac{GM}{L^2}=0\),解是\(K=\frac{GMm^2}{L^2}(1-{\rm e}\cos\varphi)\),上一篇讲过。因为右边的修正项很小,所以可以用牛顿力学解近似:$$\frac{{\rm d}^2K}{{\rm d}\varphi^2}+K-\frac{GM}{L^2}\approx 3GM[\frac{GMm^2}{L^2}(1-{\rm e}\cos\varphi)]^2=\frac{3G^3M^3m^4}{L^4}(1-{\rm e}\cos\varphi)^2$$ 求解微分方程,比较复杂,解是\(K=\frac{GMm^2}{L^2}(1-{\rm e}\cos\varphi)+\frac{3G^3M^3m^4}{L^4}[(1-\frac{e^2}{2})-\frac{e^2}{6}\cos 2\varphi +e\varphi\sin\varphi]\),修正项很小可以只要单调递增的项\(K=\frac{GMm^2}{L^2}(1-{\rm e}\cos\varphi)+\frac{3G^3M^3m^4}{L^4}e\varphi\sin\varphi\),继续运用近似:$$\frac{3G^3M^3m^4}{L^4}e\varphi\sin\varphi \approx \frac{3GMm^2}{L^2}e\sin(\frac{3G^2M^2m^2}{L^2}\varphi)\sin\varphi $$ $$\frac{3GMm^2}{L^2}e\cos(\frac{3G^2M^2m^2}{L^2}\varphi)\cos\varphi \approx \frac{3GMm^2}{L^2}e\cos\varphi $$ $$K \approx \frac{GMm^2}{L^2}[1-e\cos(1-\frac{3G^2M^2m^2}{L^2})\varphi]$$ 所以每圈进动\(2\pi\frac{3G^2M^2m^2}{L^2}=\frac{6\pi G^2M^2m^2}{L^2}=\frac{6\pi GM}{a(1-e^2)}\),恢复c,得到\(\frac{6\pi GM}{c^2a(1-e^2)}\),代人数据得到水星近日点要多进动 43.1"/世纪 与实验观测符合。 还有,引力对光有作用,可以偏折光线,可以解类似的方程\(\frac{{\rm d}^2K}{{\rm d}\varphi^2}+K=3GMK^2\),没有经典项,因为经典力学光不受力。经典力学解为\(K= \frac{1}{b}\cos \varphi\),可以解出\(K= \frac{1}{b}\cos \varphi+\frac{GM}{b^2c^2}(2-\cos^2 \varphi)\),无穷远处忽略本来就很小cosφ的平方项和K,近似为\(\cos \varphi=- \frac{2GM}{bc^2}\),偏转角度近似为\(2\frac{2GM}{bc^2}=\frac{4GM}{bc^2}\)。 这种效应就像透镜偏转光线一样,所以被称为引力透镜,环状的被称为爱因斯坦环。引力透镜有时候会大幅改变宇宙中星系的像,所以会让星系图像扭曲分裂,但是却可以让被遮挡的星系可以看见,还能放大遥远的星系,人类看见最远的恒星就是引力透镜放大从而看见的的。黑洞的引力透镜效应很强,会让黑洞有特别的形态,能看见背面的吸积盘。 广义相对论的验证中最重要的就是爱丁顿的日食观测,几乎可以认为是让广义相对论被学界接受,这个日食观测到了约为1.98"(巴西索布拉尔,克罗姆林)和1.61"(非洲普林西比岛,爱丁顿)的结果,与理论上1.75"接近。 广义相对论还表明了时间会被引力减慢,在场很弱的条件下\({\rm d}\tau^2\approx(1+2\varphi_g){\rm d}t^2\) ,所以近似认为\({\rm d}t\approx({1+\varphi_g})^{-1}{\rm d}\tau\),\({\rm \Delta}t\approx({1+\frac{GM}{rc^2}})^{-1}{\rm \Delta}\tau\),这个公式可以校准导航卫星。 广义相对论还表明了引力红移。弱场可以近似用能量代替质量,\(E=h\nu_{\infty }\approx h\nu({1+\frac{GM}{rc^2}})\),\(\nu_{\infty }\approx \nu({1+\frac{GM}{rc^2}})\)。引力红移在强引力场非常明显,黑洞甚至还能让光子无限红移,所在的平面叫做无限红移面,史瓦西黑洞中就是事件视界。对于史瓦西黑洞,势能项的变形可以得到一个势垒,在1.5被史瓦西半径处,一个势阱,在3倍史瓦西半径处,所以3倍史瓦西半径是最靠里的稳定轨道,也是吸积盘的内径,里面是暴跌区,而1.5被史瓦西半径是一切运动的最靠里的轨道,光子的环绕轨道,光子球,在吸积盘里下落的势能会释放,占质量的5.7%,非常高,但现实中的会更高。 黑洞 对于旋转的黑洞,度规是上个世纪60年代才给出的,有六个非零分量。$${\rm d}\tau^2=(1-\frac{2GMr}{c^2(r^2+\frac{L^2}{c^2M^2}\cos^2\theta)}){\rm d}t^2+\frac{4GLr\sin^2\theta}{c^4(r^2+\frac{L^2}{c^2M^2}\cos^2\theta)}{\rm d}t{\rm d}\varphi-\frac{r^2+\frac{L^2}{c^2M^2}\cos^2\theta}{c^2r^2-2GMr+\frac{L^2}{M^2}}{\rm d}r^2$$$$-(\frac{r^2}{c^2}+\frac{L^2}{c^4M^2}\cos^2\theta){\rm d}\theta^2-(\frac{r^2}{c^2}+\frac{L^2}{c^4M^2}+\frac{2GL^2r\sin^2\theta}{Mc^6(r^2+\frac{L^2}{c^2M^2}\cos^2\theta)})\sin^2\theta{\rm d}\varphi^2$$ 外事件视界半径是\(\frac{GM}{c^2}+\sqrt{\frac{G^2M^2}{c^4}-\frac{L^2}{c^2M^2}}\),角动量越大事件视界越小,外无限红移面是\(\frac{GM}{c^2}+\sqrt{\frac{G^2M^2}{c^4}-\frac{L^2}{c^2M^2}\cos^2\theta}\),可以看见两者不重合,中间有个奇特的夹层,夹层里还可以从黑洞逃出去,但运动方向只能与黑洞的自转同项,还必须高速运动不能静止,这个夹层内有很多能量,被称为能层。能层理论上有负能量轨道,所以彭罗斯认为可以在能层内把物体分成两部分,一部分放入负能轨道被黑洞吞噬,另一部分就能带着大量能量逃出来,这就是彭罗斯过程,科幻中常见。彭罗斯过程也是黑洞喷流的解释之一,黑洞吸积盘的物质约1%无法吸入,会从两级喷出,也就是相对论性喷流,速度在光速的99.9%以上,喷流的能量就和彭罗斯过程可能有关,也和黑洞磁场有关。 克尔黑洞的稳定轨道更加靠内,所以能在吸入物质时释放更多能量,最高约43%。事实上黑洞可以认为都是克尔黑洞,黑洞都在高速自转,因为黑洞形成时的前体就在旋转,形成黑洞后仍然保留了大量角动量,而且黑洞吸入物质是方向的偏移会让物质的角动量转移进黑洞,黑洞都有极大的角动量。星系中心有超大质量黑洞,吸入物质时释放的能量非常大,所以黑洞会非常亮,尤其是在轴向,类星体是一类遥远的星系,是宇宙中最亮的天体,及时上百亿光年外的类星体有的亮度也能在20等以内,就是因为中心黑洞在大量吸入物质发光,而且喷流还对着我们。 黑洞还有可能带电荷,影响与角动量类似,但是黑洞的电荷容易被中和,所以可以忽略。黑洞只有质量、角动量、电荷这三个信息可以观测,其他信息全部不知道去哪了,这是无毛(三毛)定理,这也是对黑洞的前言研究。黑洞的引力对星系有很大影响,可以认为超大质量黑洞与星系有绑定的关系。黑洞吸入了大量的熵,是宇宙的空调。可以估算全可观测宇宙的史瓦西半径,几乎与可观测宇宙的半径接近,所以我们的宇宙可能就是个大号黑洞。 掉进黑洞的过程中,先是时间停止,然后时空互换,这和逐渐超过光速实在太像了,这是个有趣的问题,这可能是快子相关的线索。 克尔黑洞内部还有内事件视界\(\frac{GM}{c^2}-\sqrt{\frac{G^2M^2}{c^4}-\frac{L^2}{c^2M^2}}\)和内无限红移面\(\frac{GM}{c^2}-\sqrt{\frac{G^2M^2}{c^4}-\frac{L^2}{c^2M^2}\cos^2\theta}\),只有内外事件视界之间才是时空互换只能向内的,而内事件视界与内无限红移面之间有个内能层,与外能层类似,在往里时空反而正常了,可以自由运动了。最内部也不是奇点,而是个奇环,转速越快半径越大,里面是个有趣的洞,有些理论认为可以从洞里穿过去到达平行宇宙。有人认为转速够快可以让事件视界消失奇环裸露,有人认为不能,这就是裸奇点问题。 时空中的物体在运动时,会拖动空间,这叫做参考系拖拽,旋转的物体会让空间旋转,这会导致时空的的旋转。这也是近日点进动的原因之一。地球的这个现象非常微弱,但是已经被引力探测器-B在内的实验证明了。 黑洞很长一段时间只是理论,但是人们通过射电望远镜阵列,实现了一地球直径为口径的巨型等效望远镜,拍下了黑洞的照片。 引力波 时空中的物体在往复运动时,会拖动空间震动,也就有了引力波。在之前的推导中,有近似\(\frac{1}{2}\nabla^2 g_{00}=\frac{8\pi G}{c^4}(T_{00}-\frac{1}{2}g_{00}T)\)。可以推广一下\(\nabla^{2} g_{\mu\mu}=\frac{16\pi G}{c^4}(T_{\mu\mu}-\frac{1}{2}g_{\mu\mu}T)\),在经典力学中,有波动方程(n的波动方程)\(\frac{\partial^2 n}{\partial t^2}-v^2(\frac{\partial^2 n}{\partial x^2}+\frac{\partial^2 n}{\partial y^2}+\frac{\partial^2 n}{\partial z^2})=f(x,y,z,t)\),其中达朗贝尔算子\(\square^2 =\frac{\partial^2 }{\partial t^2}-v^2 \nabla^2\),对于四维时空,如果v=c,那么有\(\square^2=\nabla^2\),所以就有引力的波动方程\(\square^{2} g_{\mu\mu}=\frac{16\pi G}{c^4}(T_{\mu\mu}-\frac{1}{2}g_{\mu\mu}T)\),这就是引力波的预言。这还说明了引力波以光速传播。 引力波的震动方式很有趣,引力波有横波成分也有纵波成分,引力波是柱面波,有独特的震动模式。 (图中可以脑补一下) 引力波的探测很困难,因为振幅很小。引力波会引发微小的物体长度变化,可以用巨型迈克尔逊干涉仪来探测LEGO就是,成功探测了引力波。 宇宙学常数 空间在不停被天体吸入,所以空间的间隔会拉大,这说明宇宙在膨胀。爱因斯坦为了让宇宙是静态的,引入了宇宙学常数Λ进行了修正:$$R_{\mu\nu}-\frac{1}{2}g_{\mu\nu}R+\Lambda g_{\mu\nu}=\frac{8\pi G}{c^4}T_{\mu\nu}$$ 但是哈勃发现宇宙确实在膨胀,所以宇宙学常数被称为爱因斯坦最大的错误。后来人们为了解释暗能量,把宇宙学常数又翻出来了,这是个有趣的问题。 广义相对论与未来 广义相对论的度规可以取负号,对黑洞取负号就有了白洞,白洞会喷出物质,物质无法进入,是时空的起点,但是没有被探测到过,有研究认为白洞喷出的物质会形成黑洞把白洞包住,所以无法探测。宇宙大爆炸就是一个单向的、无中生有的过程,有些人认为这就是一个白洞。 广义相对论的时空图可以解析延拓,就可以让黑洞之间、黑洞与白洞连接起来。因为时空之间的连接就像管道一样,所以被称为虫洞,又名爱因斯坦-罗森桥。虫洞能连接不同宇宙,从而穿越平行宇宙。虫洞还可以缩短距离,从而实现类似于超光速的效果。虫洞也是科幻中常见的。有些人认为虫洞和量子纠缠本质一致,这就是ER=EPR猜想。 白洞需要负能量,能出去的虫洞也需要。墨西哥理论物理学家阿库别瑞给出了一个度规\({\rm d}s^2=-c^2(\alpha^2-\beta_i\beta^i){\rm d}t^2+2c\beta_i{\rm d}x^i{\rm d}t+\gamma_{ij}{\rm d}x^i{\rm d}x^j\),其中αβγ是函数,阿库别瑞研究的是\(\alpha=1,\beta_1=\beta_x=-\frac{\tanh[\sigma(\sqrt{(x-x_s)^2+y^2+z^2}+R)]- \tanh[\sigma(\sqrt{(x-x_s)^2+y^2+z^2}-R)]}{2\tanh(\sigma R)}\frac{{\rm d}x_s}{{\rm d}t},\beta_2=\beta_y=\beta_3=\beta_z=0,\gamma_{ij}=\delta_{ij}\),\(x_s\)是运动的位移,σ、R是常数。阿库别瑞度规同样需要负能量,阿库别瑞度规能让内部的空间(曲速泡)高速运动,甚至超过光速。这就是曲速引擎。可以造出超光速飞船,但这不违背相对论,因为这是坐标系的变化,飞船本身没动,这也可以理解为是让目的地离飞船更近,出发地离飞船更远。还可以理解是改变引力场方程左边的第二项实现加速。 人们说,狭义相对论关上了一道门,广义相对论打开了一扇窗。广义相对论让超光速有了希望,但是需要大量负能,很困难,但这至少是种希望。 广义相对论与量子力学 密度非常大的时候,会出现量子引力,但是量子力学不兼容广义相对论,时空和引力无法量子化。有些人在想统一两者,例如量子化空间成圈并取消时间的圈量子引力理论和引入引力子、超对称粒子,把粒子视为弦的超弦理论,但都难以实验,与”能级大沙漠“有关,普遍沦为玄学,个人不看好。爱因斯坦晚年就是陷入了试图统一两者的坑里。所以我们不知道的还有很多很多,广义相对论不是终极理论。 后记 广义相对论有不低的学习门槛,学习前普遍会被数学毒打一顿,但是我们要去学习理解,去理解这个宇宙。希望大家能学的顺利,我这里表达一下我的理解,希望能有点用处。广义相对论学习的人不多,但是我们仰望星空,还是要理解的更多。 |
© copyright 2024 stardust & discuz team
如有问题/举报,邮箱联系stardust@stardust-lab.org
友站链接