牛顿力学在17世纪就已经发展得相当成熟了,但为什么在18世纪,科学家们又建立起了另一套拉格朗日力学? 9月29日12时,《张朝阳的物理课》第一百七十七期开播,创始人、董事局主席兼首席执行官、物理学博士张朝阳坐镇视频直播间,从光学的费马原理类比出发,说明自然界存在对某个作用量取变分极值的偏好,接着构建起拉格朗日力学体系,并举例说明拉格朗日力学的简便之处。
从费马原理重新审视牛顿运动方程
在正式介绍拉格朗日力学前,张朝阳先带大家回顾了牛顿力学是如何处理问题的。在牛顿力学中,需要先对物体做受力分析,这些力的合力会反映到物体的加速度上,加速度a是速度v的变化率,速度v是位置矢量x的变化率。举一个简单的例子,重物在重力作用下自由落体。
(重物自由落体)
为简单起见,只考虑竖直方向的坐标,取竖直向下为正方向建立x轴,这样就可以把物体在t时刻的位置记为一个坐标x(t),在上面加一点表示坐标对时间求一阶导,得到速度v,再加一个点是求二阶导,得到加速度a
用牛顿第二定律可以列出
很容易解出自由落体的运动方程为
以上是由牛顿定理解出来的运动方程,它是x关于t的二次函数,画在x-t图中是一条抛物线。
(运动路线多种选择)
但不妨再大胆地想想,假设现在不知道运动方程是怎么样的,或者说,假设在另一个星球上满足另一条物理规律,那么它的路线很可能不再是t的平方,而是t的一次方或者三次方。从起点①到终点②,有很多种可能的路线(图中红线),它与黑线差△x(t)。由于路线不再由牛顿定律确定,运动方程只能写成关于t的未知的函数
在这样的情况下,有没有可能找到另外一个条件,从这个新的出发点出发,能重新推导出牛顿定律呢?
回顾先前电动力学课上讲过的“分层理念”。可以把电磁学量分成三层,第一层是电势和磁矢势,第二层是电磁场,可以由第一层求时空偏导得到,第三层是电磁场的散度和旋度,与电荷和电流直接相关。麦克斯韦方程组可以用第二层和第三层的量来描述,也可以把第二层的量换成第一层来得到更紧凑的形式。类似地,力学中应该也可以找到x和v背后更底层的量,把牛顿定律写成另一种形式。在这种思想的启发下,假设有一个标量函数F,它与x和v有关
这个函数对时间的积分会出来一个数
这样写相当于输入一个路线函数x(t),它会通过被积函数F输出一个数S,这是从函数x(t)到数S的映射,称为泛函。
之所以想到构造这样一个泛函,是因为在17世纪,光学领域已经提出了光的费马原理。费马告诉大家,设定光出发的起点和抵达的终点,两点之间有很多可能的路径可以相连,那么光所走的真实路径一定是用时最短的那条,或者说,用时一定取在一个极值。用这个原理可以把光在均匀介质中沿直线传播、光的反射和折射规律都涵盖进去。
光所走的用时是对路径求积分得出的一个泛函。路径是一个函数,对它输入自变量坐标它会输出因变量坐标,是数到数的映射。而用时是一个泛函,对它输入一个路径函数它会输出一个时间,是函数到数的映射。
如果把每一条可能的路径看做函数空间中的一个点,泛函就是输入一个函数空间中的点并输出一个数。光所走的真实路径位于泛函取极值的地方,它的一阶变分为0,意思是说,把给泛函的输入,从代表光所走的真实路径的点稍作偏移,也即把路径稍微移动一小段,泛函所输出的数值将几乎不变。这和函数取极值时一阶导为0是一样的,这样的点称为驻点(stationary point),光所走的实际路径也称为stationary path。
类比光的费马原理,有没有可能在力学中也构造一个标量函数F,使得物体在按真实运动方程运动时,输出的数S也取为极值呢?
从变分取极值推导运动方程,并用函数空间理解驻点
有了想法,就可以开始数学推导了。对路线x(t)做变分,变为x(t)+△x(t)后,F会相应地变为F+△F,S也会变为S+△S。这里只关注变化量,写出S的一阶变分为
虽然路线x(t)和速度v(t)作为时间的函数是有关联的,但F作为x和v的二元函数,对它们的依赖关系是独立的。所以在考察F的变分时,应该先假设摁住速度v不动,考虑△x的贡献,再摁住x不动,考虑△v的贡献
美版苹果12去哪里买
在第二项对速度的变分中,可以把变分和对时间求导的顺序做一个交换
代回对F的变分式,并将第二项凑成全微分的形式
交换第二项和第三项的位置,把和△x线性相关的项放在一起,再代回对S的变分式
上式写成了两项,第二项是一个全微分,很容易积出结果。因为在对路线x的变分中已经固定了起点和终点,
所以对第二项积分后得到的变化量是0。另一方面,这里要寻找的F的函数形式是使得S在实际运动方程上取极值,或者说,它的一阶变分取0,是一个在输入函数x的函数空间中的驻点,这要求无论△x如何选择,第一项的结果也依然是0。所以方括号中的被积函数必须取为0,
(张朝阳推导变分取极值的条件)
至此,张朝阳从数学上推出了一个泛函S取极值时,它的被积函数F应该与路线x和速度v具有何种关系。虽然x和v作为t的函数是相互依赖的,但F对x和v的函数关系是独立的,在考虑F如何构造时,可以用正交的x轴和v轴代表所有可能路线的函数空间。
二维码推广模板
每个路线通过被积函数F对应一个泛函S,它能画成函数空间中的一个曲面。但这个面是冗余的,在这个面上,只有v是x对时间求一阶导的点才对应有意义的路线。在这些有意义的函数点所连成的线上做一阶变分,变分为0的驻点对应的路线函数就应该是物体的真实路线,这些点就好像“山谷”、“山脊”或者“鞍点”,而“山坡”所对应的点就不是物体的真实路线。
(用函数空间中的曲面理解变分驻点。这里x轴和v轴虽然垂直,但对于有意义的路线而言它们并不是独立的)
有读者会注意到目前只要求了一阶变分为0,它对应的是取极值的驻点,但并不能判断它是极小、极大还是一个鞍点,为什么会叫它“最小作用量原理”呢?这其实是一个习惯的叫法,更严格的叫法应该是平稳作用量原理(principle of stationary action)。在大部分情况下,构造出来的F在实际运动路线下确实取的是泛函极小值,它的二阶变分大于0,是一个位于山谷的凹点。
构造拉格朗日量和作用量,建立拉格朗日力学
那么被积函数F在什么样的函数形式下,求出来的驻点对应的路线正好是牛顿第二定律呢?在不考虑非保守力(比如摩擦力或洛伦兹力)的情况下,拉格朗日给出的结果是,被积函数F等于动能T减去势能V,这称为拉格朗日量
拉格朗日量对时间的积分S也被正式命名为作用量。刚刚得到的关于变分取极值的方程也正式变成了欧拉-拉格朗日方程
上面的拉格朗日量是动能和势能的函数,确实很像电动力学中第一层的电势和磁矢势。张朝阳再次以自由落体举例。在这里,重物的动能为
重力势能为
所以拉格朗日量为
代入欧拉-拉格朗日方程
得到的运动方程正好和牛顿的运动定律一致
再来考虑另一个例子。有一物体套在滑杆上,它在重力的作用下往下滑。杆子的形状并不规则,在笛卡尔坐标系中需要两个直角坐标来表述。但是因为物体被约束在了杆子上,它只有1个自由度,所以可以只用一个坐标来描述它的运动。
(在物体沿杆下滑问题中,只有一个运动自由度)
设物体的初始位置为坐标原点,取沿杆走过的长度l(t)作为描述物体运动的坐标,每一个l对应一个高度h(l),它的拉格朗日量是
代入欧拉-拉格朗日方程
得到
这也和牛顿定律是一致的。因为在滑杆上,倾斜角的正弦值sinθ就是高度关于沿杆长度的变化率dh/dl,而通过力的矢量分解,重力沿杆方向的分量正是重力乘以倾斜角的正弦值,所以上式其实是物体在物体沿杆方向上牛顿第二定律。而在垂直于杆的方向上,物体的重力分量和杆的支持力相互抵消,物体被牢牢地约束住了,没有运动自由度。
在欧拉-拉格朗日方程中,通过对拉格朗日量做微分,可以得到牛顿力学里的加速度和力。反过来,也可以对牛顿运动方程做积分,来看看它能否回到拉格朗日力学的动能和势能。令上式两边对运动路线求积分,左边得到
第二个等号中把积分变量替换成了dt,第三个等号又替换成了dv,积出来的正是动能。对右边积分得到
它正是重力势能的减少量。把两边放在一起看,不难发现它就是机械能守恒
(张朝阳推导机械能守恒)
通过这个不规则形状的杆的例子,可以发现拉格朗日力学天然地把运动约束考虑进了坐标里,它不一定是笛卡尔的直角坐标,也不一定是极坐标或者球坐标,只要能找到合适的广义坐标,就能有效地用运动约束减少微分方程的数量。一个自由度可以用一个广义坐标和广义速度来描述,如果有n个运动自由度,拉格朗日量就是关于n个广义坐标和n个广义速度的标量函数
它关于这n组广义坐标和速度,有n个欧拉-拉格朗日方程
另一方面,相比于牛顿力学,拉格朗日力学只用考虑拉格朗日量一个标量,而不涉及对力的矢量分析。虽然牛顿力学更形象直观,但在某些受力情况复杂的体系中,拉格朗日力学能更方便地得出物体运动所满足的微分方程。后来的量子力学和量子场论也借鉴了其中的很多概念。
据了解,《张朝阳的物理课》于每周周五、周日中午12时在视频直播,网友可以在视频“关注流”中搜索“张朝阳”,观看直播及往期完整视频回放;关注“张朝阳的物理课”账号,查看课程中的“知识点”短视频;此外,还可以在新闻APP的“科技”账号上,阅览每期物理课程的详细文章。