当前位置: 华文星空 > 知识

学物理真能去二次元吗? / 怎么这个也算高数啊?

2022-08-06知识

目録

3. 负责新手教程的村口大叔: 高等数学

3.1. 通过高等数学初探大学模式
3.2. 等号、定义和代入都是理性的基本精华
3.3. 高等数学这门课的重点内容

4. 怎么这个也算高数啊?

4.1. 关于微分与导数的二三事
4.2. 物理学是一门关于近似的科学
4.3. 近似的起源之级数展开
4.4. 忽略高阶项不会带来误差吗
4.5. 积分变换
4.6. 多重积分测度、分部积分与边界项
4.7. 积分与求和差不多就是一回事, 都能与求导瞎寄吧换位置

東雲正樹: 学物理真能去二次元吗? / 目録

東雲正樹: 学物理真能去二次元吗? / 大致加点方案

東雲正樹: 学物理真能去二次元吗? / 怎么这个也算高数啊?

東雲正樹: 学物理真能去二次元吗? / 如果你事线代, 也好

東雲正樹: 学物理真能去二次元吗? / 欧拉公式 (Euler's formula), 物理人最后的 Euclid 几何直观

東雲正樹: 学物理真能去二次元吗? / 你问 gamma 要学普物? 那其实跳掉也没啥


在学数学之前, 你更应该赶紧掌握的实际上是两类软件:

千万不要觉得还早, 对这两类软件来说大一就已经很晚了.

3. 负责新手教程的村口大叔: 高等数学

相信你早有耳闻, 开学第一堂课是一门叫做高等数学的炫酷课程对吧? 但其实你被骗了, 两次.

(1). 开学的第一堂课叫军训, 某人痛恨军训, 但我不说他是谁 [1] .
(2). 高等数学并不酷炫.

我不知道这玩意儿为啥叫高等数学, 实际上你把所有的理工科课程都列一遍的话就会发现, 这个所谓的高数其实是最简单最基础的那一门··· 它高在哪儿呢? 别问我, 真不知道. 高数顶多就是用来让你体验大学学习模式的课程.

所以电影里老喜欢拿微积分跟天才划上等号的这种操作说实在的, 感觉有点搞 [2] .

反正, 记住这句话: 高数是极其符合直觉的一门课程.

我们学习数理内容的过程本质上就是直觉重塑的过程, 因为没有人能记住那么多的内容, 我们只是把它们直觉化了. 而高数作为起点是合理的, 因为高数所符合的直觉还真就是日常老百姓的直觉, 这里面并没有涉及多少直觉重塑的过程.

不过本文还是想默认你学过至少单元微积分了 [3] , 如果没有:

3.1. 通过高等数学初探大学模式:

高数课我记得好像是从函数开始讲起的吧? 其实从这里开始就能看出大学模式和中学模式的区别了. 在中学永远是一次只学一个特别特别小的知识点然后还给你翻来覆去地摆弄, 搞到最后学生都不知道书上到底讲了啥, 甚至可能到毕业都没按顺序读过哪怕一次课本. 反正高中数学最后给人留下的印象就是被科任老师嚼碎后翻来讲去的一堆小知识点. 那高数呢? 高数开局讲函数就会出现几个高中没见过的玩意儿, 比如说反三角函数之类. 而学这些东西的流程就是讲一下它们的定义, 然后就结束了. 往后要用到这些东西的时候也就可以直接用了.

这时一颗中学的大脑可能就要感到违和不堪, 他想不通怎么都还没教过的东西你就能开始用了. 那实际上大学就是这样的, 一个东西的定义给你讲明白了就等于说是教过了. 如果说它还具有某些极其常用的好性质那可能也会顺便提一下, 最多就这样了.

而中学之所以能病态地给你把一个知识点相关的所有技巧都讲一轮甚至几轮, 本质上就是因为中学的知识点实在是太浅太少了. 最后面对的选拔性考试又十分畸形地发展到了纯粹在考谁见得多背得牢··· 那显然在这样恶性循环下是没有人能办到不去浪费自己的生命的.

所以被荼毒的高中大脑在大学课堂上的第一个感想可能就是:『怎么老师尽谈些虚的, 不好好讲讲怎么具体操作? 』. 那答案就是, 处理问题的思想还真就比具体的操作要重要. 思想才是课程的精华. 仅谈操作的话都不说对学历有没有要求, 就算是一台计算机它也办得到啊.

实际上学习前置知识的几乎唯一目的就是能学习后续的知识:

  • 对将来的科研人员而言, 我们就是希望最后能学会量子场论, 然后开始科研之路. 那这一路走来肯定是越直接越好, 能往后学了就往后学呗.
  • 对纯粹来大学感受高等教育混个文凭的同学而言, 也一样是越往后学观点越高, 对思维的提升也越快, 所以如果你只是在纯粹追求大脑升级的话, 那也应该径直不断地往后学.
  • 你不往后学, 老搁些低级地图上艰难地搞全收集有啥意思? 这和打 ARPG 的道理其实差不多, 没谁一周目全收集的. 先升级, 变强力了再回去一波带走多痛快? 而且游戏里全收集是有前提的吧? 一是这款游戏本身真的属于佳作让人难以割舍, 二是几百块的游戏内容通常极其有限, 搞全收集也是无奈之举. 那你搁这一个学科全搜集可就是迷惑操作了, 这里边儿的内容真的有限吗? 大学课程和高中最本质的区别就是没有考纲, 咱不搞八股了.

    所以所谓的大学模式就是, 咱只走主线, 后期需要啥支线素材了再回头去拿一下这样.

    比如说你学完不定积分, 学完就学完了, 别成天瞎几把背一些积分技巧, 个人爱好除外 (?).
    比如说你开始学力学了, 千万不要想着个『Yeah! 我要刷题当小滑块儿高手!』
    总之技巧是学不完的, 碰一个记一个吧.

    不, 事实上我想说, 那些所谓的技巧其实越少越好, 因为技巧是不容易记忆的, 而且动机十分迷惑, 可能是因为我没啥数学细胞吧, 反正我就很讨厌这些动机不明的灵感操作.

    最令人安心的其实还是那种朴实无华、直击本质、符合直觉、直来直去的操作, 这些操作掌握的多就说明你是个明白人, 能一眼看透理论背后的本质结构, 只有追求这些我们才不至于迷失在数学的计算中. 这也是为啥我中学时期就喜欢物理多于数学, 因为物理没难度, 求啥算啥直来直去, 不凑这个配那个搞些花里胡哨的. 我最近的一个回答就是希望能多少传达出点儿这种思想:

    3.2. 等号、定义和代入都是理性的基本精华:

    进入大学阶段, 在我看来物理人开局的基本素养就是理解等号的含义、明确定义且办到推导时步步有据与整体代入得思想这仨.

    首先是等号的含义:

  • 必须认识到等号所连接的两端在我们讨论的问题下是同一个东西.
  • 这意味着你同时对等号两边做任何相同的操作, 这个等号都始终是要成立的, 所以不要困惑于等号两边同时取极限后仍然相等之类的事实.
  • 为啥要强调是在讨论的问题下严格相等? 关于这一点的理解在将来研究的理论框架复杂起来时是很必要的. 但这很难举出初级的例子来, 因为刚入门确实碰不到这么微妙的问题, 比如说两个线性空间同构, 那在线性空间层面上我们就可以将二者划等号, 但它们真的就相等吗? 其实里面的元素可以完全不同; 比如即使是在各自的基本表示 [4] 下仍可写 \[\mathfrak{s}\mathfrak{u}\left( 2 \right)=\mathfrak{s}\mathfrak{o}\left( 3 \right)\] , 这么写大家都懂, 即这俩 Lie 代数同构对吧? 但实际上 \[\mathfrak{s}\mathfrak{u}\left( 2 \right)\] 的基本表示在矩阵的乘法下还构成 Clifford 代数, 但 \[\mathfrak{s}\mathfrak{o}\left( 3 \right)\] 的基本表示则不然, 所以二者的等号仅仅只是 Lie 代数意义下的等号. 其实从这个例子来看或许也说明了我们绝不应该用代数的表示替代代数本身.
  • 好吧, 看不懂第三点的可以这么想, 当我们说三个香蕉和三个林檎数量相等的时候, 那这个等号仅仅就只是数量意义下的等号, 我们知道林檎并不等于香蕉, 但如果我们现在只讨论数量的话, 那就可以划一个等号, 但前提是必须要明确讨论的问题.
  • 然后就是步步有据:

  • 也就是重视定义、定理与推论, 其实也没那么费神, 用着用着就都记住了.
  • 所谓步步有据就是绝对绝对绝对不能想当然, 在接下来的生活中, 你必须为每一次理论推导中的每一个步骤都找到可以这么做的依据, 这里的依据指的就是定义、定理与推论.
  • 这绝不是强人所难, 大家都办到了这一点, 习惯之后其实一切都很自然.
  • 重视定义的重要性还体现在整个理论体系都是从基础定义出发推导出来的, 碰到不熟悉的问题, 我们的第一个想法就应该是从定义出发来剖析这个问题.
  • 我记得上高中的时候数学老师就强调过要重视定义,
    当时我也很不解, 难道不应该是重视解题技巧吗?
    我是说定义这种东西不是特别 trivial 考试根本不可能考到的吗?
    然而本科上了一年课后属于是恍然大悟了.

    最后就是整体代入:

  • 绝对要有整体的思想.
  • 比如说当你知道 \[{{\text{e}}^{x}}=\sum\limits_{n=0}^{\infty }{\frac{{{x}^{n}}}{n!}}\] 后, 必须要能自信地写出 \[{{\text{e}}^{f\left( x \right)}}=\sum\limits_{n=0}^{\infty }{\frac{f{{\left( x \right)}^{n}}}{n!}}.\]
  • 只要你面对的对象满足某个定理的所有条件, 那这条定理就对它适用, 无论它是啥有多怪.
  • 总而言之就是, 在将来你会在运算中碰到很多很多第一次见的情况, 具体到这些技术活儿, 可能的情况是无穷无尽的, 谁也不可能给你穷举出来, 这个时候就要你自己发挥上面这仨本领细细地从定义出发来考虑一些全新操作的合理性.

    3.3. 高等数学这门课的重点内容:

    高数开局的函数与映射基本上就是送的, 你觉得高数很简单, 然后第二节课··· 我擦, \[\varepsilon -\delta \] 语言是个什么狗八玩应啊? 那其实像这种就不属于重点内容, 我不知道你们期末考不考, 但这东西铁没啥用, 至少对理论物理学家而言是这样的. 这些属于分析学内容了, 分析学对我们的物理直觉没多大帮助, 我们需要的是代数而不是分析, 我们需要的是直观理解与形式上的运算规则. 所以只要是见到劝物理系新生学数学分析与泛函分析的, 你一律当放屁处理就好了.

    不过话又说回来, 这个 \[\varepsilon -\delta \] 语言其实也不难理解, 跟着学一轮涨涨见识还是很有必要的, 只是不用太过于认真对待了. 你要说连续与极限的概念那到后期的拓扑学里还有另一种定义形式呢, 你纠结一类具体的定义形式是没啥必要的, 重点是理解这些定义背后的那些概念, 因为你将来计算的时候肯定不可能在脑子里搬出一套什么 \[\varepsilon -\delta \] 语言之类的火星文, 就极限本身真的是一个相当直观的概念, 就是无限趋近嘛, 这不小学生都能理解?

    那高数的精华内容是那些呢? 我闭卷回忆一下大概就是:

  • 映射与函数: 一定要学会使用映射的语言, 将来碰到比较复杂的情况还是映射讲得最清楚.
  • 从映射的角度看函数大概就是这种感觉:
  • 极限与无穷小的阶: 这是一切的根基, 物理学是取近似的科学, 要是阶都搞不清楚可就寄了.
  • 一元微积分: 包括定积分与不定积分, 这基本上就是大学层次的乘除法, 里面有许多的技巧, 然而比较重要的好像就是一个分部积分···
  • 解析几何: 常识级内容, 解析式与立体几何图像的对应其实很直观的. 其实解析式与图像的对应就是说, 图像本身是点构成的集合, 而这些点都能满足解析式, 就这么简单. 对新手, 我个人推荐先把其中一个变量比如说 z 当作常数, 然后看看另外俩变量也就是 x-y 构成啥图像, 因为二维图像大家总是熟悉的了, 而这个二维图像实际上就是一个平面也就是 z=z_0 与所研究的立体图形的截面, 然后研究截面随着 z 如何改变, 这样一层一层地把整个三维图像扫描出来就好了.
  • 偏导数与全导数: 这个在理论推导中还是很有必要理清楚的, 实际上也不复杂, 后面会讲讲.
  • 幂级数展开: 精华中的精华, 说是物理学的根基不为过, 是必须潜移默化的东西.
  • 其实大概就这些, 像啥曲线曲面积分与微分方程之类的东西其实很微妙.

  • 曲线面积分在高数里看着复杂的一批, 但等后期学到电动力学后会引入一个叫 nabla 的符号 \[\nabla \] , 然后配合所谓的 Green 公式与 Stokes 公式一切都会突然变得十分简洁变得显然起来, 所以没啥必要认真对待高数里教的那些乱七八糟的.
  • 重积分就更简单了, 你不用太在意那些所谓的化几重积分为几个定积分的几种不同做法. 其实化 n 重积分为 n 次积分本质上就是用 n 次级分的 n 个上下限勾勒出 n 重积分的积分区域罢了. 你只要理解了这个目的, 接下来那些所谓的不同做法都是自然就会想到的. 哎, 你要真处理不来就别搞了, 说实在的往后我们都是全空间积分, 哪来的 n 重积分这么复杂的东西啊?
  • 至于微分方程吧, 其实也不用怎么掌握, 能记住二阶常系数齐次方程的解是平面波就行了, 那一阶的怎么办? 解不出来再人为求一次导变二阶呗 (笑) [5] .
  • 要说的话还有个 Fourier 级数展开, 其实这个对物理系价值不那么大, 倒是涉及信号处理的工科用到的多, 物理系看重的其实是后期衍生出来的 Fourier 变换, 所以对这个级数展开只要稍作了解知道怎么回事就行了.
  • 4. 怎么这个也算高数啊?

    某人曾说过, 至少对于本科物理, 数学上就只需要掌握到高数和线代即可.

    而这个某人就是我捏:

    你去问任何一个物理人, 普遍应该会觉得我说的没啥毛病, 但其实这里有个比较黑话的地方, 那就是我们物理人口中的高数线代其实··· 稍微有点儿广义.

    先不谈线代吧, 线代是下篇文章的主角, 暂且仅谈高数, 那么什么是高数呢? 你大一的高数课程当然是高数, 但实际上, 在我们眼里可以说所有要用到的不是线性代数的数学, 呃就, 都是高数··· 或者说所有研究怎么折腾函数的数学都是高数.

    比如说 Taylor 展开是高数, 其实洛朗展开 (Laurent expansion) 在我们看来也是高数, 其实不管啥级数展开我们都觉得是高数. 比如说傅里叶级数展开 (Fourier expansion) 是高数, 那其实傅里叶变换 (Fourier transform) 在我们看来也是高数, 进一步地所有积分变换比如说博雷尔变换 (Borel transform) 在我们看来也都是高数. 其实就算涉及到泛函的理论我们也还觉得是高数, 然后那一整本数学物理方法, 你猜我们还管它里边儿的内容叫啥? 没错, 高数.

    但其实这么说也没错, 因为, 它们真的和高数的形式差不了太多. 那接下来就讲讲这些高数课上讲不到的或者不会这么讲的高数吧, 但它们的启蒙确实都源于高数这门课.

    4.1. 关于微分与导数的二三事:

    首先最需要指出的是, 物理人的导数从来就只用 Leibniz 记号.

    也就是说我们会写 \[\frac{\text{d}y\left( x \right)}{\text{d}x}\] 而不会选择写成 \[{y}'\left( x \right)\] ,
    这是因为我们确实就是把求导看作是俩无穷小量之比,
    而前面带有微分算符 \[\text{d}\] 的东西, 我们就看作是无穷小量.
    所以对于解微分方程时碰到的类似于 \[\frac{\text{d}y}{\text{d}x}=f\left( x \right)\Rightarrow \text{d}y=f\left( x \right)\text{d}x\] 的这种步骤,
    我们还真就是认为这是将无穷小量 \[\text{d}x\] 给乘过去了, 且下面还会碰到更多类似的操作.
    数学老师或许还专门跟你强调过不能这么想,
    但实际上, 我这么整了这么多年, 从来就没出过错 [6] .
    所以我们更常写微分, 需要导数的时候, 除过去就是了.

    单说 \[\frac{\text{d}}{\text{d}x}\] 又是个什么玩意儿?

    然后就是微分形式的不变性.

    我们喜欢写微分其实就是因为有这个微分形式不变性,
    就是说对函数 \[f\left( u \right)\] 求微分可得 \[\text{d}f=\frac{\text{d}f}{\text{d}u}\text{d}u.\]
    如果后来又发现 u 是 x 的函数, 那上面的式子也依然是成立的.
    不过你也可以进一步地写为 \[\text{d}f=\frac{\text{d}f}{\text{d}u}\frac{\text{d}u}{\text{d}x}\text{d}x.\]
    所以无论怎样, 你写微分总是一个正确的式子,
    而在 Leibniz 记号下这一切都是如此之容易记忆, 链式法也是如此显然.
    就是说你完全可以认为这是在除一个无穷小量再乘一个无穷小量, 同理还能约掉.

    学完微分学积分, 积分其实就仨重点:

  • (1). 定积分是一个值, 这个意思就是说定积分仅依赖于上下限, 积分变量不重要可以随便换.
  • 具体而言就是 \[\int_{a}^{b}{f(x)\text{d}x}=\int_{a}^{b}{f(t)\text{d}t}\ne \int_{a}^{c}{f(t)\text{d}t}.\]
  • (2). 不定积分是与求导互逆的操作, 而其结果就是原函数, 是个函数 [7] .
  • 具体而言就是 \[f(x)=\frac{\text{d}}{\text{d}x}\left[ \int{f(x)\text{d}x} \right]\ne \frac{\text{d}}{\text{d}x}\left[ \int{f(t)\text{d}t} \right]=f(t).\]
    这很好理解, 就是 \[\frac{\text{d}}{\text{d}x}\] 与 \[\text{d}x\] 约掉了嘛 (笑), 然后 \[\int{\text{d}f(x)}=f(x).\]
    所以互逆指的就是对一个函数不定积分完再求导还是等于它自己. 但是求导完再不定积分会多出一个常数是怎么回事? 其实这个常数是要通过求导前的函数在某一点处的值来确定的, 确定完就又等于回它自己了.
  • (3). 所以不定积分做完别忘了加一个任意常数, 因为任意常数的导数是零.
  • \[\int{f(x)\text{d}x}\equiv F(x)+c\Rightarrow \frac{\text{d}}{\text{d}x}\left[ F(x)+c \right]=\frac{\text{d}}{\text{d}x}\text{F}(x)=f(x).\]
    其实你也可以把 c 吸收到 \[F(x)\] 里面去, 而这里将 c 写出来的本质目的其实想表达的是这个常数是任意的, 也就是说不定积分的解不唯一, 任意一个解函数加一个常数得到的仍然是所研究函数的不定积分. 而这个任意常数一般是由初始条件或边界条件确定的, 呃··· 不用想得那么玄乎, 这些所谓的条件其实就是某点的函数值罢了. 相比之下求导就没有这个性质, 导函数加一个任意常数显然就不再是所研究函数的导函数了.
  • (*). 其实你可以认为 \[\int\] 和 \rm d 互逆, 所以有 \[\text{d}\int{\equiv }\int{\text{d}}\equiv 1.\]
  • 比如说有 \[\int_{a}^{b}{f(x)\text{d}x}=\int_{a}^{b}{\text{d}\int{f(x)\text{d}x}}=\int{f(b)\text{d}b}-\int{f(a)\text{d}a}.\]
    又比如说有 \[\frac{\text{d}}{\text{d}x}\int{f(x)\text{d}x}=\frac{\cancel{\text{d}}}{\text{d}x}\cancel{\int}{f(x)\text{d}x}=\frac{1}{\text{d}x}f(x)\text{d}x=f(x).\]
    或者 \[\frac{\text{d}}{\text{d}x}\int{f(x)\text{d}x}=\int{\frac{\text{d}}{\text{d}x}f(x)\text{d}x}=\int{\text{d}f(x)}=f(x).\]
    很诡异对吧? 但推导出来的这些结论都是正确的.

    最后到重头戏了, 一元可能没啥意思对吧? 最困扰你们这帮 young ass 的终究还是那个偏导与全导的问题对吧? 其实还是微分形式不变性, 这个问题我看很多地方都讲的绕来绕去, 然而我发现你就只需要记住一个式子就完了.

    你就只需要记住 \[\text{d}f\left( {{x}_{1}},\cdots ,{{x}_{n}} \right)=\frac{\partial f}{\partial {{x}_{1}}}\text{d}{{x}_{1}}+\cdots +\frac{\partial f}{\partial {{x}_{n}}}\text{d}{{x}_{n}}\] 这个式子就够了.
    全微分你总是会做的, 那 这里的系数就是偏导数, 完全可以把这个当作偏导数定义来看.
    如果 \[{{x}_{1}},\cdots ,{{x}_{n}}\] 都是变量 \[t\] 的函数之类的无非就是可以再做一步:
    \[\text{d}f\left( {{x}_{1}},\cdots ,{{x}_{n}} \right)=\left( \frac{\partial f}{\partial {{x}_{1}}}\frac{\text{d}{{x}_{1}}}{\text{d}t}+\cdots +\frac{\partial f}{\partial {{x}_{n}}}\frac{\text{d}{{x}_{n}}}{\text{d}t} \right)\text{d}t,\]
    然后全导数就是 \[\frac{\text{d}f\left( {{x}_{1}},\cdots ,{{x}_{n}} \right)}{\text{d}t}=\frac{\partial f}{\partial {{x}_{1}}}\frac{\text{d}{{x}_{1}}}{\text{d}t}+\cdots +\frac{\partial f}{\partial {{x}_{n}}}\frac{\text{d}{{x}_{n}}}{\text{d}t}\] 呗.
    不过即便 \[{{x}_{1}},\cdots ,{{x}_{n}}\] 都是变量 \[t\] 的函数, 最下面的这个式子依然是成立的:
    \[\text{d}f\left( {{x}_{1}},\cdots ,{{x}_{n}} \right)=\frac{\partial f}{\partial {{x}_{1}}}\text{d}{{x}_{1}}+\cdots +\frac{\partial f}{\partial {{x}_{n}}}\text{d}{{x}_{n}}.\]
    而最迷惑新手的就是 \[f\left( {{x}_{1}},\cdots ,{{x}_{n}},t \right)\] 的情况, 这时搞不明白 \[\frac{\text{d}f}{\text{d}t},\frac{\partial f}{\partial t}\] 的区别对吧?
    微分, 还是微分 \[\text{d}f\left( {{x}_{1}},\cdots ,{{x}_{n}},t \right)=\frac{\partial f}{\partial {{x}_{1}}}\text{d}{{x}_{1}}+\cdots +\frac{\partial f}{\partial {{x}_{n}}}\text{d}{{x}_{n}}+\frac{\partial f}{\partial t}\text{d}t.\]
    那 f 关于 t 的全导数无非就是先写出:
    \[\text{d}f\left( {{x}_{1}},\cdots ,{{x}_{n}},t \right)=\left( \frac{\partial f}{\partial {{x}_{1}}}\frac{\text{d}{{x}_{1}}}{\text{d}t}+\cdots +\frac{\partial f}{\partial {{x}_{n}}}\frac{\text{d}{{x}_{n}}}{\text{d}t}+\frac{\partial f}{\partial t}\frac{\text{d}t}{\text{d}t} \right)\text{d}t,\]
    然后得到 \[\frac{\text{d}f\left( {{x}_{1}},\cdots ,{{x}_{n}},t \right)}{\text{d}t}=\frac{\partial f}{\partial {{x}_{1}}}\frac{\text{d}{{x}_{1}}}{\text{d}t}+\cdots +\frac{\partial f}{\partial {{x}_{n}}}\frac{\text{d}{{x}_{n}}}{\text{d}t}+\frac{\partial f}{\partial t}\] 就结束了.
    如果 \[{{x}_{n}}\] 不是 t 的函数呢? 没关系, 上式依然成立, 无非就是有 \[\frac{\text{d}{{x}_{n}}}{\text{d}t}=0\] 罢了.
    那现在 \[\frac{\text{d}f}{\text{d}t},\frac{\partial f}{\partial t}\] 之间的区别就很寄吧清晰了对吧?

    所以有时候偏导数和全导数混着写也不一定会出错, 因为它们确实可以相等.

    事实上物理人都老寄吧会混着写了, 但他们心里清不清楚这些操作的合法性我就不好说了.

    噢对了, 用我这套记号搞个什么变上限积分函数求导之类的可就太过于显然了:

    也就是说你尽管做全微分就是了, 全微分出来的式子无论在什么情况下都是成立的, 所以我们喜欢写微分啊, 印象中曲率的定义与计算也可以成为一个不错的练习:

    再细致一点儿的情况可以用 Jacobi 行列式来解决, 我曾在热力学的相关的 note 里详细介绍过相关操作, 感兴趣的话可以去看看:

    你的高数老师或许不喜欢看到我这么讲 [8] , 但你得承认这都很直观很实用.

    4.2. 物理学是一门关于近似的科学:

    近似是物理学的灵魂, 近似是物理学的根基. 普遍意义上的物理学就是指的唯像学, 也就是试图通过一些简洁普适的理论来最大程度上地预言这个世界的演化过程. 那么主导这个世界演化的规律是什么呢? No one knows. 这个规律是宇宙的终极密码, 是物理学的最终目标, 如果哪天我们发现了它, 那天迎来的将是理论物理的终结.

    所以, 当下的所有物理理论, 都只是宇宙终极密码的一个近似. 就当下而言, 物理学有三类理论: 在研究极小尺度的系统时, 我们有量子理论; 而在研究极高速的系统时, 我们有相对论; 最后就是在正常尺度与正常速度范围内的理论, 即经典理论. 现在已知的是, 经典理论既是量子理论的一个宏观尺度近似理论又是相对论的一个低速近似理论.

    但你会说经典力学是错误的吗? 如果要这么说的话, 那么量子理论与相对论就必须也都是错误的, 因为它们一定不是终极理论. 所以如果你执意要认为近似的理论是错误的, 那么整个物理学就都没有正确的部分了 [9] , 即使是标准模型它也对 Planck 能标往上走的精度是完全无知的, 而事实上终极理论究竟存在与否都还不好说.

    所以一个更理智的做法是为每一个理论确定好适用的范围, 即使你说经典力学是一个近似理论, 它的精确程度也一定超乎你的想象. 我们不妨看看与相对论相关联的 Lorentz 修正因子的大小: Lorentz 因子即 \[\gamma =\frac{1}{\sqrt{1-\frac{{{v}^{2}}}{{{\text{c}}^{2}}}}}\] , 它一般作为系数乘在一些物理量上, 好那我们日常生活的速度如何? 想一个最快的感觉是高铁吧? 但其实战斗机更快, 但也就是 \[4000\;{\text{km}}/{\text{h}}\] 的样子吧, 代进去算出来的系数约等于 1.000000000007 , 我相信这和 1 相比没啥区别吧? 所以经典物理的价值永远不会消失, 只要人类还需要计算日常生活相关的数据的话.

    正是因为存在这样的近似关系, 所以一个物理量在不同精度的理论下虽然有着不同的表现形式, 比如说动量可以是 \[m\vec{v},-\text{i}\hbar \nabla ,\sqrt{{{E}^{2}}-{{m}^{2}}}{{\vec{e}}_{p}}\] , 但我们赋予它们的都是同一个记号 \[\vec{p}\] . 然后不同的物理量在不同精度的理论下, 它们之间的关系确实类似的, 这也就是我们上一篇提到的所谓物理图像的概念. 真的是很奇妙的一个事儿, 外人听着混乱不堪但物理人看来一切都是如此亲切, 因为我们实在是太懂近似了.

    当你不需要相应精度时如果选择了更精确的理论, 则这一切只会让你的计算过程毫无意义地急剧复杂化甚至根本算不出来. 事实上在近似理论中各个物理量之间的函数形式也都是近似的, 所以在人类无法掌控的精度上, 这些物理量之间的关系完全可能是任意的.

    所以物理学就全都是近似求解? 可千万不能这么想.

    虽然你严格求解的结果一定是现实世界的一个近似, 但这并不影响这个结果可以是相应物理理论中的严格解析解这一事实. 也就是说即便现有物理理论是终极理论的近似理论, 或者甚至是现有的更精确的理论的近似理论, 也丝毫不影响它本身可以构成一个完备自洽严谨的理论这一事实. 经典力学是严谨自洽的一套公理系统, 是数学上完备的一套物理理论模型, 只不过这个模型并不是真实世界所采用的那一款罢了. 所以当我们说某一实验结果否定了经典力学时, 并不是在说经典力学出现了矛盾, 而只是发现现实世界的终极模型并不是经典力学罢了.

    不过当你的理论在其适用范围内有着极高的精度时, 它就是正确的理论, 所以不同尺度下实际上有着不同的正确理论, 而且它们有时很难或者完全不可能从精度更高的理论直接近似出来, 而是你研究出来之后会发现, 噢, 确实可以解释为一个近似关系. 但实际上这也只是形式上的结论, 真要实操的话, 你在不同尺度下就是要选择不同尺度的物理定律. 在量子场论里我们要做重整化就是基于对这个思想的认可, 我们承认我们的理论无法处理无穷高的能标, 所以我们要通过所谓的正规化将高能标的部分扭曲掉, 并坚信高能标的物理不会影响到我们现在所研究的能标. 由此我们就能重整化出一个在相应能标下的正确理论或者说有效理论.

    我擦, 不小心把留给场论的内容给讲漏嘴了.

    其实这一套就是 Wilson 的有效场论的思想, 你不得不承认这非常酷, 感觉就像是物理学的本质给他整明白了. 而这个不同尺度下有着不同正确理论的思想就源于 Anderson 那篇大名鼎鼎的 More is different , 这也就是大家平时吵来吵去的所谓建构论 vs. 涌现论.

    这一切都表明, 凝聚态和粒子物理是一样本质的东西, 别搞什么鄙视链了 [10] .

    4.3. 近似的起源之级数展开:

    要用上级数展开的近似手段, 首先你得了解高阶无穷小的概念.

    数学中的无穷小实际上都是关于某一极限过程而言的, 比如 \[\sin \left( x-3 \right)\] 在 \[x\to 3\] 这个极限过程下是无穷小的, 但在 \[x\to 0\] 时则不是无穷小量.

    而在同一个极限过程下的无穷小量是有阶数之分的, 判断两个无穷小量阶数之高低的方法就是对二者的比值取极限, 如果极限为零那么分子上的就是高阶无穷小, 如果极限为无穷那么分子上的就是低阶无穷小, 如果极限是一个有限量则二者为同阶无穷小.

    这个判断方法是清晰明了的, 比如 \[x\to 0\] 的过程下,
    显然 \[{{x}^{2}}\] 就是 x 的高阶无穷小, 因为 \[\underset{x\to 0}{\mathop{\lim }}\,\frac{{{x}^{2}}}{x}=0\] ;
    而此过程下 \[{{x}^{4}}\] 与 \[10000{{x}^{4}}\] 则是同阶无穷小, 因为 \[\underset{x\to 0}{\mathop{\lim }}\,\frac{10000{{x}^{4}}}{{{x}^{4}}}=10000\] ,
    同时 \[{{x}^{4}}\] 与 \[10000{{x}^{4}}\] 也都是 x 的高阶无穷小, 原因你懂的.

    当然你可能会说判断起来哪有这么简单, 一般见到的无穷小量不都是一堆乱七八糟的函数吗? 那这就是幂级数展开的威力了.

    如果你问我上过大学和没上过大学的人最明显的区别是什么, 那我可能会说在一个上过大学的人眼里一个性质良好的函数就是一个幂级数, 这样当年学过的那些形态各异的光滑函数在形式上就被彻底地统一了, 而对于没受过本科教育的人而言这一切将是难以想象的. 函数可以做展开的思想必须成为一个根深蒂固的常识与信仰, 物理人是如此之依赖这类操作以至于到了量子场论里碰到了发散的级数还执意要研究所谓的渐进级数来做展开.

    而在算符与代数的领域, 这些幂级数实际上就是函数符号的根本定义了.

    让我们做一个幂级数展开:

    \[f\left( x \right)=\sum\limits_{n=0}{{{\left. \frac{1}{n!}\frac{{{\text{d}}^{n}}f\left( x \right)}{\text{d}{{x}^{n}}} \right|}_{x={{x}_{0}}}}{{\left( x-{{x}_{0}} \right)}^{n}}}\equiv \sum\limits_{n=0}{{{a}_{n}}{{\left( x-{{x}_{0}} \right)}^{n}}}.\]
    取展开点为原点的话就是 \[f\left( x \right)=\sum\limits_{n=0}{{{\left. \frac{1}{n!}\frac{{{\text{d}}^{n}}f\left( x \right)}{\text{d}{{x}^{n}}} \right|}_{x=0}}{{x}^{n}}}\equiv \sum\limits_{n=0}{{{a}_{n}}{{x}^{n}}}.\]
    取展开点为原点可以理解为令 \[x-{{x}_{0}}=y\] 这样的变量代换.

    至于幂级数展开系数的来源你可以这么理解:

    如果我们要求一个函数可以写成幂级数的话就可以设 \[f\left( x \right)=\sum\limits_{n=0}{{{a}_{n}}{{\left( x-{{x}_{0}} \right)}^{n}}}.\]
    既然两边是相等的, 则关于 x 求任意阶导都应该严格相等,
    现在先不求导, 令 \[x={{x}_{0}}\] 有 \[{{\left. f\left( x \right) \right|}_{x={{x}_{0}}}}={{\left. \sum\limits_{n=0}{{{a}_{n}}{{\left( x-{{x}_{0}} \right)}^{n}}} \right|}_{x={{x}_{0}}}}={{a}_{0}}.\]
    现在求一阶导, 再令 \[x={{x}_{0}}\] 有 \[{{\left. \frac{\text{d}f\left( x \right)}{\text{d}x} \right|}_{x={{x}_{0}}}}={{\left. \sum\limits_{n=1}{n{{a}_{n}}{{\left( x-{{x}_{0}} \right)}^{n-1}}} \right|}_{x={{x}_{0}}}}={{a}_{1}}.\]
    类似地 n 阶导即 \[{{\left. \frac{{{\text{d}}^{m}}f\left( x \right)}{\text{d}{{x}^{m}}} \right|}_{x={{x}_{0}}}}={{\left. \sum\limits_{n=1}{m!{{a}_{n}}{{\left( x-{{x}_{0}} \right)}^{n-m}}} \right|}_{x={{x}_{0}}}}=m!{{a}_{m}},\]
    所以有 \[{{a}_{m}}=\frac{1}{m!}{{\left. \frac{{{\text{d}}^{m}}f\left( x \right)}{\text{d}{{x}^{m}}} \right|}_{x={{x}_{0}}}}.\]

    而我们在展开时总是会刻意地关于一个趋于 0 的量做展开, 即如果情况是 \[x\to {{x}_{0}}\] 那我们就关于 \[x-{{x}_{0}}\] 做展开就是了, 展开完就是这么个效果:

    \[f\left( x \right)={{a}_{0}}+{{a}_{1}}\left( x-{{x}_{0}} \right)+{{a}_{2}}{{\left( x-{{x}_{0}} \right)}^{2}}+\cdots +{{a}_{\infty }}{{\left( x-{{x}_{0}} \right)}^{\infty }}.\]

    显然越后面的无穷小阶数越高, 所以越往后面的项就越不重要了, 行话叫越往后面的项贡献就越小, 所以如果我们写出 \[f\left( x \right)\approx {{a}_{0}}+{{a}_{1}}\left( x-{{x}_{0}} \right)+{{a}_{2}}{{\left( x-{{x}_{0}} \right)}^{2}}\] , 那就是一种近似了.

    如果我们近似到一阶项, 即保留到 x 的一次幂项的话, 就叫 线性近似 , 算是内行黑话了, 线性近似就是近似取到线性项, 线性就是一次幂的意思.

    其实这个展开最初叫泰勒展开 (Taylor expansion), 你在高数课上刚学的时候还要研究几种不同的余项对吧? 其实那个是不重要的, 因为更高阶的东西反正都扔掉了. 在后续的学习中你还会学到无穷级数的概念, 而无穷阶的 Taylor 展开就构成了无穷级数中所谓的幂级数, 所以我就直接管这个叫幂级数展开了.

    想进一步了解幂级数展开的话, 可以看看这篇几百年前写的介绍多元幂级数展开的 note:

    在这篇 note 里我很贴心地分析了几种不同记号的转换方法,
    因为我估计很多 young ass 会对这些感到比较头疼.

    好那现在举一个物理实例看看:

    在狭义相对论里, 动量与速度、质量的关系是 \[\vec{p}=\frac{m\vec{v}}{\sqrt{1-\frac{{{v}^{2}}}{{{\text{c}}^{2}}}}}\] ,
    如果说我们要取一个经典低速理论近似的话,
    那显而易见, 这里的无穷小量就是 \[\frac{v}{\text{c}}\] , 关于 \[\frac{v}{\text{c}}\] 展开看看:
    \[\vec{p}=\frac{m{{{\vec{e}}}_{v}}\frac{v}{\text{c}}\text{c}}{\sqrt{1-\frac{{{v}^{2}}}{{{\text{c}}^{2}}}}}\]
    \[\ \ =m{{{\vec{e}}}_{v}}\frac{v}{\text{c}}\text{c}+\frac{1}{2}m{{{\vec{e}}}_{v}}\frac{{{v}^{3}}}{{{\text{c}}^{3}}}\text{c}+\frac{3}{8}m{{{\vec{e}}}_{v}}\frac{{{v}^{5}}}{{{\text{c}}^{5}}}\text{c}+\frac{5}{16}m{{{\vec{e}}}_{v}}\frac{{{v}^{7}}}{{{\text{c}}^{7}}}\text{c}+\cdots \]
    如果我们取一阶近似的话就是 \[\vec{p}\approx m{{\vec{e}}_{v}}\frac{v}{\text{c}}\text{c}=m\vec{v}\] 即回到了经典力学的动量定义.
    即便取到无穷阶, 也只是收敛到狭义相对论的动量定义, 因为就是在对它做展开.

    如果将来发现了比相对论更精确的理论, 那么它的展开近似将能得到狭义相对论的结论. 但我们根本不知道更高精度的理论是怎样的. 事实上对于更高精度的部分你完全随便瞎寄吧乱写, 只要能保证写完的理论在有限阶的近似下能给出相对论来那就可以把它当作与相对论等价的正确理论去使用. 所以说动量与速度、质量之间的关系在更高的精度下完全可以是任意的.

    4.4. 忽略高阶项不会带来误差吗:

    曾经就有人问过这个问题, 他是这么想的, 对一个函数在 \[{{x}_{0}}\] 的小领域展开后是这样的:

    \[f\left( x \right)=f\left( {{x}_{0}} \right)+\frac{\text{d}f\left( {{x}_{0}} \right)}{\text{d}{{x}_{0}}}\left( x-{{x}_{0}} \right)+\frac{{{\text{d}}^{2}}f\left( {{x}_{0}} \right)}{\text{d}x_{0}^{2}}{{\left( x-{{x}_{0}} \right)}^{2}}+\cdots \]
    小领域指的是 \[x\to {{x}_{0}}\] , 记 \[\text{d}x=x-{{x}_{0}}\] 的话就有:
    \[f\left( {{x}_{0}}+\text{d}x \right)=f\left( {{x}_{0}} \right)+\frac{\text{d}f\left( {{x}_{0}} \right)}{\text{d}{{x}_{0}}}\text{d}x+\frac{{{\text{d}}^{2}}f\left( {{x}_{0}} \right)}{\text{d}x_{0}^{2}}{{\left( \text{d}x \right)}^{2}}+\cdots \]
    如果只保留前面两项就叫小领域的 线性近似 \[f\left( {{x}_{0}}+\text{d}x \right)\approx f\left( {{x}_{0}} \right)+\frac{\text{d}f\left( {{x}_{0}} \right)}{\text{d}{{x}_{0}}}\text{d}x.\]
    那微分运算其实某种意义上确实可以理解为是 \[\text{d}f\left( x \right)=f\left( x \right)-f\left( {{x}_{0}} \right)\] ,
    这样就有 \[\text{d}f\left( x \right)=\frac{\text{d}f\left( {{x}_{0}} \right)}{\text{d}{{x}_{0}}}\text{d}x+\frac{{{\text{d}}^{2}}f\left( {{x}_{0}} \right)}{\text{d}x_{0}^{2}}{{\left( \text{d}x \right)}^{2}}+\cdots \]

    但平时怎么好像只保留了第一项? 就是说 \[\text{d}f\left( x \right)=\frac{\text{d}f\left( x \right)}{\text{d}x}\text{d}x\] 是啥意思?

    实际上这是物理人符号混乱的锅, 但其实不深究 [11] 的话也没那么大问题,
    就按照我前面说的那些野鸡数学思考模式, 其实还是可以理解的,
    关键就在于搞清楚极限与高阶无穷小的概念, 所以我说高阶无穷小的概念很重要吧:
    名言警句之 『就以后, 碰到不同阶的无穷小时, 高阶的都可以直接扔掉.』
    这就是说碰到了类似于 \[{{c}_{1}}\text{d}x+{{c}_{2}}{{\left( \text{d}x \right)}^{2}}+{{c}_{8}}{{\left( \text{d}x \right)}^{8}}\] 之类的式子,
    那可以直接写出等式: \[{{c}_{1}}\text{d}x+{{c}_{2}}{{\left( \text{d}x \right)}^{2}}+{{c}_{8}}{{\left( \text{d}x \right)}^{8}}={{c}_{1}}\text{d}x.\]
    在极限 \[\text{d}x\to 0\] 的过程下这个等式是严格成立的, 理由如下:
    \[\ \ \ \ \ \ {{c}_{1}}\text{d}x+{{c}_{2}}{{\left( \text{d}x \right)}^{2}}+{{c}_{8}}{{\left( \text{d}x \right)}^{8}}\]
    \[=\text{d}x\left[ {{c}_{1}}+{{c}_{2}}\frac{{{\left( \text{d}x \right)}^{2}}}{\text{d}x}+{{c}_{8}}\frac{{{\left( \text{d}x \right)}^{8}}}{\text{d}x} \right]\overset{\text{d}x\to 0}{\mathop{=}}\,\text{d}x\left( {{c}_{1}}+{{c}_{2}}\cdot 0+{{c}_{8}}\cdot 0 \right)={{c}_{1}}\text{d}x.\]
    这实际上就是高阶无穷小的定义, 那你又要问了为啥这个 \[\text{d}x\] 还留着? 不是零吗?
    那你要那么喜欢零的话是零也行咯, 得到啥? 不就是 \[0+0+0=0\] ? 也就是比较烧罢了.
    这当然没错, 但这有意义吗? 我们保留最低阶是因为在后续的运算中只有它的信息有意义 [12] .
    然后如果一堆无穷小量与个常数 [13] 相加, 那这些无穷小量就都可以扔了, 它们排不上用场:
    比如说 \[{{x}_{0}}+\text{d}x={{x}_{0}}\] 之类的.
    那有了这些, 就好办了:
    \[\text{d}f\left( x \right)=\frac{\text{d}f\left( {{x}_{0}} \right)}{\text{d}{{x}_{0}}}\text{d}x+\frac{{{\text{d}}^{2}}f\left( {{x}_{0}} \right)}{\text{d}x_{0}^{2}}{{\left( \text{d}x \right)}^{2}}+\cdots \]
    \[\ \ \ \ \ \ \ \ \ \ =\frac{\text{d}f\left( {{x}_{0}} \right)}{\text{d}{{x}_{0}}}\text{d}x=\frac{\text{d}f\left( x-\text{d}x \right)}{\text{d}\left( x-\text{d}x \right)}\text{d}x=\frac{\text{d}f\left( x \right)}{\text{d}x}\text{d}x.\]
    你平时可以就这么理解, 反正我这么多年也没出过错, 虽然更严谨的定义我也懂吧···
    其实微分几何里关于这个问题的讨论就更是重量级, 很值得玩味, 不过这里就先不讲了.

    所以, 我们日常生活中通常就是这么判断无穷小量的阶数的:

    带个微分算子的量, 比如说 \[\text{d}x,\text{d}y,\text{d}m(x)\] 之类的东西, 就都是一阶无穷小量.
    所以你对一个函数求全微分后, 它就成了一个无穷小量, 当然不定积分后又会变回有限量 [14] .
    而 n 个一阶无穷小量乘起来的 \[\text{d}x\text{d}m(x)\text{d}z\cdots \text{d}t\text{d}p(y)\] 这样的就是 n 阶无穷小量.
    另外就是, 针对某个小量做幂级数展开时, 那个小量的幂就是阶数.

    你有很多手段可以将无穷小量叠加为有限量, 最常见的就是积分, 而现在要清楚的就是一重积分只会让所有无穷小同时升一阶, 而一阶无穷小就升格为有限量. 当然你要是对有限量进行积分的话就会发散, 因为积分本质上就是无穷求和, 我们对无穷个一阶无穷小量进行求和得到的就是有限量, 对无穷个有限量求和自然就会发散, 而对二阶无穷小量进行一次积分它也就是变成一阶无穷小罢了. 如果二阶无穷小边上有个一阶无穷小的话, 那现在人家积分完就是有限量了, 如果再积分一次人家就会带着整个式子一起发散, 所以无论如何, 高阶无穷小都无法作为有限量给我们带来有效信息, 也就可以直接删掉没有任何问题.

    写出来就是类似于 \[\text{d}y=p\left( x \right)\text{d}x+q\left( x \right)\text{d}x\text{d}z\]
    \[\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \Rightarrow \int{\text{d}y}=y+\text{constant}=\int{p\left( x \right)\text{d}x}+\int{q\left( x \right)\text{d}x}\text{d}z\]
    \[\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ =P\left( x \right)+Q\left( x \right)\text{d}z=P\left( x \right)\] 这种感觉吧,
    总之高阶无穷小就是可以直接删掉的.

    最后要提的一点就是, 物理中经常对一个有限但比较小的量做展开, 这种情况下每一项都是有意义的, 因为都是有限量只是越来越小罢了, 然后就只求前几项, 因为越到后面影响就越来越小··· 好吧其实是因为越到后面就越难算了.

    以前还有人问我为啥全微分是写成 \[\text{d}f\left( x,y \right)=\frac{\partial f}{\partial x}\text{d}x+\frac{\partial f}{\partial y}\text{d}y\] 这样的.

    我问他那你觉得应该啥样? 他问为啥不是 \[\text{d}f\left( x,y \right)=\frac{\partial f}{\partial x}\frac{\partial f}{\partial y}\text{d}x\text{d}y\] ?
    那么电视机前的小盆友们, 你们知道答案吗?
    没错, 你这么写不就是在说一个一阶无穷小等于一个二阶无穷小了吗? 岂不荒唐?

    其实全微分的意思就是说, 一个多变量函数的线性部分是各个变量对应的线性部分之和, 这很直观.

    总之就是一定要搞明白啥是高阶无穷小以及为啥删了它不会有误差.

    最后提一下, 今后在物理学中你将会极大量地遇到一些无穷小操作, 比如说什么做一个无穷小平移或旋转、升一个无穷小温度之类的. 第一次见的时候你可能会感到很诡异, 就会很想问你妈你无穷小的操作不等于没操作吗? 但实际上这种做法是很天才的, 因为当我们不知道变换的具体形式或不知道变换后的效果时, 如果只做无穷小变换的话就可以自然地忽略掉高阶项, 于是就把一个复杂的问题取了一个线性近似. 然后轻轻松松地研究完了以后呢, 再通过积分之类的手段把这个一阶无穷小量的变换延拓到有限变换, 于是问题就研究完毕了.

    还有一个比较奇妙的就是其实并不只有积分这一招能使无穷小量升一阶, 其实有很多巧妙的无穷叠加手段都能办到这一点, 下面演示一个比较酷的:

    量子力学中我们有平移算符 \[{{Q}^{\dagger }}\left( x \right)={{\text{e}}^{-\text{i}\frac{P}{\hbar }x}}.\]
    你先不要管怎么平移的, 你还没学到, 总之就是假如我们还不知道平移算符的形式,
    但我们总可以知道两次不同的平移操作当然要满足下面这个关系:
    \[{{Q}^{\dagger }}\left( {{x}_{2}} \right){{Q}^{\dagger }}\left( {{x}_{1}} \right)={{Q}^{\dagger }}\left( {{x}_{1}} \right){{Q}^{\dagger }}\left( {{x}_{2}} \right)={{Q}^{\dagger }}\left( {{x}_{1}}+{{x}_{2}} \right).\]
    就是说先移动 x_1 再移动 x_2 与先移动 x_2 再移动 x_1 的效果是一样的,
    都是移动了 \[{{x}_{1}}+{{x}_{2}}.\]
    现在假如我们研究出了无穷小平移的表达式为 \[{{Q}^{\dagger }}\left( \text{d}x \right)=1-\text{i}\frac{P}{\hbar }\text{d}x\] 的话,
    那一切就都好办了:
    \[{{Q}^{\dagger }}\left( x \right)=\underset{n\to \infty }{\mathop{\lim }}\,{{Q}^{\dagger }}\left( \frac{x}{n}+\frac{x}{n}+\cdot \cdot \cdot +\frac{x}{n} \right)\]
    \[\ \ \ \ \ \ \ \ \ \ =\underset{n\to \infty }{\mathop{\lim }}\,{{\left[ {{Q}^{\dagger }}\left( \frac{x}{n} \right) \right]}^{n}}\] 这里用到了平移的性质.
    \[\ \ \ \ \ \ \ \ \ \ =\underset{n\to \infty }{\mathop{\lim }}\,{{\left( 1-\text{i}\frac{P}{\hbar }\frac{x}{n} \right)}^{n}}\]
    \[\ \ \ \ \ \ \ \ \ \ =\underset{n\to \infty }{\mathop{\lim }}\,{{\left[ {{\left( 1-\text{i}\frac{P}{\hbar }\frac{x}{n} \right)}^{-\frac{n\hbar }{\text{i}Px}}} \right]}^{-\text{i}\frac{P}{\hbar }x}}={{\text{e}}^{-\text{i}\frac{P}{\hbar }x}}\] 这里是重要极限定义.

    所以我们可以先分析无穷小操作, 然后得到有限操作, 这是物理学研究的一个精髓思想.

    4.5. 积分变换:

    我知道你高数里学过所谓的 Fourier 级数展开, 我看知乎上好多人都把这玩意儿整的神乎其神的, 其实好像也没啥了不起的吧? 我是说发现者 Fourier 确实很了不起, 但你学会这么个玩意儿真的需要整那么多玄学分析吗? 好像就是用频率为周期函数频率整数倍的一组三角函数做完备基底展开一个周期函数? 这不是很直观清晰的东西吗?

    咱先不管这个, 反正你以后也碰不到啥周期函数, 对我们理论物理人而言真正重要的是这里推广出来的 Fourier 变换, 级数展开也有复数的版本, 在那里三角函数被换成了平面波 \[{{\text{e}}^{\text{i}n\omega t}}\] , 然后进一步推广到 Fourier 变换之后呢? 我们把无穷级数求和改成了积分, 对被变换的函数也不再设有周期性的要求, 而作为基底的平面波也可以有连续的频谱且从基底变成所谓的积分核了.

    那其实你完全可以撇开 Fourier 级数展开的思想包袱, 就是完全没学过也没关系好吧, 我们就从零开始定义这个变换:

    Fourier 变换: \[g\left( \omega \right)=\frac{1}{\sqrt{2\pi }}\int_{-\infty }^{\infty }{f\left( t \right){{\text{e}}^{-\text{i}\omega t}}\text{d}t}.\]
    Fourier 逆变换: \[f\left( t \right)=\frac{1}{\sqrt{2\pi }}\int_{-\infty }^{\infty }{g\left( \omega \right){{\text{e}}^{\text{i}\omega t}}\text{d}\omega }.\]

    那其实这里完全没有啥门槛, 就是一个积分变换的定义罢了, 就是说假如我们有一个函数 \[f\left( t \right)\] 那就可以对它做 Fourier 变换, 然后得到一个蕴含的信息与它完全相同的 \[g\left( \omega \right)\] , 因为它俩是互逆的, 所以包含的信息肯定一模一样. 也就仅此而已, 这就叫积分变换, 我们就是把一个关于 t 的函数换成了一个关于 \[\omega \] 的函数罢了.

    其实所有的积分变换就都只是积分变换罢了, 什么拉普拉斯变换 (Laplace transform), [Borel 变换] 都是这样的, 就是引入个参数做个积分, 然后原来的变量没了剩个参数作新的变量.

    那我们为啥要做呢? 这主要是有时候在 \[\omega \] 空间里研究问题会突然简单很多. 然后在物理上其实出现率更高的是 \[{{\text{e}}^{\text{i}\frac{p}{\hbar }x}}\] 这种积分核, 这就会将坐标的函数换成一个动量的函数, 这也就是物理人常说的去动量空间处理. 听起来巨妈科幻对吧? 其实就是这么个积分变换罢了. 至于说为何坐标与动量互为 Fourier 共轭, 且听量子力学那一期的分解.

    如果你将变换式代入逆变换式:

    \[\begin{align} & f\left( t \right)=\frac{1}{\sqrt{2\pi }}\int_{-\infty }^{\infty }{g\left( \omega \right){{\text{e}}^{\text{i}\omega t}}\text{d}\omega } \\ & \ \ \ \ \ \ \ =\frac{1}{\sqrt{2\pi }}\int_{-\infty }^{\infty }{\left[ \frac{1}{\sqrt{2\pi }}\int_{-\infty }^{\infty }{f\left( {{t}'} \right){{\text{e}}^{-\text{i}\omega {t}'}}d{t}'} \right]{{\text{e}}^{\text{i}\omega t}}\text{d}\omega } \\ & \ \ \ \ \ \ \ =\int_{-\infty }^{\infty }{f\left( {{t}'} \right)\left[ \frac{1}{2\pi }\int_{-\infty }^{\infty }{{{\text{e}}^{\text{i}\omega \left( t-{t}' \right)}}\text{d}\omega } \right]\text{d}{t}'}. \\ \end{align}\]

    这种选择性实际上就是 δ 函数的定义 , 也是 δ 函数的重要功能, 所以我们可以说:

    \[\delta \left( t-{t}' \right)\equiv \frac{1}{2\pi }\int_{-\infty }^{\infty }{{{\text{e}}^{\text{i}\omega \left( t-{t}' \right)}}\text{d}\omega }.\]

    或者如果你总觉得不太接受上面那个就是 δ 函数的定义的话, 还可以这样想:

    对 δ 函数做 Fourier 变换 \[\tilde{\delta }\left( \omega \right)=\frac{1}{\sqrt{2\pi }}\int_{-\infty }^{\infty }{{{\text{e}}^{-\text{i}\omega t}}\delta \left( t \right)dt}=\frac{1}{\sqrt{2\pi }}\] 是个常数.
    这样再积分回去就有 \[\delta \left( t \right)=\frac{1}{\sqrt{2\pi }}\int_{-\infty }^{\infty }{\tilde{\delta }\left( \omega \right){{\text{e}}^{\text{i}\omega t}}d\omega }=\frac{1}{2\pi }\int_{-\infty }^{\infty }{{{\text{e}}^{\text{i}\omega t}}d\omega },\]
    物理··· 很奇妙吧?

    对离散的 Kronecker delta 也有类似的奇妙结论:

    在 \[t\in \left( -\frac{\pi }{\omega },\frac{\pi }{\omega } \right)\] 或者说 \[t\in \left( -\frac{T}{2},\frac{T}{2} \right)\] 时 [15] ,
    \[{{\delta }_{t{t}'}}=\frac{1}{N+1}\sum\limits_{n=-\frac{N}{2}}^{\frac{N}{2}}{{{\rm e}^{{\rm i}n\omega \left( t-{t}' \right)}}}=\left\{ \begin{align} & 1\ \ \ \ \ t={t}', \\ & 0\ \ \ \ \ t\ne {t}'. \\ \end{align} \right.\]
    这个结论很容易证明, 你可以自己试试.

    4.6. 多重积分测度、分部积分与边界项:

    这是一个很奇妙的小 topic, 就在一元函数里我们有一个叫分部积分的超好用技巧:

    \[\int_{a}^{b}{u\frac{\text{d}v}{\text{d}x}\text{d}x}=\left. uv \right|_{x=a}^{x=b}-\int_{a}^{b}{v\frac{\text{d}u}{\text{d}x}\text{d}x}.\]

    它的原理也十分简单, 就是 \[\text{d}\left( uv \right)=u\text{d}v+v\text{d}u\] , 具体到这个情况就是:

    \[\text{d}\left( uv \right)=u\text{d}v+v\text{d}u\Rightarrow u\text{d}v=\text{d}\left( uv \right)-v\text{d}u\Rightarrow u\frac{\text{d}v}{\text{d}x}\text{d}x=\text{d}\left( uv \right)-v\frac{\text{d}u}{\text{d}x}\text{d}x.\]
    然后对右边的式子作定积分就有 \[\int_{a}^{b}{u\frac{\text{d}v}{\text{d}x}\text{d}x}=\left. uv \right|_{x=a}^{x=b}-\int_{a}^{b}{v\frac{\text{d}u}{\text{d}x}\text{d}x}.\]

    就是说把导数算符的位置对调一下只会多出一个边界项与一个负号.

    不过三维甚至更高维的形式我看好像没有啥地方具体讲过, 就大家好像就默认成立了.

    就比如说 \[\int{{{M}_{\mu }}^{\nu }{{\partial }_{\nu }}F{{\text{d}}^{D}}x}=-\int{F{{\partial }^{\nu }}{{M}_{\mu \nu }}{{\text{d}}^{D}}x}\] 是怎么来的呢?

    下面你可能会看不太懂, 但一个重点就是:
    将来的碰到的 \[{{\text{d}}^{D}}x\] 这种 D 维积分测度实际上是 \[\prod\limits_{a=1}^{D}{\text{d}{{x}^{a}}}\] 的缩写.
    三维的情况就是 \[{{\text{d}}^{3}}x\equiv \text{d}x\text{d}y\text{d}z=\text{d}{{x}_{1}}\text{d}{{x}_{2}}\text{d}{{x}_{3}}.\]

    好, 那接下来就是简单证个明:

    \[\begin{align} & \ \ \ \ \ \int{{{M}_{\mu }}^{\nu }{{\partial }_{\nu }}F{{\text{d}}^{D}}x} \\ & =\int{{{M}_{\mu }}^{\nu }{{\partial }_{\nu }}F\prod\limits_{\rho }{\text{d}{{x}^{\rho }}}} \\ & =\prod\limits_{\rho }{\int{{{M}_{\mu }}^{\nu }{{\partial }_{\nu }}F\text{d}{{x}^{\rho }}}} \\ & =\prod\limits_{\rho }{\int{{{M}_{\mu }}^{\nu }\frac{\partial F}{\partial {{x}^{\nu }}}\text{d}{{x}^{\rho }}}} \\ & =\prod\limits_{\rho }{\int{{{M}_{\mu }}^{\nu }\text{d}F\frac{\partial {{x}^{\rho }}}{\partial {{x}^{\nu }}}}} \\ & =\prod\limits_{\rho }{\int{{{M}_{\mu }}^{\nu }{{\delta }_{\nu }}^{\rho }\text{d}F}} \\ & =\prod\limits_{\rho }{\int{{{M}_{\mu }}^{\rho }\text{d}F}} \\ \end{align}\]
    \[\begin{align} & =\prod\limits_{\rho }{\left( \left. F{{M}_{\mu }}^{\rho } \right|_{{{x}^{\rho }}=-\infty }^{{{x}^{\rho }}=\infty }-\int{F\text{d}{{M}_{\mu }}^{\rho }} \right)} \\ & =\prod\limits_{\rho }{\left( \left. F{{M}_{\mu }}^{\rho } \right|_{{{x}^{\rho }}=-\infty }^{{{x}^{\rho }}=\infty }-\int{F\text{d}{{M}_{\mu }}^{\nu }{{\delta }_{\nu }}^{\rho }} \right)} \\ & =\prod\limits_{\rho }{\left( \left. F{{M}_{\mu }}^{\rho } \right|_{{{x}^{\rho }}=-\infty }^{{{x}^{\rho }}=\infty }-\int{F\text{d}{{M}_{\mu }}^{\nu }\frac{\partial {{x}^{\rho }}}{\partial {{x}^{\nu }}}} \right)} \\ & =\prod\limits_{\rho }{\left( \left. F{{M}_{\mu }}^{\rho } \right|_{{{x}^{\rho }}=-\infty }^{{{x}^{\rho }}=\infty }-\int{F\text{d}{{x}^{\rho }}\frac{\partial {{M}_{\mu }}^{\nu }}{\partial {{x}^{\nu }}}} \right)} \\ \end{align}\]
    \[\begin{align} & =\prod\limits_{\rho }{\left. F{{M}_{\mu }}^{\rho } \right|_{{{x}^{\rho }}=-\infty }^{{{x}^{\rho }}=\infty }}-\int{F\frac{\partial {{M}_{\mu }}^{\nu }}{\partial {{x}^{\nu }}}\prod\limits_{\rho }{\text{d}{{x}^{\rho }}}} \\ & =\prod\limits_{\rho }{\left. F{{M}_{\mu }}^{\rho } \right|_{{{x}^{\rho }}=-\infty }^{{{x}^{\rho }}=\infty }}-\int{F{{\partial }_{\nu }}{{M}_{\mu }}^{\nu }{{\text{d}}^{D}}x}=-\int{F{{\partial }^{\nu }}{{M}_{\mu \nu }}{{\text{d}}^{D}}x}. \\ \end{align}\]

    最后一步其实就是把边界项扔了, 因为在一般无穷远处必须是零, 否则研究的系统就不收敛了.

    4.7. 积分与求和差不多就是一回事, 都能与求导瞎寄吧换位置:

    积分符号在我们这里从来就没有啥神圣性, 它本质上不就是无穷求和吗? 那就是求和, 所以在一个物理老油条眼里 \[\int{\text{d}x},\sum\limits_{n}{{}}\] 这俩符号差不多是一回事···

    你可以对一个数列求和最后得到一个不带求和指标的数 \[{{a}_{n}}\to \sum\limits_{n}{{{a}_{n}}}.\]
    你也可以对一个函数求积分最后得到一个不带变量的数 \[f\left( x \right)\to \int_{-\infty }^{\infty }{\text{d}xf\left( x \right)}.\]

    积分一般就是默认全空间积分, 理论物理九九成的积分都是全空间积分, 所以最后我们都懒得写上下限了, 然后积分变量也写到左边儿去了, 反正就是懂的都懂. 最后就是, 这俩确实很像对吧? 其实原理都差不多, 就是求和.

    所以对一个积分变换, 有时候我们也会说是一个展开式:

    比如说 \[f\left( t \right)=\frac{1}{\sqrt{2\pi }}\int_{-\infty }^{\infty }{g\left( \omega \right){{\text{e}}^{\text{i}\omega t}}\text{d}\omega }.\]
    我们就会说他是把 \[f\left( t \right)\] 作平面波展开了, 展开系数是 \[g\left( \omega \right)\] , 核函数 \[{{\text{e}}^{\text{i}\omega t}}\] 就是基.
    我们为啥要说出这种浑话呢?
    反正就是说了, 大家都这么说, 因为这确实和离散展开没啥区别.
    反正在量子场论里场算符就是这样进行所谓的动量模式展开的.

    最后就是可以瞎几把换位置的这个问题:

    \[\ \ \ \sum\limits_{n}{\sum\limits_{m}{\frac{\text{d}}{\text{d}y}}}\int{\text{d}x}{{A}_{n}}\left( x,y \right){{B}_{m}}\left( x \right)\]
    \[=\int{\text{d}x}\sum\limits_{m}{\sum\limits_{n}{\frac{\partial {{A}_{n}}\left( x,y \right)}{\partial y}{{B}_{m}}\left( x \right)}}=\sum\limits_{m,n}{\int{\text{d}x}\frac{\partial {{A}_{n}}\left( x,y \right)}{\partial y}{{B}_{m}}\left( x \right)}.\]
    物理人就是这样的, 我们处理的函数一般就是性质良好, 怎么整都很难出乱子的.
    实际上这也不难理解吧? 你每一项都求和完再求导和都求导完再求和当然是相等的啊.
    因为求导是一个线性算符嘛, 所谓线性就是有分配律且能随便绕过不含求导变量的系数.
    然后积分其实就是求和, 所以, 所以你懂的.
    最后就是求和次序也可以随便交换, 其实这和交换积分次序差不多是一回事嘛.

    写得搞笑点就是 \[\left[ \int{\text{d}x},\sum\limits_{n}{{}} \right]=\left[ \sum\limits_{n}{{}},\sum\limits_{m}{{}} \right]=\left[ \frac{\text{d}}{\text{d}y},\int{\text{d}x} \right]=0\] , 大家都对易 [16] .

    会不会出错呢? 极小概率, 如果谁科研中这么搞出错了, 那他估计恨不得跟所有人都提一嘴, 然后将来大家课上学到这里的时候教授就会专门强调一下: 唯独这里咱不能这么做了嗷.

    参考

    1. ^ 每年的开学时期是辅导员最忙的时候, 如果你主动提出去帮助辅导员整理文件的话, 就可以在空调房里躲掉军训, 不展开讲了, 这是我一朋友告诉我的 (.
    2. ^ 微积分我用屁股都能算.
    3. ^ 太过于基础的内容我可懒得讲嗷.
    4. ^ 就是对应 Lie 群的基本表示的生成元.
    5. ^ 我以前还真这么干过, 确实可行啊.
    6. ^ 当然对背后的极限过程也必须是要有比较到位的理解才行.
    7. ^ 求导的结果就是导函数, 也是个函数.
    8. ^ 或者可能看完当场去世.
    9. ^ 试想有人对某个集合内的元素提出了一个分类标准, 结果按照他这个标准只能把所有的元素都归为同一类, 那他是不是铁弱智呢?
    10. ^ 噢, 材料除外, 材料确实有点儿捞.
    11. ^ 真要理清楚这个问题其实确实有点儿绕.
    12. ^ 等下会讲这个问题.
    13. ^ 值得一提的就是你得先保证无穷小量边儿上的这个数不会趋于零, 在量子场论里我们分母上经常会写一个无穷小量 iε, 但我们不会轻易删掉它, 因为边上的量在壳时会趋于零, 这时就需要这个无穷小量来使这一项发散.
    14. ^ 所以说微分和积分是互逆的操作, 但别忘了加个常数 C.
    15. ^ 也就是一个周期之内
    16. ^ 对易子起码要等到量子力学才能介绍, 所以是一个比较超前的笑话吧···