量子力学

量子力学的发展史

量子力学的诞生

1900 年,开尔文勋爵在一篇名为《19 世纪热和光的动力学理论上空的乌云》的演讲中说到:“动力学理论断言,热和光都是运动的方式。但是现在这一理论的优美性和明晰性被两朵乌云遮蔽了,显得黯然失色......” 而后这两朵乌云在物理学界掀起了狂风巨浪,两朵乌云在给当时的科学界带来巨大疑惑的同时,也为孕育出全新的科学指明了前行的方向。

开尔文口中的两朵乌云分别指的是迈克尔逊-莫雷实验和黑体辐射问题。为了驱赶这两朵乌云,科学家们分别提出了新的理论诠释。后来,第一朵乌云导致了相对论的出现;第二朵乌云导致了量子论的诞生。

这里我们主要关注第二朵乌云中,经典理论描述黑体辐射产生的“紫外灾难”:一个理想黑体吸收电磁辐射后产生的热辐射光谱在紫外波段产生发散的特性。人们发现根据当时已有的物理定律推导了黑体的谱分布和辐射波长的关系,得到了下图 1 中右侧黑色虚线,经典理论预测了在短波段(紫外)存在着辐射强度无穷大,然而这不符合人们在实验上观测到的结果。

黑体辐射

图 1:黑体辐射光谱

为了准确描述黑体辐射的光谱,科学家们做出了许多努力。1896 年,维恩从古典热动力学出发,推导出黑体温度与辐射波长的维恩公式。但该公式存在着明显的缺陷:只在短波段与实验结果符合较好,在长波段与实验结果有着明显的偏离。1900 年,瑞利从电动力学和统计物理学原理出发,得出一个新的黑体辐射公式,经金斯修正得到了瑞利-金斯公式。与之前维恩公式相反,瑞利-金斯公式在长波段与实验结果较为吻合,而在短波段(紫外)发散,和实验结果相差甚远,即“紫外灾难”。

这些曲折的研究为量子论的出现提供了土壤,普朗克在 1900 年通过数学手段,结合维恩公式和瑞利-金斯公式的特点凑出了普朗克黑体辐射公式,在各个波段都可以很好地符合实验结果。但问题是:一个可以正确描述物理现象的公式其背后深层次的物理原理是什么?普朗克提出了一个大胆的假设:黑体发射和吸收的能量是不连续的,这些能量值是某个最小能量元 的整数倍(也称作“量子”),且能量元与振动频率成正比,即 ,这里 是频率, 是未约化的普朗克常数。1900 年 12 月 24 日,普朗克在德国物理学会的圣诞会上,宣读了题为《关于正常光谱的能量分布定律》的论文。这是历史上第一次把量子的概念引入科学,人们把这一天称为“量子诞生日”。

随着量子化概念的引入,诸多之前经典物理无法解释的实验现象得以重新诠释。早在 1887 年,赫兹在实验上发现只有频率大于特定值的光照射在金属上才能激发出金属中的电子,产生所谓的“光电效应”。1905 年,爱因斯坦根据普朗克量子化的思想,通过将光看成光量子,假定每个光子能量只和光子的频率相关,且金属中的电子只能一份一份地吸收光子的能量,从而很好地解释了经典理论无法解释的光电效应。

同样量子化的思想为解决物质世界的基础问题:原子结构,提供了全新的视角。1911 年,卢瑟福提出了电子绕原子核做圆周运动的原子结构模型,然而这种原子结构在经典理论预言中会因为电子做圆周运动产生电磁辐射而不稳定。为了解决这一问题,玻尔在1913年把量子化的思想融入了卢瑟福原子模型,做出能级量子化的假设:电子能级是不连续的,只能在特定的轨道上做圆周运动,如图 2 所示。当电子的能量较高的时候,电子轨道半径大(高能级轨道);当电子的能量较低的时候,电子轨道半径小(低能级轨道)。而且只有当电子吸收或发射两个能级差的能量时,电子才能在两个能级上跃迁。

原子能级

图 2:玻尔原子模型。

黑体辐射和光电效应的研究都涉及光为何物的问题。在长达几个世纪的争论中人们意识到光既具有粒子性,又具有波动性。光显现出哪一种性质取决于我们如何去观测它。如果我们用检验粒子的方法去检验光,那么光就会显现出粒子的性质;如果我们用检验波的方法去检验光,那么光就会显现出波的性质。而对光的本质研究也促使了人们对微观粒子的量子化理解。1924 年,德布罗意根据光的波粒二象性提出了一切微观粒子也具有粒子性和波动性二重特征这一假说。为了描述微观粒子的动力学行为,海森堡在1926年创立了矩阵力学用于刻画原子的能级量子化问题。同年,薛定谔创立了波动力学用于刻画微观粒子的运动,提出了薛定谔方程用于描述微观粒子的波函数行为。之后,玻恩根据德布罗意物质波的思想,结合薛定谔方程,提出了波函数的概率波解释,才较为完整的刻画了微观原子结构与动力学行为。至此,如上科学的发展逐步形成一门全新的学科:量子力学,物质世界遵循量子力学规律这一观点逐渐为人们所接受。下述章节我们将从公设化的角度系统性地介绍量子力学的基本原理。

量子力学公设化

量子力学的发展离不开数学,海森堡矩阵力学是第一个完备且被正确定义的量子力学理论。通过将粒子的物理量阐释为随时间演化的矩阵,海森堡矩阵力学可以方便地描述众多物理过程和现象。海森堡矩阵力学的基本原理如下:

  1. 所有的可观测量都可用一个厄米矩阵表示,一个系统的哈密顿量(Hamiltonian)是广义坐标矩阵和与之共轭的广义动量矩阵的函数。
  2. 可观测量的观测值是对应厄米矩阵的本征值,系统能量是哈密顿量的本征值。
  3. 广义坐标和广义动量满足正则对易关系(强量子条件)。
  4. 跃迁需满足频率条件。

这些原理对于初学者有些拗口且不易理解,我们只需要知道相应的基本概念,并加以运用,深层次的理解可以参阅后续章节和参考文献。

另一种广为人知的量子力学理论是薛定谔波动力学,它的基本假设是引入波函数 和建立波函数满足的薛定谔方程:

其中 分别是微观粒子的质量和所处的外势场,通过求解薛定谔方程,我们可以得知微观粒子波函数的演化过程,进而窥探微观粒子的动力学信息。

随着越来越多的量子理论被提出,人们对于量子世界的认知逐渐清晰起来。为了使这些理论成体系,狄拉克在 1930 年证明了海森堡矩阵力学和薛定谔波动力学的等价性,将粒子动力学行为抽象为希尔伯特空间(Hilbert Space)上的演化,并在此基础上发展了相对论量子力学。狄拉克后续还引入了现代量子力学上常用的狄拉克符号。基于希尔伯特公设化物理的思路,狄拉克和冯·诺依曼发展了量子力学的第一个完备数学表述体系,将量子力学的规律从具体的物理体系中抽象出来,极大的促进了量子力学在其他学科中的发展。二十世纪八十年代,运用量子力学的公设化思想和量子态叠加、干涉、纠缠等特性,结合计算机科学、信息科学等学科知识,诞生了量子计算、量子信息、量子通信等前沿交叉学科。

四大公设

量子力学是用于发展物理理论的数学框架,其本质是数学。我们知道公设是数学推导的基础,量子力学也存在四条最基本的公设。大部分量子现象和理论可以通过这四条基本的公设并结合实际的物理体系性质推演出来。可以说,四大公设奠定了现代量子力学的发展框架。

费曼曾在他的著作《The Character of Physical Law》中说到:"I think I can safely say that nobody understands quantum mechanics." 作为初学者,我们很难也不需要完全理解这些公设,我们所要做的就是了解它们并学会使用它们。接下来,我们逐条介绍四大公设。如章节介绍所述,这四大公设恰恰对应于第三节中量子比特、单量子比特门、量子测量和多量子比特门四部分,这里将采用更抽象的形式、结合实际的物理系统重述一遍,让读者对量子计算的认识更加全面。

公设一:(量子态) 一个孤立物理系统的状态由希尔伯特空间中的单位矢量表示。该希尔伯特空间被称为这个单位矢量的态空间(State Space)。

首先,我们介绍最简单也是最常用的量子力学系统--量子比特。如前一节所述,一个量子比特的状态可以用一个二维的单位复数矢量所描述。量子比特的态空间是二维的,可以以计算基 , 和 为该空间的正交基底。

物理实现

量子态在自然世界中是真实存在的。1921 年,斯特恩和格拉赫做了一个实验,他们使高温银原子经过狭缝准直后形成一个原子射线束,随后通过一个不均匀的磁场,原子束在磁场的作用下发生偏折,最终落在屏幕上(如图 3)。根据经典物理的理论,银原子的磁矩(Magnetic Moments)方向是随机的,所以原子偏转的角度应当也是随机的,由此我们应该会得到一条连续的黑斑。可实际上,观测者看到了上下两块清晰的黑斑。倘若从经典的角度出发,很难去解释这一现象,但是如果我们用量子比特的角度去解释,一切就顺其自然了。

实验示意图

图 3:斯特恩-格拉赫实验示意图

首先,我们需要了解自旋(Spin)这一概念。在经典力学里没有与自旋对应的物理量,我们只需要知道自旋是粒子的一种固有性质,会对原子的磁矩产生影响。对于电子,有自旋上(Spin Up)和自旋下(Spin Down)两种情况。我们知道一个银原子有 47 个电子,每个自旋上的电子和一个自旋下的电子配对,那么就会有 23 对电子和一个单电子。这 23 对电子彼此中和,对外不显现自旋的特性,剩下单个电子的自旋状态决定了原子的状态。这个未配对的电子可能是自旋上 也可能是自旋下 ,亦或者是自旋上和自旋下的叠加

现在,从量子力学的角度去看待这个实验,一切就解释得通了。首先,把一束有 个自旋为 的银原子通过不均匀的磁场(等价于第三公设的测量)打到观测屏上,我们会观察到 个银原子组成了上面的黑斑, 个银原子组成了下面的黑斑。

公设二:(量子态演化) 对于一个封闭的物理系统,它的量子态以酉变换(Unitary Transformation)的方式进行演化。具体地,假设封闭系统在任意两个时刻 的量子态分别为 ,那么,可以理解为在初始态 上做酉操作 (Unitary Operation)使得初始态变成了最终态 只取决于 ,即

量子态演化的本质其实是把希尔伯特空间上的一个单位向量(初始态)变成另一个单位向量(最终态)的过程,值得注意的是,在演化过程中,向量的长度不变。在线性代数中,酉变换或者酉矩阵刚好可以满足将单位向量旋转到另一个单位向量,所以酉矩阵被用来描述量子态的演化。酉矩阵 满足 , 其特点是不改变向量的长度,

我们举几个在量子信息和量子计算中常用的酉操作——泡利矩阵。在之前章节,我们有提及过相关知识,这里简单复习一下。泡利矩阵也叫做泡利门,有四种: 门, 门, 门和 门。 门也被称为量子非门,其作用和经典非门十分类似,可以把 变成 ,把 变成 ,又被称为比特翻转门(Bit Flip)。 门会把 变成 ,把 变成 门作用在 态上不会产生变化,但是作用在 会变成 ,因此 门也被成为相位翻转门(Phase Flip)。此外,还有一个非常有趣且常用的酉操作叫做 Hadamard 门,通常标记为 ,他的矩阵表达式为

Hadamard 门具体的效果是

物理实现

这里,我们以超导量子计算机为例。超导量子计算机的基本结构是二能级系统,即 。倘若想要在这个二能级系统上实现 X 门,,则需要对单量子比特在布洛赫球面上进行绕 轴旋转 角度的操作。在超导量子计算机上,这一旋转的物理实现是由脉冲和量子比特耦合实现的(对量子比特施加脉冲)。量子比特处于不同态的时候所具有的能量也是不同的,在基态 时的能量为 ,在激发态 时的能量为 ,能量差记为 。为了能够使量子系统从基态转变成激发态,施加在量子比特上的脉冲的频率需要和能量差 耦合,也就是说,脉冲的频率并不是任意的,而是由初始态和目标态决定。

除此之外,脉冲作用的时间也并不是随机的。倘若脉冲一直作用在量子比特上,量子态会先从 转到 ,随后再转成 ,如此往复,一直在 之间循环。我们只需要算好时间,在量子态刚好到达 的时候停止脉冲,那么就可以把 转成 ,即在超导量子计算机上实现了 门。

公设三:(量子测量) 一个物理系统的量子测量可以用一组作用在该系统希尔伯特空间上的测量算符 来表示,其中下标 代表测量后可能得到的结果。具体来说,如果系统在测量前处于量子态 ,那么测量后得到 的概率为

此时,该系统的量子态坍缩为

注意,一组测量算符须满足完备性条件(Completeness Relation),即

特别地,这里的 表示与 规模相同的单位矩阵。

在公设二中,我们提出量子态在封闭的环境中的演化是一种酉变换,即在演化过程中与外界没有任何联系,也就是说身处于外界的我们是无从得知这个量子系统究竟处于哪一种量子态。为了探知量子系统的态,总会有一个时刻,实验学家会对这个量子系统做测量,去探究这个量子系统发生了什么。一旦对系统做了测量,该量子系统必定会和外部发生信息交换(系统不再封闭),换句话说,量子系统的状态会被我们测量这一行为改变。从经典的角度出发很难理解这一现象,在经典情形下,比特的状态不受观测影响。而在量子情形下,测量会使处于叠加态的量子系统坍缩到一个确定的态上。例如单量子比特态 使用测量算符组 测量后分别以概率 塌缩到量子态

物理实现

这里,我们以光学量子计算机为例,说明在一个具体的量子系统中如何进行量子测量。光学量子计算机以光的偏振为基底,横向偏振记为 ,纵向偏振记为 ,且 。对于任意一个光子,我们都可以用叠加态 描述光的偏振,且 (公设一)。为了测量光子的偏振,我们就需要分束器。

BS

图 4:光子探测示意图

所谓分束器,顾名思义,就是依据光的偏振,把一束光分成两束的设备,如图 4 所示。光束 1 是由 光子组成的光束,从左侧射入。通过分束器之后,根据公设三,每个光子有 的概率坍缩成 ,从右侧射出;有 的概率坍缩成 ,从下面射出。从理论上说,光束 2 有 个光子;光束 3 有 个光子。相应的,探测器会告诉我们光束 2 有 个光子,光束 3 有 个光子。从而我们可以计算出

公设四:(复合系统) 一个复合(Composite)物理系统的态空间是它的子物理系统的态空间的张量积。特别地,如果一个物理系统由 个子系统组成,并且制备第 个子系统的量子态为 ,其中 ,那么该复合物理系统的量子态是

量子计算机显然不能仅限于操纵一个量子比特进行运算,所以,我们需要一个方法可以同时描述、操纵多个量子比特,公设四就提供了相应的方法。假设我们有两个量子比特,且每个量子比特目前的状态都由各自的态矢量描述,那么这两个量子比特构成的系统量子态就是这些态矢量的张量积。简单的说,我们手中有两个量子比特 ,他们的态分别是 ,那么这两个系统的态可以被描述为 ,其中符号 是张量积。

但要注意的是,并不是说这个两量子比特系统所有的态都可以写成两个单量子比特态矢量的张量积。例如,某个贝尔态可以表示为

这种态不能分解成两个单量子比特张量积的形式,我们称之为纠缠态(Entangled State)。也就是说,当一个两量子比特系统处于贝尔态时,我们无法用态矢量去描述单个量子比特的状态。如果想要描述纠缠系统中每个单量子比特的状态,就要引入密度算符(Density Operator,或称密度矩阵 Density Matrix)的概念了。密度算符,与态矢量相似,也可以用来描述一个物理系统的状态,我们将在密度算符小节中作详细介绍。

物理实现

生成一个能够写成张量积形式的量子态十分容易。光学量子计算机上只需要分别生成两个光子 ,同时表示这两个光子就可以直接写成张量积的形式

但是生成一个贝尔态就麻烦的多,这里我们举一个生成贝尔态的例子。如图 5 所示,一个自旋为 的粒子 A 分裂成两个自旋为 的粒子 B 和 C。根据自旋守恒,B 和 C 的自旋必定相反。我们用自旋下 代表自旋 的粒子,用自旋上 代表自旋 的粒子。如果粒子 B 的自旋向上 ,那么粒子 C 的自旋必定向下 ,这时 B 和 C 可以表示为 ;如果粒子 B 的自旋向下 ,那么粒子 C 的自旋必定向上 ,这时 B 和 C 可以表示为 。由于两种情况是等概率的,那么我们只能用叠加态来表示他们的自旋,即

Bell state

图 5:贝尔态的产生

密度算符

由于阅读本教程的后续章节基本不需要涉及到密度算符的量子力学,笔者建议初次学习的读者跳过本节剩余内容,先去第二章熟悉量子电路模型。有兴趣的读者可以在对量子计算有所了解后再阅读此部分内容。

在上一小节中我们发现,当两个量子比特处于贝尔态 时,单个量子比特的状态无法用一个态矢量去描述,而密度算符则可以方便地描述这种情况下的量子态。

量子态的系综

假设 Alice 和 Bob 共享一对处于量子态为

的量子比特(各有一个量子比特),当 均不为 时,Alice 和 Bob 都无法用一个态矢量去描述他们身边的量子比特。换句话说,这对量子比特中的单个量子比特无法用一个确定的态矢量去描述。例如,当 时, 便是之前提到的贝尔态 。我们称可以用一个确定的态矢量描述的量子态为纯态(Pure State),否则我们称之为混态(Mixed State)。由第三节引理 1,我们知道贝尔态 是一个纯态,而其中单个量子比特却处于混态。同样地,虽然 Alice 和 Bob 共享的这对量子比特所处的量子态 是一个纯态,但单看其中一个量子比特却是处于混态的。

现在我们考虑这样的情况,Alice 在她的量子比特上用一组测量算符 进行测量,而 Bob 不做任何操作,那么在这个两量子比特系统上,Alice 做的测量可以写成

由公设三可得,Alice 测量得到 的概率是

到目前为止,我们并没有对测量算符 作出任何其他的描述,也就是说上面的式子对于任意的测量算符 都是成立的。从测量的统计结果上来看,Alice 的量子比特所处的量子态可以看作纯态 的一个概率分布,其处于态 的概率为 ,处于态 的概率为

更广义地来说,一个处于混态的量子系统可以看作是一组纯态 的概率分布,其中 的概率为 ,我们把 称为纯态的一个系综(Ensemble)。描述该系统所处量子态的密度算符是

例如 Alice 的量子比特的状态就可以用密度算符

来描述。更进一步,如果一个量子系统有 的概率由密度算符 描述,那么描述该系统的密度算符为

当然,密度算符也可以方便地描述纯态,即一个量子系统处于量子态 的概率为 ,此时我们有

习题 1. 证明一个量子系统可以描述为

下面我们来介绍一下密度算符的性质:

  1. ;
  2. 是一个半正定算符(Positive Operator),即对于该系统态空间中的任意向量 是一个大于或等于 的实数。

证明. 给定一个系统的密度算符

对于该系统态空间中的任意一个复向量 ,我们有

所以 是一个半正定算符。

事实上,该定理的逆命题也是成立的,即满足上述两个条件的算符都可以看作一个密度算符。

习题 2. 证明习题 1 的逆命题。

习题 3. 证明如果 是一个纯态,那么 ,否则

既然纯态也可以方便地用密度算符描述,那么上一小节中用态矢量形式介绍的量子力学四大公设都可以方便地推广到密度算符的描述体系下,在下一小节中我们会逐一介绍。

量子力学四大公设的密度算符描述

公设一: 一个孤立物理系统的态空间是一个希尔伯特空间,这个系统可以完全由它的密度算符来描述。如果该系统有 的概率处于量子态 ,那么描述该系统的密度算符为

密度算符是一个迹为 的半正定算符。

公设二: 在一个封闭的物理系统中,其量子态的演化方式是酉变换。具体地,假设孤立系统在任意两个时刻 的量子态为 ,那么, 之间的演化方式是酉变换 ,并且 是由时间 决定的,且

我们知道对于一个封闭的物理系统,其量子态的演化是由一个酉矩阵 描述的。对于一个纯态 ,其经过演化会变为 。而对于一个混态,我们只需要对组成其系综的每个纯态 作用 就行了,也就是说系综由 演化为了 。因此,如果一个量子系统初始时处于量子态 ,经过演化后它的状态会变为

公设三: 一个物理系统的量子测量可以用一组作用在该系统希尔伯特空间上的测量算符 来表示,其中下标 代表测量后可能得到的结果。具体来说,如果系统在测量前处于量子态 ,那么测量后得到 的概率为

此时,该系统的量子态坍缩为

注意,一组测量算符须满足完备性条件,即

关于测量的部分在量子测量小节中已有提及,在一个处于混态 的量子系统上用一组测量算符 进行测量,则得到结果 的概率为

如果测量得到的结果为 ,那么测量后系统的量子态坍缩为

公设四: 一个复合物理系统的态空间是它的子物理系统的态空间的张量积。此外,如果一个物理系统由 个子系统组成,且第 个子系统被制备为量子态 ,那么由这些子系统组成的复合物理系统所处的量子态为

在态矢量的描述中我们知道如果一个物理系统由 个子系统组成,且子系统 处于量子态 ,那么该系统所处的量子态是这些子系统量子态的张量积

类似地,在密度算符框架下,我们得到上述公设四的密度算符描述形式。

子系统的密度算符

由公设四我们得知,如果我们分别制备了 个子系统的量子态,且子系统 处于量子态 ,那么由这些子系统构成的复合系统所处的量子态是这些子系统量子态的张量积。那反过来,如果我们知道了一个物理系统处于量子态 ,我们如何去求它的一个子系统的状态呢?这时我们就要引入偏迹(Partial Trace)的概念,即只对部分系统做取迹的操作。

求偏迹是一个线性的操作。对于复合物理系统中的密度算符 ,我们可以定义它关于子系统 的偏迹,

分别称为 在子系统 约化密度算符(Reduced Density operator)。这里 分别表示系统 的一组计算基, 分别表示 的恒同算符(可以理解为单位矩阵)。

例 1. 假设 Alice 和 Bob 各有一个量子比特,且这两个量子比特组成的复合系统的量子态为

那么 Alice 的量子比特的约化密度算符为

同理,Bob 的量子比特的约化密度算符为

注意,在上述例子中,求得的子系统的约化密度算符的张量积便是复合系统的量子态,即

但大多复合系统并不总是如此。

例 2. 一个两量子比特系统处于贝尔态,其密度算符描述是

其中 的简写。该系统的两个子系统的约化密度算符分别是

在上个例子中,我们求得了处于贝尔态的两量子比特系统中单个量子比特的约化密度算符,但与之前不同的是,这两个量子比特的约化密度算符的张量积并不等于该两量子比特系统的密度算符,即

所以,对于处于纠缠态的量子系统来说,无论是用态矢量的描述方式还是密度算符的描述方式,我们都无法对其子系统进行独立且完整的描述。

参考资料

[1] Kelvin, Lord. I. "Nineteenth century clouds over the dynamical theory of heat and light." The London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science 2.7 (1901): 1-40.

[2] Planck, Max. "On the law of distribution of energy in the normal spectrum." Annalen der physik 4.553 (1901): 1.

[3] Brown, L.M. "Paul AM Dirac’s The Principles of Quantum Mechanics." Physics in perspective 8.4 (2006): 381-407.

[4] Van Hove, Léon. "Von Neumann's contributions to quantum theory." Bulletin of the American Mathematical Society 64.3. P2 (1958): 95-99.

[5] Feynman, Richard. The character of physical law. MIT press, 2017.

最后更新时间:2021年12月20日

Navigated to 量易简