线性代数

线性代数是研究线性空间的基本工具。由于量子力学的基本假设可以用复线性空间来描述,线性代数便是量子力学的重要基础之一。事实上,掌握初等线性代数便足以理解量子力学(特别是量子计算)的大部分重要结论。量子计算之所以常常显得晦涩难懂,往往是因为多数读者(相较于实线性空间)不熟悉复线性空间的一般性质,以及不熟悉物理学家常用的(不同于数学中常用的)符号约定。因此本节从复习线性代数的基本定义开始,将线性空间的数域推广到复数域,并引入物理学家常用的记号,包括 狄拉克符号(Dirac Notation)等。对于已经熟练掌握线性代数的读者,我们也建议快速浏览本节内容,熟悉狄拉克符号的使用方法后再进行下一节量子计算基本概念的学习。

向量

向量的定义,加法和数乘

同实线性空间一样,我们用一个 元有序数组 来表示复线性空间 中的向量。在实际计算中,向量往往被写成 的矩阵形式:

基于此,向量之间的加法运算,以及向量和复数之间的数乘运算规则可以用矩阵表示如下:

在这里我们引入物理学家常用的狄拉克符号。狄拉克符号是在量子力学和量子计算中非常实用的一套符号系统,使用狄拉克符号可以简化量子计算中许多公式的推导以及结论的表述。在狄拉克符号系统中,一个复向量被记为

向量记号也形象地被称为右矢(Ket)。值得注意的是,出于习惯,在复线性空间中零向量 并不会被记作 。我们仍用 来表示零向量。

同实线性空间一样,在定义了向量之间的加法和向量与复数之间的数乘之后,我们可以把一个向量写成某一组向量的线性组合。例如对于向量组 :

任意向量 都能表示成 的线性组合:

不难发现,复线性空间 的所有向量关于向量加法和数乘是封闭的,即向量的任意线性组合仍然是 中的一个向量。若 中的若干向量构成的集合也关于向量加法和数乘封闭,则称这个向量的集合是 的一个子空间。

向量组张成的空间及空间的基

对于一组向量 ,若 中的任意向量都能表示成 的线性组合,则称向量组 张成(Span)线性空间 。例如上文的 张成了线性空间 。显然,张成 的向量组并不唯一:向量组

也张成了线性空间

根据张成空间的定义可知,若 张成线性空间 ,且 的一个线性组合,则 也张成线性空间 。这提示我们需要寻找最小的张成线性空间的向量组。

我们首先定义线性无关向量组。一个向量组 是线性无关的,当且仅当向量组中任意元素都不能表示成其他元素的线性组合。可以证明:

  1. 线性空间 中的一个线性无关向量组中最多有 个向量;

  2. 对线性空间 中的任意向量组 ,若 张成线性空间 ,则 至少包含 个向量。

因此,对张成线性空间 的任意线性无关的向量组 ,必有 。更一般地,对于任意线性空间 ,若线性无关的向量组 张成了线性空间 ,则所有这样的线性无关向量组一定包含同样数量的向量。线性空间 维数 因此定义为任一张成线性空间 的线性无关向量组的向量个数。

另一方面,若向量组 ,则 不能张成 ,亦即存在 中的向量不能写成 的线性组合。此时若只考虑能写成向量组 的线性组合的所有向量(显然这些向量是 中所有向量的一个真子集),不难发现这些向量在加法和数乘的意义下是封闭的。因此,我们将向量组 的所有线性组合构成的集合称作 张成的 的子空间,记作

一个张成线性空间 的一个线性无关向量组称为线性空间 的一组。根据定义,上文中向量组 都是线性空间 的一组基。我们对 这样的基特别感兴趣,因为它满足一些很优美的性质。我们称形如:

的一组基为线性空间 计算基(Computational Basis)。计算基的性质需要在后文中引入范数的概念之后再做进一步介绍。

矩阵

矩阵的定义以及常见操作

同实线性空间一样,在指定了基之后,复线性空间中的线性变换和复矩阵存在一一对应的关系。囿于篇幅,本节对线性变换相关内容的表述都采用矩阵的形式。一个 复矩阵可以写成如下形式:

也常被记作 ,其中矩阵元 均为复数,且 。由于向量是一类特殊的矩阵,以下矩阵的操作同样适用于向量。

同实线性空间一样,矩阵 转置 定义为

此时 是一个 的复矩阵。

由于 的矩阵元均为复数,我们可以类比复共轭的定义,定义复矩阵 共轭

即对每个矩阵元取复共轭。

最后,我们把共轭操作和转置操作结合起来,定义矩阵的共轭转置。矩阵 共轭转置 定义为

称行数与列数相等的矩阵为方阵。称方阵中行标与列标相同的元素为其对角元,即矩阵 中的

称非对角元全为 0 的方阵为对角矩阵,简记为 。不难发现,对角矩阵的转置等于其自身,对角矩阵的共轭等于其共轭转置。

称对角元全为 1 的对角矩阵称为单位矩阵,通常记作 ,其中 指该单位矩阵的行数,在不歧义时也简记为 。显然单位矩阵是一类特殊的对角矩阵,单位矩阵的转置、共轭、共轭转置均等于其自身。

狄拉克符号系统中对于向量的共轭转置有非常方便的表示。对于向量 ,它的共轭转置在狄拉克符号系统中记作

这个符号也被形象地称作左矢(Bra)。

矩阵乘法

是一个 的矩阵, 是一个 的矩阵,则 之间的乘积 是一个 的矩阵,定义为

我们曾指出线性变换与矩阵存在一一对应关系。事实上,线性变换 对向量 作用后得到的新向量 可由矩阵乘法:

计算得到。

可以证明,矩阵间的乘法满足结合律:。如果我们对一个向量先作线性变换 得到 ,再作线性变换 得到 ,则根据矩阵乘法的结合律:

这意味着先 的复合线性变换可由矩阵乘积 表示。

根据矩阵乘法的定义,不难证明矩阵乘积的操作有如下性质:

对于单位矩阵 ,任何矩阵与单位矩阵的乘积均等与其自身。

最后,我们介绍两类用狄拉克符号表示的向量间乘法。设

是复线性空间 中的两个向量,根据矩阵乘法的定义,两个向量不能直接相乘,但若将其中一个向量(比如 )共轭转置,则可以进行相乘。根据相乘的顺序,可以定义两类向量间的乘法,其中:

向量 内积定义为

可见向量 间的内积 是一个复数,且满足

向量 外积定义为

可见向量 间的外积 是一个 的复矩阵。特别地,我们也可以定义不同向量空间中向量的外积,这里就不再赘述了。向量内积和外积的作用将在后续章节作进一步介绍。

几类特殊的矩阵

在定义了矩阵的共轭转置操作后,我们介绍几类特殊的矩阵。:以下几类矩阵皆为方阵

酉矩阵(Unitary Matrix)是共轭转置与其自身乘积为单位矩阵 的矩阵。称矩阵 为酉矩阵,若:

酉矩阵的一个重要性质是保持内积不变:设 为酉矩阵且 是是复线性空间 中的两个向量,则 的内积和 的内积相等,即

厄米矩阵(Hermitian Matrix、自共轭矩阵)是共轭转置等于其自身的矩阵。称矩阵 为厄米矩阵,若:

作为酉矩阵和厄米矩阵的例子,我们介绍量子力学中十分常见的泡利矩阵。泡利矩阵是由以下四个 方阵组成的集合:

不难证明四个泡利矩阵都同时是酉矩阵和厄米矩阵。

泡利矩阵拥有许多优美的性质。例如,泡利矩阵构成了所有 复矩阵的一组基,即任意 矩阵都能写成四个泡利矩阵的线性组合:

接下来我们介绍一类厄米矩阵中非常重要的一个子类,半正定矩阵(Positive Semidefinite Matrix,有时简记为 Positive Matrix)。若对任意向量 ,矩阵 满足 的内积(记作 )都是非负实数,即称矩阵 是半正定矩阵:

若对任意非零向量 都是正实数,则称矩阵 正定(Positive Definite)的。

半正定矩阵的定义中并没有规定需要是厄米矩阵。但事实上,从定义出发可以证明半正定矩阵都是厄米矩阵。

在本小节的最后,我们介绍正规矩阵,以便在后文中介绍量子计算中十分重要的谱分解定理。若两个矩阵 满足 ,则称矩阵 对易(Commute)。正规矩阵(normal matrix,有时也译作规范矩阵)是共轭转置与其自身对易的矩阵。矩阵 是正规矩阵,若:

显然,酉矩阵、厄米矩阵、半正定矩阵和正定矩阵都是正规矩阵。

内积

内积的性质,标准正交基

在矩阵乘法小节我们曾简单介绍了向量间内积的概念,现在我们进一步介绍内积的性质,以及范数的概念。

考虑线性空间 中的向量 ,回忆其内积定义:

不难发现,内积作为一个 的函数满足以下性质:

  1. 内积对第二个自变量是线性的,即

  1. 内积对第一个自变量是共轭线性的,即
  1. 对任意向量 ,当且仅当 是零向量时,.

(事实上,满足上述四条性质的 映射都可被定义为线性空间的内积。完备地刻画内积的属性是高等代数课程的任务,这里我们通过矩阵乘法定义内积,略微牺牲数学严谨性的同时降低了理解量子计算的门槛。)

在有限维的情况下(本教程绝大多数情况下涉及的复线性空间均为有限维),定义了内积的复线性空间被称为 希尔伯特空间(Hilbert Space)。

上述第四条性质表明任意向量与其自身的内积是一个非负实数,这提示我们可以利用内积量化一个向量的“大小”。定义向量的范数为向量与其自身内积的算术平方根,即对于向量 的范数

若向量 的范数为 1,则称向量 单位向量。若向量 间的内积为 0,则称向量 正交

对于线性空间 的一组基,若满足:

  1. 基中每一个向量都是单位向量;
  2. 基中任意两向量间正交。

则称这组基为标准正交基(Orthonormal,词源正交的 Orthogonal 和标准化的 Normalized),也称规范正交基或幺正基。显然, 的计算基是一组标准正交基。

矩阵的外积表示

前文提到在指定基的情况下线性变换和矩阵之间存在一一对应的关系。事实上,利用向量外积可以方便地表示给定标准正交基下矩阵的表示。设希尔伯特空间中的一组标准正交基为 ,考虑任意向量 在标准正交基上的分解:,则

对任意 成立。因此,

此式称为标准正交基的完备性关系。对任意 的矩阵 ,设 分别为 上的一组标准正交基,应用两次完备性关系得到

从以上矩阵的外积表示可知,当 分别为 上的一组计算基时, 恰为 的矩阵元 .

作为一个特例,考虑希尔伯特空间中的两组标准正交基 。考虑矩阵

则有 ,即 变换到 。可以证明 是酉矩阵。因此,对同一线性空间中的任意两组标准正交基 ,一定存在酉矩阵 使得 将每个 变换到

张量积

矩阵间的张量积

矩阵间的张量积(Tensor Product)又称克罗内克积。不同于矩阵乘积,矩阵间的张量积对矩阵的行列数没有限制。设 是一个 的矩阵, 是一个 的矩阵。矩阵 间的张量积 定义为:

注意这里使用了分块矩阵的记法。可见 是一个 的矩阵。

作为例子,考虑 中的向量 ,以及 中的向量 ,则

狄拉克符号系统省略了向量间的张量符号,将 记作 ,亦可记作

同样地,我们可以计算泡利矩阵间的张量积,例如

希尔伯特空间的张量积

通过张量积,我们可以实现将若干个希尔伯特空间合成一个大的希尔伯特空间。下面,我们从我们从基之间的张量积入手来说明这一点。作为例子,考虑希尔伯特空间 的计算基

则两组基 之间的 个张量积:

恰好组成了 的计算基,或者说,张成了空间 。注意狄拉克符号系统省略了向量间的张量符号。

对于更一般的情况,设希尔伯特空间 分别有标准正交基 ,则称 个向量 张成的空间是空间 的张量积,记作

不难证明张量积具有如下性质:

  1. 。这意味着一般来说

  2. 。这意味着向量内积和外积有非常简便的狄拉克符号表示:

  1. 单位向量间的张量积依然是单位向量。

利用谱分解定理和内外积的狄拉克符号表示可以很方便地证明,酉矩阵之间的张量积、厄米矩阵之间的张量积和半正定矩阵之间的张量积依然分别是酉矩阵、厄米矩阵和半正定矩阵。这里谱分解定理的详细描述参见本节的下一段。

张量积的幂表示

最后,我们约定矩阵与其自身张量积的幂表示。若矩阵 与其自身作 次张量积,则将其记作 ,例如

不难证明对 的矩阵 的矩阵。

谱分解定理与矩阵函数

本征向量与本征值

在介绍谱分解定理之前,我们先简单复习一下本征值的概念。:本小节讨论的所有矩阵均为方阵。

对于复矩阵 ,若非零向量 使得 ,则向量 称为复矩阵 本征向量(Eigenvector),对应的复数 称为本征值(Eigenvalue)。

可得 。由于 是非零向量,因此 的根就是矩阵 的本征值。 因此被称为矩阵 的特征方程。对于 的矩阵 ,其特征方程是一个关于 次方程,必有 个复根。因此, 的矩阵 必有 个(复)本征值。

矩阵的酉对角化及其充要条件

设矩阵 的本征值为 。矩阵 酉对角化是指通过酉共轭将矩阵 转化为以本征值为对角元的对角矩阵,即寻找一个酉矩阵 使得

并不是所有的矩阵都能进行酉对角化。在这里我们不加证明地给出矩阵可以进行谱分解的充要条件,这被称为谱分解定理(Spectral Decomposition Theorem):

定理 1(谱分解定理). 设有 的矩阵 ,则以下条件等价:

  1. 矩阵 可以被酉对角化;

  2. 矩阵 是正规矩阵;

  3. 矩阵 拥有 个规范正交的本征向量。

矩阵 的本征值 被称为矩阵 的谱。矩阵 的酉对角化有时又被称为矩阵 谱分解,这是因为矩阵 此时可以分解为其特征向量的外积之和:

其中 是酉矩阵 的第 列,亦即矩阵 的第 个规范正交的本征向量,因为显然有

作为例子,考虑泡利矩阵中的 的本征向量为

对应的本征值分别为 。不难验证 的本征向量之间正交,且 有谱分解:

酉矩阵、厄米矩阵和半正定矩阵的谱

由于酉矩阵、厄米矩阵和半正定矩阵都是正规矩阵,它们都有谱分解。这里我们直接给出它们的谱的性质:

  1. 酉矩阵的谱都在复平面上的单位圆上,即

  2. 厄米矩阵的谱是实的,即

  3. 半正定矩阵的谱是非负的,即 。正定矩阵的谱是正的,即

矩阵函数

对具有谱分解形式的正规矩阵 ,我们可以基于一般的复单变量函数 ,定义矩阵的函数

因此,常见的初等函数函数(如多项式、三角函数、指数、对数等)都可以以此方法定义在正规矩阵上。

作为矩阵函数例子,我们直接给出泡利矩阵的指数形式,它们也被称为旋转算符

根据矩阵函数的定义可以验证

习题 1. 对任意的厄米矩阵 及实数 ,我们有 是酉矩阵。

本节最后,我们介绍矩阵的一个重要特征,在部分教材中也被归于一类特殊的矩阵函数。

矩阵 定义为矩阵的对角元之和:

根据定义可以证明迹具有以下性质:

  1. 循环性:

  2. 线性:

由迹的循环性可知迹是酉不变的,即 。因此矩阵的迹也可被视为其对应的线性变换共轭等价类的函数。

由迹的循环性可知,。这个技巧在后续计算量子电路的测量结果时非常有用。

参考资料

[1] Roman, Steven, S. Axler, and F. W. Gehring. Advanced linear algebra. Vol. 3. New York: Springer, 2005.

[2] Nielsen, Michael A., and Isaac L. Chuang. "Quantum Computation and Quantum Information: 10th Anniversary Edition." Cambridge University Press, 2010.

最后更新时间:2021年12月20日