什么是希尔伯特零点定理

2024-12-28 06:15:06

推荐回答（2个）

回答1：

希尔伯特零点定理提供了多项式环的理想和仿射空间子集的基本对应。

回答2：

数学上，线性变换的特征向量（本征向量）是一个非退化的向量，其方向在该变换[2]下不变。该向量在此变换下缩放的比例称为其特征值（本征值）。图1给出了一幅图像的例子。一个变换通常可以由其特征值和特征向量完全描述。特征空间是相同特征值的特征向量的集合。

这些概念在纯数学和应用数学的很多领域发挥着巨大的作用—在线性代数，泛函分析，甚至在一些非线性的情况中也有着显著的重要性。

“特征”一词来自德语的eigen。1904年希尔伯特首先在这个意义下使用了这个词，更早亥尔姆霍尔兹也在相关意义下使用过该词。eigen一词可翻译为“自身的”，“特定于...的”，“有特征的”或者“个体的”—这强调了特征值对于定义特定的变换有多重要。

定义
空间上的变换—如平移(移动原点)，旋转，反射，拉伸，压缩，或者这些变换的组合；以及其它变换—可以通过它们在向量上的作用来显示。向量可以用从一点指向另一点的箭头来表示。

变换的特征向量是指在变换下不变或者简单地乘以一个缩放因子的非零向量[3]。
特征向量的特征值是它所乘的那个缩放因子。
特征空间就是由所有有着相同特征值的特征向量组成的空间，还包括零向量，但要注意零向量本身不是特征向量。
变换的主特征向量是对应特征值最大的特征向量。
特征值的几何重次是相应特征空间的维数。
有限维向量空间上一个变换的谱是其所有特征值的集合。
例如，三维空间旋转的特征向量是沿着旋转轴的一个向量，相应的特征值是1，相应的特征空间包含所有和该轴平行的向量。该特征空间是一个一维空间，因而特征值1的几何重次是1。特征值1是旋转的谱当中唯一的实特征值。

参看：特征平面
例子
随着地球的自转，每个从地心往外指的箭头都在旋转，除了在转轴上的那些箭头。考虑地球在一小时自转后的变换：地心指向地理南极的箭头是这个变换的一个特征向量，但是从地心指向赤道任何一处的箭头不会是一个特征向量。因为指向极点的箭头没有被地球的自转拉伸，它的特征值是1。

另一个例子是，薄金属板关于一个固定点均匀伸展，使得板上每一个点到该固定点的距离翻倍。这个伸展是一个有特征值2的变换。从该固定点到板上任何一点的向量是一个特征向量，而相应的特征空间是所有这些向量的集合。
但是，三维几何空间不是唯一的向量空间。例如，考虑两端固定的拉紧的绳子，就像弦乐器的振动弦那样（图2.）。振动弦的原子到它们在弦静止时的位置之间的带符号那些距离视为一个空间中的一个向量的分量，那个空间的维数就是弦上原子的个数。

如果考虑绳子随着时间流逝发生的变换，它的特征向量，或者说特征函数（如果将绳子假设为一个连续媒介），就是它的驻波—也就是那些通过空气的传播让人们听到弓弦和吉他的拨动声的振动。驻波对应于弦的特定振动，它们使得弦的形状随着时间变化而伸缩一个因子（特征值）。和弦相关的该向量的每个分量乘上了一个依赖于时间的因子。驻波的振幅（特征值）在考虑到阻尼的情况下逐渐减弱。因此可以将每个特征向量对应于一个寿命，并将特征向量的概念和共振的概念联系起来。

特征值方程
从数学上看，如果向量v与变换满足

则称向量v是变换的一个特征向量，λ是相应的特征值。其中是将变换作用于v得到的向量。这一等式被称作“特征值方程”。

假设是一个线性变换，那么v可以由其所在向量空间的一组基表示为：

其中vi是向量在基向量上的投影（即坐标），这里假设向量空间为n 维。由此，可以直接以坐标向量表示。利用基向量，线性变换也可以用一个简单的矩阵乘法表示。上述的特征值方程可以表示为：

但是，有时候用矩阵形式写下特征值方程是不自然甚或不可能的。例如在向量空间是无穷维的时候，上述的弦的情况就是一例。取决于变换和它所作用的空间的性质，有时将特征值方程表示为一组微分方程更好。若是一个微分算子，其特征向量通常称为该微分算子的特征函数。例如，微分本身是一个线性变换因为（若M和N是可微函数，而a和b是常数）

考虑对于时间t的微分。其特征函数满足如下特征值方程：

,
其中λ是该函数所对应的特征值。这样一个时间的函数，如果λ = 0，它就不变，如果λ为正，它就按比例增长，如果λ是负的，它就按比例衰减。例如，理想化的兔子的总数在兔子更多的地方繁殖更快，从而满足一个正λ的特征值方程。

该特征值方程的一个解是N = exp(λt)，也即指数函数；这样，该函数是微分算子d/dt的特征值为λ的特征函数。若λ是负数，我们称N的演变为指数衰减；若它是正数，则称指数增长。λ的值可以是一个任意复数。因此d/dt的谱是整个复平面。在这个例子中，算子d/dt作用的空间是单变量可微函数的空间。该空间有无穷维（因为不是每一个可微函数都可以用有限的基函数的线性组合来表达的）。但是，每个特征值λ所对应的特征空间是一维的。它就是所有形为N = N0exp(λt)的函数的集合。N0是任意常数，也就在t=0的初始数量。

谱定理
关于此话题更进一步的细节，见谱定理。

谱定理在有限维的情况，将所有可对角化的矩阵作了分类：它显示一个矩阵是可对角化的，当且仅当它是一个正规矩阵。注意这包括自共轭（厄尔米特）的情况。这很有用，因为对角化矩阵T的函数f(T)（譬如波莱尔函数f）的概念是清楚的。在采用更一般的矩阵的函数的时候谱定理的作用就更明显了。例如，若f是解析的，则它的形式幂级数，若用T取代x，可以看作在矩阵的巴拿赫空间中绝对收敛。谱定理也允许方便地定义正算子的唯一的平方根。

谱定理可以推广到希尔伯特空间上的有界正规算子，或者无界自共轭算子的情况。

矩阵的特征值和特征向量

计算矩阵的特征值和特征向量
假设我们想要计算给定矩阵的特征值。若矩阵很小，我们可以用特征多项式进行符号演算。但是，对于大型矩阵这通常是不可行的，在那种情况我们必须采用数值方法。

符号演算
关于此话题更进一步的细节，见矩阵特征值的符号演算。

求特征值
描述正方形矩阵的特征值的重要工具是特征多项式：说λ是A的特征值等价于说线性系统 (A – λI) v = 0 (其中I是恒等矩阵)有非零解v (一个特征向量)，因此等价于行列式:

函数p(λ) = det(A – λI)是λ的多项式，因为行列式定义为一些乘积的和。这就是A的特征多项式：矩阵的特征值也就是其特征多项式的零点。

一个矩阵A的特征值可以通过求解方程pA(λ) = 0来得到。若A是一个n×n矩阵，则pA为n次多项式，因而A最多有n个特征值。反过来，代数基本定理说这个方程刚好有n个根，如果重根也计算在内的话。所有奇数次的多项式必有一个实数根，因此对于奇数n，每个实矩阵至少有一个实特征值。在实矩阵的情形，对于偶数或奇数的n，非实数特征值成共轭对出现。

求特征向量
一旦找到特征值λ，相应的特征值可以通过求解如下方程得到：

没有实特征值的一个矩阵的例子实顺时针90度旋转：

其特征多项式是λ2 + 1，因此其特征值成复共轭对出现：i, -i。相应的特征向量也是非实数的。

数值计算
关于此话题更进一步的细节，见特征值算法。

在实践中，大型矩阵的特征值无法通过特征多项式计算。计算该多项式本身相当费资源，而精确的“符号式”的根对于高次的多项式来说很难计算和表达：阿贝尔－鲁费尼定理显示高次（5次或更高）多项式的根无法用n次方根来简单表达。对于估算多项式的根的有效算法是有的，但特征值中的小误差可以导致特征向量的巨大误差。因此，寻找特征多项式和特征值的一般算法，是迭代法。最简单的方法是幂法：取一个随机向量v，然后计算如下的一系列单位向量

, , , ...
这个序列几乎总是收敛于最大绝对值的特征值所对应的特征向量。这个算法很简单，但是本身不是很有用。但是，象QR算法这样的算法正是以此为基础的。

性质
代数重次
A的一个特征值λ的代数重次是λ作为A的特征多项式的零点的次数；换句话说，若λ是一个该多项式的根，它是因子(t − λ)在特征多项式中在因式分解后中出现的次数。一个n×n矩阵有n个特征值，如果将代数重次计算在内的话，因为其特征多项式次数为n。

一个代数重次1的特征值为“单特征值”。

在关于矩阵理论的条目中，可能会遇到如下的命题：

"一个矩阵A的特征值为4,4,3,3,3,2,2,1,"
表示4的代数重次为二，3的是三，2的是二，而1的是1。这样的风格因为代数重次对于矩阵理论中的很多数学证明很重要而被大量使用。

回想一下，我们定义特征向量的几何重次为相应特征空间的维数，也就是λI − A的零空间。代数重次也可以视为一种维数：它是相应广义特征空间 (第一种意义)的维数，也就是矩阵(λI − A)k对于任何足够大的k的零空间。也就是说，它是“广义特征向量”（第一种意义）的空间，其中一个广义特征向量是任何一个如果 λI − A作用连续作用足够多次就“最终”会变0的向量。任何特征向量是一个广义特征向量，以此任一特征空间被包含于相应的广义特征空间。这给了一个几何重次总是小于代数重次的简单证明。这里的第一种意义不可和下面所说的广义特征值问题混淆。

例如：

它只有一个特征值，也就是λ = 1。其特征多项式是(λ − 1)2，所以这个特征值代数重次为2。但是，相应特征空间是通常称为x轴的数轴，由向量线性撑成，所以几何重次只是1。

广义特征向量可以用于计算一个矩阵的若当标准型（参看下面的讨论）。若当块通常不是对角化而是幂零的这个事实与特征向量和广义特征向量之间的区别直接相关。

一般矩阵分解定理
如上所述，谱定理表明正方形矩阵可以对角化当且仅当它是正规的。对于更一般的未必正规的矩阵，我们有类似的结果。当然在一般的情况，有些要求必须放松，例如酉等价性或者最终的矩阵的对角性。所有这些结果在一定程度上利用了特征值和特征向量。下面列出了一些这样的结果：

舒尔三角形式表明任何矩阵酉等价于一个上三角矩阵；
奇异值分解定理， A = U∑V * 其中∑为对角阵，而U,V为酉矩阵。A = U∑V * 的对角线上的元素非负，而正的项称为A的奇异值。这对非正方形矩阵也成立；
若当标准型，其中A = U∧U − 1 其中∧不是对角阵，但是分块对角阵，而U是酉矩阵。若当块的大小和个数由特征值的几何和代数重次决定。若当分解是一个基本的结果。从它可以立即得到一个正方形矩阵可以完全用它的特征值包括重次来表述，最多只会相差一个酉等价。这表示数学上特征值在矩阵的研究中有着极端重要的作用。
作为若当分解的直接结果，一个矩阵A可以“唯一”地写作A = S + N其中S可以对角化，N是幂零的（也即，对于某个q，Nq=0），而S和N可交换(SN=NS)。
任何可逆矩阵A可以唯一地写作A = SJ，其中S可对角化而J是么幂矩阵 (也即，使得特征多项式是(λ-1)的幂，而S和J可交换)。

特征值的一些另外的属性
谱在相似变换下不变: 矩阵A和P-1AP有相同的特征值，这对任何矩阵A和任何可逆矩阵 P都成立。谱在转置之下也不变：矩阵A和AT有相同的特征值。

因为有限维空间上的线性变换是双射当且仅当它是单射，一个矩阵可逆当且仅当所有特征值都不是0。

若当分解的一些更多的结果如下：

一个矩阵是对角阵当且仅当代数和几何重次对于所有特征值都相等。特别的有，一个n×n矩阵如果有n不同特征值，则总是可以对角化的。
矩阵作用的向量空间可以视为其广义特征向量所撑成的不变子空间的直和。对角线上的每个块对应于该直和的一个子空间。若一个块是对角化的，其不变子空间是一个特征空间。否则它是一个广义特征空间，如上面所定义；
因为迹，也就是矩阵主对角线元素之和，在酉等价下不变，若当标准型说明它等于所有特征值之和；
类似的有，因为三角矩阵的特征值就是主对角线上的项，其行列式等于等于特征值的乘积（按代数重次计算出现次数）。
正规矩阵的一些子类的谱的位置是：

一个厄尔米特矩阵(A = A*)的所有特征值是实数。进一步的有，所有正定矩阵(v*Av > 0 for all vectors v)的所有特征值是正数；
所有斜厄尔米特矩阵(A = −A*)的特征值是纯虚数；
所有酉矩阵(A-1 = A*)的特征值绝对值为1;
假设A是一个m×n矩阵，其中m ≤ n，而B是一个n×m矩阵。则BA有和AB相同的特征值加上n − m个等于0的特征值。

每个矩阵可以被赋予一个算子范数。算子范数是其特征值的模的上确界，因而也是它的谱半径。该范数直接和计算最大模的特征值的幂法直接相关。当一个矩阵是正规的，其算子范数是其特征值的最大模，并且独立于其定义域的范数。

共轭特征向量
一个共轭特征向量或者说共特征向量是一个在变换下成为其共轭乘以一个标量的向量，其中那个标量称为该线性变换的共轭特征值或者说共特征值。共轭特征变量和共轭特征值代表了和常规特征向量和特征值相同的信息和含义，但是在交替坐标系统被使用的时候出现。对应的方程是：

例如，在相干电磁散射理论中，线性变换A代表散射物体施行的作用，而特征向量表示电磁波的极化状态。在光学中，坐标系统按照波的观点定义，称为前向散射对齐 (FSA)，从而导致了常规的特征值方程，而在雷达中，坐标系统按照雷达的观点定义，称为后向散射对齐 (BSA)，从而给出了共轭特征值方程。

广义特征值问题
一个广义特征值问题(第二种意义)有如下形式

其中A和B为矩阵。其广义特征值(第二种意义)λ 可以通过求解如下方程得到

形如A − λB的矩阵的集合，其中λ是一个复数，称为一个“铅笔”。若B可逆，则最初的问题可以写作如下形式

也即标准的特征值问题。但是，在很多情况下施行逆操作是不可取的，而广义特征值问题应该如同其原始表述来求解。

如果A和B是实系数的对称矩阵，则特征值为实数。这在上面的第二种等价表述中并不明显，因为矩阵B − 1A未必是对称的。

这里的一个例子是分子轨道应用如下。

系数为环中元素
在方矩阵A，其系数属于一个环的情况，λ称为一个右特征值如果存在一个列向量x使得Ax=λx，或者称为一个左特征值如果存在非零行向量y使得yA=yλ。

若环是可交换的，左特征值和右特征值相等，并简称为特征值。否则，例如当环是四元数集合的时候，它们可能是不同的。
若向量空间是无穷维的，特征值的概念可以推广到谱的概念。谱是标量λ的集合，对于这些标量，没有定义，也就是说它们使得没有有界逆。

很明显，如果λ是T的特征值，λ位于T的谱内。一般来讲，反过来并不成立。在希尔伯特空间或者巴拿赫空间上有一些算子完全没有特征向量。这可以从下面的例子中看到。在希尔伯特空间(所有标量级数的空间，每个级数使得收敛)上的双向平移没有特征向量却有谱值。

在无穷维空间，有界算子的谱系总是非空的，这对无界自共轭算子也成立。通过检验谱测度，任何有界或无界的自共轭算子的谱可以分解为绝对连续，离散，和孤立部分。指数增长或者衰减是连续谱的例子，而振动弦驻波是离散谱例子。氢原子是两种谱都有出现的例子。氢原子的束缚态对应于谱的离散部分，而离子化状态用连续谱表示。图3用氯原子的例子作了解释。
应用
薛定谔方程
一个变换用微分算子代表的特征值方程的例子是量子力学中的时不变薛定谔方程

HΨE = EΨE
其中H是哈密尔顿算子，一个二阶微分算子而ΨE是波函数，对应于特征值E的特征函数，该值可以解释为它的能量。

图4. 一个氢原子中的一个电子的束缚态所对应的波函数可以视为氢原子哈密尔顿算子的一个特征向量，也是角动量算子的一个特征向量。它们对应于可以解释为它们的能量(递增：n=1,2,3,...)和角动量(递增：s, p, d,...)的特征值。这里画出了波函数绝对值的平方。更亮区域对应于位置测度的更高概率密度。每幅图的中心都是原子核，一个质子但是，在这个情况我们只寻找薛定鄂方程的束缚态解，就像在量子化学中常做的那样，我们在平方可积的函数中寻找ΨE。因为这个空间是一个希尔伯特空间，有一个定义良好的标量积，我们可以引入一个基集合，在其中ΨE和H可以表示为一个一维数组和一个矩阵。这使得我们能够用矩阵形式表达薛定鄂方程。(图4代表氢原子哈密尔顿算子的最低能级特征函数。）

狄拉克记法经常在这个上下文中使用，以强调状态的向量和它的表示，函数ΨE之间的区别。在这个情况下，薛定鄂方程写作

并称是H的一个本征态(H有时候在入门级课本中写作)，H被看作是一个变换（参看观测值）而不是一个它用微分算子术语进行的特定表示。在上述方程中，理解为通过应用H到得到的一个向量。

分子轨道
在量子力学中，特别是在原子物理和分子物理中，在Hartree-Fock理论下，原子轨道和分子轨道可以定义为Fock算子的特征向量。相应的特征值通过Koopmans定理可以解释为电离势能。在这个情况下，特征向量一词可以用于更广泛的意义，因为Fock算子显式地依赖于轨道和它们地特征值。如果需要强调这个特点，可以称它为隐特征值方程。这样地方程通常采用迭代程序求解，在这个情况下称为自洽场方法。在量子化学中，经常会把Hartree-Fock方程通过非正交基集合来表达。这个特定地表达是一个广义特征值问题称为Roothaan方程。

因子分析
在因素分析中，一个协变矩阵的特征向量对应于因素，而特征值是因素负载。因素分析是一种统计学技术，用于社会科学和市场分析、产品管理、运筹规划和其他处理大量数据的应用科学。其目标是用称为因素的少量的不可观测随机变量来解释在一些可观测随机变量中的变化。可观测随机变量用因素的线性组合来建模，再加上“残差项。

图5. 特征脸是特征变量的例子特征脸
在图像处理中，脸部图像的处理可以看作分量为每个像素的辉度的向量。该向量空间的维数是像素的个数。一个标准化面部图形的一个大型数据集合的协变矩阵的特征向量称为特征脸。它们对于将任何面部图像表达为它们的线性组合非常有用。特征脸提供了一种用于识别目的的数据压缩的方式。在这个应用中，一般只取最大那些特征值所对应的特征脸。

惯量张量
在力学中，惯量的特征向量定义了刚体的主轴。惯量是决定刚体围绕质心转动的关键数据。

应力张量
在固体力学中，应力张量是对称的，因而可以分解为对角张量，其特征值位于对角线上，而特征向量可以作为基。因为它是对角阵，在这个定向中，应力张量没有剪切分量；它只有主分量。