在研究一个数学对象时,我们经常会对它进行分类。比如我们通常把数分为:实数,虚数;实数又分成有理数,无理数;当然也有按照正负来分的。还有整数分成素数(也叫质数)和合数,等等。现在我们谈谈矩阵的分类,以下默认矩阵是方的。
数学中分类一般是按照等价关系划分等价类的
所谓等价关系其实就是满足反身性,对称性,传递性的二元关系(总结一下我们等于号的全部性质就知道了)
矩阵中最常见的三种等价关系分别是
- 相抵等价—-初等变换
- 合同等价—-合同变换
- 相似等价—-相似变换
相抵等价完全由秩确定,合同变换我们一般只针对实对称矩阵处理。相似变化是我们讨论最多的也是最复杂的,我们总想把复杂的东西变简单,对于一个矩阵我们总想做变换把它变成最简单形式(称为标准型),相抵等价的标准型和对称矩阵合同等价的标准型都十分简单,但是很不幸的也是最幸运的是,并非所有的矩阵都可以相似于对角阵,相似变换标准型称为若尔当标准型,以纪念若尔当对矩阵相似变换所做的贡献。
然而今天主题并不是上面的任何一种,而是由伟大的数学家 Issai Schur 提出的酉相似,酉变换的概念和相应定理。
任意复方阵酉相似于上三角矩阵
酉矩阵和酉相似
一个矩阵称为酉矩阵,如果它的共轭转置是它的逆。复矩阵 $A$ 与 $B$ 称为酉相似的,如果存在酉矩阵 $U$ 使得 $B=U^ \star AU$ ,这里$U^ \star$ 表示 $U$ 的共轭转置。
定理 1. 对任意复方阵 $A$,存在酉矩阵 $U$ 使得
其中$\lambda_1,\lambda_2,\cdots,\lambda_n$ 为$A$的全部特征值。
Proof:设 $\alpha_1$ 是$A$的特征值 $\lambda_1$ 对应的特征向量,将 $\alpha_1$ 扩充为$\mathbf{C}^n$的一组标准正交基 $P=(\alpha_1,\alpha_2,\cdots,\alpha_n)$ ,则 $A = P \left( \begin{matrix} \lambda_1 & \star \\ \mathbf{0} & B \end{matrix} \right)P^\star$ 。对复矩阵的阶数应用数学归纳法,存在$n-1$ 阶酉矩阵 $Q$ 使得
因此
其中 $U = P \left( \begin{matrix} 1 & \\ & Q \end{matrix} \right)$ 是 $n$ 阶酉矩阵,证毕。
矩阵酉相似于对角阵当且仅当它是正规矩阵
矩阵 $A$ 称为正规矩阵(normal matrix),如果$ A^ \star A=AA^ \star $。显然酉矩阵,Hermite 阵,反 Hermite 阵都是正规矩阵。
定理 2(Issai Schur)矩阵 $A$ 酉相似于对角阵的充分必要条件是 $A$ 是正规矩阵
Proof:必要性显然,下证明充分性:
由定理 1 知,存在酉矩阵 $U$ 使得:
若 $A$ 是正规矩阵,则有
考虑矩阵两端$(1,1)$位置得到:
其中$ \sigma^2 $是上三角矩阵
的第一行的非对角元绝对值之平方和,因此由 $\sigma^2$ 可知上三角矩阵的第一行非对角元全为 0,类似的考察矩阵两端 $(2,2)$ 的位置,一直到 $(n,n)$ 的位置即可知道上面矩阵是对角阵,证毕。
上述定理给出了酉相似于对角型的充分必要条件,而且条件十分易于判断。整个过程简洁优美。另外由于酉矩阵条件数恒定为 1,有其数值稳定性,因此经常用于实际计算中,例如 QR 方法涉及的两个矩阵变换 Househoulder 变换和 Givens 变换都是酉变换。