复数、复向量与复矩阵
复数
共轭
运算性质:
实矩阵有共轭特征根:
极坐标表示
欧拉公式 $e^{i\theta} = \cos\theta + i \sin\theta$
例:
由$\cos3\theta + i \sin 3\theta = e^{i3\theta} = (e^i\theta)^3 = (\cos\theta + i \sin\theta)^3$导出三倍角公式。
单位根
方程$z^n = 1$有$n$个根,记作$1, \omega, \omega^2, \cdots, \omega^{n-1}$。
范德蒙行列式:
傅里叶矩阵——特殊的范德蒙矩阵
埃尔米特矩阵和酉矩阵
复向量空间
复向量与复矩阵:
向量内积:
注意:$u^\mathrm H v \neq v^\mathrm H u$,也即$(u, v) \neq (v, u)$
另一种可能的定义方式:$(u, v) := u^\mathrm T \bar v$
埃尔米特矩阵
实对称矩阵$S=S^\mathrm T$的性质:
- 所有特征值为实数
- 属于不同特征值的特征向量两两相交
- 可对角化。$S=Q\Lambda Q^\mathrm T$,$Q$为正交阵($QQ^\mathrm T = I$)。
埃尔米特矩阵的性质:
- 所有特征值为实数
- $\forall z \in \mathbb C^n, z^\mathrm H Sz \in \mathbb R$
- 属于不同特征值的特征向量两两正交
反埃尔米特矩阵的非零特征值为纯虚数。
酉矩阵
正交阵$Q^\mathrm T Q = I$
酉矩阵的性质:
- 保长度$||Qz||=||z||$
- 特征值的绝对值为$1$
- 行列式的模为$1$
例:
列向量互相正交,(单位化的)傅里叶矩阵是酉矩阵,$F_3^{-1}=F_3^\mathrm H$。
快速傅里叶变换(略)
酉空间与酉变换
欧几里得空间与酉空间
欧几里得空间
设$V$是实数域上的线性空间,若对于$V$中任意两个元素$\alpha, \beta$,都定义了内积运算$(\alpha, \beta)$,且满足:
- $(\alpha, \beta) = (\beta, \alpha)$
- $(k \alpha, \beta) = k(\alpha, \beta)$
- $(\alpha + \beta, \gamma) = (\alpha, \gamma) + (\beta, \gamma)$
- $(\alpha, \alpha) \ge 0$,且$(\alpha, \alpha) = 0 \Leftrightarrow \alpha = \theta$
则称$V$是欧几里得空间。
欧氏空间的例子:$n$维向量空间$\mathbb R^n$
可以定义长度$||\alpha|| = \sqrt{(\alpha, \alpha)}$与夹角$<\alpha, \beta> = arccos \frac{(\alpha, \beta)}{||\alpha|| \cdot ||\beta||}$
酉空间
设$V$是复数域上的线性空间,若对于$V$中任意两个元素$\alpha, \beta$,都定义了内积运算$(\alpha, \beta)$,且满足:
- $(\alpha, \beta) = \overline{(\beta, \alpha)}$
- $(k \alpha, \beta) = k(\alpha, \beta) = (\alpha, \bar k \beta)$
- $(\alpha + \beta, \gamma) = (\alpha, \gamma) + (\beta, \gamma)$
- $(\alpha, \alpha) \ge 0$,且$(\alpha, \alpha) = 0 \Leftrightarrow \alpha = \theta$
则称$V$是酉空间。
酉空间的例子:
$n$维复向量空间$\mathbb C^n$,内积$(\alpha, \beta) := \alpha ^ \mathrm T \bar \beta$
$n$阶复矩阵空间$M_n(\mathbb C)$,内积$(A, B) := tr(A\bar B ^\mathrm T)$
定义模:$|\alpha| = \sqrt{(\alpha, \alpha)}$。
柯西-施瓦兹不等式:
正交:$\alpha \perp \beta \Leftrightarrow (\alpha, \beta) = 0$
两两正交的非零向量组线性无关。
施密特正交化
$\alpha_1, \alpha_2, \alpha_3, \cdots, \alpha_n$为酉空间$V$中的一组基。
$\epsilon_1, \epsilon_2, \epsilon_3, \cdots, \epsilon_n$为酉空间$V$中的一组标准正交基。
可逆复方阵的UR分解:
设$A \in M_n(\mathbb C)$可逆,则$\exists U, R \in M_n(\mathbb C)$,使
其中$U$为酉矩阵,$R$为上三角矩阵(对角线上为正实数)。
酉、正规、埃尔米特变换
酉变换
设$\sigma$是酉空间$V$的一个线性变换,若对$\forall \alpha, \beta \in V$,
则称$\sigma$为酉变换。
酉变换的等价命题:
- $\sigma$是酉变换
- $\forall \alpha \in V, |\sigma \alpha| = |\alpha|$
- $\sigma$将一组标准正交基变为另一组标准正交基
- $\sigma$在任意一组标准正交基下的矩阵是酉矩阵
共轭变换
设$\sigma$是酉空间$V$的一个线性变换,若$V$上线性变换$\sigma^\ast $满足
则称$\sigma^\ast $是$\sigma$的共轭变换。
设$\sigma$和$\sigma^\ast $在一组标准正交基下的矩阵分别为$A, A^\ast $,则$A^\ast = A^H$。
恒等变换的共轭变换是恒等变换
酉变换的共轭变换是其逆变换
埃尔米特变换的共轭变换是其自身
共轭变换的性质:
- $(\sigma^\ast)^\ast = \sigma$
- $(k\sigma)^\ast = \bar k \sigma^\ast $
- $(\sigma + \tau)^\ast = \sigma^\ast + \tau^\ast $
- $(\sigma \tau)^\ast = \tau^\ast \sigma^\ast $
正规变换
设$\sigma$是酉空间$V$的一个线性变换,若
则称$\sigma$是正规变换。
恒等变换、酉变换、埃尔米特变换都是正规变换。
若$\sigma$是酉空间$V$的正规变换,$\lambda$是$\sigma$的特征值,$\zeta$是对应的一个特征向量。则$\zeta$也是$\sigma^\ast$的属于$\bar \lambda$的特征向量。
证明:
$(\sigma - \lambda \epsilon)^\ast = \sigma^\ast - \bar \lambda \epsilon$,$((\sigma - \lambda \epsilon)\zeta, (\sigma - \lambda \epsilon)\zeta) = 0$。
由$\sigma\sigma^\ast = \sigma^\ast\sigma$,有$(\sigma - \lambda \epsilon)(\sigma - \lambda \epsilon)^\ast = (\sigma - \lambda \epsilon)^\ast(\sigma - \lambda \epsilon)$,则
设$\sigma$是正规变换,则$\sigma$属于不同特征值的特征向量相互正交。
设$\sigma$是$n$维酉空间中的正规变换,则$V$中存在一组标准正交基,使得$\sigma$在这组基下的矩阵是对角矩阵。
证明:
使用归纳法,设$\sigma$在$V$中有特征值$\lambda_1$,$\eta_1$是对应的特征向量。
设$M$为$L(\lambda_1)$的正交补$L(\lambda_1)^\perp$。
证明$M$是$\sigma$和$\sigma^\ast$的不变子空间。
将$\sigma$限制到$M$上,$\sigma|_M$是正规变换。
由归纳假设,$M$存在一组标准正交基$\eta_2, \eta_3, \cdots, \eta_n$,使得
而$\eta_1, \eta_2, \eta_3, \cdots, \eta_n$也是$V$中的一组标准正交基。
正规变换在标准正交基下的矩阵称为正规矩阵。
正规矩阵$A$有性质$AA^\mathrm H = A^\mathrm H A$。
任意正规矩阵$A$,存在酉矩阵$U$,使得
正规矩阵$A$的对角化方法
求特征值$\lambda_i$
对每个特征值求特征向量,即$(\lambdaiI-A)x = 0$的基础解系$\alpha{i1}, \alpha{i2}, \cdots, \alpha{im_i}$。
对每组特征向量做施密特正交化,得到特征子空间$V_{\lambda_i}$的标准正交基。
各特征子空间正交,合并标准正交基,令酉矩阵
埃尔米特变换
设$\sigma$是酉空间$V$的一个线性变换,若对$\forall \alpha, \beta \in V$,
也即
则称$\sigma$为埃尔米特变换。
埃尔米特变换的特征值都是实数。
设$\sigma$是酉空间$V$上的埃尔米特变换,$W$是$\sigma$的不变子空间,则$W^\perp$也是$\sigma$的不变子空间。
埃尔米特二次型
埃尔米特二次型
$n$个复变量$x_1, x_2, \cdots, x_n$的二次齐次函数
称为埃尔米特二次型。
令$A = (a_{ij})$,$A$是埃尔米特矩阵。
故$f$为实值函数。
任意埃尔米特二次型$f = x^\mathrm HAx$,存在满秩线性替换$x = Cy$,化为
埃尔米特二次型的规范形。其中$r$为埃尔米特二次型矩阵$A$的秩,也称为埃尔米特二次型的秩$p$,$p$称为正惯性指数,$r-p$称为负惯性指数,$p - (r-p) = 2p - r$称为符号差。
正定、半正定、负定
设$f = x^\mathrm HAx$是埃尔米特二次型。
- 若对于$\forall x \neq 0, x^\mathrm H A x > 0$,则称$f$是正定的。
- 若对于$\forall x \neq 0, x^\mathrm H A x < 0$,则称$f$是负定的。
- 若对于$\forall x \neq 0, x^\mathrm H A x \ge 0$,则称$f$是半正定的。
- 若对于$\forall x \neq 0, x^\mathrm H A x \le 0$,则称$f$是半负定的。
- 否则,称$f$是不定的。
设$A$是$n$阶埃尔米特矩阵,以下命题等价:
- $A$正定
- 以$A$为矩阵的埃尔米特二次型正惯性指数等于矩阵的秩等于$n$
- 存在可逆复方阵$P$,使$P$复合同于$I$,即$P^\mathrm HAP = I$
- 存在可逆复方阵$C$,使$A = C^\mathrm H C$
- $A$的特征值全是正实数
- 存在主对角线上均是正实数的上三角复矩阵$R$,使$A = R^\mathrm H R$
- $A$的所有主子式都大于$0$
- $A$的所有顺序主子式都大于$0$
设$A$是$n$阶埃尔米特矩阵,以下命题等价:
- $A$半正定
- 以$A$为矩阵的埃尔米特二次型正惯性指数$p$等于矩阵的秩但小于$n$
- 存在可逆复方阵$P$,使$P^\mathrm HAP = diag(I_r, \mathbf 0)$
- 存在复方阵$C$,使$A = C^\mathrm H C$
- $A$的特征值全是非负实数
若尔当标准型
极小多项式、商空间和三角化
极小多项式
设$F$为数域,$A \in M_n(F)$,$f(x) \in F[x]$为$F$上的多项式。
若$f(A) = 0$,则称$f(x)$是$A$的化零多项式。
Hamilton-Cayley定理:
$A$的特征多项式$f_A(\lambda) = |\lambda I-A|$是$A$的化零多项式。
设$A \in M_n(F)$,$A$的化零多项式中次数最低的首项系数为$1$的多项式叫做$A$的极小多项式,记作$m_A(x)$。
设$A \in M_n(F)$,$\forall f(x) \in F[x]$,
$\Rightarrow$:
由带余除法,$f(x) = q(x)m_A(x) + r(x),\deg r(x) < \deg m_A(x)$
而$r(A)$不是化零多项式,$r(x) = 0$
相似矩阵有相同的极小多项式。
$A \sim B, A = C^{-1}BC$。
证明$m_A(x) | m_B(x), m_B(x) | m_A(x)$
商空间
$V$是数域$F$上的线性空间,$W$是$V$的子空间。对于$\alpha, \beta \in V$,若$\alpha - \beta \in W$,则称$\alpha$与$\beta$模$W$同余,记作$\alpha \equiv \beta \pmod W$。
模$W$同余是一种等价关系,因为它满足反身性、对称性、传递性。
定义模$W$的同余类$\alpha + W = {\alpha + \beta | \beta \in W}$,$\alpha$叫做这个同余类的一个代表。
同余类的性质:
- 同余类与选取的代表无关
- 两个模$W$的同余类或者完全相等,或者没有公共元素
按模$W$同余这一等价关系定义的等价类的集合$\overline V = {\alpha + W | \alpha \in V}$称为线性空间$V$的商集。
$\overline V$中元素定义加法与数乘运算:
- $(\alpha + W) + (\beta + W) = (\alpha + \beta) + W$
- $k(\alpha + W) = k\alpha + W$
$\overline V$中运算满足线性空间的七条公理,称为$V$的商空间,记作$V/W$。
$\dim V/W = \dim V - \dim W$
诱导变换
设$\sigma$是线性空间$V$上的一个线性变换,$W$是$\sigma$的不变子空间。
在商空间$V/W$上定义变换$\tau:V/W \to V/W$,$\tau(\alpha + W) = \sigma(\alpha) + W$。
易验证$\tau$是线性变换,称为$\sigma$诱导的变换。
诱导变换的矩阵
设$\dim W = r$,
所以
矩阵的三角化
设$\sigma$是复数域$\mathbb C$上的线性空间$V$的一个线性变换,则$\sigma$的任意真不变子空间必包含在一个维数增加$1$的不变子空间中。
证明:
取$V$的真不变子空间$W$,设$\tau:V/W \to V/W$为$\sigma$的诱导变换。
设$\lambda$是$\tau$的特征值,$\tau(\alpha + W) = \lambda(\alpha + W) = (\lambda\alpha + W)$。
于是$\sigma\alpha = \lambda \alpha + w, w \in W$。
令$U = L(\alpha \cup W)$。$\forall \gamma \in U, \gamma = k\alpha + \beta, \beta \in W$。
$\therefore \sigma \gamma = \sigma(k\alpha + \beta) = k(\lambda \alpha + w) + \sigma \beta = k\lambda \alpha + kw + \sigma \beta \in U$
从子空间$W_0={\theta}$开始,依次构造维数递增$1$的不变子空间${\theta} = W_0 \subset W_1 \subset W_2 \subset \cdots \subset W_n = V$。
可以在$V$中取一组基$\varepsilon_1, \varepsilon_2, \cdots, \varepsilon_n$,使$\sigma$在这组基下的矩阵为三角阵。
Schur定理:任意$n$阶复方阵总相似于上(下)三角矩阵。
循环矩阵和空间直和分解
子空间的直和
若$W_1, W_2$是$V$的子空间,$\forall \alpha \in W_1+W_2$,$\alpha = \alpha_1 + \alpha_2$分解是唯一的,其中$\alpha_1 \in W_1, \alpha_2 \in W_2$。
则称$W_1 + W_2$是$W_1$和$W_2$的直和,记作$W_1 \oplus W_2$。
直和的例子:平面$\mathbb R^2$中的$x$轴与$y$轴。
$W_1 + W_2$是直和的充要条件:
- 零向量表示唯一($\theta = \alpha_1 + \alpha_2,\alpha_1 \in W_1, \alpha_2 \in W_2 \ \Rightarrow \ \alpha_1 = \alpha_2 = \theta$)
- $W_1 \cap W_2 = {\theta}$
- $\dim(W_1 + W_2) = \dim(W_1) + \dim(W_2)$
幂零变换和循环变换
设$\sigma \in L(V)$,若$\exists m \in \mathbb N,\sigma^m = 0$,则称$\sigma$是幂零变换,满足性质的最小的$m$称为$\sigma$的幂零次数。
幂零变换的所有特征值都是$0$。非零变换的幂零变换不可对角化。
设$A \in M_n$,若$\exists m \in \mathbb N, A^m = 0$,则称$A$是幂零矩阵。
设$\sigma \in L(V),\alpha \in V$。若$\alpha, \sigma\alpha, \sigma^2\alpha, \cdots, \sigma^{n-1}\alpha$构成$V$的一组基,且$\sigma^n\alpha = \theta$。则称$\sigma$是一个循环变换,$\alpha, \sigma\alpha, \cdots, \sigma^{n-1}\alpha$,由循环基生成的子空间叫循环子空间。
循环变换在循环基下的矩阵称为循环矩阵,形如
循环变换是特殊的幂零变换,幂零次数等于$n$。
循环子空间是不变子空间。
对于复数域上线性空间$V$的任意幂零变换$\sigma$,$V$必可以分解成若干循环子空间的直和:
使$\sigma$限制在每一个循环子空间上的变换$\sigma|_{T_i}$是循环变换。
记$W_i=Im \ \sigma^i, i = 0, 1, 2, \cdots, m$。
$\because\sigma^{i+1}\alpha = \sigma^i(\sigma \alpha)$
$\therefore Im \ \sigma^{i+1} \subset Im \ \sigma^i$
${\theta} = Wm \subset W{m-1} \subset \cdots \subset W_0 = V$
$Wm = {\theta}, W{m-1} \subset \ker \sigma$。
记$\dim W{m-1} = p{m-1}$,在$W{m-1}$中取一组基$\varepsilon^{(m-1)}_1, \varepsilon^{(m-1)}_2, \cdots, \varepsilon^{(m-1)}{p_{m-1}}$。
则$\sigma \varepsilon^{(m-1)}i = \theta, i = 1, 2, \cdots, p{m-1}$。
在$W{m-2}$中有一组元素$\varepsilon^{(m-2)}_1, \varepsilon^{(m-2)}_2, \cdots, \varepsilon^{(m-2)}{p{m-1}}$满足$\sigma \varepsilon^{(m-2)}_i = \varepsilon^{(m-1)}_i, i = 1, 2, \cdots, p{m-1}$。
可以证明
线性无关。
将$\varepsilon^{(m-2)}1, \varepsilon^{(m-2)}_2, \cdots, \varepsilon^{(m-2)}{p{m-1}}$扩充为$W{m-2}$的一组基,使得被扩充的基元素在$\ker \sigma$里。
设$\dim W{m-2} - \dim W{m-1} = p_{m-2}$,则
是$W{m-2}$的基,其中$\sigma \varepsilon^{(m-2)}{p{m-1}+j} = \theta, j = 1, 2, \cdots, p{m-2} - p_{m-1}$。
同理一步步构造出$W{m-3}, W{m-4}, \cdots, W_{0} =V$的基:
每一列的基元素构成一个$\sigma$的循环子空间$Ti, i = 1, 2, \cdots, p_0$,$\sigma|{T_i}$是循环变换。
将基${\varepsilon^{(j)}i}$从上到下,从左到右顺序排列,$\sigma$在这组基下的矩阵就是$diag(N_1, N_2, \cdots, N{p_0})$,其中$N_i$为循环矩阵,阶数为循环子空间$T_i$的维数。
根子空间与空间分解定理
根向量与根子空间
设$\sigma \in L(V)$,$\lambda$是$\sigma$的特征值,$\alpha \in V$。若存在$m \in \mathbb N$,使得
则称$\alpha$是属于特征值$\lambda$的根向量。
设$\sigma \in L(V)$,任意$\lambda$,令
则:
- $U_\lambda$是$V$的子空间
- $U_\lambda$是$\sigma$的不变子空间
- $U_\lambda \neq {\theta} \Leftrightarrow \lambda$是$\sigma$的特征值
设$\sigma \in L(V)$,$\lambda$是$\sigma$的特征值,$U_\lambda$由所有属于$\lambda$的根向量构成,称为特征值$\lambda$的根子空间。
$(\sigma - \lambda \varepsilon)|{U\lambda}$是幂零变换。
当$\mu \neq \lambda$时,$(\sigma - \mu \varepsilon)|{U\lambda}$是可逆变换。
可逆变换$\Leftrightarrow$双射$\Leftrightarrow$$\dim \ker \sigma = 0$(有限维线性空间$V$上线性变换$\sigma$满足$\dim \ker \sigma + \dim \mathrm{Im} \sigma = \dim V$)
设$(\sigma - \mu \varepsilon)\alpha = \theta$,$\sigma \alpha = \mu \alpha$。
则$(\sigma - \lambda \varepsilon)\alpha = (\mu - \lambda) \alpha$。
又$(\sigma - \lambda \varepsilon)|{U\lambda}$是幂零变换,特征值为$0$。
$\therefore \alpha = \theta, \dim \ker \sigma = 0$
设$\sigma$有$s$个不同的特征值$\lambda_1, \lambda_2, \cdots, \lambda_s$,对应的根子空间为$U_1, U_2, \cdots, U_s$,则根子空间$U_1, U_2, \cdots, U_s$的和$U_1 + U_2 + \cdots + U_s$是直和。
证明:
证零元素表示唯一,即
数学归纳法,$\exists m \in \mathbb N$,使得
令
由归纳假设,
又由$(\sigma - \lambdas \varepsilon)|{U_i}$是可逆变换,
故
对于$\sigma$的特征值$\lambda$,根子空间$U_\lambda$的维数等于$\lambda$的代数重数。
证明:
设特征值$\lambda0$的代数重数为$n_0$,$\dim U{\lambda} = s$。
在$U_\lambda$中选一组基,扩充为$V$的基。
在这组基下$\sigma$的矩阵
$\sigma$的特征多项式
自然地,$s \le n_0$。
若$s < n0$,$(\lambda - \lambda_0) | \det(\lambda I - D)$。记$\tau : V/U{\lambda0} \to V / U{\lambda0}$是$\sigma$的诱导变换,$\lambda_0$是$\tau$的特征值,设$\alpha + U{\lambda_0}$是对应的特征向量。
因此
矛盾。
空间分解定理和若尔当标准形定理
设$V$是复数域上$n$维线性空间,$\sigma \in L(V)$,$\lambda_1, \lambda_2, \cdots, \lambda_s$是$\sigma$的全部相异特征值,代数重数分别为$n_0, n_1, \cdots, n_s$。特征多项式$f(\lambda) = \det(\lambda \varepsilon - \sigma) = (\lambda - \lambda_1)^{n_1}(\lambda - \lambda_2)^{n_2}\cdots(\lambda - \lambda_s)^{n_s}$,则
形如
的矩阵称为若尔当块,由若尔当块构成的准对角矩阵称为若尔当标准形。
设$V$是复数域$\mathbb C$上的线性空间,$\sigma \in L(V)$,则存在一组基,使$\sigma$在这组基下的矩阵是若尔当标准形。
证明:
$V$可以分解为根子空间$U{\lambda_1}, U{\lambda2}, \cdots, U{\lambda_s}$的直和。
设$\rhoi = (\sigma - \lambda_i \varepsilon)|{U{\lambda_i}}$是幂零变换,$U{\lambdai}$可以分解为循环子空间$T{i1}, T{i2}, \cdots, T{iti}$的直和,使$\rho_i|{T_{ij}}$是循环变换。
在$T_{ij}$上选取一组循环基,$\rho_i$对应的矩阵为循环矩阵$N$。
$\sigma = \rho_i + \lambda_i \varepsilon$,在循环基下对应的矩阵为
即若尔当块。
把所有循环基按顺序排列,即得若尔当标准形。
任意复矩阵与若尔当标准形相似。
若尔当标准形的极小多项式与计算
若尔当标准形的极小多项式
设$A$是准对角矩阵$A=diag(A_1, A_2, \cdots, A_s)$,则$A$的极小多项式是$A_i$的极小多项式的最小公倍式。
证明:
$k$阶若尔当块
的极小多项式为
若尔当标准形的极小多项式为各若尔当块的极小多项式的最小公倍式。
矩阵$A$可对角化$\Leftrightarrow$$A$的极小多项式无重根
若尔当标准形的计算
特征值$\lambdai$对应的特征子空间$U{\lambda_i}$中$j$维循环子空间的数目
若尔当块的数量
例:
设
求$A$的若尔当标准形。
$\lambda_1 = -1, n_1 = 2$:
$t_1 = 2$,基图:
两个一阶若尔当块。
$\lambda_2 = 5, n_2 = 3$:
$t_2 = 2$,基图:
一个一阶若尔当块,一个二阶若尔当块。
P矩阵的计算
由线性方程组$(A - \lambda_i I)x = 0$求得第一行向量$x^{(j)}_1$,由$(A - \lambda_i I) x = x^{(j)}_1$求得对应的$2$级广义特征向量$x^{(j)}_2$,如此求得所有的广义特征向量构成的若干若尔当链,排列即得矩阵$P$,使
矩阵分析初步
矩阵函数的微积分
函数矩阵
以实变量$x$的函数$a_{ij}(x)$为元素的矩阵
称为函数矩阵。其中$A_{ij}(x)$是定义在$[a,b]$上的实函数。
函数矩阵的运算:
- 函数矩阵加法$A(x) + B(x)$
- 函数与函数矩阵的数乘$k(x) A(x)$
- 函数矩阵乘法$A(x)B(x)$
- 函数矩阵的转置$A^\mathrm T(x)$
对于$n$阶函数矩阵$A(x)$,若存在$n$阶函数矩阵$B(x)$,使得对于任意$x \in [a,b]$,都有
则称$A(x)$在$[a,b]$上可逆,$B(x) = A^{-1}(x)$是$A(x)$的逆矩阵。
$n$阶方阵$A(x)$在区间$[a, b]$上可逆 $\Leftrightarrow$ $\det A(x)$在区间$[a, b]$处处不为$0$
且若$A(x)$可逆,则
伴随矩阵
其中$C{ij}(x)$是$a{ij}(x)$的代数余子式。
函数矩阵$A(x)$在$[a, b]$上不恒等于$0$的子式的最高阶数称为$A(x)$的秩。
函数矩阵:可逆 $\Rightarrow$ 满秩,满秩 $\nRightarrow$ 可逆
函数矩阵的微积分
若$A(x) = (a{ij}(x)){m \times n}$的所有元素$a_{ij}(x)$在$x=x_0$处有极限,且
则称$A(x)$在$x = x_0$处有极限,记作
其中$A = (a{ij}){m \times n}$。
设$\lim{x \to x_0}A(x) = A, \lim{x \to x_0}B(x) = B$,有性质:
- $\lim_{x \to x_0}(A(x) \pm B(x)) = A \pm B$
- $\lim_{x \to x_0}(kA(x)) = kA, k \in \mathbb R$
- $\lim_{x \to x_0}(A(x)B(x)) = AB$
若$A(x) = (a{ij}(x)){m \times n}$的所有元素$a_{ij}(x)$在$x=x_0$处连续,即
则称$A(x)$在$x = x_0$处连续,记作
其中$A(x0) = (a{ij}(x0)){m \times n}$。
若$A(x) = (a{ij}(x)){m \times n}$的所有元素$a_{ij}(x)$在$x=x_0$处可导,则称$A(x)$在$x = x_0$处可导,记作
导数性质:
$A(x)$是常数矩阵 $\Leftrightarrow$ $\frac{\mathrm dA(x)}{\mathrm dx} = \mathbf 0$
若$A(x), B(x)$可导,则$A(x) \pm B(x)$也可导,且
若$k(x), A(x)$可导,则$k(x)A(x)$也可导,且
若$A(x), B(x)$可导,$A(x)B(x)$可乘,则$A(x)B(x)$也可导,且
矩阵乘法不满足交换律:
逆矩阵的导数:
两边求导,
若$A(x)$为函数矩阵,$x = f(t)$是$t$的函数,$A(x)$与$f(t)$可导,则
$A(x)$的$k$阶导数:
若$A(x) = (a{ij}(x)){m \times n}$的所有元素$a_{ij}(x)$在区间$[a, b]$上可积,则称$A(x)$在区间$[a, b]$上可积,且
定积分性质:
- $\int_a^b(A(x) \pm B(x))\mathrm dx = \int_a^bA(x)\mathrm dx \pm \int_a^bB(x)\mathrm dx $
- $\int_a^b(kA(x))\mathrm dx = k\int_a^bA(x)\mathrm dx, k \in \mathbb R$
函数向量的线性相关性
设$\alphai(x) = (a{i1}(x), a{i2}(x), \cdots, a{in}(x))^\mathrm T, i = 1, 2, \cdots, m$是在区间$[a, b]$上连续的函数向量。若存在不全为零的实数$k_1, k_2, \cdots, k_m$,使得对于$\forall x \in [a, b]$,
成立,则称在区间$[a, b]$上,$\alpha_1(x), \alpha_2(x), \cdots, \alpha_m(x)$线性相关。否则称为线性无关。
设$\alpha_1(x), \alpha_2(x), \cdots, \alpha_m(x)$是在区间$[a, b]$上连续的函数向量,记
则矩阵$G=(g{ij}){m \times m}$称为$\alpha_1(x), \alpha_2(x), \cdots, \alpha_m(x)$的格拉姆矩阵,$\det G$称为格拉姆行列式。
在区间$[a, b]$上连续的函数向量$\alpha_1(x), \alpha_2(x), \cdots, \alpha_m(x)$线性无关的充要条件是格拉姆矩阵满秩。
证明:
设
两边左乘$\alpha_i^\mathrm T(x)$,对$x$在$[a, b]$上积分
令$k = (k_1, k_2, \cdots, k_m)^\mathrm T$,
$G$满秩 $\Leftrightarrow$ $k$只有零解。
若$G$不满秩,$k$存在非零解。令
设$\alpha_1(x), \alpha_2(x), \cdots, \alpha_m(x)$是在区间$[a, b]$上有$m-1$阶导数的函数向量,记
令
称为$\alpha_1(x), \alpha_2(x), \cdots, \alpha_m(x)$的朗斯基矩阵。
设$W(x)$是$\alpha_1(x), \alpha_2(x), \cdots, \alpha_m(x)$的朗斯基矩阵。若存在某点$x_0 \in [a, b]$,使$W(x_0)$的秩等于$m$,则向量$\alpha_1(x), \alpha_2(x), \cdots, \alpha_m(x)$在$[a, b]$上线性无关。
反证法:
若$\alpha_1(x), \alpha_2(x), \cdots, \alpha_m(x)$线性相关,则存在不全为零的实数$k_i$,使得
逐次求导,
代入$x = x_0$,写成矩阵形式,
记$k = (k_1, k_2, \cdots. k_m)^\mathrm T$,
由$k \neq \mathbf 0$,$W^\mathrm T(x_0)$秩小于$m$,矛盾。
矩阵序列和矩阵级数
矩阵序列
设矩阵序列${Ak} \subseteq M_n(\mathbb C)$,其中$A_k = (a^{(k)}{ij}){n \times n}$。如果$n^2$个数列${a{ij}^{(k)}}$都收敛,则称矩阵序列${Ak}$是收敛的。以数列${a{ij}^{(k)}}$的极限$a{ij}$为元素的矩阵$A = (a{ij}) \in M_n(\mathbb C)$称为矩阵序列${A_k}$的极限,记作
否则称${A_k}$是发散的。
若$A_k \to A, B_k \to B$,有性质:
- $aA_k + bB_k \to aA + bB, a, b\in C$
- $A_kB_k \to AB$
- $PA_kQ \to PAQ, P, Q \in M_n(\mathbb C)$是可逆阵
- 若$A$与$A_k$均可逆,$A^{-1}_k \to A^{-1}$
设$A_k \in M_n(\mathbb C)$,则
的充要条件是$A$的所有特征值的模都小于$1$。
证明:
设$A$的若尔当标准形$J = diag(J_1, J_2, \cdots, J_s)$。
存在可逆阵$P$,使
则
而
于是
矩阵级数
设有矩阵序列$A_1, A_2, \cdots, A_k, \cdots$,称$A_1 + A_2 + \cdots + A_k + \cdots$为矩阵级数,前$k$项的和$S_k = A_1 + A_2 + \cdots + A_k$称为级数的部分和。
若
则称级数$A_1 + A_2 + \cdots + A_k + \cdots$收敛,$S$是级数的和。否则称为发散。
显然,级数收敛的充要条件是$n^2$个数项级数$\sum{k = 1}^{\infty}a{ij}^{(k)}$都收敛。
矩阵级数的性质:
若$\sum{k = 1}^{\infty}A_k$收敛,则$\lim{k \to \infty} A_k = \mathbf 0$
若$\sum{k = 1}^{\infty}A_k = S, \sum{k = 1}^{\infty}Bk = T$,则$\sum{k = 1}^{\infty}(A_k \pm B_k) = S \pm T$
若$\sum{k = 1}^{\infty}A_k = S$,则$\sum{k = 1}^{\infty}(cA_k) = cS, c \in \mathbb C$
若$P, Q \in Mn(\mathbb C)$可逆,$\sum{k = 1}^{\infty}Ak$收敛,则$\sum{k = 1}^{\infty}PA_kQ$也收敛,且
若$\sum_{k = 1}^{\infty}A_k$收敛,则$A$的特征值的模都小于$1$。
设矩阵级数$A1 + A_2 + \cdots + A_k + \cdots$,其中$A_k = (a{ij}^{(k)}) \in Mn(\mathbb C)$。如果$n^2$个数项级数$\sum{k = 1}^{\infty} a_{ij}^{(k)}$都绝对收敛,则称矩阵级数绝对收敛。
矩阵级数$\sum{k = 1}^{\infty} A_k$绝对收敛的充要条件是级数$\sum{k = 1}^{\infty} ||Ak||$收敛,其中$||A_k|| = \max{i, j}|(Ak){ij}|$。
若$P, Q \in Mn(\mathbb C)$可逆,$\sum{k = 1}^{\infty}Ak$绝对收敛,则$\sum{k = 1}^{\infty}PA_kQ$也绝对收敛,且
设$\sum{k = 1}^{\infty}A_k, \sum{k = 1}^{\infty}B_k$是两个矩阵级数,且满足
- $Bk$的所有元素$b{ij}^{(k)} \ge 0$
- $Ak$和$B_k$的对应元素满足$|a{ij}^{(k)}| \le b_{ij}^{(k)}$
- $\sum_{k = 1}^{\infty}B_k$收敛
则$\sum_{k = 1}^{\infty}A_k$绝对收敛。
矩阵函数
矩阵多项式
设$f(x) \in \mathbb C[x], A \in M_n(\mathbb C)$,若
则
称为$m$次矩阵多项式。
计算矩阵多项式:
设$A \in M_n(\mathbb C)$,$A$的所有相异特征值组成的集合叫做矩阵$A$的谱。
设$A \in M_n(\mathbb C)$,$\lambda_1, \lambda_2, \cdots, \lambda_s$是$A$的互异特征值,$A$的极小多项式为
假设给定的函数$f(x)$有足够多阶导数,则
称为$f(x)$关于矩阵$A$的谱上的值。如果$f(x)$关于矩阵$A$的谱上的值都存在,则称函数$f(x)$在$A$的谱上有定义。
$A$的极小多项式$m_A(x)$在$A$的谱上的值均为零。
若$g(x)$在$A$的谱上的值均为零,则$m_A(x) | g(x)$。
证明:
设$A \in M_n(\mathbb C)$,$f(x), g(x)$是多项式,则
$\Rightarrow$:
记
即
$\Leftarrow$:
在$A$的谱上的值为零。
推论:$A$的化零多项式在$A$的谱上的值为零。
矩阵函数
设函数$f(x)$在矩阵$A$的谱上有定义,$g(x)$是任意多项式。若$f(x)$与$g(x)$在$A$的谱上有相同的值
则矩阵函数$f(A)$定义为
$g(A)$称为$f(A)$的定义多项式。
例:
设$A = \begin{bmatrix} 6 & -1 \ 3 & 2 \ \end{bmatrix}, f(x) = e^{2x}$,计算$f(A)$。
$\lambda_1 = 3, \lambda_2 = 5$,拉格朗日插值:
矩阵函数性质:
- $Af(A) = f(A)A$
- 若$f(x) = f_1(x) + f_2(x)$,则$f(A) = f_1(A) + f_2(A)$
- 若$f(x) = f_1(x) f_2(x)$,则$f(A) = f_1(A) f_2(A)$
- 设$A = diag(A_1, A_2, \cdots, A_s)$,$f(A) = diag(f(A_1), f(A_2), \cdots, f(A_s))$
- 若$B = P^{-1}AP$,则$f(B) = P^{-1}f(A)P$
矩阵函数$f(A)$的若尔当表示:
设若尔当块$J_i = \lambda_i I + N \in M_t(\mathbb C)$,若$f(x)$在$\lambda_i$邻域内有$t - 1$阶导数,则
证明:
$Ji$的极小多项式$m{J_i}(x) = (x - \lambda_i)^t$,$f(x)$在$J_i$的谱上的值为$f(\lambda_i), f’(\lambda_i), \cdots, f^{(t-1)}(\lambda_i)$。令
是$f(J_i)$的定义多项式,故
矩阵函数的幂级数表示
设复变量函数$f(x)$是在开圆$|x - \lambda_0| < r$内解析的函数,即在$|x - \lambda_0| < r$内可以展开成幂级数
则只要方阵$A$的所有特征值都在开圆$|x - \lambda_0| < r$内,就有
对若尔当块$J = \lambda I + N$证明即可。
$f(x)$可以在$\lambda$点展开为
记$b_k = \frac{f^{(k)}(\lambda)}{k!}$,
又由$f(x)$也可展开为
于是
故
结合初等函数的幂级数表示,可以求得一些常见初等函数的矩阵函数:
其中谱半径$\rho(A) = \max |\lambda_i|$。
微分方程组的矩阵分析解法
一阶常系数线性微分方程组
其中$A \in M_n(\mathbb C)$,$x$是$t$的$n$维函数向量$(x_1(t), x_2(t), \cdots, x_n(t))^\mathrm T$。
证明:
方程$\frac{\mathrm dx}{\mathrm dt} = Ax$的满足初始条件$x|_{t = 0} = x_0$的解存在且唯一,且
唯一性证明:
设$x(t) = (x_1(t), x_2(t), \cdots, x_n(t))^\mathrm T$是方程的解,且$x(0) = x_0$。
将$x(t)$在$t=0$处展开,
由$x(t)$是方程的解,
故
用特征值与特征向量表示微分方程组的解
希望找到形如
的解。设
其中$\alpha_i \in \mathbb C^n, \alpha_1 \neq \mathbf 0$。
关于$t$逐次求导,
而
故
$\lambda$是$A$的特征值,$\alpha_1$是$A$属于$\lambda$的特征向量。
而
两边左乘$(A - \lambda I)$,
故$\alpha_2$是由$\alpha_1$生成的广义特征向量。
同理,$\alpha_1, \alpha_2, \cdots, \alpha_k$形成一条$A$的属于特征值$\lambda$的若尔当链。
上式定义的$x(t)$是方程组$\frac{\mathrm dx}{\mathrm dt} = Ax$的解,当且仅当$\alpha_1, \alpha_2, \cdots, \alpha_k$构成$A$的一条属于特征值$\lambda$的若尔当链。
由若尔当链定义的解叫做方程组的基本解,它们的线性组合叫一般解。
例:
求$\frac{\mathrm dx(t)}{\mathrm dt} = \begin{bmatrix} 4 & 2 & 2 \ -2 & 0 & -4 \ 0 & 0 & 4 \ \end{bmatrix}x(t)$的一般解。
属于$\lambda = 4$的特征向量$\alpha_1^{(1)} = (0, -1, 1)^\mathrm T$,属于$\lambda = 2$的特征向量$\alpha_2^{(1)} = (2, -2, 0)^\mathrm T$以及广义特征向量$\alpha_2^{(2)} = (1, 0, 0)^\mathrm T$。
所求的一般解为
使用教材:《线性代数与几何(第2版)(下)》,清华大学出版社。