1. Прямая сумма линейных подпространств. Пусть $\varepsilon^{n}$ – $n$-мерное векторное пространство (гл. I, §5), элементами которого являются комплексные $n$-векторы:
\[
\boldsymbol{x}=\left[\begin{array}{c}
x_{1} \\
\vdots \\
x_{n}
\end{array}\right],
\]
где $x_{1}, \ldots, x_{n}$ – координаты вектора $\boldsymbol{x}$ в некотором базисе.
Определение 1. Подмножество $\mathfrak{M} \subset \ell^{n}$ называется подпространством линейного пространства $\ell^{n}$, если оно само является линейным пространством относительно введенных в $\ell^{n}$ основных операций умножения на число и сложения, т. е. из условия $\boldsymbol{x}, \boldsymbol{y} \in \mathfrak{M}$ следует, что $\alpha \boldsymbol{x}+\beta \boldsymbol{\beta} \in \mathfrak{M}$, ғде $\alpha$ и $\beta-$ произвольные комплексные числа.
Заметим, что любое подпросгранство $\mathfrak{2}$ содержит нулевой элемент 0 , так как если $\xi \in \mathfrak{M}$, то
\[
0=0 \xi \in \mathfrak{M} \text {. }
\]
Пр и ме р. Совокупность векторов
\[
y=A x,
\]
где $A-(n \times n)$-матрица, очевидно, представляет собой подпространство $\mathfrak{M}$ B $\$ n$.
В частности, при $A=O$ и $A=E$ будем иметь так называемые несобстбенные подпространства $\mathfrak{R}=0$ и $\mathfrak{\eta}=\mathrm{z}^{n}$.
Отметим, что сумма подпространств
\[
\mathfrak{M}_{1}+\mathfrak{M}_{\mathrm{g}} \equiv\{\boldsymbol{x}+\boldsymbol{y}\},
\]
где $x \in \mathfrak{m}_{1}$ и $y \in \mathfrak{m}_{2}$, а также их пересечение
\[
\mathfrak{M}_{1} \cap \mathfrak{M}_{2}
\]
суть также подпространства в $\ell^{n}$.
Пусть $\boldsymbol{x}^{(1)}, \ldots, \boldsymbol{x}^{(k)}$ – максимальное число линейно независимых векторов, содержсцихся в линейном подпространстве 9 . В таком случае
\[
M_{i} \equiv\left\{\alpha_{1} x^{(1)}+\ldots+\alpha_{k} x^{(k)}\right\},
\]
где $\alpha_{1}, \ldots, \alpha_{k}$ – произвольные комплексные числа, т. е. $\boldsymbol{x}^{(1)}, \ldots$ $\ldots, \boldsymbol{x}^{(k)}$ является базисом для 9 . Число $k$ называется размерностью подпространства э)), т. е.
\[
\operatorname{dim} \mathfrak{N}=k
\]
где $0 \leqslant k \leqslant n$.
Обратно, множество
\[
\mathfrak{M}=\left\{\alpha_{1} \boldsymbol{x}^{(1)}+\ldots+\alpha_{k} \boldsymbol{x}^{(k)}\right\},
\]
натянутое на векторы $\boldsymbol{x}^{(1)}, \ldots, \boldsymbol{x}^{(k)}\left(\alpha_{1}, \ldots, \alpha_{k}\right.$ – комплексные числа), является линейным подпространством, причем если данные векторы линейно ғезависимы, то размерность подпространства $\mathfrak{i}$ равна $k$.
Определение 2. Линейное пространство $\mathfrak{2}$ называется прямой суммой (см. [5]) линейных подпространств $\mathfrak{M}_{j}(j=1,2, \ldots, s)$, т. е.
\[
\mathfrak{M}=\mathfrak{M}_{1} \oplus \mathfrak{M}_{2} \oplus \ldots \oplus \mathfrak{M}_{s},
\]
если каждый вектор $x \in \mathfrak{M}$ допускает единственное представление
\[
\boldsymbol{x}=\boldsymbol{x}^{(1)}+\boldsymbol{x}^{(2)}+\ldots+\boldsymbol{x}^{(s)},
\]
где $\boldsymbol{x}^{(j)} \in \mathfrak{M}_{j}(j=1,2, \ldots, s)$.
Из определения 2 вытекает, что соотношение (1) выполнено тогда и только тогда, когда нулевой вектор 0 не допускает нетривиального разложения
\[
0=\xi^{(1)}+\xi^{(2)}+\ldots+\xi^{(s)},
\]
где $\xi^{(j)} \in \mathfrak{M}_{j}(j=1,2, \ldots, s)$, причем не все векторы $\xi^{(j)}$ нулевые.
Очевидно, из (1) следует, что
\[
\mathfrak{M}_{j} \cap \mathfrak{M}_{k}=\mathbf{0} \text { при } j
eq k .
\]
Обратно, если для слагаемых суммы (1) попарно выполнены условия (2), то сумма (1) прямая.
Теорема 1. Если линейное пространство $\mathscr{\ell}^{n}$ представляет прямую сумму подпространств $)_{j}(j=1, \ldots, s)$ :
\[
\mathfrak{q}^{n}=\mathfrak{M}_{1} \oplus \ldots \oplus \mathfrak{M}_{s},
\]
то обтединение любых базисов этих подпространств является базисом пространства $\gtrless^{n}$.
Обратно, если обтединение некоторых базисов подпространств $\mathfrak{M}_{j}\left(j=1, \ldots\right.$, s) есть базис пространства $\mathfrak{\imath}^{n}$, то $\mathfrak{\ell}^{n}$ представляет собой прямую сумму этих подпространств.
Доказательство. 1) Докажем сначала первую часть теоремы, причем доказательство будем проводить для прямой суммы дв ух подпространств
\[
\mathfrak{q}^{n} \equiv \mathfrak{m}^{p} \oplus \mathrm{m}^{q}
\]
размерностей $p$ и $q$. Переход к общему случаю, очевидно, не представляет затруднений.
Пусть $\boldsymbol{y}^{(1)}, \ldots, \boldsymbol{y}^{(p)}$ и $\boldsymbol{z}^{(1)}, \ldots, \boldsymbol{z}^{(q)}-$ некоторые базисы, сооветственно, подпространств м $^{p}$ и $\mathrm{m}^{q}$. Из формулы (3) следует, что для любого вектора $x \in \mathfrak{l}^{n}$ справедливо представление
\[
x=y+z,
\]
где $y \in \mathfrak{M}^{p}$ и $z \in \mathfrak{M}^{q}$. Отсюда
\[
x=\sum_{k=1}^{p} \alpha_{k} y^{(k)}+\sum_{l=1}^{q} \beta_{l} z^{(l)},
\]
где $\alpha_{1}, \ldots, \alpha_{p}$ и $\beta_{1}, \ldots, \beta_{q}$ – координаты векторов $\boldsymbol{y}$ и $\boldsymbol{z}$ в соответствующих базисах. Так как представление (5) единственно, то векторы $\boldsymbol{y}^{(1)}, \ldots, \boldsymbol{y}^{(\rho)}, \boldsymbol{z}^{(1)}, \ldots, \boldsymbol{z}^{(q)}$ линейно независимы и образуют базис пространства е in.
2) Докажем теперь вторую часть теоремы. Пусть для подпространств $\mathfrak{M}^{p}$ и $\mathfrak{M}^{q}$ существуют базисы $\boldsymbol{y}^{(1)}, \ldots, \boldsymbol{y}^{(p)}$ и $\boldsymbol{z}^{(1)}, \ldots, \boldsymbol{z}^{(q)}$, объединение которых есть базис пространства $\ell^{n}$. Тогда для каждого $x \in \mathfrak{e}^{n}$ справедливо разложение (5), и это разложение единственно. Но в таком случае имеет место единственное представление (4) и, следовательно, ел есть прямая сумма подпространств $\mathfrak{m}^{p}$ и $\mathfrak{i}^{q}$.
Следствие. Сумма подпротранств
\[
\mathfrak{M}=\mathfrak{m}_{1}+\ldots+\mathfrak{M}_{s}
\]
является прямой тогда и только тогда, когда
\[
\operatorname{dim} \mathfrak{M}=\sum_{j=1}^{s} \operatorname{dim} \mathfrak{N}_{j}
\]
Определение 3. Пусть
\[
\text { M } \supset \text {. }
\]
– вложенные подпространства линейного пространства $\AA^{n}$.
Векторы $\xi^{(1)}, \ldots, \xi^{(p)}$ из э будем называть линейно независиньми относительно подпространсте $\Re$ (см. [10]), если 1) они линейно независимы и 2) подпространство, натянутое на эти векторы, имеет с $\mathfrak{i}$ лишь нулевое пересечение, т. е.
\[
\sum_{j=1}^{p} \alpha_{j} \xi^{(j)} \in \Re
\]
тогда и только тогда, когда
\[
\alpha_{1}=\gamma_{2}=\ldots=\alpha_{p}=0 .
\]
Заметим, что векторы $\xi^{(1)}, \ldots, \xi^{(p)}$, линейно независимые относительно $\Re=0$, являются линейно независимыми в обычном смысле.
Теорема 2. Пусть
\[
\mathfrak{Q}^{n}=\mathfrak{M}_{m} \supset \mathfrak{M}_{m-1} \supset \ldots \supset \mathfrak{M}_{1} \supset \mathfrak{m}_{0}=0
\]
– цепочка вложенных друг в друга различных подпространств и
\[
\xi_{i}^{(p)}, \ldots, \xi_{p}^{(p)} \quad\left(p=1, \ldots, m ; k_{p} \geqslant 1\right)
\]
– максимальная система векторов из $\mathfrak{M}_{p}$, линейно независимых относительно $9 \Re_{p-1}$. Тогда объединение всех систем (7) представляет базис пространстеа $\mathrm{Q}^{n}$.
Доказательство. Прежде всего, заметим, что полная совокупность векторов (7) является набором линейно независимых векторов пространства $\ell^{n}$. Действительно, пусть
\[
\sum_{j=1}^{k^{m}} \alpha_{j}^{(m)} \hat{\xi}_{j}^{(m)}+\ldots+\sum_{j=1}^{k_{p}} \alpha_{j}^{(p)} \xi_{j}^{(p)}+\ldots+\sum_{j=1}^{k_{1}} \alpha_{j}^{(1) \xi(1)}=0,
\]
где $\alpha_{j}^{(q)}=0$ при $q>p$ и $a_{r}^{(p)}
eq 0$ для некоторого $r \in\left[1, k_{p}\right]$. Тогда $\sum_{j=1}^{k_{p}} \alpha^{(p) \xi_{j}(p)}$ в силу соотишения (8) представляет ненулевой элемент из подпространства, натяғутого на векторы $\xi_{1}^{(p)}, \ldots, \xi_{p}^{p p}$, принадлежащий подпространству М $\mathfrak{p}_{p-1}$, что невозможно.
Докажем теперь, что векторы (7) образуют базис пространства $\ell^{n}$. Доказательство будем проводить методом математической индукции по числу $m$ элементов цепочки (исключая $\mathfrak{N}_{0}$ ).
Если $m=1$, т. е.
\[
\mathfrak{Q}^{n} \equiv \mathfrak{M}_{1} \supset \mathfrak{M}_{0}=0,
\]
то векторы (7) представляют собой максимальную систему линейно независимых векторов в $\ell^{n}$ и, следовательно, образуют его базис.
Предположим теперь, что тєорема верна для любой цепочки вложенных подпространств
\[
\mathfrak{M}_{m-1} \supset \ldots \supset \mathfrak{M}_{1} \supset \mathfrak{M}_{0}=0
\]
содержащей $m-1$ элементов $(m>1$ ), отличных от нуля. Иными словами, мы предполагаем, что базис подпространства $\mathfrak{m}_{m-1}$ может быть построен указанным выше способом. Пусть $\boldsymbol{x} \in \mathfrak{M}_{m}$. Можно предполагать, что векторы
\[
\xi_{1}^{(m)}, \ldots, \xi_{k}^{(m)}, \boldsymbol{x}
\]
линейно независимы, ибо в противном случае вектор $\boldsymbol{x}$ являлся бы линейной комбинацией векторов $\xi_{1}^{(m)}, \ldots, \xi_{k}^{(m)}$ и, следовательно, теорема была бы доказана. Подпространство
\[
\bigodot=\left\{\alpha_{1} \xi_{1}^{(m)}+\ldots+\alpha_{k} \xi_{k_{m}}^{(m)}+\beta \boldsymbol{x}\right\},
\]
натянутое на векторы (9), в силу свойства максимальности системы (7) имеет с подпространством $9 i_{m-1}$ ненулевое пересечение
\[
\boldsymbol{z}=\sum_{j=1}^{k_{m}} a_{j} \boldsymbol{\xi}_{j}^{(m)}+b \boldsymbol{x} \in \mathfrak{M}_{m-1},
\]
где, очевидно, $b
eq 0$. Но на основании индукционного предположения для подпространства $9 i_{n-1}$ теорема верна, т. е. $\boldsymbol{z}$ представляет собой линейную комбинацию векторов $\xi_{1}^{(m-1)}, \ldots$ $\ldots, \xi_{k_{m-1}}^{(m-1)}, \ldots, \xi_{1}^{(1)}, \ldots, \xi_{k_{1}}^{(1)}$. Таким образом, из (10) получаем, что произвольный вектор $x \in{ }^{m} i_{m}$ может быть выражен в виде линейной комбинации векторов f $\left.^{p}\right)$ ( $\left.p=1, \ldots, m ; j=1, \ldots, k_{p}\right)$. Отсюда вытекает, что систеиа векторов (7) есть базис пространства $\&^{n}$, что и требовалось доказать.
Следствие. Для каждого подпространства $\mathfrak{M}^{p}\left(\operatorname{dim} \mathfrak{M}^{p}=p\right.$ ) линейного пространства ${ }^{n}$ существует дополнительное подпространство $\mathfrak{D}^{q}\left(\operatorname{dim} \mathfrak{2}^{q}=q\right)$ такое, что
\[
\mathfrak{Q}^{n}=\mathfrak{M}^{p} \oplus \mathfrak{M}^{q} \quad(p+q=n) .
\]
Действительно, имеем
\[
\mathfrak{R}^{n} \supset \mathfrak{M}^{p} \supset 0 .
\]
В пространстве $\mathfrak{2}^{n}$ выберем максимальную совокупность векторов $\eta^{(1)}, \ldots, \boldsymbol{\eta}^{(q)}$, линейно независимую относительно $\mathfrak{\ell ^ { p }}$, и пусть $\xi^{(1)}, \ldots, \xi^{(p)}$ — максимальная совокупность векторов, линейно независимых относительно 0 , т. е. линейно независимых в обычном смысле. Объединение
\[
\xi^{(1)}, \ldots, \xi^{(p)}, \eta^{(1)}, \ldots, \eta^{(q)}
\]
в силу теоремы 2 представляет базис пространства $\ell^{n}$, поэтому
Отсюда
\[
\begin{array}{c}
p+q=n . \\
\mathfrak{\ell}^{n}=\mathfrak{M}^{p} \oplus \mathfrak{M} \mathfrak{M}^{q},
\end{array}
\]
где $\mathfrak{M}^{q}$ – подпространство, натянутое на векторы $\eta^{(1)}, \ldots, \eta^{(q)}$.
$2^{\circ}$ Инвариантные подпространства. Пусть в векторном пространстве $\ell^{n}$ задано линейное преобразование $\hat{A}$ (гл. $\mathrm{I}, \S 5$ ), переводящее $\mathfrak{q}^{n}$ в самое себя или в свою правильную часть, т. е.
\[
\hat{A} \Re^{n} \subseteq \Re^{n} .
\]
Определение 4. Подпространство $\mathfrak{M} \subset \mathfrak{\ell}^{n}$ называется $и н$ вариантным относительно преобразования $\hat{A}$, если каждый вектор $\boldsymbol{x} \subset \mathfrak{M}$ преобразованием $\hat{A}$ переводится в вектор $\boldsymbol{y}=\hat{A} \boldsymbol{x} \in \mathfrak{M}$, т. е.
\[
\hat{A} \mathfrak{M} \subset \mathfrak{M} \text {. }
\]
Очевидно, нулевое подпросранство и само пространство $\mathfrak{g}^{n}$ инвариантны относительно любого линейного преобразования в $\mathfrak{E}^{n}$.
Кроме того, сумма и пересечение подпространств пространства $\ell^{n}$, инвариантных относительно линейного преобразования $\hat{A}$, суть также подпространства, инвариантные относительно преобразования $\hat{A}$.
Если в пространстве $\mathfrak{R}^{n}$ выбран базис $\boldsymbol{\varepsilon}_{1}, \ldots, \varepsilon_{n}$ и
\[
\left.\begin{array}{c}
\hat{A} \varepsilon_{1}=a_{11} \varepsilon_{1}+\ldots+a_{n 1} \varepsilon_{n}, \\
\cdot \cdot \cdot \cdot \cdot \cdot \cdot \cdot \cdot \cdot \cdot \\
\hat{A} \varepsilon_{n}=a_{1 n} \varepsilon_{1}+\ldots+a_{n n} \varepsilon_{n},
\end{array}\right\}
\]
то преобразованию $\hat{A}$ соответствует матрица (матрица преобразования в данном базисе, гл. I, §5)
\[
A=\left[\begin{array}{ccc}
a_{11} & \ldots & a_{1 n} \\
\cdot & \cdot & \cdot \\
a_{n 1} & \ldots & a_{n n}
\end{array}\right] .
\]
Матрица $A$, очевидно, является транспонированной относительно матрицы системы (11). Отметим, что если $A=\left[a_{j k}\right]$, то $a_{j k}$ представляет собой $j$-ю координату $k$-го преобразованного базисного вектора.
Отсюда для любого вектора
\[
\boldsymbol{x}=\sum_{k} x_{k} \varepsilon_{k}
\]
имеем
\[
\hat{A} \boldsymbol{x}=\sum_{k} x_{k} \hat{A} \boldsymbol{\varepsilon}_{k}=\sum_{k} x_{k} \sum_{j} a_{j k} \varepsilon_{j}=\sum_{j} \boldsymbol{\varepsilon}_{j} \sum_{k} a_{j k} x_{k} .
\]
Таким образом, вектор $\boldsymbol{y}=\hat{A} \boldsymbol{x}$ в данном базисе будет иметь представление
\[
y=A x,
\]
где $A$-матрица преобразования.
Теорема 3. Если линейное пространство распадается в прямую сумму нескольких подпространств:
\[
\mathfrak{g}^{n}=\mathfrak{M}_{1} \oplus \ldots \oplus \mathfrak{M}_{s},
\]
инвариантных относительно данного линейного преобразования $\hat{A}$ в $\ell^{n}$, то в надлежащем базисе матрица $A$ этого преобразования имеет квазидиагональный вид
\[
A=\operatorname{diag}\left(A_{1}, \ldots, A_{s}\right),
\]
где $A_{j}$-квадратные матрицы, соответственно, порядков $n_{j}=$ $=\operatorname{dim})_{j}\left(j=1, \ldots\right.$, s) и $n_{1}+\ldots+n_{s}=n$.
Доказательство (см. [5]). Выберем в подпространствах $\mathfrak{M}_{1}, \mathfrak{N}_{2}, \ldots, \mathfrak{M}_{s}$ соответственно базисы: $\boldsymbol{\varepsilon}_{1}^{(1)}, \ldots, \boldsymbol{\varepsilon}_{n_{1}}^{(1)} ; \boldsymbol{\varepsilon}_{1}^{(2)}, \ldots$ $\ldots, \boldsymbol{\varepsilon}_{n_{2}}^{(2)} ; \ldots ; \boldsymbol{\varepsilon}_{1}^{(s)}, \ldots, \boldsymbol{\varepsilon}_{n_{s}}^{(s)}$. Тогда в силу теоремы 2 их объединение будет базисом пространства $\ell_{n}$. Так как
\[
\hat{A} \mathfrak{M}_{p} \subset \mathfrak{M}_{p} \text { и } \hat{A} \mathfrak{M}_{p} \cap \mathfrak{M}_{q}=0
\]
при $p
eq q(p=1, \ldots, s)$, то
Отсюда, полагая
будем иметь формулу (13).
Замечания. Матрицу $A_{p}(p=1, \ldots, s)$ можно рассматривать как матрицу преобразовсния $\hat{A}_{p}$, индуцируемого данным $15^{*}$ преобразованием $\hat{A}$ на инвариантном подпространстве $\mathfrak{M}_{p}$; иными словами, преобразование $\hat{A}_{p}$ есть преобразование $\hat{A}$, рассматриваемое лишь на подпространстве $\mathfrak{N}_{p}$.
$3^{\circ}$ Алгебра преобразований. Пусть $\hat{A}$ и $\hat{B}$-преобразования, действующие из $\mathfrak{\ell}^{n}$ в $\mathfrak{\ell}^{n}$. Для $\boldsymbol{x} \in \mathfrak{\ell}^{n}$ естественно определяются комбинированные преобразования (см. гл. I, §5):
а) произведение преобразования $\hat{A}$ на скаляр а:
\[
(\alpha \hat{A}) x=\alpha(\hat{A} x)
\]
(в частном случае, если $\alpha=0$, имеем нулевое преобразование
\[
\hat{0} x=0) ;
\]
b) сумма преобразований $\hat{A}$ и $\hat{B}$ :
\[
(\hat{A}+\hat{B}) \boldsymbol{x}=\hat{A} \boldsymbol{x}+\hat{B} \boldsymbol{x} ;
\]
с) произведение преобразований $\hat{A}$ и $\hat{B}$ :
и
\[
\begin{aligned}
(\hat{A} \hat{B}) \boldsymbol{x} & =\hat{A}(\hat{B} \boldsymbol{x}) \\
(\hat{B} \hat{A}) \boldsymbol{x} & =\hat{B}(\hat{A} \boldsymbol{x}) .
\end{aligned}
\]
В общем случае
\[
\hat{A} \hat{B}
eq \hat{B} \hat{A} \text {. }
\]
Вводя единичное преобразование
\[
\hat{E} \boldsymbol{x} \equiv \boldsymbol{x},
\]
можно определить обратное преобразование $\hat{A}^{-1}$ как преобразование (если оно существует), удовлетворяющее условию:
\[
\hat{A}^{-1} \hat{A}=\hat{A} \hat{A}^{-1}=\hat{E} .
\]
Если $\hat{A}^{-1}$ и $\hat{B}^{-1}$ существует, то легко проверить, что
\[
(\hat{A} \hat{B})^{-1}=\hat{B}^{-1} \hat{A}^{-1} .
\]
Обычным способом определяются целые степени преобразований:
\[
\begin{array}{c}
\hat{A}^{2}=\hat{A} \hat{A}, \quad \hat{A}^{3}=\hat{A} \hat{A} \hat{A}, \ldots \\
\hat{A}^{-2}=\hat{A}^{-1} \hat{A}^{-1}, \quad \hat{A}^{-3}=\hat{A}^{-1} \hat{A}^{-1} \hat{A}^{-1}, \ldots
\end{array}
\]
причем
\[
\hat{A}^{0}=\hat{E} \text {. }
\]
Очевидно, при любых целых $p$ и $q$ имеем
\[
\hat{A}^{p} \hat{A}^{q}=\hat{A}^{p+q} .
\]
Используя понятие степени преобразования для заданного полинома
\[
\varphi(z)=a_{0} z^{m}+a_{1} z^{m-1}+\ldots+a_{m}
\]
с числовыми коэффициентами $a_{0}, a_{1}, \ldots, a_{m}$, можно найти соответствующее преобразование
\[
\vartheta(\hat{A})=a_{0} \hat{A}^{m}+a_{1} \hat{A}^{m-1}+\ldots+a_{m} \hat{A}^{0},
\]
где $\hat{A}^{0}=\hat{E}$.
Покажем, что если преобразование $\hat{A}$ линейное (гл. I, §5), то полиномиальное преобразование $\varphi(\hat{A})$ также линейное. Действительно, для любых $\boldsymbol{x}, \boldsymbol{y} \in$ и $^{n}$ и произвольных чисел $\alpha$ и $\beta$ имеем
\[
\begin{array}{l}
\hat{A}^{0}(\alpha x+\beta y)=\alpha x+\beta y=\alpha \hat{A}^{0} x+\beta \hat{A}^{0} y, \\
\hat{A}^{1}(\alpha x+\beta y)=\alpha \hat{A} x+\beta \hat{A} y, \\
\hat{A}^{2}(\alpha x+\beta y)=\hat{A}(\alpha \hat{A} x+\beta \hat{A} y)=\alpha \hat{A}^{2} x+\beta \hat{A}^{2} y, \\
\hat{A}^{m}(\alpha x+\beta y)=\dot{\hat{A}}\left(\dot{\alpha} \hat{A}^{m-1} x+\beta \hat{A}^{m-1} y\right)=\alpha \hat{A}^{m} \dot{x}+\beta \hat{A}^{m} \boldsymbol{y} . \\
\end{array}
\]
Отсюда, умножая эти равенства на коэффициенты $a_{0}, a_{1}, a_{2}, \ldots, a_{n}$ и почленно складывая, получим
\[
\varphi(\hat{A})(\alpha+\boldsymbol{x}+\beta \boldsymbol{y})=\alpha(\hat{A}) \boldsymbol{x}+\beta \varphi(\hat{A}) \boldsymbol{y},
\]
т. е. преобразование $\varphi(\hat{A})$ линейное
Отметим, что если преобразования $\hat{A}$ и $\hat{B}$ линейные, то алгебраическим операциям над этими преобразованиями соответствуют такие же алгебраические операции над их матрицами (в одном и том же базисе).
$4^{\circ}$ Первая теорема приведения. Пусть $\hat{A}$ – линейное преобразование, действующее из $\mathfrak{Q}^{n}$ в $\mathfrak{\ell}^{n}$, и $A-(n \times n)$-матрица этого преобразования в некоторэм базисе.
Многочлен
\[
\Delta(\lambda)=\operatorname{det}(\lambda E-A)
\]
называется характеристическим полиномом преобразования $\hat{A}$ (или матрицы $A$ ), а его корни – характеристическими числами (или собственными значениями) преобразования $A$ (а также матрицы $A$ ).
Как известно, характеристический полином, а следовательно, и характеристические корни преобразования $\dot{A}$ не зависят от выбора базиса.
Согласно теореме Кейли (гл. I, § 10) матрица $A$ является корнем своего характеристического полинома, т. е. полином $\Delta(A)$ аннулирует матрицу $A$ :
\[
\Delta(A)=0 .
\]
Так как алгебра линейных преобразований вполне аналогична алгебре матриц, то преобразование $\hat{A}$ также является корнем своего характеристического полинома, т. е.
\[
\Delta(A)=\hat{0} .
\]
Поэтому полином $\Delta(z)$ может быть назван полиномом, ан нулирующим преобразование $\hat{A}$.
Ненулевой вектор $\boldsymbol{x}$, удовлетворяющий условию
\[
\hat{A} \boldsymbol{x}=\lambda \boldsymbol{x},
\]
где $\lambda$ – некоторое число, называется собственным вектором преобразования $\hat{A}$, отвечающим его собственному значению $\lambda$ (ср. гл. I, $\S 5$ ).
Если $A$ есть матрица данного преобразования $A$ в некотором базисе, то собственные векторы преобразования $A$ в этом базисе могут быть определены как нетривиальные решения однородной линейной системы $(A-\lambda E) \boldsymbol{x}=0$. Поэтому все собственные значения $\lambda$ преобразования $\hat{A}$ являются корнями векового уравнения
\[
\operatorname{det}(\lambda E-A)=0,
\]
причем для каждого корня $\lambda=\lambda_{j}$ существует один или несколько линейно независимых соответствующих собственных векторов преобразования $\hat{A}$.
Пусть $\lambda_{1}, \ldots, \lambda_{m}(m \leqslant n)$ – различные собственные значения преобразования $A$ и $p_{1}, \ldots, p_{m}$ – их кратности $\left(p_{j} \geqslant 1, j=1, \ldots\right.$ $\left.\ldots, m ; p_{1}+\ldots+p_{m}=n\right)$. Тогда, очевидно, имеем
\[
\Delta(z)=\left(z-\lambda_{1}\right)^{p_{1}} \ldots\left(z-\lambda_{m}\right)^{p_{m}}
\]
и, следовательно,
\[
\Delta(\hat{A})=\left(\hat{A}-\lambda_{1} \hat{E}\right)^{p_{1}} \ldots\left(\hat{A}-\lambda_{m} \hat{E}\right)^{p_{m}} .
\]
Определение 5. Совокупность всех векторов $x \in \mathfrak{\ell}^{n}$, удовлетворяющих условию:
\[
\left(\hat{A}-\lambda_{j} \hat{E}\right)^{p}{ }^{j} \boldsymbol{x}=\mathbf{0} \quad(j=1, \ldots, m),
\]
где $p_{j}$-кратность характеристического корня $\lambda_{j}$, будем называть корневым подпространством преобразования $\hat{A}$, принадлежащим его собственному значению $\lambda_{j}{ }^{1}$ ).
1) Обычно (см., например, [5]) под корневым пространством преобразования $\hat{A}$, принадлежащим его собственному значению $\lambda_{\text {j }}$, понимается совокупность всех векторов $x \in \underline{g}$, для которых хотя бы при одном натуральном $k=k[x]$ выполнено соотношение
\[
\left(\hat{A}-\lambda_{j} E\right)^{k} \boldsymbol{x}=\mathbf{0} .
\]
Так как впоследствии доказывается, что при построении корневого подпро-
Замечание. Для любого собственного значения $\lambda_{j}$ преобразования $\hat{A}$ принадлежащее ему корневое подпространство $\mathfrak{M} \boldsymbol{l}_{j}$ содержит собственные векторы этого преобразования, отвечающие $\lambda_{j}$, и, следовательно, не сводится к нулевому вектору.
Действительно, если
\[
\hat{A} x=\lambda_{j} x \quad(x
eq 0),
\]
то имеем
\[
\left(\hat{A}-\lambda_{j} \hat{E}\right)^{p_{j} \boldsymbol{x}}=\left(\hat{A}-\lambda_{j} \hat{E}\right)^{p_{j}-1}\left(\hat{A}-\lambda_{j} \hat{E}\right) \boldsymbol{x}=0
\]
и, следовательно, $\boldsymbol{x} \in \mathfrak{M}_{j}$.
Заметим, что корневое пространство $\mathfrak{M}_{j}$ не содержит собственных векторов преобразования $\hat{A}$, отвечающих его собственным значениям $\lambda_{k}$, отличным от $\lambda_{j}$. В самом деле, если
\[
\hat{A} y=\lambda_{k} y \quad(y
eq 0),
\]
где $\lambda_{k}
eq \lambda_{j}$, то
\[
\begin{array}{l}
\left(\hat{A}-\lambda_{j} \hat{E}\right)^{p_{j}} \boldsymbol{y}=\left(\hat{A}-\lambda_{j} \hat{E}\right)^{p_{j}-1}\left(\hat{A}-\lambda_{j} \hat{E}\right) \boldsymbol{y}= \\
=\left(\lambda_{k}-\lambda_{j}\right)\left(\hat{A}-\lambda_{j} \hat{E}\right)^{p_{j}-1} \boldsymbol{y}=\left(\lambda_{k}-\lambda_{j}\right)^{p_{j}} \boldsymbol{y}
eq \mathbf{0}
\end{array}
\]
и, следовательно, $y \bar{\epsilon}_{j}$.
Таким образом, преобразование $\hat{A}$ на каждом его корневом подпространстве $\mathfrak{2}_{j}(j=1, \ldots, m)$ имеет единственное собственное значение $\lambda_{j}$.
Лемма 1. Для всякого линейного преобразования $A$ в $\Omega^{n}$ его любое корневое подпространство $\mathfrak{i}_{j}$ является подпространством пространства $\mathfrak{R}^{n}$, инвариантным относительно данного преобразования $\hat{A}$.
Доказательство. Пусть $\mathfrak{M}_{j}(j=1, \ldots, m)$ – корневое пространство линейного преобрєзования, принадлежащее его собственному значению $\lambda_{j}$, т. е. множество всех векторов $\boldsymbol{x} \in \mathfrak{\ell}^{n}$, удовлетворяющих условию (17). Для любых $x \in \mathfrak{M}_{j}$ и $y \in \mathfrak{M}_{j}$ и произвольных чисел $\alpha$ и $\beta$ имеем (см. $3^{\circ}$ )
\[
\begin{array}{l}
\left(\hat{A}-\lambda_{j} \hat{E}\right)^{p} j(\alpha \boldsymbol{x}+\beta \boldsymbol{y})=\alpha\left(\hat{A}-\lambda_{j} \hat{E}\right)^{p_{j}} \boldsymbol{x}+\beta\left(\hat{A}-\lambda_{j} \hat{E}\right)^{p_{j}} \boldsymbol{y}= \\
=\alpha .0+\beta 0=0 .
\end{array}
\]
Следовательно, $\alpha \boldsymbol{x}+\beta \boldsymbol{y} \in \mathfrak{M}_{j}$, т. е. $\mathfrak{M}_{j}$ есть подпространство пространства $\ell^{n}$. $\qquad$
странства можно ограничиться показателями $k \leqslant p_{j}$, где $p_{j}$-кратность характеристического корня $\lambda_{j}$, то определение 5 , введенное ради краткости изложения, эквивалентно обычному.
Подпространство $\mathfrak{M}_{j}$ инвариантно относительно преобразования $\hat{A}$, так как, учитывая перестановочность преобразований $\left(\hat{A}-\lambda_{j} \hat{E}\right)^{p_{i}}$ и $\hat{A}$, при $\boldsymbol{x} \in \mathfrak{M}_{j}$ получаем
\[
\left(\hat{A}-\lambda_{j} \hat{E}\right)^{p_{j}} \hat{A} \boldsymbol{x}=\hat{A}\left[\left(\hat{A}-\lambda_{j} \hat{E}\right)^{p_{j} x}\right]=\hat{A} 0=0,
\]
т. е. $\hat{A} \boldsymbol{x} \in \mathfrak{M}_{j}$.
Теорема 4 (первая теорема разложения). Комnлексное векторное пространство $\mathrm{Q}^{n}$ представляет собой прямую сумиу инвариантных корневых подпространств любого своего иинейного преобразования $\hat{A}$, принадлежащих всем его различным собственным значениям $\lambda_{1}, \ldots, \lambda_{m}(m \leqslant n)$.
Доказательство (см. [5]). Пусть $\Delta$ (ג) из (14) – характеристический полином преобразования $\hat{A}$. Разлагая дробь $1 / \Delta(\lambda)$ на простейшие, будем иметь
\[
\frac{1}{\Delta(\lambda)}=\left[\frac{A_{1}^{(1)}}{\lambda-\lambda_{1}}+\ldots+\frac{A_{p_{1}}^{(1)}}{\left(\lambda-\lambda_{1}\right)^{p_{1}}}\right]+\ldots+\left[\frac{A_{1}^{(m)}}{\lambda-\lambda_{m}}+\ldots+\frac{A_{p_{m}}^{(m)}}{\left(\lambda-\lambda_{m}\right)^{p_{m}}}\right],
\]
где $A_{k}^{(j)}\left(j=1, \ldots, m ; k=1, \ldots, p_{j}\right)$ – некоторые постоянные. Отсюда находим
\[
\frac{1}{\Delta(\lambda)}=\frac{P_{1}(\lambda)}{\left(\lambda-\lambda_{1}\right)^{p_{1}}}+\ldots+\frac{P_{m}(\lambda)}{\left(\lambda-\lambda_{m}\right)^{p_{m}}},
\]
где $P_{j}(\lambda) \quad(j=1, \ldots, m)$ – целые полиномы, причем дроби $P_{j}(\lambda) /\left(\lambda-\lambda_{j}\right)^{p}{ }_{j}-$ несократимые, т. е. $P_{j}\left(\lambda_{j}\right)
eq 0$.
Таким образом, получаем тождество
\[
1 \equiv P_{1}(\lambda) \Delta_{1}(\lambda)+\ldots+P_{m}(\lambda) \Delta_{m}(\lambda),
\]
где
\[
\Delta_{j}(\lambda)=\frac{\Delta(\lambda)}{\left(\lambda-\lambda_{j}\right)^{p_{j}}} \quad(j=1, \ldots, m)
\]
– также целье полиномы.
Для любого вектора $\boldsymbol{x} \in \ell^{n}$ положим
\[
\boldsymbol{x}^{(j)}=P_{j}(\hat{A}) \Delta_{j}(\hat{A}) \boldsymbol{x} \quad(j=1, \ldots, m) .
\]
Так как на основании формулы (18) имеем
\[
\hat{E}=P_{1}(\hat{A}) \Delta_{1}(\hat{A})+\cdots+P_{m}(\hat{A}) \Delta_{m}(\hat{A}),
\]
то
\[
\boldsymbol{x}=P_{1}(\hat{A}) \Delta_{1}(\hat{A}) \boldsymbol{x}+\cdots+P_{m}(\hat{A}) \Delta_{m}(\hat{A}) \boldsymbol{x}
\]
и, следовательно, справедливо разложение
\[
\boldsymbol{x}=\boldsymbol{x}^{(1)}+\ldots+\boldsymbol{x}^{(m)} .
\]
Пусть $\mathfrak{M}_{j}$ – корневое подпространство преобразования $\hat{A}$, отвечающее его собственному значению $\lambda_{j}(j=1, \ldots, m)$, т. е.
\[
\mathfrak{M}_{j}=\left\{\boldsymbol{x} \in \mathfrak{Q}^{n}:\left(\hat{A}-\lambda_{j} \hat{E}\right)^{p_{j}} \boldsymbol{x}=0\right\} .
\]
Покажем, что $\boldsymbol{x}^{(j)} \in \mathfrak{M}_{j}$. Действительно, используя формулы и (20), на основании теоремы Кейли получаем
\[
\left(\hat{A}-\lambda_{j} \hat{E}\right)^{p_{j}} \boldsymbol{x}^{(j)}=P_{j}(\hat{A}) \Delta(\hat{A}) \boldsymbol{x}=\mathbf{0},
\]
т. е. $\boldsymbol{x}^{(j)} \in \mathfrak{N}_{j}$.
Докажем, что разложение (22) на компоненты $\boldsymbol{x}(j) \in \mathfrak{M}_{j}$ $(j=1, \ldots, m)$ единственно. Действительно, пусть, кроме (22), имеем
\[
\boldsymbol{x}=\boldsymbol{y}^{(1)}+\ldots+\boldsymbol{y}^{(m)},
\]
где $\boldsymbol{y}^{(j)} \in \mathfrak{M}_{j}(j=1, \ldots, m)$. Учитывая, что при $k
eq j$ и $\boldsymbol{z} \in \mathfrak{M}_{j}$ справедливо соотношение
\[
\begin{array}{l}
\Delta_{k}(\hat{A}) \boldsymbol{z}=\left(\hat{A}-\lambda_{1} \hat{E}\right)^{p_{1}} \ldots\left(\hat{A}-\lambda_{k-1} \hat{E}\right)^{p_{k-1}}\left(\hat{A}-\lambda_{k+1} \hat{E}\right)^{p_{k+1}} \ldots \\
\ldots\left(\hat{A}-\lambda_{m} \hat{E}\right)^{p^{m}} \boldsymbol{z}=\prod_{\substack{s
eq j \\
s
eq k}}\left(\hat{A}-\lambda_{s} \hat{E}\right)^{p_{s}} \cdot\left(\hat{A}-\lambda_{j} \hat{E}\right)^{p_{j}} \boldsymbol{z}=\mathbf{0},
\end{array}
\]
и используя формулы (21) и (20), будем иметь
\[
\begin{aligned}
y^{(j)}=\sum_{k=1}^{m} P_{k}(\hat{A}) \Delta_{k}(\hat{A}) y^{(i)}=P_{j}(\hat{A}) \Delta_{j}(\hat{A}) y^{(j)}= \\
=\sum_{k=1}^{m} P_{j}(\hat{A}) \Delta_{j}(\hat{A}) y^{(k)}=P_{j}(\hat{A}) \Delta_{j}(\hat{A}) \sum_{k=1}^{m} y^{(k)}= \\
=P_{j}(\hat{A}) \Delta_{j}(\hat{A}) x=x^{(j)} \quad(j=1, \ldots, m) .
\end{aligned}
\]
Таким образом, всякий вектор $x \in \varrho^{n}$ единственным образом может быть представлен в виде суммы (22), где $\boldsymbol{x}^{(j)} \in$ $\in \mathfrak{M}_{j}(j=1, \ldots, m)$, и, следовательно, пространство $\mathfrak{\varepsilon}^{n}$ является прямой суммой корневых подпространств:
\[
\mathfrak{g}^{n}=\mathfrak{M}_{1} \oplus \ldots \oplus \mathfrak{) _ { m }},
\]
где
\[
\operatorname{dim} \mathfrak{M}_{1}+\ldots+\operatorname{dim} \mathfrak{m}_{m}=n \text {. }
\]
Следствие 1. Если линейное преобразование $\hat{A}_{8} \mathscr{Q}^{n}$ имеет единственное собственное значение $\lambda_{1}$, то пространство $\mathfrak{g}^{\text {n }}$ является корневым для $\hat{A}$, принадлежащим $\lambda_{1}$, m. е.
\[
\mathfrak{R}^{n}=\left\{x \in \mathfrak{Q}^{n}:\left(\hat{A}-\lambda_{1} \hat{E}\right)^{n} x=0\right\} .
\]
Следствие 2. Размерности корневых подпространств $\mathfrak{M}_{j}$ ( $j=1, \ldots, m$ ) совпадают с кратностями соответствующих собственных значений $\lambda_{j}$, m. $е$.
\[
\operatorname{dim} \mathfrak{M}_{j}=p_{j} \quad(j=1, \ldots, m) .
\]
Доказательство будем проводить методом индукции относительно числа $m$ собственных значений преобразования $\hat{A}$.
Если преобразование $\hat{A}$ допускает единственное собственное значение $\lambda_{1}(m=1)$, то его характеристический полином имеет вид
\[
\Delta(z)=\left(z-\lambda_{1}\right)^{n} .
\]
Отсюда кратность корня $\lambda_{1}$ есть $p_{1}=n$, и эта кратность совпадает с размерностью единственного корневого подпространства $\mathfrak{9}_{1}$ :
\[
\operatorname{dim} \mathfrak{M}_{1}=\operatorname{dim} \mathfrak{Q}^{n}=n .
\]
Пусть теперь наше утверждение верно для всех линейных преобразований $\hat{B}$ любого линейного пространства $\mathfrak{p}^{k}$, допускающих $m-1$ различных собственных значений ( $m \geqslant 2$ ).
В пространстве $\ell^{n}$ рассмотрим линейное преобразование $\hat{A}$, имеющее $m$ различных собственных значений $\lambda_{1}, \ldots, \lambda_{m}$ с кратностями, соответственно, $p_{1}, \ldots, p_{m}$, где
\[
p_{1}+\ldots+p_{m}=n \text {. }
\]
Пусть $\mathfrak{M}_{j}(j=1, \ldots, m)$ – корғевое подпространство преобразования $\hat{A}$, принадлежащее собственному значению $\lambda_{j}$. Прямая сумма
\[
\mathfrak{M}_{1} \oplus \ldots \oplus \mathfrak{M}_{m-1}
\]
представляет собой некоторое линейное подпространство $\varepsilon^{k}$, на котором на основании приведенного выше замечания преобразование $\hat{A}$ имеет лишь $m-1$ различных собственных значений $\lambda_{1}, \ldots, \lambda_{m-1}$. В таком случае в силу индукционного предположения получим
\[
\operatorname{dim} \mathfrak{M}_{s}=p_{s} \quad(s=1, \ldots, m-1) .
\]
Кроме того, как было доказано, имеем
\[
\mathfrak{\ell}^{n}=\mathfrak{M}_{1} \oplus \ldots \oplus \mathfrak{M}_{m-1} \oplus \mathfrak{M}_{m} ;
\]
поэтому
\[
n=\operatorname{dim} \ell^{n}=\sum_{s=1}^{m-1} \operatorname{dim} \mathfrak{M}_{s}+\operatorname{dim} \mathfrak{M}_{m}=\sum_{s=1}^{m-1} p_{s}+\operatorname{dim} \mathfrak{M}_{m} .
\]
Отсюда, учитывая формулу (25), получаем
\[
\operatorname{dim} \mathfrak{m}_{m}=n-\sum_{s=1}^{m-1} p_{s}=p_{m},
\]
и, таким образом, наше утверждение доказано.
Следствие 3. Если линейное преобразование $\hat{A}$ рассматривать на его корневом подпространстве $\mathfrak{H}_{j}(j=1, \ldots, n)$, принадлежацем собственному значению $\lambda_{j}$, то характеристический полином этого преобразования имеет вид
\[
D_{j}(z)=\left(z-\lambda_{j}\right)^{p_{j},}
\]
где $p_{j}$-к катность корня $\lambda_{j}$.
Формула (26) вытекает из гого обстоятельства, что на корневом подпространстве $\mathfrak{M}_{j}$ преобразование $\hat{A}$ имеет единственное собственное значение $\lambda_{j}$, причем размерность $\mathfrak{m}_{j}$ равна $p_{j}$.
На основании первой теоремы разложения (теорема 4) и теоремы 3 получаем первуютеорему приведения:
Теорема 4′. Всякую $(n \times n)$-матрицу $A$, имеющую разлиные собственные значения $\lambda_{1}, \ldots, \lambda_{m}(m \leqslant n)$ с соотвепствующими кратностями $p_{1}, \ldots, p_{m}$, где $\sum_{j=1}^{m} p_{j}=n$, путем преобразования подобия с некоторой неособенной матрицей $S$ можно привести к квазидиагональному виду:
\[
S A S^{-1}=\operatorname{diag}\left[A_{1}\left(\lambda_{1}\right), \ldots, A_{m}\left(\lambda_{m}\right)\right],
\]
где $A_{j}\left(\lambda_{j}\right)(j=1, \ldots, m)$-квадратная матрица порядка $p_{j}$, допускающая единственное собственное значение $\lambda_{j}$, m. е. такал, что ее характеристический полином имеет вид
\[
D_{j}(\lambda) \equiv \operatorname{det}\left[E^{\left(p_{j}\right)} \lambda-A_{j}\left(\lambda_{j}\right)\right]=\left(\lambda-\lambda_{j}\right)^{p_{i}} .
\]
Таким образом, остается изучить структуру квадратных матриц, обладающих единственным собственным значением.
$5^{\circ}$ Вторая теорема приведения. Для изучения структуры корневых подпространств линейного преобразования введем понятие цик.ического пространства.
Определение 6. Линейное пространство $\&^{n}$ называется циклическим относительно его линейного преобразования $\hat{A}$, если некоторая цепочка векторов
\[
\xi, \hat{A} \xi, \ldots, \hat{A}^{n-1} \xi(\xi
eq 0)
\]
образует базис этого пространства (цикличский базис).
Это определение дословно переносится на инвариантное подпространство.
Лемма 2. Если $\hat{A}$-линейное преобразование в $\mathfrak{E}^{n}$ с единственным собственным значением $\lambda$ и пространство $\mathfrak{Q}^{n}$ – циклическое относительно преобразования
\[
\hat{B}=\hat{A}-\lambda \hat{E},
\]
то матрица $A$ преобразования $\hat{A}$ в циклическом базисе
\[
\xi_{1}, \xi_{2}=\hat{B} \xi_{1}, \ldots, \xi_{n}=\hat{B}^{n-1} \xi_{1}
\]
представляет собой клетку Жордана
\[
J(\lambda)=\left[\begin{array}{lllll}
\lambda & 1 & \ldots & 0 & 0 \\
0 & \lambda & \ldots & 0 & 0 \\
. & . & \ldots & \cdot & \cdot \\
0 & 0 & \ldots & \lambda & 1 \\
0 & 0 & \ldots & 0 & \lambda
\end{array}\right] \equiv \lambda E+I_{1},
\]
соответствующую числу $\lambda$.
Доказательство. Так как пространство $\varrho^{n}$ является корневым подпространством для преобразования $\hat{A}$, принадлежащим собственному значению $\lambda$, то
\[
\hat{B}^{n}=(\hat{A}-\lambda \hat{E})^{n}=\hat{0}
\]
(см. следствие 1 теоремы 4).
Из соотношений (27), полагая $\xi_{n+1}=\mathbf{0}$, имеем
\[
\hat{A} \xi_{k}=(\lambda \hat{E}+\hat{B}) \xi_{k}=\lambda \xi_{k}+\xi_{k+1} \quad(k=1, \ldots, n),
\]
поэтому
\[
\left.\begin{array}{cc}
\hat{A} \xi_{1}=\lambda \xi_{1}+\xi_{2}, \\
\hat{A} \xi_{2}= & \lambda \xi_{2}+\xi_{3}, \\
\cdot \cdot \cdot \cdot \cdot \cdot \cdot \cdot \cdot \xi_{n-1}+\xi_{n}, \\
\hat{A} \xi_{n-1}= & \lambda \xi_{n} .
\end{array}\right\}
\]
Следовательно, матрица преобразования $\hat{A}$ в базисе (27) представляет клетку Жордана (28).
Теорема 5 (втораятеоремаразложения). Пусть $\mathfrak{M}_{j}-$ корневое подпространство линейного преобразования А в $_{\text {в }}$, принадлежащее его собственному значению $\lambda_{j}$. Тогда $\mathfrak{\lambda}_{j}$ разлагается в прямую сумму инвариантных подпространств
\[
\mathfrak{M}_{j}=\mathfrak{N}_{1} \oplus \ldots \oplus \mathfrak{R}_{s},
\]
циклических относительно
\[
\hat{B}_{j}=\hat{A}-\lambda_{j} \hat{E} .
\]
Доказательство. Пусть $\operatorname{dim} \mathfrak{M}_{j}=p_{j}\left(1 \leqslant p_{j} \leqslant n\right)$. Положим
\[
\mathfrak{C}_{k}=\left\{\boldsymbol{x} \in \mathfrak{M}_{j}: \quad \hat{B}_{j}^{k} \boldsymbol{x}=\mathbf{=}\right\} \quad\left(k=0,1, \ldots, p_{j}\right),
\]
где $\hat{B}_{j}$ определяется формулой (29).
Очевидно, имеем
причем $\mathscr{S}_{k}\left(k=0,1, \ldots, p_{j}\right)$ – подпространства в $\mathfrak{M}_{j}$, инвариантные относительно преобразования $\hat{B}_{j}$.
Пусть
\[
\xi_{1}^{(k)}, \ldots, \xi_{q_{k}}^{(k)} \quad\left(k=1, \ldots, p_{j}\right)
\]
– все векторы из $\Im_{k}$, линейно независимые относительно $\bigodot_{k-1}$ (определение 3), т. е. векторы (30) линейно независимы и подпространство, натянутое на них, имеет с $\mathfrak{C}_{k-1}$ нулевое пересечение, причем число их максимально.
Положим
\[
\xi_{h}^{(k-l)}=\hat{B}_{j}^{l} \xi_{h}^{(k)} \quad\left(h=1, \ldots, q_{k} ; l<k\right) .
\]
Тогда векторы $\xi_{h}^{(h-l)} \in \Im_{k-l}$ и линейно независимы относительно $\varsigma_{k, l-1}$ при $k>1$.
Действительно, имеем
\[
\hat{B}_{j}^{k-l} \xi_{h}^{(k-l)}=\hat{B}_{j}^{k \xi_{h}^{(k)}=0,}
\]
T. e.
\[
\xi_{h}^{(k-l)} \in \mathfrak{S}_{k-l} .
\]
Далее, векторы $\xi_{h}^{(k-l)}$ линейно независимы, так как, если
\[
\sum_{h} \alpha_{h} \xi_{h}^{(k-l)}=\hat{B}_{j}^{l}\left(\sum_{h} \alpha_{h} \xi_{h}^{(k)}\right)=0,
\]
TO
\[
\sum_{n} \alpha_{h} \xi_{h}^{(k)} \in \mathfrak{S}_{l} \subset \mathscr{C}_{k=1} .
\]
Отсюда, учитывая, что векторы (30) линейно независимы относительно $\mathfrak{\Im}_{k-1}$, находим
\[
\sum_{h} \alpha_{h} \xi_{i}^{(k)}=0
\]
T. e.
\[
\alpha_{1}=\alpha_{2}=\ldots=\alpha_{q_{k}}=0,
\]
и, таким образом, векторы (31) линейно независимы. Наконец, пусть
\[
x=\sum_{h} \alpha_{h} \xi_{i k}^{i k-l)} \in \mathfrak{S}_{k-l-1} .
\]
Тогда
\[
\mathbf{0}=\hat{B}_{j}^{k-l-1} \boldsymbol{x}=\hat{B}_{j}^{k-1}\left(\sum_{h} \alpha_{h} \boldsymbol{\xi}_{h}^{(k)}\right)
\]
и, следовательно,
\[
\sum_{k} \alpha_{h} \xi_{h}^{(k)} \in \mathscr{E}_{k-\mathbf{1}} .
\]
Но векторы $\xi_{h}^{(k)}$ линейно независимы относительно $\mathcal{\Xi}_{k .1}$; поэтому
\[
\alpha_{1}=\alpha_{2}=\ldots=\alpha_{q_{k}}=0,
\]
т. е. $\boldsymbol{x}=\mathbf{0}$, и, таким образом, векторы $\xi_{h}^{(k-l)}$ линейно независимы относительно $\mathfrak{C}_{k-l-1}$.
Пусть $\mathfrak{\Xi}_{r}\left(1 \leqslant r \leqslant p_{j}\right)$ – подпространство в $\mathfrak{M}_{j}$ наивысшей размерности, содержащее ненулевье векторы, линейно независимые относительно $\Xi_{r_{-1}}$. Такое подпространство существует, так как преобразование $\hat{A}$ на инвариантном подпространстве $\mathfrak{i}$; имеет по меньшей мере один собственный вектор $\xi
eq 0$, соответствующий собственному значению $\lambda_{j}$, т. е.
\[
\hat{B}_{j} \xi=\left(A-\lambda_{j} \hat{E}\right) \xi=0,
\]
который, очевидно, входит в $\mathfrak{\bigodot}_{1}$ и является линейно независимым относительно $\mathfrak{c}_{0}=0$.
В подпространстве $\Im_{r}$ построим максимальную систему векторов
\[
\xi_{1}^{(r)}, \ldots, \xi_{q_{r}}^{(r)},
\]
линейно независимых относительно подпространства $\mathfrak{C}_{r-1}$. Как было показано выше, векторы
\[
\xi_{h}^{(r-1)}=\hat{B}_{j} \xi_{h}^{(r)} \quad\left(h=1, \ldots, q_{r}\right)
\]
принадлежат подпространству $\mathscr{C}_{r-1}$ и линейно независимы относительно $\Xi_{r-9}$. Дополним эту систему, если это необходимо, до максимальной системы векторов
\[
\xi_{1}^{(r-1)}, \ldots, \xi_{q_{r-1}}^{(r-1)} \quad\left(q_{r-1} \geqslant q_{r}\right),
\]
линейно независимых относительно $\bigodot_{r-2}$.
Продолжая этот процесс дальше, мы в каждом подпространстве $\Xi_{k}(1 \leqslant k \leqslant r)$ будем иметь максимальную систему векторов
\[
\xi_{1}^{(k)}, \ldots, \xi_{q_{k}}^{\left(k_{1}\right.} \quad\left(k=r, r-1, \ldots, 1 ; q_{k-1} \geqslant q_{k}\right),
\]
линейно независимых относительно $\mathfrak{S}_{k-1}$, причем справедливы соотношения
\[
\boldsymbol{\xi}_{h}^{(k-1)}=\hat{B}_{j} \boldsymbol{\xi}_{h}^{(k)} \quad\left(h=1, \ldots, q_{k} ; 1 \leqslant k \leqslant r\right) .
\]
Согласно теореме 2 объединение всех векторов (32) представляет собой базис подпространства $\mathfrak{M}_{j}$. Каждый из этих базисных векторов $\xi_{h}^{(k)} \in \Im_{k}$ такой, что $\hat{B}_{j} \xi_{h}^{(k+1)}
eq \xi_{h}^{(k)}$, порождает полную цепочку (серию векторов)
\[
\xi_{h}^{(k)}, \hat{B}_{j} \xi_{h}^{(k)}, \ldots, \hat{B}_{j}^{k-1} \xi_{h}^{(k)}\left(\hat{B}_{j}^{k} \xi_{h}^{k}=0\right)
\]
которая является циклическим базисом подпространства $\mathfrak{R}$ размерности $k$, натянутого на векторы цепочки, причем $\Re$, очевидно, инвариантно относительно преобразования $\hat{B}_{j}$.
Нумеруя эти циклические подпространства $\mathfrak{N}_{1}, \ldots, \mathfrak{N}_{s}\left(s=q_{1}\right)$ и учитывая, что объединение их базисов является базисом подпространства $\mathfrak{M}_{j}$, на основании теоремы 1 получаем, что $\mathfrak{M}_{j}$ представляет собой прямую сумму:
\[
\mathfrak{M}_{j}=\mathfrak{M}_{1} \oplus \ldots \oplus \mathfrak{R}_{s}
\]
что и требовалось доказать.
Замечание. Из данной конструкции построения базиса подпространства $\mathfrak{M}_{j}$ вытекает, что в сумме (35) имеется ровно $q_{i}-q_{k+1}$ слагаемых $\Re_{l}$, для которых
\[
\operatorname{dim} \Re_{l}=k \quad\left(k=r, r-1, \ldots, 1 ; q_{r+1}=0\right),
\]
причем максимальная размерность подпространства $\mathfrak{R}_{l}$ равна $r$ и
\[
\begin{aligned}
q_{r} r+\left(q_{r-1}-q_{r}\right)(r-1)+ & \ldots+\left(q_{2}-q_{3}\right) \cdot 2+\left(q_{1}-q_{2}\right) \cdot 1= \\
& =q_{r}+q_{r-1}+\ldots+q_{2}+q_{1}=\operatorname{dim} \mathrm{m}_{j} .
\end{aligned}
\]
Теорема 5′ (вторая теорема приведения). Пусть $(n \times n)$-матрица $A$ имеет единтвенное собственное значение $\lambda$. Тогда эту матрицу с помощью преобразования подобия с меособенной матрицей $S$ можно призести к квазидиагональному виду
\[
S A S^{1}=\operatorname{diag}\left[J_{1}(\lambda), \ldots, J_{s}(\lambda)\right],
\]
где
\[
J_{k}(\lambda)=\left[\begin{array}{ccccc}
\lambda & 1 & \ldots & 0 & 0 \\
0 & \lambda & \ldots & 0 & 0 \\
\cdot & \cdot & \cdot & \cdot & \cdot \\
0 & 0 & \ldots & \lambda & 1 \\
0 & 0 & \ldots & 0 & \lambda
\end{array}\right] \equiv \lambda E^{\left(e_{k}\right)}+I_{1}^{\left(e_{k}\right)} \quad(k=1, \ldots, s)
\]
-клетки Жордана различных порядков $e_{k}\left(e_{1}+\ldots+e_{s}=n\right)$.
Формула (36) непосредственно вытекает из разложения (35), теоремы 3 и леммы 2.
Объединяя первую и вторую теоремы приведения (теоремы $4^{\prime}$ и $5^{\prime}$ ), получаем следующий результат.
Теорема 6. Всякая $(n \times n)$-матрица $A=\left[a_{j k}\right]^{*}$ подобна некоторой матрице
\[
J=S A S^{-1} \quad(\operatorname{det} S
eq 0),
\]
имеющей жорданову форму
\[
J=\operatorname{diag}\left[J_{1}\left(\lambda_{1}\right), \ldots, J_{m}\left(\lambda_{m}\right)\right] \quad(m \leqslant n),
\]
где $\lambda_{1}, \ldots, \lambda_{m}$-различные собственные значения матрицы $A$,
\[
J_{k}\left(\lambda_{k}\right)=\operatorname{diag}\left[J_{k_{1}}\left(\lambda_{k}\right), \ldots, J_{k_{l k}}\left(\lambda_{k}\right)\right]
\]
$u$
\[
J_{k_{h}}\left(\lambda_{k}\right)=\lambda_{k} E^{\left(e_{k} h_{h}{ }^{\prime}\right.}+I_{1}^{\left(k_{h}\right)} \quad\left(h=1, \ldots, l_{k} ; k=1, \ldots, m\right)
\]
– клетка Жордана с собственным зачением $\lambda_{k}$, причем каждому собственному значению $\lambda_{k}$ кратности матриць $A$ соответствует одна или несколько клеток Жордана порядка $e_{k h}$, дде
и
\[
\begin{array}{c}
e_{k_{1}}+\ldots+e_{k, l_{k}}=p_{k} \quad(k=1, \ldots, m) \\
p_{1}+\ldots+p_{m}=n .
\end{array}
\]
Число $l_{k}$ клеток Жордана, отвечающих собственному значению $\lambda_{k}$, совпадает с максимальным числом линейно независимых собственных векторов матрицы $A$, соответствующих значению $\lambda_{k}$.
Замечание. Если матрила $A$ действительная, то базис, в котором она имеет жорданову форму (37), можно выбрать так, что составляющие циклические базисы, соответствующие действительным собственным значениям, будут действительны, а комплексно-сопряженным – комплексно-сопряженные.
Укажем один из способов нахождения элементарных делителей данной квадратной матрицы $A=\left[a_{j k}\right]$ порядка $n$. Рассмотрим $\lambda$-матрицу
\[
F(\lambda)=\lambda E-A \text {. }
\]
Пусть $r$ – ранг матрицы $F(\lambda)(1 \leqslant r \leqslant n)$ и $D_{j}(\lambda)(j=0,1, \ldots, r)-$ наибольший общий делитель ее миноров $j$-го порядка, где положено $D_{0}(\lambda)=1$. Функция
\[
E_{j}(\lambda)=\frac{D_{j}(\lambda)}{D_{j-1}(\lambda)} \quad(j=1, \ldots, r),
\]
являющаяся целым полиномом, называется $j$-м инвариантным множителем матрицы $A$ (см. [82]).
Если $\lambda_{1}, \ldots, \lambda_{m}(m \leqslant n)$ – различные характеристические корни матрицы $A$, то можно доказать справедливость разложения
\[
E_{j}(\lambda)=\left(\lambda-\lambda_{1}\right)^{e_{1 j}, \cdots} \quad\left(\lambda-\lambda_{m}\right)^{e_{m j}},
\]
где множители $\left(\lambda-\lambda_{k}\right)^{e_{k j}} \quad\left(e_{k j} \geqslant 1\right)$, не сводящиеся к постоянным величинам, являются элементарными делителями матрицы $A$. Последнее разложение дает возможность эффективно вычислять элементарные делители данной матрицы.
Упражнение. Пусть $A=a_{j k} \mid$ – действительная $(n \times n)$-матрица, $\lambda_{p}=a_{p} \pm i_{p}(\beta
eq 0)(p=1,2, \ldots)$ – ее комплексные собственные значения, а $\gamma_{q}(q=1,2, \ldots)$ – ее действительные собственные значения. Доказать, что тогда матрицу $A$ с помощью действительной неособенной матрицы $T$ можно иредставить в виде
\[
A=T^{-1} B T
\]
где
\[
B=\operatorname{diag}\left[K_{1}\left(\lambda_{1}\right), \ldots, K_{P}\left(\lambda_{P}\right) ; \quad J_{1}\left(\gamma_{1}\right), \ldots, \quad J_{Q}\left(\gamma_{Q}\right)\right],
\]
причем (см. [17])
\[
\begin{array}{c}
K_{p}\left(\lambda_{p}\right)=\left[\begin{array}{ccccc}
S_{p} & E^{(2,} & \ldots & O_{2} & O_{2} \\
O_{2} & S_{p} & \ldots & O_{2} & O_{2} \\
\cdots & \cdots & \ldots & \cdots & \cdots \\
O_{2} & O_{2} & \ldots & S_{p} & E^{(2)} \\
O_{2} & O_{2} & \ldots & O_{2} & S_{p}
\end{array}\right], \\
S_{p}=\left[\begin{array}{rr}
\alpha_{p} & -\beta_{p} \\
\beta_{p} & \alpha_{p}
\end{array}\right], \quad E^{(2)}=\left[\begin{array}{ll}
1 & 0 \\
0 & 1
\end{array}\right] \\
(p=1, \ldots, P),
\end{array}
\]
и
\[
\begin{array}{c}
J_{q}\left(\gamma_{q}\right)=\left[\begin{array}{ccccc}
\tilde{i} q & 1 & \ldots & 0 & 0 \\
0 & \gamma_{q} & \ldots & 0 & 0 \\
\cdots & \cdots & \cdots & 0 \\
0 & 0 & \ldots & \gamma_{q} & 1 \\
0 & 0 & \ldots & 0 & \gamma_{q}
\end{array}\right] \\
(q=1, \ldots, Q) .
\end{array}
\]