упомянутого в начале вида достаточно выбрать r подпространстве
соответственным образом орты. Мы приходим, таким образом, к рассмотрению частного случая, а именно матрицы с единственным характеристическим числом. Пусть, вообще, некоторая матрица D порядка
имеет единственное характеристическое число а кратности
. Матрица
а будет иметь единственное характеристическое число нуль кратности
, и эту матрицу мы и будем дальше рассматривать.
В силу тождества Кейли мы имеем
так как левая часть характеристического уравнения для матрицы В равна, очевидно,
Но может случиться, что
где l — целое положительное число, меньшее
. Возьмем наименьшее целое положительное число
при котором имеет место формула
Если, например, сама матрица В равна нулю, то
. Для матрицы
нетрудно проверить, что
Если матрица В равна нулю, то
есть чисто диагональная матрица
и, таким образом, мы уже имеем каноническую форму. Итак, имеет смысл рассматривать лишь тот случай, когда
В силу условия (31) уравнение
определяет всё пространство измерения
. Мы его будем в дальнейшем обозначать
Построим теперь уравнение
Поскольку матрица
отлична от нуля, это уравнение определяет некоторое подпространство с числом измерений, меньшим
. Определим вообще последовательность пространств следующими уравнениями:
и обозначим через
подпространство, определяемое уравнением
Пусть
число измерений этого подпространства. Как мы уже упоминали выше,
совпадает со всем пространством
и
Если некоторый вектор
входит в подпространство
т. е. удовлетворяет уравнению
то вектор будет удовлетворять уравнению
т. е. будет входить в подпространство
Кроме того, очевидно, что всякий вектор, входящий в пространство
тем самым входит и в подпространство
т. е. подпространство
составляет часть подпространства
Дальше мы увидим, что число измерений подпространства
всегда меньше числа измерений подпространства
т. е. подпространство
составляет правильную часть подпространства
а не совпадает с ним. Мы имеем пока неравенства вида
и дальше мы покажем, что не только в начале, но и везде в дальнейшем мы имеем просто знак
Обозначим
где
есть некоторое целое положительное число. Мы можем построить в подпространстве
, иначе говоря, во всем пространстве
линейно независимых векторов
таких, что никакая их линейная комбинация не принадлежит
При этом всякий вектор из
может быть представлен в виде линейной комбинации векторов
и некоторого вектора из
. Для образования этих векторов
мы можем, например, в подпространстве
выбрать любым образом линейно независимых векторов. При этом векторы
будут дополнять эти векторы до полной системы линейно независимых векторов в пространстве
Совершенно так же обозначим
где
будет некоторым целым неотрицательным числом, и построим в подпространстве
такие
линейно независимых векторов, что никакая их линейная комбинация не принадлежит подпространству
Назовем эти векторы и любые их линейные комбинации векторами
Рассмотрим теперь векторы
Все они принадлежат подпространству
. Покажем, что никакая их линейная комбинация не может принадлежать подпространству
Действительно, в противном случае мы имели бы
или
т. е. оказалось бы, что линейная комбинация векторов
принадлежит подпространству
что противоречит определению этих векторов. Таким образом, мы видим, что векторы (34) суть линейно независимые вектора из подпространства
являющиеся для этого подпространства векторами
т. е. никакая их линейная комбинация
не принадлежит
. Отсюда непосредственно вытекает, что
. Совершенно так же, обозначая
мы получим и вообще, обозначая
мы имеем
Отсюда, между прочим, и вытекает непосредственно, что в формуле (33) мы имеем везде знак
т. е.
Число
можно назвать числом измерений подпространства
по отношению к подпространству
составляющему его часть. Точнее говоря,
есть число линейно независимых векторов из
таких, что любая их линейная комбинация не принадлежит к
Эти векторы образуют некоторое подпространство
входящее в
Точно так же
есть число измерений относительно
и мы получаем аналогично предыдущему некоторое подпространство
, входящее в
Вообще
есть число измерений
относительно
и какие-нибудь
линейно независимых векторов из
обладающих тем свойством, что никакая их линейная комбинация не входит в
образуют подпространство От, входящее в
Подпространство
совпадает с самим
Если
есть некоторый вектор из От и тем самым из
то
должен принадлежать
Но он уже не может принадлежать
ибо и противном случае мы имели бы
и, следовательно, вектор
принадлежал бы не только
но и
что противоречит определению подпространства
Таким образом, производя над подпространством От линейное преобразование В, мы получим часть подпространства
(или все подпространство
причем линейно независимые векторы От переходят также в линейно независимые векторы От Из формул
непосредственно вытекает, в силу
и подпространства
образуют, очевидно, полную систему подпространств.
Мы переходим, наконец, к последнему этапу построения, а именно к построению окончательных подпространств, инвариантных относительно линейного преобразования, осуществляемого матрицей В. Выбираем из
некоторый вектор за первый
и строим еще
ортов по следующему правилу:
Из предыдущих рассуждений непосредственно следует, что эти орты линейно независимы и что они принадлежат последовательно
к подпространствам
. Нетрудно видеть, что они образуют подпространство, инвариантное по отношению к линейному преобразованию В. Действительно, имеем при любом выборе постоянных
Отсюда непосредственно следует, что матрица линейного преобразования образованного таким образом инвариантного подпространства, если принять за орты, будет матрицей порядка I канонической формы:
Использовав таким образом один из векторов из
мы берем какой-нибудь второй вектор
из
линейно независимый с и пристраиваем к нему еще
векторов по формулам
Построенные таким образом
векторов будут линейно независимы не только друг с другом, но и с векторами Это непосредственно вытекает из того факта, что линейно независимые векторы из
переходят в линейно независимые векторы из
при преобразовании Я Принимая векторы
за орты, мы получим инвариантное подпространство, в котором наше линейное преобразование будет осуществляться матрицей
Используя все
векторов из подпространства
мы построим
инвариантных подпространств измерения
в каждом из которых наше линейное преобразование будет осуществляться матрицей вида
Переходим теперь к следующему подпространству GM измерения
причем
Из этого подпространства
векторов уже использованы при предыдущем построении ортов. Используя остальные
векторов совершенно так же, как это мы делали выше, мы построим
инвариантных подпространств, в каждом из которых наше линейное преобразование при сделанном выборе ортов будет выглядеть в виде матрицы
порядка
канонической формы.
Вообще, когда мы дойдем до подпространства
то в нем останутся неиспользованными
линейно независимых векторов. Выбирая эти векторы каким угодно образом и применяя к каждому
них последовательно преобразование В, мы для каждого из них получим дополнительно еще
векторов и, принимая
эти векторы за орты, мы получим
серий ортов, причем каждая из этих серий будет содержать
ортов и будет определять некоторое инвариантное подпространство измерения
, для которого наше преобразование будет осуществляться матрицей
канонической формы порядка
.
Наконец, когда мы придем к последнему подпространству
то в нем останутся неиспользованными
линейно независимых векторов, для которых имеет место формула
Принимая каждый из них за орт, мы получим
инвариантных подпространств одного измерения, в каждом из которых наше линейное преобразование будет выглядеть в виде матрицы первого порядка, равной нулю. Окончательно результат нового выбора ортов будет выражаться некоторым линейным преобразованием а над составляющими вектора, и в результате этого преобразования наше линейное преобразование, осуществляемое раньше матрицей
будет теперь осуществляться подобной матрицей квазидиагональной формы
причем в квадратной скобке среди нижних значков будет
равных
равных
и т. д. и, наконец,
равных единице. Для матрицы
мы имеем, очевидно,
т. е. дело сводится к прибавлению числа а к диагональным элементам, и мы получим, таким образом,
Вернемся, наконец, к нашей исходной матрице
. В предыдущем номере, согласно формуле (28), мы ее представили в виде квазидиагональной матрицы, в которой каждая составляющая матрица
имеет единственное характеристическое число
кратности
Каждую из этих матриц
мы можем, согласно предыдущему, привести к канонической форме (38) при помощи некоторой матрицы а порядка
. Если ввести в рассмотрение матрицу
то мы будем иметь
и окончательно наша матрица А приведется к канонической форме
Числа
должны совпадать с числами
причем сумма нижних значков у составляющих матриц
для которых
должна равняться
.
Формула (39) решает вполне задачу о приведении данной матрицы А к канонической форме. Возникает вопрос об единственности такого представления, т. е. о доказательстве того факта, что внутри квадратной скобки, стоящей в правой части формулы (39), при любом способе приведения к канонической форме будет стоять совершенно определенное число матриц
при заданных
Итак, пусть имеется приведение матрицы А к канонической форме, сделанное каким-либо образом:
Принимая во внимание, что подобные матрицы должны иметь одинаковое характеристическое уравнение, можем написать характеристическое уравнение матрицы А в виде
или
что равносильно следующему [190]:
Но из вида матрицы
следует, что
Таким образом, числа
должны совпадать с характеристическими числами
матрицы А, и сумма значков
для которых
должна равняться кратности
характеристического числа
Остается показать, что эти числа
должны иметь определенное значение. Этот факт можно доказать, пользуясь теми геометрическими соображениями, которые дали нам приведение матрицы к канонической форме. Существенную роль при этом должно играть рассмотрение инвариантных подпространств. Мы не будем проводить этого доказательства, а в следующем номере докажем критерий алгебраического характера, определяющий вполне значки
по заданной матрице А. Этот критерий, основанный на рассмотрении общего наибольшего делителя определителей данного порядка матрицы (А — X), приведен без доказательства в первой части этого тома
Он, очевидно, дает нам и доказательство единственности представления данной матрицы в канонической форме.