ДОБАВЛЕНИЕ. ПРИВЕДЕНИЕ МАТРИЦ К КАНОНИЧЕСКОЙ ФОРМЕ
190. Вспомогательные предложения.
Целью настоящего добавления является доказательство предложения, приведенного нами без доказательства в
Прежде всего, сформулируем это предложение. Если А есть некоторая матрица, то всегда можно найти такую матрицу V с определителем, отличным от нуля, что матрица
, подобная матрице А, будет иметь квазидиагональную (или диагональную) форму
где матрицы
имеют вид
Нижний значок
указывает порядок матрицы и аргумент X дает число, стоящее на главной диагонали. Если
то матрица
приводится к числу X. В результате доказательства этого предложения мы дополним его в некоторых существенных пунктах.
Напомним, прежде всего, геометрический смысл перехода к подобной матрице. Матрица А порядка
является оператором в
-мерном пространстве в том смысле, что она совершает некоторое линейное преобразование этого пространства. Вид матрицы А зависит, как мы видели
от выбора координат, т. е. основных ортов. Если матрица А выражает линейное преобразование при определенном выборе ортов и если мы совершаем преобразование координат, при котором новые составляющие каждого вектора выражаются через его прежние составляющие при помощи преобразования V, то в новой координатной системе наше линейное преобразование будет
выражаться матрицей
Таким образом, формулированная нами задача сводится, по. существу, к выбору ортов, в некотором смысле наиболее естественных для линейного преобразования, осуществляемого в прежней системе координат матрицей А, а именно к такому выбору ортов, при котором наше линейное преобразование выражается матрицей, имеющей форму, указанную в правой части равенства (1).
Прежде чем переходить к решению этой задачи, мы предварительно выясним некоторые вспомогательные предложения, которыми нам придется пользоваться. Большая часть этих предложений выяснена ранее, но для цельности картины мы соберем их здесь в одном месте.
Прежде всего мы остановимся на выяснении понятия подпространства, с которым мы часто имели дело и раньше. Если
суть k линейно независимых векторов пространства, причем
то совокупность векторов, определяемых формулой
где
произвольные числа, мы называли подпространством измерения k, образованным вышеуказанными векторами. В случае
подпространство совпадает со всем пространством. Можно дать другое определение подпространства, эквивалентное только что указанному, а именно: подпространством называется совокупность векторов, обладающих следующими двумя свойствами. Если некоторый вектор
принадлежит этой совокупности, то и вектор
где с — произвольное число, также принадлежит совокупности, и если два вектора
и принадлежат совокупности, то и их сумма также принадлежит совокупности. Иначе говоря, совершая действие умножения на число и сложение над векторами совокупности, мы не выходим из этой совокупности.
В дальнейшем мы будем иметь дело с двумя способами определения подпространства, которые мы сейчас и укажем. Пусть Р — некоторая матрица порядка
их — произвольный переменный вектор в
-мерном пространстве. Совокупность векторов, определяемых формулой
является, очевидно, некоторым подпространством, которое может совпадать и с полным пространством. Действительно, если к указанной совокупности принадлежит некоторый вектор
то к этой же совокупности принадлежит и вектор
и если к нашей совокупности принадлежат два вектора
то к этой совокупности принадлежит, очевидно, и вектор
и, таким образом, формула (4) при произвольном переменном векторе
действительно определяет некоторое подпространство. Как мы уже упоминали [III, 15], число измерений этого подпространства равно рангу матрицы Р.
Укажем теперь второй способ определения подпространства. Пуаь Q есть некоторая матрица порядка
, и мы рассматриваем совокупность векторов, удовлетворяющих уравнению
Совершенно так же, как и выше, можно показать, что эта совокупность векторов образует некоторое подпространство. Как мы видели выше
это подпространство будет иметь измерение
где
матрицы
Говоря о подпространстве, мы, конечно, всегда предполагаем, что оно не пустое, т. е. что оно содержит действительно векторы, отличные от нуля. Посмотрим, в каком случае формула (4) определяет пустое подпространство, т. е. в каком случае для любого
из нашего пространства формула (4) дает вектор, равный нулю. Принимая во внимание самый вид линейного преобразования, мы можем утверждать, что это будет иметь место в том и только в том случае, когда матрица Р равна пулю, т. е. когда все ее элементы равны нулю.
Пусть
некоторые подпространства. Мы будем говорить, что они образуют полную систему подпространств, если всякий вектор
нашего пространства может быть представлен единственным образом в виде суммы векторов
принадлежащих указанным выше подпространствам. Отметим значение условия единственности представления. Из этого условия непосредственно вытекает, что вектор, равный нулю, не может быть представлен в виде суммы (6), среди слагаемых которой есть отличные от нуля, а это в свою очередь равносильно тому факту, что между векторами упомянутых выше подпространств не может существовать линейной зависимости. В качестве примера рассмотрим обычное вещественное трехмерное пространство, образованное векторами, имеющими начало в некоторой точке О. В качестве полной системы подпространств мы можем взять некоторую плоскость L, проходящую через О, и некоторую прямую
проходящую через О и не лежащую в плоскости L. Первое подпространство будет двух измерений и может быть образовано двумя произвольными векторами, лежащими в плоскости L и не находящимися на одной прямой. Второе подпространство будет одного измерения и может быть образовано любым вектором, лежащим на прямой
Всякий вектор нашего трехмерного пространства может быть единственным образом представлен как сумма векторов, лежащих в плоскости L и на прямой
Пусть А есть некоторая матрица, осуществляющая линейное преобразование пространства. Положим, что нам удалось найти такую полную систему подпространств
измерения
что каждое из этих подпространств будет инвариантным по отношению
шению к линейному преобразованию, осуществляемому матрицей
, т. е., иначе говоря, любой вектор подпространства
в результате линейного преобразования, осуществляемого матрицей
, перейдет в вектор того же подпространства. В данном случае мы имеем следующий естественный выбор ортов, при котором матрица А принимает квазидиагональпую форму структуры
. Берем за первые
, ортов какие-либо
линейно независимых векторов, образующих подпространство
за следующие
, ортов выбираем какие-нибудь
линейно независимых векторов, образующих подпространство
и т. д. Раз
образует полную систему подпространств, мы имеем, очевидно,
Нетрудно видеть, что при таком выборе ортов наша матрица А действительно будет квазидиагоналыюй формы. Остановимся на этом подробнее и для простоты письма ограничимся случаем
Пусть
некоторый вектор и
- новый вектор, получаемый из него при помощи нашего линейного преобразования. В силу инвариантности подпространства
и сделанного выбора ортов мы должны иметь При
и точно так же, в силу инвариантности
если
то
Отсюда непосредственно следует, что при сделанном выборе ортов наше линейное преобразование осуществляется квазидиагональной матрицей вида
Отметим еще, что выбор основных ортов внутри каждого подпространства остается совершенно произвольным, и в дальнейшем мы используем этот произвол для того, чтобы привести каждую из отдельных матриц А и
входящих в квазидиагональпую матрицу (7), к наиболее простой в некотором смысле форме.
Мы переходим сейчас к следующим предложениям, которыми нам придется пользоваться в дальнейшем.
Пусть
есть некоторый полином
Подставляя вместо
некоторую матрицу А, мы получаем полином от матрицы
В результате действий, указанных в правой части, мы получим некоторую новую матрицу, т. е. всякий полином от матрицы
есть также некоторая матрица. Отметим, что коэффициенты полинома
суть некоторые числа. Поскольку целые положительные степени одной и той же матрицы
коммутируют друг с другом и с любыми числами, мы можем утверждать, что не только сложение, но и умножение полиномов от одной и той же матрицы А производится по правилам обычной алгебры так же, как это делается с полиномами от численного аргумента. Таким образом, если мы имеем некоторое тождество, связывающее несколько полиномов от численного аргумента и содержащее действия сложения и умножения, то же самое тождество будет иметь место, если вместо аргумента
мы подставим любую матрицу А.
Основную роль в вопросе приведения матриц к каноническому виду играет характеристическое уравнение
где
элементы матрицы А. Это уравнение может быть записано в виде
где символ
означает определитель матрицы U. Как мы показали выше [91], имеет место следующее тождество Кейли:
т. е. если в характеристический полином
матрицы А вместо аргумента X вставить матрицу А, то в результате получится матрица, равная нулю.
Нам остается еще отметить два простых предложения. Как известно, корни уравнения (9) называются характеристическими числами матрицы А. Докажем следующую теорему: если
суть характеристические числа матрицы А, то у матрицы
где s — целое положительное число, характеристические числа будут
Принимая во внимание, что в полиноме
старший член равен
мы можем написать тождество относительно X:
Пусть
- корень степени s из единицы. Мы имеем очевидное тождество [I, 175]:
Принимая во внимание, что определитель произведения матриц равен произведению определителей и тождеств (12) и (13), мы можем написать
или
Отсюда, в силу тождества (13), получим
т. е.
что и доказывает высказанную теорему.
В дальнейшем нам придется вычислять определитель матриц, имеющих квазидиагональную форму
Нетрудно видеть, что он равен произведению определителей матриц А, т. е.
Для простоты письма ограничимся случаем
. Мы имеем в силу закона умножения
откуда
Применяя разложение определителя по элементам некоторого столбца или строки, мы получим, например,
откуда и вытекает непосредственно формула (14).
В заключение напомним, что подобные матрицы имеют одинаковые характеристические числа.