ГЛАВА VIII. МАТРИЧНЫЕ УРАВНЕНИЯ
В
этой главе мы рассмотрим некоторые типы матричных уравнений, встречающиеся в
разнообразных вопросах теории матриц и ее приложений.
§ 1. Уравнение AX=XB
Пусть
дано уравнение
, (1)
где
и
– две заданные
квадратные матрицы (вообще говоря, разных порядков)
,
а
– искомая
прямоугольная матрица размером
:
.
Выпишем
элементарные делители матриц
и
(в поле комплексных чисел):
.
В
соответствии с этими элементарными делителями приведем матрицы
и
к нормальной
жордановой форме
, (2)
где
и
– квадратные
неособенные матрицы соответственно порядка
и
, а
и
– жордановы матрицы:
(3)
Подставляя
в уравнение (1) вместо
и
их выражения (2), получим:
.
Умножим
обе части этого равенства слева на
, а справа – на
:
. (4)
Вводя
вместо искомой матрицы
новую искомую матрицу
(тех же размеров
)
, (5)
мы
уравнение (4) запишем так:
. (6)
Мы
заменили матричное уравнение (1) уравнением (6) того же вида, но в котором
заданные матрицы имеют нормальную жорданову форму.
В
соответствии с квазидиагональным видом матриц
и
разобьем матрицу
на блоки:
(здесь
– прямоугольная
матрица размером
).
Используя
правило умножения блочной матрицы на квазидиагональную (см. стр. 56),
произведем умножение матриц в левой и правой частях уравнения (6). Тогда это
уравнение распадается на
матричных уравнений
,
которые
перепишем еще так:
; (7)
при
этом мы ввели сокращенные обозначения
. (8)
Возьмем
какое-нибудь из уравнений (7). Могут представиться два случая:
1.
. Проитерируем
раз
равенство (7):
. (9)
Заметим,
что в силу (8)
. (10)
Если
в (9) взять
,
то в каждом члене суммы, стоящей в правой части равенства (9), выполняется по
крайней мере одно из соотношений
,
и
потому в силу (10) либо
, либо
. Так как, кроме того, в
рассматриваемом случае
, то из (9) находим:
. (11)
2.
. В этом
случае уравнение (7) принимает вид
. (12)
В
матрицах
и
элементы
первой наддиагонали равны единице, а все остальные элементы равны нулю.
Учитывая эту специфичную структуру матриц
и
и полагая
,
мы
заменим матричное уравнение (12) следующей эквивалентной ему системой скалярных
соотношении:
. (13)
Равенства
(13) означают:
1)
В матрице
на
каждой линии, параллельной главной диагонали, стоят равные между собой
элементы,
2)
.
Пусть
. В этом
случае
–
квадратная матрица. Из 1), 2) следует, что в матрице
все элементы, расположенные
под главной диагональю, равны нулю, все элементы главной диагонали равны
некоторому числу
,
все элементы первой наддиагонали равны некоторому числу
и т. д., т. е.
; (14)
здесь
–
произвольные параметры (уравнения (12) не накладывают никаких ограничений на
значения этих параметров).
Легко
видеть, что при
, (15)
а
при
. (16)
Про
матрицы (14), (15) и (16) мы будем говорить, что они имеют правильную верхнюю
треугольную форму. Число произвольных параметров в
равно наименьшему из чисел
и
. Приведенная ниже
схема показывает структуру матрицы
при
(произвольные параметры здесь
обозначены через
):
Для
того чтобы при подсчете произвольных параметров в матрице
охватить и случай 1,
обозначим через
наибольший
общий делитель элементарных делителей
и
, а через
– степень многочлена
. В случае 1
; в случае 2 имеем:
. Таким
образом, в обоих случаях число произвольных параметров в
равно
. Число произвольных
параметров в
определяется
формулой
.
В
дальнейшем нам удобно будет общее решение уравнения (6) обозначить через
(до сих пор мы это
решение обозначали буквой
).
Полученные
в этом параграфе результаты можно сформулировать в виде следующей теоремы:
Теорема
1. Общее решение матричного уравнения
,
где
задается
формулой
. (17)
Здесь
– общее
решение уравнения
– имеет следующую структуру:
разбивается на
блоки
;
если
, то на
месте
стоит
нулевая матрица, если же
, то на месте
стоит произвольная
правильная верхняя треугольная матрица.
,
а следовательно, и
зависят линейно от
произвольных
параметров
:
, (18)
где
определяется
формулой
(19)
[здесь
обозначает
степень наибольшего общего делителя
и
].
Заметим,
что матрицы
,
фигурирующие в формуле (18), суть решения исходного уравнения (1) (матрица
получается из
, если параметру
дать значение
единицы, а остальным параметрам – нулевые значения;
). Эти решения линейно
независимы, так как в противном случае при некоторых значениях параметров
, не равных
одновременно нулю, матрица
, а следовательно, и
равнялись бы нулю,
что невозможно. Таким образом, равенство (19) показывает, что любое решение
исходного уравнения представляет собой линейную комбинацию
линейно независимых
решений.
Если
матрицы
и
не имеют
общих характеристических чисел (характеристические многочлены
и
взаимно просты),
то
и,
следовательно,
,
т. е. в этом случае уравнение (1) имеет только тривиальное нулевое решение
.
Замечание.
Пусть элементы матриц
и
принадлежат некоторому числовому полю
. Тогда
нельзя утверждать, что элементы матриц
фигурирующих в формуле (17), также
принадлежат полю
.
Элементы этих матриц можно выбрать в расширенном поле
, которое получается из поля
путем
приобщения к последнему корней характеристических уравнений
и
. С такого рода расширением
основного поля всегда приходится иметь дело, когда пользуются приведением
заданных матриц к нормальной жордановой форме.
Однако
матричное уравнение (1) эквивалентно системе
линейных однородных уравнении, где
неизвестными служат элементы
искомой матрицы
:
. (20)
Нами
доказано, что эта система имеет
линейно независимых решений, где
определяется
формулой (19). Но известно, что базисные линейно независимые решения можно
выбрать в основном поле
, которому принадлежат коэффициенты
уравнений (20). Таким образом, в формуле (18) матрицы
можно выбрать так, чтобы их
элементы принадлежали полю
. Тогда, придавая в формуле (18)
произвольным параметрам всевозможные значения из поля
, мы получим все матрицы
с элементами из
, удовлетворяющие
уравнению (1).