§ 5. Обращение прямоугольных матриц. Псевдообратная матрица
Если
— квадратная и
неособенная матрица, то для нее существует обратная матрица
. Если же
— не квадратная,
а прямоугольная
-матрица
(
) или
квадратная, но особенная, то матрица
не имеет
обратной и символ
не имеет смысла. Однако, как
будет показано далее, для произвольной прямоугольной матрицы
существует
«псевдообратная» матрица
, которая
обладает некоторыми свойствами обратной матрицы и имеет важные применения при
решении системы линейных уравнений. В случае, когда
— квадратная неособенная матрица,
псевдообратная матрица
совпадает с обратной
.
1. Скелетное разложение матрицы. В дальнейшем мы
будем пользоваться представлением произвольной прямоугольной
-матрицы
ранга
в виде произведения
двух матриц
и
, имеющих соответственно размеры
и
:
. (36)
Здесь ранги сомножителей
и
обязательно равны
рангу произведения
,
. Действительно (см. стр. 22),
Но ранги
и
не могут
превосходить
,
так как
—
один из размеров матриц
и
. Поэтому
.
Для того чтобы получить
разложение (36), достаточно в качестве столбцов матрицы
взять любые
линейно независимых
столбцов матрицы
,
либо любые
линейно
независимых столбцов, через которые линейно выражаются столбцы матрицы
. Тогда произвольный
-й столбец
матрицы
будет
линейной комбинацией столбцов матрицы
с коэффициентами
; эти коэффициенты и образуют
-й столбец
матрицы
(
, см. стр. 19).
Поскольку
матрицы
и
имеют
максимально возможный ранг
, то квадратные матрицы
и
являются
неособенными:
,
.
(37)
Действительно, пусть столбец
— произвольное
решение уравнения
.
(38)
Помножим это уравнение слева на строку
. Тогда
. Отсюда следует
и (поскольку
— линейная
комбинация линейно независимых столбцов матрицы
; ср. с формулой (13"))
. Из того, что
уравнение (38) имеет только нулевое решение
, вытекает, что
. Аналогично устанавливается
второе неравенство (37).
Разложение (36) будем называть скелетным разложением
матрицы
.
2. Существование и единственность псевдообратной
матрицы. Рассмотрим матричное уравнение
.
(39)
Если
— квадратная неособенная матрица, то
это уравнение имеет единственное решение
. Если же
— произвольная прямоугольная
-матрица, то искомое
решение
имеет
размеры
но
не определяется однозначно. В общем случае уравнение (39) имеет бесчисленное
множество решений. Ниже будет показано, что среди этих решений имеется только
одно, обладающее тем свойством, что его строки и столбцы являются линейными
комбинациями соответственно строк и столбцов сопряженной матрицы
. Именно это решение
мы будем называть псевдообратной матрицей для
и обозначать через
.
Определение 5. Матрица
размеров
называется псевдообратной для
-матрицы
, если выполняются
равенства
, (40)
, (41)
где
и
— некоторые матрицы
Докажем сначала, что для данной матрицы
не может существовать
двух различных псевдообратных матриц
и
. Действительно, из равенств
,
,
,
Полагая
,
,
, найдем:
,
.
Отсюда
и, следовательно (см. конец § 3),
.
Но тогда
, т.е.
.
Для того чтобы установить существование матрицы
, мы воспользуемся
скелетным разложением (36) и будем искать сначала псевдообратные матрицы
и
. Так как по
определению должны иметь место равенства
,
(42)
где
— некоторая матрица, то
.
Умножая слева на
и замечая, что
— неособенная квадратная
матрица, найдем:
.
Но тогда второе из равенств (42) дает искомое
выражение для
:
. (43)
Совершенно аналогично найдем:
. (44)
Покажем теперь, что матрица
(45)
удовлетворяет условиям (40), (41)
и, следовательно, является псевдообратной матрицей для
.
В самом деле,
.
С другой стороны, из равенств (43),
(44) и (45) с учетом равенства
, полагая
, находим
,
,
где
,
.
Таким образом доказано, что для
произвольной прямоугольной матрицы
существует одна и только одна псевдообратная матрица
, которая определяется формулой (45), где
и
— сомножители в скелетном разложении
матрицы
.
Из самого определения псевдообратной матрицы непосредственно следует, что в
случае квадратной неособенной матрицы
псевдообратная матрица
совпадает с обратной
.
Пример. Пусть
.
Здесь
. в качестве
столбцов матрицы
первые два
столбца матрицы
. Тогда
и
,
.
,
.
Поэтому,
согласно формуле (45)
3. Свойства
псевдообратной матрицы. Отметим
следующие свойства псевдообратной матрицы:
1
;
2
;
3
,
;
4
,
.
Первое свойство означает, что
операции перехода к сопряженной и к псевдообратной матрице перестановочны между
собой. Равенство 2° выражает собой взаимность понятия псевдообратной матрицы,
тан как согласно 2° псевдообратной матрицей для
является
исходная матрица
. Согласно равенствам 3° и 4°
матрицы
и
являются
эрмитовыми и инволютивными (квадрат каждой из этих
матриц равен самой матрице).
Для вывода равенства 1°
воспользуемся скелетным разложением (36):
. Тогда
равенство
дает скелетное
разложение матрицы
. Поэтому, заменяя в формуле
(45) матрицу
на
, а матрицу
на
,
получим:
.
Равенства
,
,
являются скелетными
разложениями. Следовательно,
.
Используя свойство 1°, а также
выражения для
и
, найдем:
.
Справедливость равенств 3° и 4°
проверяется непосредственно путем подстановки в эти равенства вместо
соответствующего
выражения из формулы (45).
Заметим, что в общем случае, когда
разложение
не
является скелетным, не всегда имеет место равенство
. Так,
например
.
Здесь
,
,
.
Поэтому
.
4. Наилучшее
приближенное решение (по методу
наименьших квадратов). Рассмотрим произвольную систему линейных уравнений
(46)
или в
матричной записи
. (46')
Здесь
-
заданные
числа, а
–
искомые.
В
общем случае система (46) может быть и несовместной.
Столбец
(47)
называется наилучшим приближенным решением системы (46), если при значениях
«квадратичное
отклонение»
(48)
достигает своего наименьшего
значения и среди всех столбцов
, для которых это отклонение имеет минимальное
значение, столбец
имеет наименьшую «длину», т. е. для этого столбца
величина
(49)
имеет наименьшее значение.
Покажем, что система (46) всегда
имеет одно и только одно наилучшее приближенное решение и это приближенное
решение определяется по формуле
, (50)
где
— псевдообратная матрица для матрицы
.
Для этого рассмотрим произвольный
столбец
и
положим
,
где
,
. (51)
Тогда
. (52)
Но
. (53)
Исходя из разложения (36) и формулы
(45), найдем:
.
Поэтому из равенства
(53) следует
,
(54)
но тогда и
.
(54')
Поэтому
из равенства (52) находим
,
(55)
и,
следовательно, для любого столбца
.
(56)
Пусть
теперь
;
тогда,
согласно равенству (55)
,
(57)
где
.
С другой
стороны,
.
(58)
Вспоминая,
что
(см.определение
5), получим в силу (57):
. (59)
Но
тогда и
.
Поэтому
из равенства (58) находим
,
и,
следовательно
,
(60)
причем
знак = имеет место только при
, т.е. при
, где
.
Пример.
Найти наилучшее приближенное решение (по методу наименьших квадратов) системы
линейных уравнений:
,
,
.
Здесь
.
Но
тогда (см. пример на стр. 35)
,
и
поэтому
.
Следовательно,
,
,
,
.
Определим
норму
- матрицы
как
неотрицательное число, задаваемое формулой
.
(61)
При
этом очевидно, что
.
(61')
Рассмотрим
матричное уравнение
,
(62)
где
и
– заданные
и
-матрицы, а
- искомая
-матрица.
Определим
наилучшее приближенное решение
уравнения (62) из условия
,
причем
в случае, когда
,
требуется,
чтобы
.
Из
соотношений
,
(63)
(64)
следует,
что
-й
столбец искомой матрицы
должен быть наилучшим приближенным
решением системы линейных уравнений
Поэтому
Поскольку
это равенство справедливо при любом
то
.
(65)
Таким
образом, уравнение (62) всегда имеет одно и только одно наилучшее приближенное
решение, определяемое формулой (65).
В
частном случае, когда
— единичная матрица
-го порядка, имеем
. Следовательно,
псевдообратная матрица
является наилучшим приближенным
решением (по методу наименьших квадратов) матричного уравнения
.
Это
свойство псевдообратной матрицы
может быть принято в
качестве ее определения.
5.
Метод Гревилля последовательного нахождения псевдообратной матрицы состоит в
следующем. Пусть
-
-й столбец в
-матрице
,
— матрица, образованная
первыми
столбцами
матрицы
.
—
последняя строка в матрице
(
,
,
). Тогда
(66)
и
для
имеют
место рекуррентные формулы
,
,
;
(67)
при
этом, если
,
то
;
(68)
если
же
, т.е.
, то
.
(69)
Предлагаем читателю проверить, что
матрица
является
псевдообратной для матрицы
, если матрица
и строка
определяются формулами (61)-(64). Этот метод не
требует вычисления детерминантов и может быть использован для вычисления
обратной матрицы. Пример. Пусть
.
Заметим.
Что для каждой матрицы
мы можем писать
вместо
. Тогда
,
,
,
,
.
Таким
образом
.
Далее
и
.
Поэтому
и
.