§ 5. Системы линейных уравнений
В главе XII мы рассматривали лишь системы однородных линейных уравнений, теперь рассмотрим любые системы. Итак, пусть дана система
уравнений первой степени с
неизвестными:
Решением этих уравнений является, как и в случае однородной системы, всякий набор чисел
, обращающий при подстановке
систему (1) в систему числовых тождеств. Но, в отличие от случая однородной системы, мы теперь, в общем случае, будем решение
рассматривать не как вектор, а как точку
арифметического пространства
(или, что приводит к тому же, любого
-мерного аффинного пространства с заданной в нем системой координат). В частном случае, когда система (1) оказывается однородной, мы будем отождествлять точку
с вектором ОМ
, что позволит нам по-прежнему говорить о решениях однородных систем как о векторах.
Матрицей системы (1) будем по-прежнему называть матрицу
составленную из коэффициентов при неизвестных; ее ранг называется рангом системы уравнений (1).
Матрица
называется расширенной матрицей системы (1) (или, когда невозможны
-просто «расширенной матрицей»). Система (1) называется линейно независимой, если совокупность всех строк расширенной матрицы (3) есть линейно независимая система.
Если заменить правые части в уравнениях (1) нулями, то получится однородная система уравнений
называемая однородной системой, соответствующей системе (1).
Начнем с некоторых совершенно простых, но важных предложений. Прежде всего, в отличие от однородных систем, которые всегда имеют по крайней мере одно решение, а именно нулевое
, неоднородная система может не иметь ни одного решения; в этом случае система называется несовместной. Примером несовместной системы может служить система
а также система
Менее тривиален следующий пример. Пусть в трехмерном пространстве дана плоскость
в прямая, определяемая уравнениями
Тогда три уравнения
тогда и только тогда несовместны, когда прямая (II) параллельна (в собственном смысле) плоскости (I).
В этом случае все векторы, лежащие на прямой (II), лежат и в плоскости (I); матрица системы (III) имеет ранг 2; расширенная же матрица имеет ранг 3 (если бы она имела ранг 2, то прямая (II) лежала бы в плоскости
.
Имеет место общая
Основная теорема I. Для того чтобы система уравненный (1) была совместной, необходимо и достаточно, чтобы ранг матрицы. А системы был равен рангу расширенной матрицы
В самом деле, если система (1) совместна и имеет решение
, то вектор
есть линейная комбинация векторов-столбцов
матрицы А, а именно:
В этом случае вектор b содержится в векторном пространстве V, порожденном векторами
так что обе системы векторов
и
являются системами образующих одного и того же пространства V; но теореме 8 главы XII максимальное число линейно независимых элементов, содержащихся соответственно в (4) и в (4), одно и то же. А это значит, что максимальное число линейно независимых столбцов в матрицах А и
одно и то же, ранги этих матриц равны.
Если система (1) не имеет решения, то вектор
не является линейной комбинацией векторов-столбцов
матрицы А.
Возьмем какую-нибудь максимальную линейно независимую подсистему системы
пусть она состоит из
векторов
, например из
. Это означает, что ранг матрицы А равен
. Так как вектор
, не будучи линейной комбинацией векторов
, тем более не является линейной комбинацией векторов
, то система
есть линейно независимая система, состоящая из
столбцов матрицы
, так что ранг этой матрицы больше ранга
матрицы А. Теорема 1 доказана.
Напомним теперь совсем простой факт, доказанный еще в § 5 главы VII.
Лемма. Пусть
— какое-нибудь определенное решение системы (1). Всякое решение
системы (1) может быть записано в виде
где
— какое-нибудь решение однородной системы (10).
Обратно, всякая точка
, получаемая по формуле (5) из фиксированного решения
системы (1) и любого решения
системы (10), является решением системы (1).
Теперь в двух словах доказывается
Основная теорема 2. Пусть (1) есть совместная система ранга
. Тогда множество ее решений.
есть плоскость
-мерного пространства, имеющая размерность
.
Обратно, всякая
-мерная плоскость
-мерного пространства есть множество всех решений некоторой (линейно независимой) системы, состоящей из
уравнений первой степени с
неизвестными (имеющей, очевидно, ранг
).
Доказательство. Системы (1) и (10) имеют ранг
; множе ство всех решений системы (10) есть
-мерное,
, векторно пространство. Пусть
— какое-нибудь определенное решение системы (1). Тогда все решения системы (1) получаются в виде (5), где
— какой-нибудь вектор из V; другими словами, все решения
системы (1) (и только они) суть концевые точки всевозможных векторов
, приложенных к точке
. А это и значит, что множество всех решений системы (1) есть
-мерная плоскость (натянутая на точку
и какие-нибудь векторы их,
, образующие базнс пространства V).
Первое утверждение теоремы 2 доказано.
Доказываем второе утверждение. Пусть
есть
-мерная плоскость
-мерного аффинного пространства
. Предполагаем, что в
выбрана некоторая система координат, тогда все точки М и все векторы и пространства
записываются их координатами:
. В плоскости
берем произвольную точку
. Тогда любой вектор
плоскости
и только вектор, лежащий в плоскости
, может быть записан в виде
этим равенством установлено взаимно однозначное соответствие между всеми векторами и и всеми точками М, лежащими в плоскости
; при этом, если
, то
Но множество всех векторов, лежащих в плоскости
(будучи
-мерным подпространством векторного пространства V), есть множество решений
некоторой однородной линейно независимой системы из
уравнений с
неизвестными
пусть эта система есть
или, если заменить
их значениями (5),
Вектор
, тогда и только тогда удовлетворяет системе (6), если его конец
удовлетворяет системе (6), в которой неизвестными служат уже
.
Но все равно, сказать ли, что вектор
лежит в плоскости
(т. е. удовлетворяет системе
) или что в этой плоскости лежит его конец; поэтому множество всех точек
, удовлетворяющих системе (6), совпадает с множеством всех точек плоскости
. Полагая
Можем представить систему (6) в виде
Это и есть искомая независимая система из
уравнений, множество решений которой есть множество всех точек данной
-мерной плоскости и которая поэтому называется общей системой уравнений данной плоскости.
Замечание 1 (о параллельности). Плоскость
размерности
и плоскость
размерности
в
-мерном пространстве
называются параллельными между собою (в широком смысле), если многообразие V всех векторов, лежащих в плоскости
, содержится в многообразии V всех векторов, лежащих в плоскости
. Если две параллельные (в широком смысле) плоскости
и
имеют хотя бы одну общую точку
, то одна из двух плоскостей — та, размерность которой меньше, — целиком лежит в другой. Доказательство может быть предоставлено читателю. В частности, если обе параллельные (в широком смысле) плоскости имеют одну и ту же размерность, то они либо совпадают между собою, либо не имеют ни одной общей точки. Во втором случае эти плоскости называются параллельными в собственном смысле слова. Для (
-мерных плоскостей в
-мерном пространстве получаем условия параллельности, которые совершенно аналогичны условиям параллельности обыкновенных двумерных плоскостей в трехмерном пространстве.
Плоскости размерности
в
-мерном пространстве
часто называются гиперплоскостями
-мерного пространства. Каждая гиперплоскость задается одним линейным уравнением
между координатами точек
-мерного пространства
, и каждое уравнение вида (8) определяет некоторую гиперплоскость в
. Два уравнения этого вида тогда и только тогда эквивалентны между собою (т. е. определяют одну и ту же гиперплоскость), когда их коэффициенты пропорциональны.
Каждая гиперплоскость, заданная уравнением (8), разбивает пространство на два полупространства: одно состоит из всех точек
, в которых многочлен
принимает положительные значения, другое — из тех точек, в которых этот многочлен принимает отрицательные значения.
Про две точки
говорят, что они лежат по одну или по разные стороны от гиперплоскости (8), в зависимости от того, принадлежат ли они к одному или к разным полупространствам, определяемым данной гиперплоскостью.
Существенно отметить следующие факты: если две точки P и Q принадлежат к одному полупространству (лежат по одну сторону от гиперплоскости (8)), то к тому же полупространству принадлежат и все точки отрезка PQ. Другими словами: каждое полупространство является выпуклым множеством. Если же точки P и Q принадлежат к разным полупространствам (лежат по разные стороны от гиперплоскости (8)), то отрезок PQ пересекает гиперплоскость (8) в одной точке. Доказательства этих утверждений совершенно аналогичны доказательствам теоремы 2 (§ 6) главы V и теоремы 7 (§ 7) главы X.