§ 5. Существование канонического базиса для всякой квадратичной и всякой билинейной функции («приведение квадратичных форм к каноническому виду»)
Квадратная матрица
все элементы которой, не лежащие на главной диагонали, равны нулю, называется матрицей диагонального вида или просто диагональной матрицей.
Квадратичная, а также билинейная форма, матрица которой имеет диагональный вид, называется формой канонического вида, или просто канонической формой, или канонической записью (каноническим представлением) данной квадратичной функции или квадратичной формы.
Теорема 7. Для каждой квадратичной и для каждой симметричной билинейной функции, определенной в пространстве
, существует канонический базис, т. е. базис
, в котором данная функция имеет каноническую запись.
При этом число отличных от нуля среди коэффициентов
во всякой канонической записи равно рангу функции.
Мы знаем, что каждая симметричная билинейная функция является полярной функцией от одной и только от одной квадратичной функции и что обе эти функции во всяком базисе имеют одну и ту же матрицу. Поэтому достаточно доказать теорему 7 для квадратичных функций. Заметим прежде всего, что ранг матрицы диагонального вида (1), очевидно, равен числу отличных от нуля ее членов
. Поэтому, если квадратичная функция в каком-нибудь базисе имеет каноническую запись, то число отличных от нуля коэффициентов в этой записи равно рангу функции — второе утверждение теоремы 7 есть следствие первого.
к доказательству первого утверждения. Тривиальный случай, когда
для всех и
, оставляем в стороне.
Пусть в пространстве
дана квадратичная функция Ф, записывающаяся в некотором базисе
в виде
для
. Пусть, наряду с базисом
, дан второй базис
.
При
форма
имеет вид
, и этот вид уже является каноническим. Предположим, что теорема 7 доказана для
. Докажем ее при
. Предположим сначала, что в
хотя бы один коэффициент вида
, т. е. коэффициент при квадрате одного из переменных, отличен от нуля. Без ограничения общности можем предположить, что
. Тогда выражение
(после раскрытия скобки) является однородным многочленом второй степени, т. е. квадратичной формой от
неременных
, в которой члены, содержащие
, суть в точности те же, что и в форме
. Поэтому разность
есть квадратичная форма уже от
переменных
, которую мы обозначим через
:
В силу индуктивного предположения существует линейное преобразование неременных
:
приводящее форму
к каноническому виду
Поэтому имеет место равенство
Теперь положим
что позволяет нам записать (4) в виде
— форма
приобрела относительно переменных
канонический вид;
Переход от переменных
к переменным
есть линейное преобразование переменных с невырожденной матрицей. В самом деле, разрешая (5) относительно
, получим
Подставляя сюда вместо
их выражения
через
, можем — после приведения подобных членов — переписать (5) в виде
что вместе с
дает нам искомые формулы преобразования переменных
с детерминантом
Итак, преобразование
приводит форму
к каноническому виду (6) и решает, таким образом, поставленную задачу в предположении, что хоть одно
.
Остается рассмотреть случай, когда все
. Таким образом, для всех отличных от нуля коэффициентов
формы
имеем
. Среди этих коэффициентов имеются
отличные от нуля (иначе было бы
тривиальный случай, исключенный выше). Итак, пусть,
.
Тогда
члены, каждый из которых содержит хотя бы одно из переменных
.
Сделаем преобразование
детерминант которого есть
Преобразование (7) переводит форму
в форму
, которая состоит из
, т. е. из
и из членов, содержащих по крайней мере одно из переменных
ни один из этих членов не может сократиться ни с
ни с
, поэтому форма
содержит
с коэффициентом
, отличным от нуля; значит,
, по предыдущему, приводится к каноническому виду линейным преобразованием переменных
к каким-то новым переменным
. Переход от первоначальных переменных
к переменным
(слагаясь из двух невырожденных линейных преобразований) является невырожденным линейным преобразованием, приводящим форму
к каноническому виду. Теорема 7 доказана.
Теорема 8 («закон инерции для квадратичных
всех канонических записях данной квадратичной функции
:
для
число положительных среди коэффициентов
одно и то же; оно называется индексомх) данной квадратичной функции (и индексом любой квадратичной формы, представляющей эту функцию в каком-либо базисе).
Доказательство. Пусть даны какие-нибудь два канонических представления квадратичной функции Ф:
для
для
В канонических представлениях (8) и
мы пишем лишь члены, отличные от нуля; их число, по только что доказанному, в обоих представлениях одно и то же и равно рангу
функции Ф.
Предположим, что в представлении (8) имеется k положительных коэффициентов, а в представлении
число положительных коэффициентов есть
. Без ограничения общности можем предположить, что среди коэффициентов
положительными являются
(и только они) и что среди коэффициентов
положительны
. Переход от переменных
к переменным
и к переменным
осуществляется невырожденными линейными преобразованиями, так что, обратно, как
, так и
линейно выражаются через
:
Без ограничения общности можем предположить, что
. Напишем уравнения, полученные приравниванием нулю правых частей первых к тождеств (9) и последних
тождеств
. Получим всего
однородных уравнений (относительно
неизвестных
):
Так как число уравнений меньше числа неизвестных, то система (10) имеет решения, отличные от нулевого. Пусть
, — одно из таких решений.
Подставляя значения
в (9) и
, получаем числовые значения переменных
, причем
так что при подстановке найденных числовых значений переменных
получим числовое значение многочлена
, равное одновременно
и
Но все коэффициенты при квадратах в (
) отрицательны, а в
— положительны, поэтому (11) и
могут выражать одно и то же число лишь при условии, что одновременно все числа
равны нулю. Значит, выполнены не только тождества
но и тождества
т.е.
есть решение системы
из
однородных уравнений с
неизвестными; значит, детерминант этой системы, т. е. детерминант
, должен быть равен нулю, тогда как он отличен от нуля. Полученное противоречие доказывает теорему.
Замечание. Пусть Ф — квадратичная функция ранга
, определенная в пространстве
индекс функции Ф обозначим через
. Тогда в любом каноническом представлении функции Ф (относительно любого канонического базиса
)
апхп для
число положительных коэффициентов среди
равно
, число отрицательных равно
, а число коэффициентов
, равных нулю, есть
.
Число
называется сигнатурой квадратичной функции Ф (и всякой квадратичной формы, представляющей относительно какого-нибудь базиса функцию Ф). Из трех чисел
любые два определяют третье (и
).
В самом деле, если даны
то
если даны
, то
.
Полученные результаты могут быть дополнены следующим предложением.
Теорема 9. Для каждой квадратичной функции Ф ранга
и индекса
, определенной в
-мерном пространстве
, существует базис
, относительно которого эта функция записывается в виде
В самом деле, предположим, что мы уже нашли базис
, в котором функция Ф имеет каноническую запись
Среди коэффициентов
число отличных от нуля равно
; поэтому без ограничения общности можно предположить (изменив, если нужно, нумерацию единичных векторов
), что
отличны от нуля, а
. При этом среди коэффициентов
имеются
положительных, пусть это будут
а остальные — отрицательные
все
можно предположить положительными.
Перейдем теперь к базису
что означает преобразование координат
В результате которого получаем
для
что и требовалось доказать.
Квадратичная функция
и представляющая ее в любом данном базисе квадратичная форма
называются положительно определенными, если для любого вектора и
значение функции
положительно. Итак, квадратичная форма
положительно определенна, если она обращается в нуль, лишь когда обращаются в нуль одновременно все переменные
, и положительна, если значение по крайней мере одного переменного отлично от нуля.
Из этого определения сразу следует
Замечание 1. Если квадратичная функция
положительно определенна, то во всяком представлении ее в виде квадратичной формы
все коэффициенты при квадратах переменных положительны. В самом деле, если иоложим
, то, полагая
имеем
вопреки предположению. В частности, положительны все коэффициенты
в каноническом представлении
положительно определенной функции
. Обратно, из того, что все
, положительны, очевидно, следует, что
для любого
, т. е. что функция
положительно определенна.
Итак, имеет место
Теорема 10. Для того чтобы квадратичная функция
[квадратичная форма
) была положительно определенной, необходимо и достаточно, чтобы в ее каноническом представлении (относительно канонического базиса
)
все коэффициенты
, - были положительны.
Из теоремы 10, в частности, следует, что всякая положительно определенная квадратичная функция
в
-мерном пространстве
имеет ранг
.
Замечание 2. Дискриминант положительно определенной квадратичной формы
положителен.
Так как при переходе от одного базиса к другому дискриминант квадратичной формы сохраняет свой знак (теорема 3), то достаточно рассмотреть дискриминант
канонического представления данной положительно определенной квадратичной формы, который (так как все
очевидно, положителен.
Квадратичная функция (форма) называется полуопределенной положительно, если для всех векторов и имеем
. Очевидно, для положительной полуопределенности квадратичной функции необходимо и достаточно, чтобы в ее каноническом представлении все коэффициенты
, - были неотрицательны.
Квадратичная функция (форма) называется отрицательно определенной или соответственно отрицательно полуопределенной, если она для всякого
принимает отрицательное, соответственно неположительное, значение. Это бывает тогда и только тогда, когда все коэффициенты в каноническом представлении отрицательны, соответственно неположительны.
При всяком представлении отрицательно определенной квадратичной функции
в виде формы
коэффициенты
при квадратах переменных отрицательны.
Условимся, наконец, называть симметричную билинейную функцию
положительно (соответственно отрицательно) определенной, если этим свойством обладает порожденная ею квадратичная функция
Замечание 3. В случае двух переменных докажем следующее предложение. Для того чтобы квадратичная форма
была положительно определенной, необходимо и достаточно, чтобы три числа
были положительны.
Необходимость условия вытекает из замечаний 1 и 2. Доказываем достаточность. Так как
, то в каноническом представлении
формы
имеем
одного знака; если бы
были отрицательны, то форма
была бы отрицательно определенной, и тогда было бы
— вопреки предположению.