§ 2.8. Поиск экстремумов
В заключение этой главы мы рассмотрим задачу поиска экстремумов функций нескольких переменных при наличии ограничений. Эта задача непосредственно не относится к исследованию свойств количества информации, но весьма часто встречается в теории информации в приложении к максимизации или минимизации средней взаимной информации, а также других теоретико-информационных функций. Ниже будут сформулированы необходимые условия экстремума, так называемые условия Куна-Таккера, и показано, что эти условия являются достаточными для максимизации или минимизации выпуклых функций, заданных на выпуклых множествах.
Всюду ниже будет предполагаться, что рассматриваемые функции имеют непрерывные частные производные в области определений. Особый интерес для теории информации представляет случай, когда рассматриваемые функции определены на множестве вероятностных векторов следовательно, ограничения при поиске экстремума выделяют только те векторы, для которых
2.8.1. Метод неопределенных множителей Лагранжа.
Предположим, что требуется найти экстремум функции при условии, что где все функции определены на множестве -мерных действительных векторов Стандартным методом решения такой задачи, приводящим задачу поиска условного экстремума к задаче поиска безусловного, является метод неопределенных множителей Лагранжа.
Идею этого метода поясним на примере функций двух переменных: пусть требуется найти экстремум при условии, что в экстремальной точке у выполняется равенство Предположим, что в точке у частные производные не равны нулю одновременно. Если последнее условие выполнено, например, то в некоторой окрестности точки у однозначно определена дифференцируемая по х функция следовательно, задача заключается
порядка образованные частными производными функций по из переменных
Метод неопределенных множителей Лагранжа дает один из возможных путей поиска экстремумов функций нескольких переменных при наличии ограничений. Однако условия (2.8.4), при которых этот метод применим, могут не выполняться. С другой стороны, часто встречаются задачи поиска экстремума при ограничениях, представляющих собой неравенства, а не равенства, как в разобранном выше случае. Поэтому желательно иметь необходимые условия экстремума, не зависящие от типа ограничений и от свойств функций, задающих ограничения. Такого сорта задачи составляют предмет теории нелинейного программирования (см., например, [8]). Одним из центральных результатов нелинейного программирования, который широко используется в теории информации, является теорема Куна—Танкера.
Рис. 2.8.1. Градиент и приращение функции по направлению