6.3. ОЦЕНКИ ПО МАКСИМУМУ ПРАВДОПОДОБИЯ
Предположим теперь, что нам дано множество
непомеченных выборок, извлеченных независимо из смеси с плотностью
где вектор параметров
фиксирован, но неизвестен. Правдоподобие наблюдаемых выборок по определению — это совместная плотность
Оценка по максимуму правдоподобия
— это то значение
, которое максимизирует
Если мы предположим, что
— дифференцируемая функция по
, то можем получить некоторые интересные необходимые условия для
. Пусть
-логарифм правдоподобия, и пусть
— градиент I по отношению к
. Тогда
и
Если мы предположим, что элементы векторов
; функционально независимы при
и если вводим апостериорную вероятность
то видим, что градиент логарифма правдоподобия можно записать в удобной форме:
Поскольку градиент должен обратиться в нуль при
которое максимизирует I, оценка по максимуму правдоподобия 0г должна удовлетворять условиям
Обратно, среди решений этих уравнений для
мы найдем решение, удовлетворяющее максимуму правдоподобия.
Нетрудно обобщить эти результаты, включив априорные вероятности
в неизвестные величины. В этом случае поиск максимального значения
распространяется на
при ограничениях
и