Рис. 15.2.1. (см. скан) Поэтапное изучение с использованием теоремы Байеса
Если их просто скомбинировать и образовать одно множество, обозначаемое как
то, задавая вид правдоподобий
можно продолжить рассмотрение таким же образом, как в предыдущем разделе, чтобы получить апостериорные вероятности
Однако во многих практических ситуациях данные поступают последовательно, так что
появляется раньше, чем
и мы хотим сначала проанализировать наши вероятности в свете
а позднее пересмотреть их в свете
Схематически этот процесс изображен на рис. 15.2.1.
С точки зрения здравого смысла у нас есть надежда прийти к одинаковым конечным апостериорным вероятностям
независимо от того, поступили ли данные
все одновременно и теорема Байеса применялась один раз или два, как на рис. 15.2.1.
Действительно, легко проверить математически, что этот результат, основанный на здравом смысле, вполне правильный.
Предположим, что у нас имеются наблюдения
и первый этап, изображенный на рис. 15.2.1, завершен. Тогда, вспомнив, что все «входы» изображенного на рисунке второго этапа условны по
получим необходимые для применения теоремы Байеса на втором этапе величины:
и
Пользуясь теоремой Байеса, получим:
где
Однако в результате применения теоремы Байеса на первом этапе имеем:
Подставляя это выражение в выражение
получим:
Но к такому же результату приводит и однократное применение теоремы Байеса для объединенного множества данных
Следовательно, искомый результат получен.
Отметим еще два момента:
а) как схему, изображенную на рис. 15.2.1, так и проведенные математические рассуждения можно обобщить на любое число этапов (порций данных);
б) часто встречаются ситуации, когда множества данных
условно зависящие от каждого из
содержат независимую информацию, такую, что
Это упрощает вычисления.
Пример 15.2.4. При предварительном медицинском обследовании пациента обнаружено, что он находится в одном из взаимоисключающих медицинских состояний
каждое из которых первоначально оценивается как равновероятное. При дальнейшем обследовании выявилось наличие симптома X (данные
) и симптома
(данные
), о которых известно, что они существуют независимо друг от друга, если задано какое-либо конкретное медицинское состояние. Имеются многочисленные прошлые записи, позволяющие врачам рассчитать
для
Ниже суммируются полученные результаты:
Используя эти значения, можно рассмотреть вероятности состояний
взяв сначала
а затем на втором этапе включив
. С помощью теоремы Байеса на первом этапе получим:
где
Отсюда
На втором этапе, учитывая независимость
при заданных
запишем теорему Байеса в виде
где
Рис. 15.2.2. (см. скан) Последовательный пересмотр
данные)
В результате получим:
Пересчет этих вероятностей по мере увеличения количества информации продемонстрирован на рис. 15.2.2.