14.7. Конструирование моделей, использующих плотность вероятности
В случае когда из двух соседних кластеров один значительно меньше другого, имеет смысл подвинуть границу между ними ближе к центроиде меньшею кластера. Точно так же, если кластеры вытянуты в направлении, отличающемся от направления линии, соединяющей их центроиды, граница должна быть повернута в направлении их вытянутости. Хороший способ модификации представленных выше простых схем состоит в использовании стандартных моделей распределения вероятности.
Как правило, используется гауссовское распределение для измерений
со средним х и средним квадратичным отклонением . Это делается не столько потому, что позволяет аппроксимировать распределение-вероятностей, встречающееся на практике, сколько потому, что позволяет получать решения в аналитической форме. Мы начинаем с двух распределений с одинаковым разбросом и центроидами соответственно. Можно было бы поместить границу там, где плотности вероятности имеют одинаковое значение, т. е. там, где
или просто Опять получилось уравнение перпендикуляра к середине линии, соединяющей Таким образом, найдена конкретная теоретическая модель, удовлетворяющая ранее предложенному методу, в котором использовались эвристические рассуждения. Граница размещается так, что число ошибок двух различных типов оказывается одинаковым.