Главная > Методы анализа данных. Подход, основанный на методе динамических сгущений
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

6.4.5. Сходимость и критерии остановки алгоритма

Мы видели (см. 6.2.3), что алгоритм сходится, достигая несмещенным элемент, т. е. разбиение такое, что

Для контроля за сходимостью алгоритма удобно использовать критерий, оценивающий «количество информации» (см. 19, с. 561), измеряющее объем изменений индексов классов индивидуумов при переходе от одного разбиения к другому на шаге алгоритма.

6.4.5.1. Остановка алгоритма, когда достигается несмещенный элемент

Информацию о принадлежности индивидуума к классу рассматривают как наименьшее возможное количество информации. Если К — число требуемых классов, то определение единицы выбранной информации является определением свойства с К модальностями (появления события среди К равновероятных). Таким образом, можно ввести следующее понятие. Пусть два разбиения (содержащие, возможно, пустые классы) множества Средняя условная информация, содержащаяся в разбиении когда известно определяется так:

Можно доказать следующие предложения:

1. тогда и только тогда, когда является измельчением или совпадает с

2 тогда и только тогда, когда точки каждого класса распределены равномерно во всех классах

3. Во всех остальных случаях Отсюда видно, что если для некоторого , то каждый класс из при переходе к целиком входит в некоторый класс разбиения Тогда в случае равенства числа классов в получаем, что разбиение несмещенное; противоположный случай встречается на практике редко. Проверка значения критерия проводится в алгоритме сразу после получения разбиения для того, чтобы выявить, возможно, несмещенный элемент (в этом случае «экономят» итерацию, т. е. К локальных факторных анализов).

Тем не менее на практике возможно и даже желательно, во избежание слишком большого числа итераций, останавливать алгоритм, как только получают разбиение, достаточно устойчивое в смысле, который мы сейчас уточним.

6.4.5.2. Устойчивость разбиения

Считают, что разбиение устойчиво, если:

1) условная информация, содержащаяся в при известном меньше некоторого порога, который задается на основе сведений о данных;

2) переход от значимо не меняет величину критерия полученных аффинных многообразий. Это понятие устойчивости обосновывает процедуры остановки, описанные в 6.2.3.3.

1
Оглавление
email@scask.ru