Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
§ 2. Базовый алгоритм ZET заполнения пробеловВ основе алгоритма ZET [72,83] лежат три предположения. Первое (гипотеза избыточности) состоит в том, что реальные таблицы имеют избыточность, проявляющуюся в наличии похожих между собой объектов (строк) и зависящих друг от друга свойств (столбцов). Если же избыточность отсутствует (как, например, в таблице случайных чисел), то предпочесть один прогноз другому не возможно.
Второе
предположение (гипотеза локальной компактности) состоит в утверждении, что для
предсказания пропущенного элемента Третье предположение (гипотеза линейных зависимостей) заключается в том, что из всех возможных видов зависимостей между столбцами (строками) в алгоритме ZET используются только линейные зависимости. Если зависимости носят более сложный характер, то для их надежного обнаружения требуется такой большой объем данных, который в реальных задачах встречается нечасто. В работе алгоритма ZET можно выделить три этапа. 1. На первом этапе для данного пробела из исходной матрицы «объект-свойство», столбцы которой нормированы по дисперсии, выбирается подмножество компетентных строк и затем для этих строк — компетентных столбцов. 2. На втором этапе автоматически подбираются параметры в формуле, используемой для предсказания пропущенного элемента, при которых ожидаемая ошибка предсказания достигает минимума. 3. На третьем этапе выполняется непосредственно прогнозирование элемента по этой формуле. Под
компетентностью
Здесь Под
компетентностью
где По
указанию пользователя программа выбирает компетентную подматрицу любого
размера в пределах от 2х2 до В
процессе предсказания значения пробела с использованием зависимостей между
Здесь
Рис. 22 По
формуле (1) с выбранным значением Процедура
заполнения пробела с использованием связи между
Для выбора Общий
прогноз
Здесь Как
отмечалось, оценка ожидаемой ошибки заполнения пробела (отклонения
предсказанного значения от истинного) может быть получена в процессе подбора
коэффициента Второй
способ определения ожидаемой ошибки основан на оценке дисперсии «подсказок».
Вычисляется дисперсия Для различных прикладных задач были сделаны многочисленные модификации описанного выше базового алгоритма ZET, отличающиеся своим назначением и наборами разных режимов работы. Программы заполнения пробелов могут работать в одном из следующих режимов: 1. Заполнение всех пробелов. 2. Заполнение только тех пробелов, ожидаемая ошибка для которых не превышает заданной величины. 3. Заполнение пробелов только на базе информации, имеющейся в исходной таблице. 4. Заполнение каждого следующего пробела с использованием исходной информации и прогнозных значений ранее заполненных пробелов. Для каждого из этих вариантов имеется несколько режимов выдачи промежуточных и окончательных результатов на печать.
|
1 |
Оглавление
|