Главная > Методы анализа данных. Подход, основанный на методе динамических сгущений
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

5.2.2. Аппроксимация расстояний

Полагаем, что расстояние на задается квадратичной формой, определяемой некоторой симметричной положительно определенной матрицей М:

5.2.2.1. Псевдорасстояние от полного вектора до неполного вектора

Пусть и об известно, что Мы хотели бы уметь вычислять По определению имеем:

Эта величина невычисляема. Найдем ее аппроксимацию. Мы можем вычислить расстояние от и до

Однако из рис. 5.2 видно, что более естественно было бы спроектировать вектор и в то же пространство, в котором находится т. е. в и затем вычислить расстояние между двумя проекциями векторов

и в пространство Следовательно, мы аппроксимируем расстояние величиной

которую назовем псевдорасстоянием от полного вектора и до неполного вектора и обозначим через Итак,

по определению.

Рис. 5.2

При использовании такой аппроксимации необходимо соблюдать некоторую осторожность. Прежде всего это — не расстояние в общепринятом смысле этого понятия. В самом деле, нетрудно убедиться, что, во-первых, из не следует с необходимостью во-вторых, для может не соблюдаться неравенство треугольника. Кроме того, в 5.2.2.3 мы увидим, что сравнение псевдорасстояний редко оказывается возможным.

Пример. Пусть имеются такие, что

Предположим, что Тогда

Мы же можем вычислить только

т. е. всего лишь некоторую часть Координаты и, соответствующие ненаблюденным на объекте переменным, не учитываются при вычислении

Замечание. В некоторых случаях выражение можно упростить. В самом деле, каждый раз, когда есть диагональная матрица, имеем

потому что диагональные матрицы коммутативны.

С другой стороны, есть проектор и, следовательно, откуда в конечном счете получаем для всякого

при условии, что диагональная матрица. Впрочем, можно показать, что это свойство справедливо и для некоторых недиагональных матриц специального типа.

5.2.2.2. Псевдорасстояние между неполными векторами

Пусть мы имеем два не полностью обследованных объекта таких, что Мы не можем знать точно расстояние однако можно, зная и вычислить его аппроксимацию Итак, элемент пространства элемент пространства Следовательно, они являются несравнимыми. В то же время части векторов расположенные в общем векторном подпространстве являются сравнимыми. Эти части и записываются:

Рис. 5.3

Две матрицы будучи обе диагональными, коммутируют. Следовательно, будем использовать следующую аппроксимацию:

Однако далее мы увидим, что псевдорасстояние между неполными векторами уже не обладает никаким интересным свойством и, следовательно, непригодно к использованию. Пример. Пусть имеются два вектора из

Если то в то время как

При подсчете аппроксимации во внимание принимаются только компоненты, статистически обследованные одновременно на обоих сравниваемых векторах.

5.2.2.3. Сравнимость псевдорасстояний

Даже по данному нами определению псевдорасстояния не могут претендовать на то, чтобы задать реальное приближенное значение истинных расстояний, поскольку часть расстояния при этом не учитывается. Однако не стоит забывать о том, что знать точные значения расстояний часто бывает менее полезным, чем знать их относительные величины. Другими словами, нам чаще важно знать, что ближе к или с, чем определить точные расстояния между Это как раз тот тип сравнений, на котором построен метод динамических сгущений. Поэтому следует изучить сравнимость псевдорасстояний, которые мы только что ввели.

Рассмотрим 5 видов сравнения псевдорасстояний.

1) В первую очередь мы интересуемся псевдорасстояниями между векторами пространства и неполными объектами Итак, пусть и не полностью обследованные объекты, т. е. мы знаем только Можно ли сравнивать псевдорасстояние от до с псевдорасстоянием от и до

Матрицы используемые для вычисления двух псевдорасстояний, различны. Следовательно, два псевдорасстояния несравнимы: чаще всего эти два выражения оперируют с различными подмножествами статистически обследованных переменных. В действительности подобного вида сравнения не имеют места при реализации метода динамических сгущений.

2) Напротив, для реализации МДС актуальна следующая задача. Пусть заданы и не полностью статистически обследованный объект, о котором известно только Агхь Ставится вопрос: к какому из векторов и или более близок объект

В этом случае мы будем сравнивать и

Вычисление этих двух псевдорасстояний производится одним и тем же способом, следовательно, они сравнимы. Именно это свойство позволит нам реализовать метод динамических сгущений в условиях неполных данных.

3) Теперь перейдем к псевдорасстояниям между неполными векторами. Пусть имеются три неполных вектора. Пусть соответствующие им проекторы. Тогда

Сразу же становится очевидным, что эти псевдорасстояния в общем случае несравнимы.

4) Затем рассмотрим следующий случай. Пусть два неполных вектора с проекторами соответственно,

Пусть и Ставится вопрос: вектор ближе к или к

Эти две величины также оказываются несравнимыми.

5) Наконец, пусть и неполные вектор-наблюдения имеют проекторы соответственно Требуется сравнить расстояние между с расстоянием между

Эти две величины сравнимы только в случае т. е. только тогда, когда совпадают переменные, по которым не были статистически обследованы объекты

Общий вывод: рассматривая векторы и и неполный вектор которому соответствует оператор можно утверждать, что псевдорасстояния являются сравнимыми. Все другие сравнения псевдорасстояний в общем случае не имеют смысла.

5.2.2.4. Надежность псевдорасстояний

Сравнимость псевдорасстояний вида где полные, неполный векторы из не означает, однако, что эти сравнения являются точным отражением реальности. В самом деле, вполне возможно, что одновременно выполняются неравенства

Продемонстрируем такую возможность на следующем примере:

Предположим, что Тогда имеем:

С другой стороны,

Следовательно, в действительности ближе к чем к и, однако наши аппроксимации приводят к противоположному выводу. Тем не менее вполне допустимо принять такую аппроксимацию, поскольку реальные величины этих расстояний не могут быть вычислены, а если исходить лишь из того, что мы знаем о векторе то он действительно оказывается более близким к , чем к

Categories

1
Оглавление
email@scask.ru