функцию
от наблюдаемых расстояний. Если функция
известна заранее, то нужно к преобразованным данным применить методы, описанные в разделах 17.6 и 17.7. Обычно
неизвестна и должна быть определена; однако может быть задан ее общий вид. Например, можно потребовать, чтобы
была полиномиальной или гладкой монотонной функцией, выражаемой в терминах
-сплайнов [см. II, раздел 6.5]; можно также решать задачу для общей монотонной функции. Последнее и есть классическая задача неметрического шкалирования. Целесообразность поиска монотонного преобразования от
в общем виде оправдана тем, что даже в случае слабой уверенности в абсолютных значениях наблюдаемых данных, как это бывает во многих прикладных задачах, они могут быть проранжированы достаточно надежно. Так что большую уверенность вселяют порядковые, а не абсолютные или кардинальные значения данных. По этой причине заслуживают исследования методы ординации, опирающиеся только на порядковую информацию. Такие методы могут быть сконструированы. Они приводят к хорошо определенной устойчивой конфигурации точек.
Должны быть решены две основные проблемы:
а) как определить критерий качества отображения, инвариантный относительно монотонного преобразования данных
б) как, выбрав подходящий критерий, найти конфигурацию X, оптимизирующую его?
Эти проблемы не имеют однозначного решения. Далее мы приведем основные подходы, применяемые в настоящее время.
Для любой ординации X может быть изображена диаграмма рассеяния
относительно
Отображение будет точным, если
монотонно возрастают с ростом
Тогда ломаная линия, соединяющая пары последовательных значений
, идет только вправо и вверх. Монотонная функция, представленная на графике, может быть взята в качестве
Она должна удовлетворять соотношению
Нельзя ожидать точного соответствия, но всегда можно аппроксимировать монотонную (или изотопную) регрессию от
относительно порядковых значений
Для этой цели существуют прямые алгоритмы [см. Barlow et al. (1978)]. Значения
зависят только от порядка
и могут сопоставляться с аппроксимирующими величинами
За меру качества отображения естественно принять критерий
подобный используемому при шкалировании по методу наименьших квадратов. На практике обычно этот критерий нормализуют, чтобы облегчить сравнение двух или более неметрических решений. Существует два способа нормализации, приводящие к критериям:
где
— среднее по всем
. Критерий
называют стресс-формулой
— стресс-формулой 2. В случае ранговых данных возникает проблема, как обращаться со связанными рангами. В настоящем контексте рассматриваются две возможности. Либо совпадающим значениям
должны соответствовать совпадающие значения
либо это не обязательно. Последнее допущение приводит к более удовлетворительным результатам.
Стрессом можно оперировать достаточно гибко. Если какие-либо
неизвестны, то при суммировании соответствующие члены просто могут быть опущены. Тогда можно использовать экспериментальную схему, в которой наблюдения
опускаются в систематической манере, что сокращает работу экспериментатора по сбору исходных данных. Исследования, проведенные в последнее время, показали, что даже если пропущено около трети данных, то оставшихся достаточно для получения удовлетворительной ординации. Другая возможность — разбить стресс на отдельные компоненты, каждая компонента может использовать свою монотонную регрессию; при этом даже допустимы разные типы регрессий. Наиболее общий подход — разбиение по строкам (или столбцам). Иногда такой подход называют локальным порядковым шкалированием. Здесь стресс вычисляется отдельно для каждой строки (или столбца) данных и минимизируется сумма отдельных значений
Такой подход целесообразен, например, когда данные собираются в виде ранжировок по строкам (или столбцам), как в многомерной развертке [см. раздел 17.9]. В предыдущих разделах мы налагали ограничение
сейчас оно не требуется, но аппроксимирующие значения всегда симметричны, т. е.
Обычно симметризуют данные по формуле
Заметим, что, если даже этого не сделано, при неметрическом шкалировании не анализируют асимметричные свойства данных. Для этой цели требуются специальные методы. Они обсуждаются в разделе 17.13.
Существуют также критерии, отличные от стресса.
Большинство критериев метрического шкалирования может быть распространено на неметрический случай при замене
на
где
инвариантна относительно монотонного преобразования значении
Формулировка критерия в терминах корреляций между
приводит к выражению критерия
что очень похоже на корреляционные критерии метрического шкалирования, обсуждаемые в разделе 17.7. По-видимому, если
определяется по аппроксимирующим значениям монотонной регрессии, как было предложено выше, то максимизация
эквивалентна минимизации стресса, за исключением незначительных эффектов от нормирующих делителей, вводимых при определении стресса. Непосредственное сравнение критериев затруднено, поскольку обычно тот, кто предпочитает критерий
предпочитает также другой вид функции
участвующей в определении стресса. Функцию
называют ранговым образом. Это очень простое преобразование: если
в данных пропущено, то полагают
если
в данных имеет ранг
то
полагают равным тому значению
которое находится на
месте; при этом делается условленная корректировка на связанные ранги. Такое преобразование обеспечивает следующее: если поддерживается монотонное соотношение между
(допустимое для связанных рангов в одной или обеих последовательностях), то
Если монотонное соотношение нарушается, то
Рамсей [см. Ramsay (1977)] использует процедуру, основанную на оценке максимума правдоподобия. Поскольку предполагается, что наблюдения
содержат только порядковую информацию, удобнее ввести предположения о распределении преобразованных значений
а именно предположить, что они распределены нормально или логнормально. Такие предположения могут показаться нереалистичными, но если все же можно принять их, то последовательность подходов, основанных на правдоподобии, позволит оценить доверительные области для каждого аппроксимирующего множества координат.
Независимо от того, используется ли стресс с монотонным преобразованием или корреляция с ранговыми образами, вычислительные проблемы очень сходны, и в обоих случаях могут применяться стандартные оптимизационные процедуры [см., например, Murray (1972)] для оптимизации выбранного критерия. Необходимо оценить
элементов матрицы X, поэтому вычислительная проблема является здесь одной из главных, и специалистами были приложены большие усилия для разработки удобных и надежных алгоритмов, включающих вспомогательные средства для работы с данными. Результат получился в определенном смысле даже более значительным, чем для большинства других методов. Методология реализована в виде нескольких широко распространенных вычислительных программ. Это большой регулярный проект. Первая программа была написана в 1962 г., к настоящему времени с учетом предыдущего опыта создано второе поколение программ. Следует перечислить такие важные программы, как KYST (Краскал, Юнг, Шепард, Торгерсон), ALSCAL (де Лью, Тейкен, Юнг), MULTISCALE (Рамсей), MINISSA (Гутман, Линго, Роскам). Краткое и простое введение в неметрическое шкалирование, включающее детальное описание перечисленных программ, содержится в [Kruskal and Wish (1978)].
Работа с программами требует определенного опыта. Они могут, что часто и бывает, сходиться к локальным оптимумам, а не к истинному оптимуму выбранного критерия; они могут вообще не сходиться. Пользователь должен распознать такие ситуации и предпринять корректирующие действия. Он должен уметь оценить достаточную размерность пространства. Проблема интерпретируемости ординации связана с вопросом об удовлетворительном значении критерия. Одним из важных выходов такого анализа является доступность значений
. Они могут быть представлены графически вместе с
что позволит отразить вид найденного преобразования. Для монотонной регрессии функция может быть разрывной. Это проливает свет на свойства данных
в другом случае функция может быть достаточно