функция правдоподобия
равна произведению таких вероятностей для всех
независимых пар и может быть выражена через суммы очков
как
где
зависит от
Отсюда следует, что
достаточные статистики для
. Дифференцируя
по
мы получаем оценки максимального правдоподобия
-оценки)
для из всех
уравнений
взятых вместе с
Мы видим, что
функции от
и не зависят от индивидуальных
в отличие от оценок (4.1.9). Для поиска
удобно записать (4.3.2) в форме
Тогда, начиная с исходного набора решений
мы можем получить
из
продолжая итерационный процесс до тех пор, пока согласие между
не будет достаточно хорошим. Используя этот метод, Брэдли и Терри [17] и Брэдли [15] табулировали
с двумя десятичными знаками для всех возможных исходов экспериментов размером
не большим, чем (3; 10), (4; 8) и (5; 5). Дикстра [35] заметил, что итерационная процедура сходится медленно, поэтому важно найти хорошие начальные значения до вычислений по (4.3.4) в случае, когда размер эксперимента не охватывается таблицами. С этой целью он советовал для начала взять все
равными, так что
получая
из (4.3.3) в виде
Это приближение к
-оценкам
может быть еще улучшено заменой
в (4.3.5) на
где
эмпирическая поправка, предложенная Дикстрой и равная
где
Заметил, что сумма
из (4.3.5), вообще говоря, не равняется единице. Приближения
также не составляют в сумме единицы для
но нормировка их на каждом шаге не нужна, так как мы на самом деле работаем с их отношениями, а не с действительными значениями (сравните с [48]).
Форд заметил интересный факт: ранжировка, получаемая по
-оценкам, та же, что и получаемая по суммам очков; если
то из (4.3.2) следует:
таким образом
Неравное число повторений
Если число сравнений
не постоянно, а равно
последнее утверждение может, конечно, не выполняться. Однако
-оценивание
из-за этого изменяется мало: нам нужно просто заменить (4.3.3) на
Сходимость итерационного процесса была установлена Фордом в общем случае при условии выполнения следующего допущения: «В каждом возможном разбиении объектов на 2 непустых подмножества некоторый объект второго множества предпочитается по крайней мере однажды некоторому объекту из первого множества».
Выполнение этого предположения весьма правдоподобно. Если оно нарушается, то существуют два подмножества
и
вообще без сравнений между множествами или же со всеми сравнениями в пользу
В первом случае, очевидно, можно не ранжировать объекты из
вместе с любым объектом из
В последнем случае, который встречается и в сбалансированном эксперименте с равными
наибольшие
значения
для объектов
должны оказаться равными нулю, так как иначе нам пришлось бы увеличить функцию правдоподобия
умножая эти
на общий множитель, меньший чем 1, и оставшиеся
на общий множитель, больший чем 1. Эти множители можно выбрать так, чтобы в сумме они давали 1.
Сомножители
включающие
которые оба принадлежат либо
либо
остаются неизменными при этой операции. Однако множители, содержащие
из
из
возрастают, из-за чего возрастает и
Но если для объектов из
должны быть все равны нулю, мы теряем надежду сравнить отдельные объекты
в этом процессе. Конечно, мы можем обработать эти объекты совсем отдельно от объектов из
Как указывает Дикстра [37], результаты для неравных
полезны также в планируемом эксперименте, где выполняется лишь часть всех возможных сравнений для того, чтобы уменьшить его объем. В этом случае
или
в соответствии с тем, сравнивается ли
или нет. Есть и другие ситуации в планировании, когда
не равны (см. гл. 5).
Точность pi
Мы ограничимся изложением свойств оценок в больших выборках
случая равных
хотя эти результаты могут быть обобщены и на случай неравных повторений [37]. Пусть
Опираясь на стандартную теорию и учитывая ограничение
Брэдли [16] показал, что
имеет, при
вырожденное многомерное нормальное распределение размерности
в пространстве размерности
с нулевым математическим ожиданием и ковариационной матрицей а, определенной равенством
где (1), (1) обозначают соответственно вектор-строку и вектор-столбец из единиц.