7.2.6. Предсказание для обратной задачи (дискриминация)
Пусть мы хотим произвести калибровку какого-либо прибора, скажем манометра (датчика давления), и при этом нам известно, что показания манометра являются линейной функцией от давления, а именно
или
Для калибровки манометра мы подаем на него два или более (скажем,
) контролируемых давления
и считываем соответствующие показания манометра
По этим данным мы подбираем уравнение
которое можно использовать для оценивания (предсказания) неизвестного давления при заданном показании манометра
Эта задача обратна рассмотренной в разд. 7.2.4 задаче предсказания значения
при заданном значении
Естественной оценкой для
(являющейся также оценкой максимального правдоподобия) является оценка, получаемая как решение подобранного уравнения
а именно
Правда, эта оценка оказывается смещенной, поскольку в общем случае
В то же время для х, можно построить доверительный интервал, используя метод разд. 7.2.2. Из (5.21) имеем
так что
Поскольку
то совокупность всех значений x, удовлетворяющих неравенству
где
образует 100
-процентную доверительную область для х. Это множество, обычно называемое интервалом дискриминации, может образовывать конечный интервал, пару полупрямых и даже всю действительную прямую (см. Miller (1966, с. 118—119, рис. 2,3 и 4), Hoadley (1970)). Конечный интервал получается тогда и только тогда, когда
когда
-критерий для
оказывается значимым). При этом указанный интервал содержит оценку
и имеет вид
где
(действительные, несовпадающие) корни уравнения
(Это уравнение получается из (7.11), если положить
Если
не попадает в интервал
то доверительная область для состоит из двух полупрямых. В то же время, если уравнение (7.12) не имеет действительных корней, то доверительная область совпадает со всей действительной прямой.
Указанная теория легко ббобщается на случай отыскания
совместных интервалов дискриминации, соответствующих
различным значениям К, скажем
При этом следует просто подставить
в (7.12) и взять А, равным
или
в зависимости от того, используем ли мы соответственно интервалы Бонферрони, Шеффе или интервалы максимального модуля.
К сожалению, этот метод не применим, если значение
не известно. Так получается, например, в случае задачи калибровки, в которой подобранная калибровочная линия используется для коррекции неограниченного числа считываемых затем показаний прибора. Так, при проведении биологических испытаний строится стандартная кривая, используемая при последующих испытаниях (дискриминациях). Если
велико, то к может оказаться столь большим, что пользоваться указанными интервалами дискриминации будет бессмысленно. Однако если
велико или просто не известно, то можно воспользоваться двумя методами, описанными Lieberman и др. (1967). Первый метод, предложенный, по-видимому, в Miller (1966, с. 125—128), использует неравенство Бонферрони (5.5) (при
) и сочетает при заданном
доверительный интервал для с доверительной полосой Уоркинга-Хотеллинга для прямой
Второй метод, по существу, использует соображения, аналогичные использованным Шеффе, и называется усиленным
-методом. Оба метода приводят к завышению ширины интервалов дискриминации. Lieberman и др. (1967) считают, что
в большинстве задач, в которых эти методы могут оказаться полезными, метод Бонферрони дает более короткие интервалы, особенно если ожидается, что последующие значения
не будут значительно отличаться от
Модификация метода Бонферрони принадлежит Oden (1973), который уточнил одно из использованных Миллером неравенств и получил более короткие интервалы.
(а) Альтернативные оценки
Мы видели уже, что оценка указанная в (7.10), является смещенной. Кроме того, она имеет неограниченную среднеквадратичную ошибку
В то же время Williams (1969) показал, что несмещенной оценки с конечной дисперсией для не существует, и поэтому он рекомендует все-таки использовать оценку
учитывая, что она строится по совокупности достаточных статистик для неизвестных параметров. Альтернативный метод, основанный на использовании регрессии х на У (даже если величина х не случайна), был возрожден в работах Krutchoff (1967, 1969). При этом было произведено сравнение обычного прогноза для х, получаемого по этой "обратной" модели (обозначим его
), со значением х, получаемым с использованием статистического моделирования. Однако Williams (1969) и Halperin (1970) показали, что критерий, использованный Krutchoff для сравнения указанных оценок, был неудовлетворительным. Halperin (1970) провел теоретический анализ, показывающий предпочтительность использования
вместо Hoadley (1970) также рассмотрел эту задачу, но с точки зрения байесовского подхода. Он отметил следующее неудовлетворительное свойство оценку Коэффициент при
в (7.12) равен
где уменьшаемое в квадратных скобках есть просто обычное F-отношение для проверки гипотезы
Поэтому, если значение
много больше, чем
то интервал дискриминации узок, и х оценивается довольно точно. Если же F-отношение оказывается лишь едва значимым (соответствующая прямая почти горизонтальна), то оценивание становится неточным. Другими словами, информация о точности
содержится в самих данных, так что представляется разумным придавать оценке
меньший вес, если известно, что она ненадежна. А это именно то, что
делает байесовская оценка. Hoadley (1970, с. 365) доказал, что
и что х является байесовской оценкой по отношению к некоторому априорному распределению
Им указан также доверительный интервал, основанный на для случая, когда это частное априорное предположение может быть подтверждено.
Если данные близки к некоторой прямой, то особенной разницы в оценках
при этом мало,
в (7.13) велико (см. упр. 4 в конце главы).
(b) Повторные наблюдения
Пусть мы имеем
повторных наблюдений
с выборочным средним
произведенных при неизвестном значении
такой ситуации мы располагаем двумя оценками для
, а именно
которые можно использовать в сочетании для построения доверительного интервала для
.
Следуя Graybill (1961, с. 125—127), положим
и
то случайные величины
и взаимно независимы и
Поэтому
и уравнение (7.12) принимает вид
где
Заметим, что оценка
основанная на
степенях свободы, имеет меньшую выборочную дисперсию по сравнению с оценкой
степенями свободы; кроме того,
Эти два факта приводят к тому, что [Сох (1971)] (1) интервалы, даваемые (7.13), будут в среднем уже интервалов, даваемых (7.12), (2) коэффициент при
в (7.14) будет обычно большим, чем соответствующий коэффициент в (7.12), так что вероятность получения конечного доверительного интервала для х увеличивается, если используются повторные наблюдения
В заключение упомянем еще о двух методах. Kalotay (1971) предложил структурное решение рассмотренной задачи, a Perng, Tong (1974) привели последовательную процедуру, в которой
случайная величина. Эта процедура дает правило остановки при построении для х доверительного интервала фиксированной ширины.