Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
6.4. ВЫБОР ПОРЯДКА ЗАВИСИМОСТИ КАК ЗАДАЧА СО МНОГИМИ РЕШЕНИЯМИЗаймемся теперь вопросом об определении порядка зависимости на основании наблюдений Будем предполагать, что исследователь может определить некоторый наименьший и некоторый наибольший возможные порядки зависимости. Во многих случаях оказывается равным нулю (указывая тем самым на независимость). В других случаях исследователь может в силу каких-нибудь причин ожидать, что порядок зависимости не меньше некоторого положительного числа Ввиду того что имеющиеся наблюдения удалены друг от друга не более чем на единиц времени, ясно, что максимальный порядок не может быть больше чем Однако ясно также, что для того, чтобы процедура обладала хорошими свойствами в отношении мощности, максимальный порядок должен быть выбран по возможности много меньшим Исследователь имеет, таким образом, задачу со многими решениями. Именно, ему необходимо выбрать порядок или Эта задача подобна задаче выбора степени полинома, представляющего тренд, изучавшейся в разд. 3.2.2. Хотя распределения здесь уже другие, общая структура задачи и ее решение будут теми же, что и в разд. 3.2.2. Мы формализуем задачу, стоящую перед исследователем, считая, что ему необходимо решить, какому из перечисленных ниже взаимно не пересекающихся множеств принадлежит параметрическая точка
Принадлежность параметрической точки множеству означает, что порядок зависимости равен Альтернативная формулировка состоит в том, что исследователю необходимо решить, верна ли хотя бы одна и (если да) какая именно из следующих нулевых гипотез:
Если верна какая-нибудь из гипотез (2), то будут верны и все ей предшествующие. Если же некоторая из гипотез (2) ложна, то будут ложными и все последующие. Иными словами,
Эти два семейства множеств связаны соотношениями
Предположим, что исследователь намерен непосредственно контролировать вероятности ошибок, возникающих при неправильном решении о том, что коэффициенты отличны от нуля, когда они в действительности равны нулю, т. е. вероятности завышения порядка зависимости. В связи с этим будем считать, что исследователь приписывает некоторый уровень значимости каждой из нулевых гипотез:
причем . Поскольку здесь каждая нулевая гипотеза включает в себя последующую (т. е. каждая последующая гипотеза является более сильной), вероятности отклонения берутся монотонно неубывающими (т. е. вероятность отклонения более сильной нулевой гипотезы, когда она верна, не меньше аналогичной вероятности для менее сильной гипотезы). С помощью взаимно непересекающихся множеств, указанное разнесение по уровням значимости записывается в виде
Пусть {принять ). Посредством соотношений (6) исследователь приписывает определенные значения вероятностям решений о том, что порядок зависимости равен когда в действительности этот порядок меньше Статистическая процедура для этой задачи со многими решениями состоит в следующем. Имеется набор попарно не пересекающихся, составляющих полную группу областей в пространстве значений (или в исходном пространстве значений Мы обозначим эти области Если выборочная точка попадает в то принимается гипотеза Приписывание уровней значимости приводит к тому, что эти области становятся подобными в том смысле, что при вероятности попадания выборочной точки в равны соответственно (независимо от Иными словами, если порядок зависимости меньше то вероятность ошибок от приписывания зависимости порядка не зависит от того, каков именно истинный (более низкий) порядок. Рассмотрим сначала альтернативы, утверждающие факт положительной зависимости. Это соответствует значениям (Позднее мы рассмотрим несмещенные процедуры для ) Зафиксировав указанные ограничения, потребуем, чтобы области были наилучшими в том смысле, чтобы были максимально возможными вероятности попадания в при условии, что верна Мы одновременно пытаемся максимизировать вероятности попадания в различных областей (каждую для всех отрицательных значений соответствующего параметра). Далее будет показано, что в указанных выше условиях при подборе одной из областей с целью максимизации вероятности попадания в эту область не имеет значения то, как выбираются остальные области. Этот факт позволяет оптимизировать области одновременно. Ограничения (5) или эквивалентные им ограничения (6) приводят к тому, что каждое множество или, что равносильно, каждое множество область отклонения гипотезы имеет (ввиду свойств достаточности и полноты) неймановскую структуру. Иначе говоря, при
для почти всех возможных значений Исходя из этого можно показать, что выбор допущении не влияет на выбор что вероятность попадания в { (являющаяся функцией при не зависит от того, какими были выбраны Отметим, что значение интересует нас только в том случае, когда Если же какое-нибудь из не равно нулю (т. е. если порядок зависимости больше то вопроса о значении не возникает и мы можем считать Лемма 6.4.1. Пусть множество в пространстве значений таково, что
и пусть — множество, определяемое значениями Тогда
где — множество, дополнительное к Смысл леммы состоит в следующем. Каким бы образом мы ни выбирали при условии (6), из которого следует (8) для и вероятность попадания в область определенную как пересечение будет зависеть только от и не будет зависеть от (когда верна гипотеза Доказательство леммы проведено в разд. 3.2.2 с использованием коэффициентов регрессии. Там же дано подобное доказательство сформулированной ниже леммы 6.4.2. Оба эти доказательства опираются только на свойства полноты и достаточности. При этом соответствующую терминологию и обозначения можно заменить терминологией и обозначениями настоящего параграфа. Пусть область, определяемая неравенством
в котором выбирается так, чтобы условная вероятность (10) при заданных равнялась для и пусть Лемма 6.4.2. Пусть удовлетворяет соотношению (8), а произвольное не пересекающееся с множество, для которого
Тогда при
Из приведенных двух лемм вытекает, что, какими бы ни были области наилучший выбор области состоит в том, что должно являться частью не содержащей точек При таком выборе вероятность
не зависит от выбора Теорема 6.4.1. Пусть непересекающиеся множества выборочного пространства таковы, что есть все это пространство и
где Тогда для каждого значения вероятность принимает максимальное значение на множестве определяемом как пересечение множества (10) при и дополнения к множеству Оптимальной, таким образом, является следующая процедура
Эта процедура сводится, по существу, к следующему. Поочередно проверяются гипотезы до тех пор пока либо какая-то из гипотез, например не будет отклонена и будет решено, что верна либо будут приняты все гипотезы вплоть до Таким образом, указанная процедура является последовательностью критериев. Этот факт обусловлен требованием независимости от истинного порядка вероятности правильного решения о том, что порядок зависимости меньше данного натурального числа. Рассмотрим теперь процедуры, использующие двусторонние критерии. При этом будем накладывать требование несмещенности. Теорема 6.4.2. Пусть — непересекающиеся множества выборочного пространства, объединение которых совпадает со всем этим пространством и
где Тогда для любого значения вероятность будет максимальной на множестве представляющем собой пересечение множества, указанного в следствии 6.3.2, для и дополнения к множеству Мы не говорили еще о том, как следует выбирать вероятности Если все фиксированы и равны, например, то Вообще говоря, приходится идти на компромисс между нашими стремлениями не переоценить порядок зависимости и сохранить чувствительность процедуры к ненулевым коэффициентам. Альтернатива состоит здесь в выборе Причем, если для больших значений значения задавать весьма малыми, можно позволить себе в качестве максимального порядка брать достаточно большое число. Результаты этого параграфа приводят к критерию для проверки гипотезы
При этом процедуры, указанные в теоремах 6.4.1 и 6.4.2, можно интерпретировать как критерии с уровнем значимости согласно которым гипотеза (17) отклоняется, если выборочная точка попадает в любую область, отличную от Процедура, указанная теоремой 6.4.1, состоит из односторонних критериев для проверки гипотез против односторонних альтернатив, утверждающих факт положительной зависимости. Если альтернативой к независимости служит отрицательная зависимость в этом случае также употребляется процедура, аналогичная предыдущей, но состоящая уже из односторонних критериев вида (15) § 6.3. Кроме того, можно сконструировать состаэные процедуры для случая, когда в качестве альтернативы к гипотезе выступает гипотеза или Замечания, сделанные в разд. 3.2.2 относительно такого типа процедур со многими решениями, используемых для определения степени полиномиального тренда, применимы и в настоящем случае. С теоретической точки зрения преимущество этой процедуры состоит в том, что исследователь контролирует здесь вероятность ошибочного завышения порядка зависимости. Неудобством ее является то, что максимальный порядок зависимости должен быть установлен заранее. Частично это неудобство можно обойти, полагая значение весьма большим, но выбирая зато вероятности очень малыми для близких к Иными словами, устанавливаются весьма малыми значения вероятностей ошибочного решения о том, что порядок зависимости равен если это велико. Альтернативой к указанной последовательной процедуре является процедура, использующая критерии значимости в обратном порядке. Если считается, что порядок зависимости не меньше то исследователь может проверить сначала гипотезу с уровнем значимости Если эта гипотеза будет принята, то выносится решение о том, что порядок зависимости равен . В противном случае проверяется гипотеза Эту процедуру можно продолжать таким образом и дальше, используя указанную последовательность критериев значимости. Если впервые будет принята гипотеза то порядок зависимости принимается равным Если гипотеза отвергается, то переходят к проверке гипотезы Если при этом отвергаются все гипотезы вплоть до гипотезы с номером заданным заранее, то порядок зависимости считается равным Преимущество этой процедуры состоит в том, что не всегда требуется вычислять все квадратичных форм, поскольку последовательность критериев может оборваться прежде, чем придется проверять гипотезу Ввиду этого вопрос о том, как следует выбирать здесь является несущественным. В разд. 3.2.2 было указано, что соответствующая процедура для определения степени полиномиального тренда имеет определенное практическое неудобство. Это неудобство состоит в том, что если коэффициент при степени имеет достаточно большое значение, то возникает тенденция к завышению оценок дисперсии ошибки, используемых для проверки Это в свою очередь ведет к возрастанию вероятности принятия одной из гипотез . В результате, может увеличиться вероятность ошибочного занижения степени полинома. Фактически чем больше тем больше и вероятность такой ошибки (если считать остальные фиксиррвауными). Этот случай проверки порядка зависимости представляется более трудным для анализа. Если зависимость соседних наблюдений, отстоящих на две единицы времени, велика, то вполне может оказаться, что вероятность отклонения гипотезы не будет велика. Так что при таком подходе может быть ошибочно решено, что порядок зависимости равен единице, в то время как на самом деле он не меньше двух. По-видимому, такую процедуру можно использовать, если для некоторого частного значения значения параметров будут достаточны для того, чтобы нельзя было решить, что хотя бы один из них будет равен нулю без того, чтобы Например, такая процедура может оказаться подходящей для случая, когда значения параметров монотонно убывают (или просто быстро убывают). Однако никакого теоретического исследования оптимальных свойств здесь не имеется. До сих пор в этой главе мы предполагали, что Если средние отличны от нуля, но известны, то при тех же предположениях в качестве объекта изучения можно рассматривать разности переменных и их математических ожиданий. Знание средних является, однако, предположением, далеким от реальности. Мы рассмотрим случай неизвестных средних в § 6.6, после того как обсудим более конкретные модели в § 6.5. (См. Т. Андерсон (1963).)
|
1 |
Оглавление
|