13.1. ПОСЛЕДОВАТЕЛЬНАЯ ПРОВЕРКА ГИПОТЕЗ
В предыдущих главах выводы относительно неизвестных параметров генеральной совокупности или распределения вероятностей, описывающего эту генеральную совокупность, основывались на случайной выборке фиксированного объема. Предположим, что последовательная выборка извлекается из генеральной совокупности, причем в каждый момент времени производится не более одного наблюдения и после получения результата наблюдения принимается решение — либо прекратить процесс выбора и использовать имеющуюся выборку и соответствующие ей значения статистик для получения выводов относительно параметров, либо продолжить выбор и произвести следующее наблюдение. При таком способе действий процедура выбора прекращается, как только получена достаточная информация относительно неизвестных параметров.
Как показано в разделе 5.12, основанный на выборках фиксированного объема критерий Неймана—Пирсона для проверки двух гипотез определяется заданием множества значений выбранной статистики, в котором гипотеза отвергается и принимается гипотеза Это множество называется критическим множеством критерия или областью отклонения Для отыскания критического множества фиксируется максимальный уровень значимости а (т. е. величина ошибки I рода) и выбирается критерий с наименьшим значением ошибки II рода (т. е. наибольшей мощностью Таким образом, в критериях, основанных на выборках фиксированного объема, фиксируется уровень значимости а и объем выборки а минимизируется.
При последовательных критериях проверки гипотез процесс выбора прекращается, когда выборка содержит достаточно информации, чтобы принять или отклонить гипотезу Если информации недостаточно, делается еще одно наблюдение. Таким образом, при
последовательной проверке гипотез текущие выборочные значения могут попасть в одну из трех областей: область принятия и область отклонения, как и в случае выборки фиксированного объема, а кроме того, и в область продолжения, когда необходимо продолжать наблюдения. При определении этих трех областей фиксируется значение а и значение е. максимальной желаемой ошибки II рода), а объем выборки является случайной величиной.
13.1.1. ОПЕРАТИВНАЯ ХАРАКТЕРИСТИКА
Предположим, что наблюдения извлечены из генеральной совокупности, соответствующей распределению вероятностей с неизвестным параметром в, и что заданы три вышеописанные области. Тем самым определен последовательный критерий. Исчерпывающей характеристикой критерия, основанного на выборке фиксированного объема, является его функция мощности, которая задает вероятность отклонения как функцию параметра в. Для последовательного критерия используется оперативная характеристика которая описывает вероятность принятия в зависимости от в. (Функция мощности [см. раздел 5.12.2] равна Если и основная гипотеза и альтернативная простые: с разделом то
13.1.2. ОЖИДАЕМЫЙ ОБЪЕМ ВЫБОРКИ
Поскольку при последовательной проверке гипотез объем выборки является случайной величиной, интересно определить его математическое ожидание. Сравнение последовательных критериев с критериями, основанными на выборках фиксированного объема, должно базироваться на ожидаемом объеме выборки, а не на наборе фактических значений объемов выборок для какого-нибудь конкретного множества наблюдений.
Ожидаемый объем выборки является функцией истинного значения параметра. Например, если обе гипотезы простые, как и раньше, а истинное значение в близко к то ожидаемый объем выборки будет больше, чем в случае, когда мало по сравнению с Ожидаемый объем выборки часто называют средним числом наблюдений (Average Sample Number (ASN)).
13.1.3. ПРИМЕРЫ СХЕМ ВЫБОРОЧНОГО КОНТРОЛЯ
В двух следующих схемах выборочного контроля предполагается, что доля в неисправных изделий в партии неизвестна и каждое изделие в партии либо неисправно, либо исправно. Требуется принять или забраковать партию на основании последовательной выборки изделий.
Считается, что партия состоит из большого числа изделий и что наблюдения независимы.
Пример 13.1.1. Простая последовательная выборка (Вальд). Зафиксируем целое число такое, что если первые изделий исправны, выбор прекращается и партия принимается. Если для некоторого объема выборки изделие неисправно, то партия бракуется. И пусть гипотезы — принять партию, забраковать партию.
Вычислим оперативную характеристику Вероятность принять Но, если доля неисправных изделий равна 0, равна вероятности того, что первые изделий исправны. Отсюда Заметим, что (все изделия в партии исправны) и (все изделия неисправны). Функцию можно изобразить при Она одновременно является для схемы с фиксированным объемом выборки [см. рис. 5.12.1].
В описанной последовательной схеме объем выборки будет равен где если последнее изделие неисправно, и равен только в случае, когда все первые изделий исправны. Поэтому ожидаемый объем выборки [см. раздел 1.4.2] задается равенством
где
Величину также можно изобразить как функцию в при
Подробное рассмотрение этого примера можно найти в работе [Wald (1960)].
Пример 13.1.2. Последовательный выбор с ограниченным объемом выборки. Рассмотрим модификацию предыдущего примера. Пусть максимальный объем выборки равен и выбор прекращается, а партия бракуется, если среди первых изделий будет обнаружено или более неисправных, причем и с фиксированы. Партия принимается, если среди первых изделий не менее исправных.
О X этой схемы равна вероятности того, что найдется или менее неисправных изделий среди первых если доля неисправных изделий равна 0:
И опять можно изобразить как функцию от 0 на интервале Следует отметить, что эта совпадает с критерия, основанного на выборке фиксированного объема
Чтобы вычислить ожидаемый объем выборки, все партии следует разбить на принимаемые и бракуемые. Для бракуемых партий вероятность прекратить испытания при равна вероятности того, что
неисправное изделие совпадает с обследованным:
Для принимаемых партий положим Тогда вероятность решения «принять» при равна вероятности того, что исправное изделие совпадает с обследованным:
Тогда
Подробности анализа этой схемы можно найти в работе [Wetherill (1966)].