ЧАСТЬ I. ЭЛЕМЕНТЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ
Глава 1 ВВЕДЕНИЕ
Статистика как наука занимается теориями и методами, используемыми для принятия решений в условиях неопределенности и неполной информации, которые неизбежны в самых широких сферах человеческой деятельности. Современная статистическая практика связана главным образом с выбором вероятностных моделей для различных физических систем, с методами сбора и анализа численных данных и с планированием эффективных и информативных экспериментов. Термин теория решений относится к классу статистических задач, в которых статистик должен получить информацию о некоторых важных параметрах, для того чтобы иметь возможность принять эффективные решения в ситуациях, где последствия его решений зависят от истинных значений этих параметров. Теория оптимальных статистических решений, развиваемая в этой книге, может быть полезна в самых различных областях и уже была с успехом применена для решения широкого круга задач. Ее обычно называют теорией субъективных или байесовских статистических решений.
В большей части книги для каждой задачи те ее аспекты, от которых зависит принятие решения, можно формализовать с помощью явного задания возможных решений, величины выигрыша или проигрыша, связанного с принятием того или иного решения, и соответствующих вероятностных распределений. Теория и методы, на которых основывается такое задание, будут обсуждены во всех подробностях. При этом большое внимание будет уделено как математическим методам описания информированности статистика и неопределенности в значениях параметров, так и методам изменения этого описания после получения добавочной информации о параметрах.
Субъективная, или байесовская, теория статистических решений применима в тех задачах, в которых неопределенность или информация относительно параметров в любой момент времени может быть задана посредством вероятностного распределения на множестве ее возможных значений. Поэтому в этой книге мы
занимаемся только теми задачами принятия решения, которые удовлетворяют следующим двум требованиям. (1) Условия задачи могут быть описаны с помощью поддающегося учету числа параметров. (2) Хотя значения этих параметров не предполагаются известными с полной точностью, однако степень неопределенности этих значений может быть описана посредством подходящего распределения вероятностей.
В связи с этими требованиями следует иметь в виду следующие два обстоятельства. Во-первых, число параметров, поддающееся учету в данной ситуации, зависит в существенной степени от текущего состояния вычислительной техники и технологии (очевидно, сегодня это число больше, чем когда бы то ни было). Во-вторых, среди статистиков и других специалистов, изучающих основания теории вероятностей, имеются значительные разногласия по поводу того, можно ли охарактеризовать неопределенность в значениях того или иного данного параметра с помощью распределения вероятностей. Одни полагают, что о таком распределении можно говорить лишь в том случае, когда явно наблюдаются относительные частоты появления исследуемых значений параметров. Другие придерживаются той точки зрения, что вероятность является логическим понятием, которое может быть соотнесено параметрам в гораздо более широком классе случаев. Более того, эти ученые считают, что в каждой такой задаче существует единственное распределение, отвечающее данному определенному параметру, которое и должно быть ему приписано. Наконец, третьи полагают, что по существу все вероятностные распределения являются субъективными и что в статистических исследованиях о значениях параметров статистик всегда может характеризовать степень своего незнания истинного значения вероятностным распределением. Существуют также различные другие мнения и разнообразные модификации трех упомянутых выше. Вот авторы некоторых известных книг, посвященных этим вопросам, в алфавитном порядке: Гуд (1950), Джеффрис (1961), Карнап (1962), Кейнс (1921), фон Мизес (1957), Нагель (1937), Рейхенбах (1949), Сэвидж (1949) и Фишер (1959).
Во всех задачах, рассматриваемых в этой книге, предполагается, что каждому параметру может быть приписано определенное вероятностное распределение. Доводы типа приводимых в гл. 6 фактически применимы к весьма широкому классу задач, решения, и эти рассуждения показывают также, как находить подходящее распределение в таких задачах. Хотя в отношении некоторых аспектов оснований теории вероятностей и статистики налицо много разногласий, разница во мнениях не простирается до того, чтобы отрицать возможность задания вероятностных распределений параметров во многих конкретных задачах, рассматриваемых здесь. Более того, существует общее согласие, что в задачах, где
параметры заведомо обладают соответствующим вероятностным распределением, в том числе во многих важных практических задачах, теория и методы принятия статистических решений, излагаемые в этой книге, являются вполне применимыми, правильными и полезными.
Поскольку современная математическая теория вероятностей является основным рабочим инструментом при развитии статистических методов, последующие четыре главы посвящены обзору тех разделов теории вероятностей, которые понадобятся нам в дальнейшем. Для того чтобы этот обзор был по возможности компактен и в то же время достаточно полон, доказательства и поясняющие обсуждения по большей части не приводятся. Читателю, которого этот краткий обзор не удовлетворит, следует обратиться к любому из стандартных учебников по. теории вероятностей или математической статистике. Вот некоторые из недавно вышедших курсов вводного плана: Бранк (1965), Линдгрен (1962), Маккорд и Морони (1964), Муд и Грейбилл (1963), Папулис (1963), Парзен (1960), Пфейффер (1965), Таккер (1968), Феллер (1964), Фримэн (1963), Харрис Б. (1966), Хогг и Крейг (1965). А вот ряд менее элементарных книг: Гнеденко (1965), Крамер (1947), Крикеберг (1965), Лоэв (1965), Рао (1965), Уилкс (1967), Феллер (1967), Фиш (1963).