Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
ГЛАВА XIII. ПРИМЕНЕНИЯ ТЕОРИИ ИГР К СТАТИСТИКЕВ главе I мы указали, что когда человек стремится получить как можно больше каких-либо благ, то его положение будет различно, в зависимости от того, должен ли он бороться только против сил природы или он вынужден также принимать во внимание поведение какого-то другого разумного существа, которое, возможно, хочет уменьшить то самое благо, которое первый хочет увеличить. Ситуации первого и второго вида можно рассматривать как игры: первая ситуация представляет игру одного лица, а вторая — игру Но несмотря на большое различие между этими двумя ситуациями, даже в игре с ненулевой суммой против природы может случиться, что игрок захочет определить наихудшее, что может ему сделать природа, то есть вычислить, какой минимум он может себе гарантировать при совершенно неблагоприятном стечении обстоятельств. Подобные ситуации возникают, в частности, в статистике, ибо статистик часто занимается задачами следующего типа: добиться максимальной точности в определении данной стоимости; свести к минимуму стоимость определения какой-либо величины с данной точностью; добиться максимальной выгоды для предпринимателя путем разработки соответствующего метода проверки его продукции (это применение статистики называют контролем качества). Связь теории игр со статистикой оказалась столь тесной, что в последние годы математики-статистики уделили этому вопросу много внимания. Мы тем не менее не будем формулировать общие теоремы по этому вопросу, ограничиваясь рассмотрением некоторых специфических примеров применения теории игр к статистическим задачам. Разбираемые нами примеры могут показаться почти тривиальными, что объясняется стремлением излагать вопрос без предварительного знакомства со статистической теорией и желанием пользоваться столь малыми матрицами, чтобы их можно было решать без помощи вычислительных машин. Тем не менее в этих простых примерах участвуют те же принципы, что и в задачах, более близких к действительности. Обычно статистик сталкивается с задачей составления некоторой оценки большого класса предметов на основе исследования выборки. (Так, например, политический деятель может попытаться предсказать исход приближающихся выборов на основании интервью с избирателями.) Статистик обычно может увеличить надежность своей оценки, увеличив размер выборки; но проведение большего числа испытаний связано с дополнительными расходами. Цоэтому перед статистиком встает вопрос — какой величины выборку ему лучше всего взять. В следующем примере приведена упрощенная идеализированная модель такой задачи. Пример 13.1. Известно, что в урне находятся два шара, каждый из которых либо черный, либо белый. Статистик S должен определить, сколько там черных шаров. Если его предположение правильно, ему должно быть уплачено а; если его ответ отличается от правильного ответа на 1 (например, он указывает 1, когда в действительности 2 черных шара, или указывает 2, когда в действительности 1 шар, и т. д.), то ему должно быть уплачено Мы полагаем, У S имеется восемь возможных способов составить предположение о количестве черных шаров (то есть у него восемь чистых стратегий): I. Не делать испытаний и предположить, что оба шара черные. И. Не делать испытаний и предположить, что один шар черный и один белый. III. Не делать испытаний и предположить, что оба шара белые. IV. Проверить один шар и предположить, что другой шар такого же цвета, что и проверенный. V. Проверить один шар и независимо от того, какого он цвета, предположить, что другой шар черный. VI. Проверить один шар и независимо от того, какого он цвета, предположить, что другой шар белый. VII. Проверить один шар и предположить, что другой шар противоположного цвета. VIII. Проверить оба шара и объявить правильное число черных шаров (которое, конечно, теперь известно). Мы не перечислили способов, хотя и логически возможных, но нелепых, например, мы не рассматриваем возможность того, что S проверит один шар и затем, если даже проверенный шар — белый, предположит, что оба шара черные. Далее, у природы имеются три возможности: нет ни одного черного шара, один шар черный и оба шара черные. Мы обозначаем эти стратегии номерами 0, 1 и 2. Рассмотрим платеж статистику S при различных сочетаниях этих стратегий. Если S применяет стратегию I, а природа применяет стратегию 0, то это значит, что S предполагает, что два шара черные, а в действительности нет ни одного черного шара. Таким образом, S ошибается на два, и ему уплачивается Чтобы понять, как вычисляется платеж в других случаях, допустим, например, что S применяет стратегию V, а природа — стратегию 1. Тогда, если S делает одно испытание, вероятность того, что испытываемый шар будет черным (как и вероятность того, что он будет белым), равна
Продолжая рассуждать так же, мы получаем матрицу 1. Матрица 1
Конечно, если бы S знал вероятность применения природой ее стратегий, то стоящая перед ним задача достижения максимума была бы проста — ему нужно было бы выбрать строку, которая для данных частот столбцов дала бы ему максимальное математическое ожидание выигрыша. Мы предполагаем, что S не знает, как будет себя вести природа, но и в этом случае он имеет возможность вычислить минимальную величину, которую он может надеяться получить при наиболее неблагоприятном возможном сочетании вероятностей, выбранных природой. Задача решается, если рассматривать матрицу 1 как платежную матрицу игры двух лиц с нулевой суммой. Если у S нет оснований ожидать, что природа поступит так, а не иначе, то он вполне может считать, что всего разумнее для него Цена игры для S и оптимальные стратегии игры зависят от относительных значений Так, если мы возьмем Матрица 2
У этой матрицы нет седловой точки. Легко убедиться, что цена игры для S равна 98, оптимальная стратегия для S — вектор Таким образом, в этом случае статистику всего лучше проверить оба шара. Это и неудивительно ввиду того, что стоимость испытания мала по сравнению с другими входящими сюда величинами. Напротив, если стоимость испытаний очень высока, то всего лучше для статистика вовсе не делать испытаний. Так, допустим, что Легко убедиться, что цена игры для S равна 0, оптимальная стратегия для S равна Наконец, если Матрица 3
Матрица 4
Легко убедиться, что цена игры для S равна 25, оптимальная стратегия для S — Замечание 13.2. Другой способ решения подобных задач (который, однако, представляется мало обосно ванным) состоит в том, чтобы применить, так сказать «довод от незнания». Это значит, что, поскольку мы совершенно не знаем вероятностей распределения шаров, одинаково возможны следующие альтернативы: 1) оба шара черные, 2) первый шар черный, а второй белый, 3) первый белый, а второй черный, 4) оба шара белые. Поскольку случай, когда один шар черный, есть сочетание случая (2) и случая (3), эти альтернативы сводятся к предположению, что природа применяет смешанную стратегию
Как мы видим, при предположениях, что Итак, S должен учитывать лишь стратегии II и VIII, то есть
Следовательно, если Замечание 13.3. Хотя мы рассмотрели пример 13.1 как обычную игру двух лиц с нулевой суммой, нужно помнить, что природа на самом деле не является сознательным разумным существом. Когда игрок S применяет свою оптимальную стратегию для этой игры, он просто устанавливает нижнюю грань математического ожидания своего выигрыша; он может сознавать, что для него разумно поступать таким образом, но это не значит, что он считает природу недоброжелательным разумным существом. Его положение несколько походит на положение человека, который хочет поместить свои капиталы так, чтобы не оказаться банкротом ни от инфляции, ни от дефляции. Это не означает, что он непременно думает, что рынок будет всегда меняться наиболее неблагоприятным него образом; но если он не в состоянии предсказать сколько-нибудь точно движение цен, он, возможно, захочет должным образом подготовиться к любой случайности. Таким образом, если
где Е — математическое ожидание выигрыша; и, возможно, если он осторожен, он захочет поступать так, чтобы непременно получить
и он не особенно стремится к тому, чтобы Это замечание находит практическое применение в том случае, когда S имеет некоторые сведения относительно возможных смешанных стратегий природы и на основе этих сведений S может ограничиться рассмотрением лишь некоторого подмножества логически возможных смешанных стратегий природы; так, он может знать, что любая применяемая природой смешанная стратегия
(где, конечно, Обратимся теперь к примеру, поясняющему применение теории игр к контролю качества. Пример 13.4. Требуется изготовить некоторый очень дорогой объект, состоящий из соединения трех одинаковых частей, таких, что весь объект будет удовлетворительным только в том случае, если удовлетворительна каждая из этих частей. Для определенности мы будем подразумевать под объектом, например, колесо с тремя спицами. Для того чтобы колесо было удовлетворительным, каждая спица должна, скажем, иметь определенную прочность (дороговизну колеса можно объяснить, например, тем, что оно довольно большое и вырезается из одного куска кварца). Потребитель этого колеса, А (правительство или, может быть, астрономическая лаборатория), сам не может изготовлять колеса; поэтому А заключает с предпринимателем М следующий договор: А уплачивает М определенную сумму за изготовление колеса согласно техническим условиям (материал, размеры и т.д.); после того как колесо изготовлено в соответствии с этими техническими условиями, М может либо выбросить его (ценность колеса как утильсырья принимается равной нулю), либо передать его А, который испытывает колесо в работе; если оно признано удовлетворительным, А платит М дополнительную сумму а; если оно неудовлетворительно, М уплачивает А штраф Но поскольку А уже уплатил М за изготовление колеса и поскольку А не желает допустить возможности, что М изготовит колесо лишь ради этого первоначального платежа, А ставит дополнительное условие, что М не должен выбрасывать колесо, если определенное испытание не покажет его негодность (хотя при желании М может передать его А, не производя испытания). Это испытание можно производить на каждой из трех спиц, причем стоимость испытания каждой спицы для М равна Теперь перед М встает вопрос о том, испытывать некоторые или все спицы, прежде чем принять колесо (то есть прежде чем передать его А). У него имеются четыре возможные линии поведения (четыре стратегии): I. Принять колесо без испытания. II. Выбрать наудачу одну из спиц и испытать ее. Если спица удовлетворительна, принять колесо. Если она неудовлетворительна, забраковать. III. Испытать выбранную наудачу спицу. Если она негодная, забраковать колесо. Если она удовлетворительна, выбрать наудачу одну из остальных спиц и испытать ее. Если эта спица негодная, забраковать колесо. Если она удовлетворительна, принять. IV. Испытать выбранную наудачу спицу. Если она негодная, забраковать колесо, если удовлетворительна, выбрать наудачу одну из остальных спиц и испытать ее; если эта спица негодная, забраковать колесо. Если она удовлетворительна, испытать третью спицу и принять или забраковать колесо в зависимости от качества последней спицы. Далее, у природы имеются четыре возможности: может быть негодной ни одна, одна, две или три спицы. Мы обозначим эти стратегии природы номерами 0, 1, 2 и 3. Исследуем, какова будет прибыль М при различных сочетаниях этих стратегий. Если М применяет стратегию I, а природа — стратегию 0, то М не производит испытаний и нет ни одной неисправной спицы. Следовательно, А признает колесо удовлетворительным и заплатит предпринимателю Если М применяет стратегию II, а природа — стратегию 0, то М производит одно испытание и А признает колесо удовлетворительным. Тогда М получит от А сумму а, но ему нужно будет израсходовать на испытание Если М применяет стратегию III, а природа — стратегию 0, то выигрыш предпринимателя будет Если М применяет стратегию I, а природа — стратегию 1, то Тогда М должен заплатить потребителю штраф Очевидно, когда М применяет стратегию I, а природа — стратегию 2 или 3, выигрыш предпринимателя также равен — Если природа применяет стратегию 3, то все спицы негодные. Тогда, если М производит любое испытание, он обнаружит при первом испытании, что колесо негодное и, следовательно, забракует его. Таким образом, платеж предпринимателю М равен лишь стоимости испытания одной спицы, а именно — Если М применяет стратегию II, а природа — стратегию 1, то вероятность того, что М обнаружит негодную спицу, равна
Рассуждая аналогичным образом, мы видим, что если М применяет стратегию II, а природа — стратегию 2, то математическое ожидание выигрыша предпринимателя М равно
Если М применяет стратегию III, а природа — стратегию 1, то вероятность того, что М обнаружит негодную спицу при первом испытании, равна Если негодную спицу обнаруживают при первом испытании, выигрыш М равен —
Продолжая рассуждать таким же образом, мы получаем матрицу 5. Матрица 5
Цена игры для М и его оптимальные стратегии в этой игре зависят от соотношения величин Так, например, если мы берем Элемент матрицы, отмеченный звездочкой, представляет седловую точку. Итак, самое худшее, что может оказаться для предпринимателя — это одна негодная спица колеса и лучше всего для М применять стратегию IV (то есть испытать все спицы колеса). Матрица 6
Применяя стратегию IV, М может быть уверен, что его убыток будет не больше 6 (поэтому при составлении договора М может с полным основанием настаивать на том, чтобы предполагаемый платеж потребителя А не меньше чем на 6 единиц превосходил стоимость изготовления). Если же Матрица 7
Здесь три элемента, отмеченные звездочками, суть седловые точки. Таким образом, худшее, что может сделать природа предпринимателю — это сделать негодными одну или большее число спиц (безразлично, сколько именно). Для М всего лучше применять стратегию I (то есть совсем не производить испытаний). Итак, при увеличенной стоимости испытаний он уже может гарантировать лишь то, что его убыток будет не больше 300. При соответствующем выборе Матрица 8
Легко убедиться, что оптимальная стратегия для природы будет теперь Библиографические замечанияО применении теории игр читатель может прочесть в следующих работах: Вальд [114], [115], [116], [117], Эрроу, Блэкуэлл и Гиршик [3] и Дворецкий, Вальд и Вольфович [36].
|
1 |
Оглавление
|