Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
Глава 10. ОБУЧЕНИЕ В СИСТЕМАХ С ДВУХАЛЬТЕРНАТИВНЫМ ВЫБОРОМИспользование биномиального распределенияИзложенные ниже вопросы охватывают задачи «обучения» принятию решения, основные принципы которых те же, что и ранее, но форма обрабатываемых данных несколько иная. Если производится обследование какого-либо вида продукции, которую предполагается изготовить или закупить, отдельные единицы продукции могут быть классифицированы как годные или негодные, качественные или дефектные, приемлемые или неприемлемые. Обследование изделия выражается в одном из этих двух возможных сообщений, а данные, полученные из ряда таких наблюдений, могут быть представлены как число дефектных изделий Пример: проверка с последующим исправлением дефектных изделийПредположим, что от поставщика поступила партия, состоящая из L изделий, и что относительно их качества существует некоторая неопределенность. Если достоверно известно, что некоторая доля
Предположим наличие простой структуры затрат, существенно зависящей от процентной доли дефектных изделий. Пусть издержки, связанные с передачей в производство одного дефектного изделия, составляют
Если
Проблема принятия решения здесь представляет интерес только в том случае, когда существует некоторая неопределенность относительно процента бракованных изделий в партии и когда имеется возможность проверки выборки образцов изделий из партии перед принятием решения. Априорное b-распределениеПредположим, что в типичном случае относительно процентной доли дефектных образцов в партии имеется неопределенность. Если размеры партии велики по отношению к размеру любой рассматриваемой выборки, то для расчета вероятности того, что в выборке из априорной неопределенности принимающего решения лица, которое могло бы быть применено к широкому многообразию исходных состояний; легко сочеталось бы с биномиальным распределением в выборках согласно логике теоремы Байеса. Оказывается, что этим требованиям очень хорошо удовлетворяет семейство
Априорное среднее значение
Это выражение может быть записано в виде
Так как подынтегральное выражение само по себе является
Априорная дисперсия величины
Предположим теперь, что при обследовании выборки из
Правдоподобность определяется здесь посредством биномиального распределения
Подставляя предыдущие выражения для априорного
Сравнивая знаменатель с определением (
Отсюда можно видеть, что апостериорное распределение для
Тогда апостериорное среднее значение
Таким образом, выбрав Предапостериорный анализЕсли было принято решение взять выборку из как случайную величину. Для фиксированного значения
Подставляя сюда выражения для биномиального и (
Сравнивая подынтегральное выражение с формулой, задающей (
Это распределение называется бета-биномиальным. Среднее значение и дисперсия величины
Априорное ожидаемое значение апостериорного среднего для
Этим подтверждается ранее полученный результат, согласно которому априорно ожидаемое значение апостериорного среднего равно априорному среднему. Априорная дисперсия апостериорного среднего значения величины
Отсюда снова видно, что при возрастании размера выборки Ценность полной информацииВозвращаясь к задаче принятия решения в случае, когда имеется возможность проверки и исправления, вычислим сначала ожидаемую ценность полной информации. Пусть на основе априорной информации можно заключить, что в нашем случае
Следовательно, наилучшим априорным действием оказывается
Последнее выражение представляет собой интеграл линейных потерь, описываемых ( Ценность выборочной информацииЕсли принимается решение взять выборку из Нам известно, что априорное распределение апостериорного среднего значения является бета-биномиальным; следовательно, ожидаемая ценность выборочной информации равна
Сюда снова входит интеграл линейных потерь, но на этот раз описываемых бета-биномиальным распределением. Подбор априорных b-распределенийНекоторые представители семейства располагает данными о прошлых значениях р, такой подбор параметров может сразу привести к достаточно хорошей модели для этих данных. Если имеются оценки среднего значения и дисперсии величины
Фиг. 10.1 Из фиг. 10.1 можно получить также некоторое представление о скорости, с какой форма распределения меняется при изменении Квадратичные функции затратВ примере проверки с последующим исправлением было трудно получить непосредственное представление о взаимосвязи между априорным распределением, размером выборки и ценностью выборочной информации, поскольку для вычисления интегралов потерь требовались значительные усилия. Однако, если изучаются проблемы принятия решения, для которых структура затрат является квадратичной, а не линейной, могут быть сделаны существенные упрощения. Рассмотрим класс задач, в которых затраты в связи с выполнением некоторого действия выражаются формулой
где а Пусть, например, доля дефектных изделий, или «ненадежность» партии продукции, оценена равной а. Если эта оценка отлична от истинного значения величины р, то затраты, выраженные через цену, уплаченную за приобретенные изделия и доход от их использования, будут приблизительно пропорциональны квадрату разности между а и р. Или рассмотрим случай, когда руководитель оценивает долю персонала, увольняющегося во время работ по проекту, как Предположим, что относительно величины биномиального параметра неопределенность может быть выражена в виде некоторого априорного распределения. Априорно ожидаемые затраты в случае выбора некоторого действия (или оценки) а даются выражением
Это выражение можно переписать в виде
Для нахождения априорно наилучшего действия возьмем первую производную от априорно ожидаемых затрат, приравняем ее нулю и решим полученное уравнение:
откуда
Таким образом, априорно наилучшим действием Вычисляя ожидаемые затраты с использованием оптимального значения а, получим
Следовательно, ожидаемые затраты на основании наилучшего значения а пропорциональны дисперсии априорного распределения величины
откуда
Эти результаты находятся в соответствии с интуитивным предположением, что ожидаемая ценность информации, содержащейся в выборке, будет увеличиваться с уменьшением апостериорной дисперсии, т. е. с увеличением размера выборки. Ценность выборочной информации уменьшается вместе с уменьшением дисперсии априорного распределения. Чем более определенной является для нас ситуация, тем меньше ценность дополнительной информации. Так как в случае полной информации дисперсия апостериорного распределения равна нулю, EVPI оказывается предельным значением EVSI при увеличении размера выборки. Отметим, что ни один из этих результатов не зависит от специальных предположений о виде априорного распределения. Они остаются пригодными как для нормального, так и для Оптимальный размер выборкиВ случае квадратичной структуры затрат выражение для оптимального размера выборки может быть получено непосредственно. Рассмотрим ожидаемый чистый выигрыш от получения выборочной информации как функцию размера выборки. Затраты на осуществление выборки полагаются просто пропорциональными размеру выборки. Итак,
Для оценки Априорная дисперсия апостериорного среднего значения равна дисперсии среднего минус ожидаемое значение апостериорной дисперсии. Мы не будем здесь приводить доказательства этого утверждения в общем случае, а лишь покажем, что оно справедливо для рассмотренного в гл. 6 нормального распределения. Напомним, что для нормального распределения априорная дисперсия апостериорного среднего дается формулой
Величина
а так как эта величина не зависит от наблюдаемого значения среднего по выборке, она равна также ожидаемому значению апостериорной дисперсии. Таким образом, наш результат верен для нормального распределения. Этим еще не доказывается, что он справедлив для общего случая, но мы будем предполагать, что это так. Применим этот результат для случая априорного
Таким образом, мы имеем
или
Ожидаемый чистый выигрыш от получения информации, содержащейся в выборке, можно теперь выразить следующим образом:
Взяв частную производную по
где Из этого выражения мы непосредственно заключаем, что а) чем больше затраты на проведение выборки б) чем меньше дисперсия априорного распределения, тем меньше оптимальный размер выборки, т. е. чем больше наша уверенность относительно значения в) чем больше затраты, связанные с наличием ошибки (измеряемые величиной С), тем больше оптимальный размер выборки; г) если выражение для Последовательные выборкиБольшая часть наших рассуждений до сих пор касалась программ сбора данных, основанных на заранее фиксированном размере выборки. Такие программы с фиксированным размером выборки, очевидно, игнорируют то обстоятельство, что в момент поступления данных полученная ранее информация уже может быть достаточно убедительной для составления определенного мнения. Таким образом, может оказаться ненужным тратить усилия на получение дополнительных данных, входящих в заранее запланированную выборку. Естественное обобщение этой идеи приводит к стратегии последовательных выборок. После получения каждой порции информации вычисляется апостериорное распределение, на основе которого решают, следует ли действовать или надо получить дополнительную порцию информации. В последнем случае предыдущее апостериорное распределение (теперь рассматриваемое уже как априорное) опять преобразуется в новое апостериорное распределение и снова принимается решение, начинать ли действовать или продолжать выборку. Такой план, если он осуществим, очевидно, позволяет наилучшим образом использовать поступающую информацию и обычно обеспечивает наиболее экономную программу сбора. Рассматривая метод последовательных выборок, мы переходим от единичных, изолированных решений к последовательному принятию решений. Исли сохраняется предположение о квадратичной структуре затрат, сравнительно легко наметить осуществление программ последовательных выборок. Предположим, что на любом конкретном этапе программы неопределенность относительно
Введем теперь следующее определение:
В этот момент он может либо остановиться и перейти к действиям, либо продолжать поиск, чтобы получить еще одно наблюдение. Следовательно,
Таким образом, минимальные ожидаемые затраты на каждом этапе могут быть определены лишь тогда, когда известны затраты для всех будущих этапов. Один из способов решения этой проблемы состоит в «усечении» программы, заранее решая приостановить дальнейшие выборки, когда сбор данных производился лишь в пределах некоторого лимита отпущенных на это средств. Посмотрим сначала, какое действие нужно выполнить, если Но даже без такого усечения программы можно быть уверенным, что если получение информации связано с определенными затратами, поиск будет прекращен и после некоторого конечного числа дополнительных выборок будут предприняты действия. Действительно, можно предположить, что существует некоторое значение
Вспоминая, что
и полагая
подставим эти величины в предыдущее выражение. Рассматривая только случай равенства и разрешая его относительно
Это и есть то значение Полученный вывод можно проиллюстрировать при помощи весьма простого примера, в котором затраты на выборку предполагаются равными
На фиг. 10.2 приведена схема относящихся сюда вычислений. При желании читатель может проверить, что при продолжении выборок после
Фиг. 10.2. Системы контроля и управленияОбратимся теперь к некоторым основным проблемам выработки решения, с которыми сталкивается руководитель, который хочет создать систему контроля и управления и контроля за операциями, относящимися к сфере его ответственности. Основные проблемы будут оставаться структурно-подобными независимо от того, хочет ли он контролировать качество выпускаемой продукции или прибыльность какого-то из подразделений своей фирмы. В общем случае мы имеем некоторую действующую систему, качество работы которой оценивается после выпуска каждой единицы продукции или в определенные моменты времени. Предположим далее, что руководитель в первом приближении разделяет действия на две категории: приемлемые и явно ошибочные. Процесс управления как таковой в конце концов сводится к установлению допусков, критериев приемлемости, заданий по сбыту, пределов ассигнований и т. д., т. е., попросту говоря, критериев приемлемого или неприемлемого качества работы системы. На деле прочно установившаяся традиция «управления по отклонениям» включает процедуру оценки качества системы, но руководителю представляется информация лишь в случае, когда качество становится неприемлемым. Проектирование полной системы управления включает а) установление критериев или стандартов приемлемого качества работы; б) определение того, насколько часто должно наблюдаться и сравниваться с критериями фактическое качество работы; в) вскрытие причин появления неприемлемого качества; г) определение характера необходимого корректирующего воздействия и выбор времени его осуществления. Проблемы «б» и «г» требуют особого внимания, так как они обычно обсуждаются в общем виде. В нестрогой формулировке эти проблемы выглядят так: 1. Следует ли затрачивать средства на частое наблюдение за качеством работы системы, чтобы можно было сразу вмешаться, когда это окажется необходимым, или же надо экономить средства, прибегая к менее частым наблюдениям, но рискуя зато упустить время, необходимое для исправления возникающих осложнений? 2. Когда появляется информация о возможном нарушении деятельности системы, руководитель должен решить, пойти ли на затраты, которых требует немедленное вмешательство (возможно, и ненужное), или же ждать до тех пор, пока состояние системы не станет более определенным. Конечно, пока он выжидает, могут произойти всякие неприятные события. Чтобы наглядно проиллюстрировать эти вопросы, рассмотрим задачу управления производственным процессом. Управление и контроль за выпуском продукции в ходе производственного процессаРассмотрим машину, выпускающую некоторые изделия, каждое из которых проверяется на годность или негодность. За основной параметр при разработке системы контроля может быть принято число проверяемых изделий технологическом процессе. Рассмотрим процесс, непосредственно следующий за осуществлением управляющего воздействия, в результате которого происходит какое-то регулирование или перенастройка системы. Пусть знание доли дефектных изделий По мере продолжения производственного процесса возникает все больше возможностей для наступления различных событий, влияющих на его ход и вызывающих его уклонения от того состояния, в которое он был переведен предшествующим управляющим воздействием. Таким образом, по мере продолжения процесса производства растет неопределенность относительно системы. В общем случае после выпуска L единиц продукции неопределенность относительно Предположим, что к концу каждого «интервала выборки» затраты на управляющее воздействие умеренны и что система при этом возвращается в то же состояние, в каком она находилась в начале интервала, т. е. состояние с параметрами
1. Затраты на управляющее воздействие могут содержать фиксированную составляющую и могут также зависеть от состояния наших знаний, т. е. от параметров 2. Затраты на осуществление выборки являются некоторой возрастающей функцией размера выборки. С возрастанием L затраты на выборку будут возрастать, так как растет ее размер, но затраты на осуществление выборки, рассчитанные на единицу продукции, могут сильно понизиться. С возрастанием L обычно происходит увеличение количества брака, выпускаемого системой. Таким образом, с увеличением «интервала выборки» растут и расходы на брак. Проектировщик системы, желающий минимизировать затраты на единицу выпускаемой продукции, обычно обнаруживает, что по мере увеличения единичные (т. е. рассчитанные на единицу продукции) затраты на управляющие воздействия уменьшаются; единичные затраты на проведение выборки уменьшаются; единичные затраты, связанные с выпуском брака, растут. Системы с многоинтервальными выборкамиВо многих системах контроля и управления руководитель не вырабатывает, как это предполагалось раньше, специальных управляющих воздействий с целью возвращения системы в исходное состояние к началу каждого интервала выборки; после изучения результатов выборки он может принять решение вообще не предпринимать никаких действий. Классическое упрощение состоит в том, чтобы решить, при каких условиях выборочной информацией можно пренебречь, и предполагать, что система действительно находится в состоянии, в котором она находилась в начале интервала. При таком упрощении структура задачи остается такой же, как предполагалось ранее. Однако более реалистично ожидать, что руководитель изучит результаты выборки, убедится, что система не находится в том же состоянии, что и в начале интервала, и все же решит не прибегать к управляющим воздействиям. Далее, управляющее воздействие, если и будет предпринято, может оказаться не вполне эффективным. Это означает, что оно может перевести систему не в исходное, а какое-то другое состояние, которое может зависеть от знания руководителем текущего значения выборок, требует рассмотрения последовательности решений. (Основная структура таких проблем описана в гл. 11). Другие системы контроля и управленияХотя разобранный только что пример управления производственным процессом достаточно хорошо иллюстрирует некоторые основные вопросы, возникающие при проектировании большинства систем управления производством, было бы нереалистично думать, что он охватывает все важные проблемы. В случае когда система управления включает в себя как людей, так и технические средства, возникает множество новых затруднений. Когда руководство фиксирует финансовые показатели, задания и нормативы для торговых или промышленных предприятий, эти определения приемлемого качества работы не только образуют основу для систем управления, но и оказывают очень важное стимулирующее воздействие на участников. Если целевое задание очень высоко, так что вероятность его достижения очень мала, участники могут просто отвергнуть его как явно нереалистичное. Если финансовый план настолько занижен, что вероятность его выполнения высока, участники могут работать ниже разумного уровня эффективности, поскольку «приемлемое качество работы» будет и без того легко достижимым. Из этих соображений сразу вытекает, что руководителю следует, не ограничиваясь осуществлением корректирующих воздействий, как в примере с управлением производственным процессом, рассмотреть возможность изменения критериев приемлемого качества работы системы. Такого изменения могут потребовать, например, легко и часто выполнимые финансовые задания, или же финансовые планы, которые редко выполняются или никогда не осуществляются. Имеются важные указания на то, что, если сотрудники системы имеют возможность устанавливать собственные критерии приемлемого качества работы, такие критерии будут оказывать гораздо большее влияние на их поведение, чем в случае, когда эти показатели устанавливаются руководителями более высокого уровня. Ясно также, что для сотрудников важно иметь четкое представление о том, как определяется приемлемое качество и насколько их собственное поведение отвечает критериям приемлемости. Вполне может также случиться, что система управления, которая только сообщает об отклонениях от приемлемого поведения и вызывает лишь корректирующие воздействия, может оказать серьезное отрицательное влияние на отношения между руководителем и сотрудниками. Представляется более мудрым сообщать также об успешном достижении целей и обеспечить какие-то формы поощрения в дополнение к корректирующим действиям в ответ на неудовлетворительную работу системы. Упражнения10.1. Покажите, что в случае априорного 10.2. Руководитель фирмы пытается решить, приступать ли к выпуску новой продукции. Он чувствует, что существует определенное количество потенциальных потребителей этой продукции, но не уверен, какая часть из них будет в действительности ее покупать. Он рассматривает дорогостоящую программу сбора данных о возможных продажах путем изучения выборки из 10.3. Фирма закупает материалы партиями объема L единиц. Когда партия получена, из нее берется выборка размером 10.4. Предположим, что вам приходится выбирать между двумя производственными процессами, практически одинаковыми во всех отношениях, кроме доли дефектных изделий. Однако у вас существует неопределенность относительно этих долей. Можно провести дорогостоящую серию контрольных испытаний, относящихся к одному или к обоим процессам. Вы хотите обосновать ваш выбор, исходя из принципа минимизации ожидаемого процента брака. Предложите план испытаний и анализ их результатов. 10.5. При разборе особенностей системы управления был использован пример, относящийся к управлению производственным процессом. Покажите, каким образом сходные идеи могут быть приложены к какой-либо другой области управления. 10.6. При анализе систем управления с выборками данных по многим интервалам наблюдений указывалось, что при проектировании системы необходимо учитывать и будущие интервалы выборок. Как решить, насколько далеко в будущее было бы важно распространить такое рассмотрение?
|
1 |
Оглавление
|