Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
8.1. ПЛАНИРОВАНИЕ ПРОЦЕССА ПОСТРОЕНИЯ МОДЕЛИПостановка задачи, выбор отклика и предполагаемых факторовКонкретная постановка — наиболее важная фаза в процедуре решения любой задачи. Важно, чтобы инженер, ученый и бизнесмен умели точно сформулировать условия своей задачи. Например, формулировки наподобие «Почему покупатель покупает мой продукт?» или «Почему сегодня линия № 5 работает не очень хорошо?» интересны, но недостаточно конкретны для принятия какого-либо решения. Постановка задачи должна быть очень четкой, и нужно точно установить как отклик, так и предикторы. В начале этой фазы планирования исследователь не должен связывать себя жесткими ограничениями; он может записать любые мыслимые факторы и отклики, которые, как он предполагает, оказывают какое-либо влияние на задачу. Список может получиться длинным, но в результате обсуждения он будет последовательно сведен к разумному числу переменных. Важно помнить, что в любой статистической процедуре отсев факторов никогда не осуществляется однозначно, в том числе и в процедурах множественной регрессии, описанных в гл. 6. В конце концов достигается постановка конкретной задачи с конкретным откликом или откликами, которые предстоит исследовать в связи с конкретным множеством потенциальных предикторов. Действительно ли выбраны основные для данной задачи переменные и доступны ли они?Полученный при формулировке задачи список факторов следует подвергнуть тщательному исследованию. Многие из этих предикторов можно исключить как неизмеримые, например температура капли в процессе может рассматриваться как важная переменная, но в настоящее время ее нельзя измерить. Такой фактор либо заменяют другим, который измерим и может использоваться вместо температуры капли, либо же находят новый измерительный инструмент. Вторая альтернатива требует затрат, и исследователю предстоит определить, какая из двух альтернатив предпочтительнее. Такая научная и практическая оценка всех переменных должна быть сделана именно на этой стадии планирования, т. е. до того как будет собрана основная масса данных. Следующий вопрос таков: в состоянии ли мы получить полное множество фактических данных одновременно для всех выбранных предикторов и откликов? Будет ли наше множество данных полным? Есть много случаев, когда этого не удается достичь и приходится искать какие-то компромиссы. Вот одна из типичных ситуаций: все данные можно собрать одновременно, но измерения откликов нуждаются в дополнительной математической обработке или получаются после дополнительных лабораторных анализов. Из-за загруженности лаборатории текущей работой может оказаться, что пройдет несколько недель, прежде чем мы сможем, наконец, получить ожидаемые результаты. Надо ли дожидаться этих анализов? Не стоит ли отбросить мысль о том, чтобы собирать такие большие массивы данных? Вопросы такого рода было бы очень полезно обсудить прежде, чем приступать к сбору данных, а временной график работы должен быть составлен заранее самым тщательным образом. После полной проверки всех переменных надо провести переоценку возможностей решения задачи. Разрешима ли задача в принципе?Так как изложенная выше процедура отсеивания делает мыслимым исключение многих факторов, то уменьшаются шансы решить задачу вообще. Однако этого, как правило, не происходит. На данной стадии планирования должно быть принято одно из трех возможных решений: 1. Первоначальный замысел следует отбросить. 2. Замысел следует пересмотреть в свете новых знаний, полученных к этому моменту. 3. Замысел представляется реальным и планирование следует продолжить. Корреляционная матрица и первые прогоны регрессииЕсли работе дано «добро», то к ее планированию можно теперь приступить на основе экспериментальных данных, и именно теперь можно проанализировать все трудности, возникающие в связи с поставленной задачей, поскольку надо составить план-график выполнения работы с учетом трудоемкости, бюджета и т. д. Если это возможно, то следовало бы получить выборку данных, вычислить и распечатать для нее описательные статистики, корреляционную матрицу и матрицу, обратную к корреляционной. Диагональные элементы обратной корреляционной матрицы переменных X — это так называемые «инфляционные» множители для дисперсии (ИМД). При их обсуждении в работе, где рассматриваются обобщенные обращения, ридж-регрессия, смещенное линейное оценивание и нелинейное оценивание Д. Маркуардт (Магquагdt D. W. Generalized inverses, ridge regression, biased linear estimation and nonlinear estimation.- Technometrics, 1970, 12, p. 591-612) указывает (на с. 610) как на желательное, что было бы хорошо иметь ИМД «больше чем 1,0, но, безусловно, не больше чем 10». Если любой из Следующее, что важно сделать — установить для каждого из рассматриваемых откликов корреляции с ним каждой из Х-переменных. При этом для каждого отклика хорошо было бы обнаружить одну-две большие корреляции. Если же их нет, то придется вновь проанализировать всю ситуацию. Может случиться так, что диапазон изменения Х-переменных окажется слишком мал. Помните, что пока пространство X не будет «достаточно большим», получить хорошее предсказание будет скорее всего нелегко. Подобные отсечения и ветвления на столь ранней стадии планирования позволяют экспериментатору получить разумные оценки ожидаемых затрат времени и средств, а также представление о шансах на создание отличной модели для предсказания. Установление целей и составление сметы расходовНа этой стадии исследователь и статистик должны установить цели предпринимаемой работы, составить план-график решения конкретных задач и подготовить задания сотрудникам и компьютеру. В плане-графике предусматриваются контрольные точки, после чего вся предварительная работа предъявляется к приемке и утверждению. Ниже приведен пример простых наметок, какие могут представляться на утверждение. Образец формуляра для намечаемой работыНАЗВАНИЕ РАБОТЫ: Оценка уравнения для расхода пара на заводе А. ИНЖЕНЕР-ИСПОЛНИТЕЛЬ: Джо ДОУ. ПРЕДПОЛАГАЕМЫЙ МЕТОД ИССЛЕДОВАНИЯ: Множественная регрессия. ДЕЛИ РАБОТЫ: 1. Окончательное уравнение должно объяснять более 80 % вариации 2. Стандартное отклонение оценки должно составлять менее 5 % от среднего значения количества используемого пара. 3. Число предикторов должно быть 4. Все оценки коэффициентов окончательного уравнения должны быть статистически значимы при 5. В остатках не должно быть заметных связей.
ПЛАН-ГРАФИК: 1. Сбор данных, прикидочные расчеты и предварительный анализ 2 недели 2. Модификация и усовершенствование 4 недели 3. Составление отчета и завершение работы 2 недели Приемлемы ли цели и бюджет?Если работа принята во всем объеме, то она вступает в стадию разработки, а если нет, то осуществляется пересмотр, направленный на уменьшение объема затрат, или же работа просто приостанавливается.
|
1 |
Оглавление
|