Главная > Теория автоматического регулирования. Книга 2
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

1. ОТЫСКАНИЕ УРАВНЕНИЯ СТАТИКИ ПО ДАННЫМ ПАССИВНОГО ЭКСПЕРИМЕНТА

Аппарат корреляционного и регрессионного анализов позволяет получить математическое описание объекта в виде полинома заданного вида, связывающего входные и выходные параметры объекта в статическом режиме.

Рассмотрим корреляционную зависимость некоторой случайной переменной величины Е от другой случайной переменной величины Пусть дана таблица наблюдений значений Е и Перенесем экспериментальные данные на координатную плоскость с осями Е и

Рис. II.1. Построение линии регрессии

Получим так называемое поле корреляции (рис. II. 1, а). Каждому наблюдению из таблицы будет соответствовать определенная точка на поле корреляции.

Весь диапазон изменения разобьем на ряд равных интервалов Все точки, попавшие в данный интервал отнесем к середине этого интервала Получим трансформированное поле корреляции (рис. II.1, б). Теперь подсчитаем частные средние арифметические для каждого значения

где — число точек, оказавшихся в интервале, причем

— общее число наблюдений.

Затем последовательно соединим точки отрезками прямых. Полученная ломаная линия называется эмпирической линией регрессии Е по Она показывает, как в среднем изменяется Е с увеличением Очевидно, что большим доверием будут пользоваться те точки эмпирической линии регрессии, которые принадлежат интервалам с большим количеством наблюдений. С ростом числа наблюдений

эмпирическая линия регрессии будет освобождаться, от случайных зигзагов, принимая все более правильный, закономерный вид. Предельное положение эмпирической линии регрессии, к которому она стремится при неограниченном увеличении числа наблюдений (и одновременном, но не столь быстром уменьшении интервалов называется предельной теоретической линией регрессии или, для кратности, просто линией регрессии. Ее нахождение по результатам конечного числа наблюдений и составляет задачу корреляционного анализа.

Процесс нахождения линии регрессии сводится к расчету параметров ее уравнения способом наименьших квадратов. Сущность способа состоит в следующем. Если для каждого фиксированного значения величина Е нормально распределена, то наилучшие оценки для коэффициентов уравнения линии регрессии получаются при достижении условия

т. е. сумма квадратов отклонений экспериментальных значений от значений рассчитанных по уравнению

должна быть наименьшей (рис. II.1,в).

Оценки для коэффициентов найденные этим способом, будут наилучшими в том смысле, что они распределены нормально, со средними, равными полученным значениям, и с наименьшими возможными дисперсиями.

Изложенные принципы справедливы и тогда, когда исследуется зависимость Е от двух и более переменных

В случае множественной корреляции рассматривают уже не линию регрессии, а соответственно плоскость или гиперплоскость регрессии. Тесноту исследуемой связи оценивает коэффициент корреляции характеризующий ту долю полной дисперсии переменной , которая вызвана действием контролируемых переменных. Чем выше значение чем теснее корреляционная связь, тем сильнее найденная зависимость проявляется среди многообразных, нарушающих ее воздействий, тем точнее по данным значениям х можно предсказать значение Е.

Значения заключены в пределах Если то связь является функциональной, т. е. учтены все параметры, от которых в той или иной мере зависит Е. Если то корреляционная зависимость между исследуемыми параметрами отсутствует. Если же то говорят о наличии более или менее тесной корреляционной зависимости. В распоряжении

исследователя имеется целый ряд формул для подсчета которыми он может пользоваться по своему усмотрению [6]. Проще всего оценивается теснота парной корреляционной зависимости. Наиболее употребительная при этом формула имеет вид

где Е — среднее значение переменной

— среднее значение переменной

— число наблюдений;

— среднеквадратичные значения соответствующих переменных.

Мерой тесноты связи для случая множественной корреляции служит множественный коэффициент корреляции который может быть определен через коэффициенты парной корреляции параметров, участвующих в уравнении. Например, для уравнения с двумя переменными коэффициент множественной корреляции подсчитывается по формуле

где — коэффициенты парной корреляции для соответствующих переменных.

Очевидно, что коэффициент корреляции, оценивающий тесноту связи функции с переменными, не может быть больше коэффициента, оценивающего тесноту связи той же функции с переменной, поскольку, включая дополнительный аргумент, мы более полно узнаем функцию. Использование коэффициента корреляции как меры тесноты связи обосновано лишь в том случае, когда исследуемые случайные переменные имеют многомерное нормальное распределение.

Проследим подробнее применение метода множественной линейной корреляции при получении математического описания сложного объекта в статике, характеризующегося большим числом переменных.

Пусть табл. II. 1 отражает свободное поведение независимых контролируемых переменных х и соответствующие наблюдения некоторой переменной Е, характеризующей эффективность работы объекта. Предположим, что между Е и существует линейтая корреляционная зависимость вида (II. 4).

Требуется определить коэффициенты уравнения (II. 4). Прежде всего, все переменные переводятся в стандартизованный масштаб по формулам

где — значения соответствующей переменной в стандартизованном масштабе;

— средние значения соответствующих переменных; — среднеквадратичные значения отклонений соответствующих переменных.

Таблица II.1 (см. скан)

Коэффициенты парной корреляции между стандартизованными переменными выражаются формулой

Можно показать, что уравнение регрессии в стандартизованном масштабе не имеет свободного члена и принимает вид

где — стандартизованные значения переменных

- значение величины Е в стандартизованном масштабе.

Коэффициенты уравнения (II. 9) находятся методом наименьших квадратов из условия

Условие минимума для соотношения (II. 10) определяется следующими выражениями;

Подставляя в выражение (II. 10) вместо его значение из уравнения (II. 9), получаем

Пользуясь условиями минимума (II. 11), находим

Раскроем скобки в каждом уравнении системы (11.13) и умножим левую и правую части уравнений на Замечаем, что при каждом коэффициенте получим, согласно формул (II.8), коэффициент парной корреляции

Принимая во внимание, что коэффициенты

получаем следующую систему нормальных уравнений:

Для сложных прризводственных объектов система (11.15), как правило, оказывается весьма высокого порядка и для ее решения необходимо использовать универсальную вычислительную машину. При этом могут использоваться как точные методы решения, так и приближенные.

Система нормальных уравнений (11.15) в матричной форме может быть записана в виде

где

Решение системы (II. 16) заключается в нахождении компонент матрицы С в выражениях (II. 17). Умножим обе части матричного уравнения на обратную матрицу т. е.

Поскольку то решение системы (II. 16) можно записать в виде

где

Операция обращения матрицы В заключается в том, что каждый элемент матрицы В, расположенный в строке и столбце, заменяется на другой элемент, равный -определитель матрицы — алгебраическое дополнение заменяемого элемента

Для выполнения операции обращения матриц высокого порядка универсальные вычислительные машины имеют специальные программы. Например, объем оперативной памяти машины «Урал II» позволяет обращать квадратные матрицы с 36 членами.

В результате решения системы (11.15) определяются коэффициенты стандартизованного уравнения регрессии. Так как все переменные величины выражены в стандартизованном масштабе, то найденные коэффициенты показывают сравнительную силу влияния изменения каждой переменной на изменение выходного параметра.

Для практического использования уравнения (II. 9) необходимо вернуться к нормальному масштабу. Коэффициенты уравнения (II. 4) определяются по формулам

Подставив найденные коэффициенты в уравнение (II. 4), получим линейную математическую модель сложного объекта в статике. Определив параметры связи, необходимо оценить ее тесноту. Для подсчета коэффициента множественной корреляции удобна формула

В теории корреляционного анализа известны способы, позволяющие оценить точность и достоверность полученного значения коэффициента корреляции в зависимости от числа проведенных наблюдений [6].

Причину малости значения можно объяснить двояким образом:

1. Выбранная линейная форма связи соответствует действительно существующей, но сама рассматриваемая связь слаба и в значительной степени нарушается действием неучтенных факторов. Увеличение тесноты связи в этом случае можно добиться введением в уравнение регрессии дополнительных переменных.

2. Действительная закономерность имеет определенно нелинейный характер, и замена ее прямолинейной зависимостью вносит слишком большие искажения. В этом случае следует перейти к методам регрессионного анализа.

Важно уяснить тот момент, что корреляционный анализ не дает сведений о форме реально существующей корреляционной связи. Форму связи, т. е. порядок уравнения и вид каждого его члена, исследователь определяет сам на основании различных предположений и гипотез.

Эффективность использования метода корреляционного анализа существенно зависит от соблюдения ряда условий, которые в обстановке реального производства иногда оказываются трудновыполнимыми.

Основным требованием является существование многомерного нормального распределения для исследуемых переменных (n-мерного,

если число переменных равно n). Тогда при соблюдении этого условия полученные коэффициенты корреляции допускают надежную интерпретацию, как показатели тесноты связи, и могут быть определены их доверительные границы.

Из сказанного выше вытекает, что практически приемы и методы корреляционного анализа могут применяться для получения линейных моделей сложных объектов, так как при нелинейной форме уравнения понятие многомерного нормального распределения переменных теряет смысл.

Основная предпосылка регрессионного анализа состоит в следующем: все исследуемые случайные переменные имеют некоторую произвольную плотность распределения, но для каждого фиксированного значения этих переменных случайная величина выхода Е имеет нормальную плотность распределения. Это равносильно требованию одномерного нормального распределения. Условия появления одномерного нормального распределения менее жестки, чем для многомерного распределения. Их выполнение в производственной обстановке вполне реально.

Для использования критерия, оценивающего значимость коэффициентов найденного уравнения регрессии, требуется выполнение следующего дополнительного условия: все распределения Е для различных фиксированных значений переменных должны иметь одинаковую дисперсию. Это допущение не так жестко, как может показаться на первый взгляд.

Указанные предпосылки справедливы как для линейных, так и для нелинейных задач. Особенно эффективны методы регрессионного анализа при построении нелинейных статических математических моделей сложных объектов. Вид связи между величиной выхода Е и переменными х предполагается известным.

Вид теоретической линии регрессии можно иногда определить, исходя из априорной информации, влияния отдельных признаков Е и

Допустим, что сложный процесс может быть описан уравнением второй степени

где — число сочетаний из элементов по два.

Рассматривая в уравнении члены второго порядка, как некоторые новые независимые переменные уравнение можно привести к линейному виду

Последнее уравнение содержит переменных, где Коэффициенты уравнения (II.22) находятся методом наименьших квадратов. Предварительно все переменные стандартизуются.

Регрессионный анализ не требует отыскания парных коэффициентов корреляции, которые при принятых предложениях лишены реального смысла. Для отыскания и проверки значимости коэффициентов используются те же приемы и методы, что и для корреляционного анализа.

При проверке адэкватности, с которой найденное уравнение (II.21) воспроизводит исследуемый процесс, можно воспользоваться следующим приемом.

Вычисляется средний квадрат отклонений экспериментальных значений от значений рассчитанных по формуле

Значение сравнивается со значением дисперсии наблюденных относительно среднего Адэкватность воспроизведения можно считать удовлетворительной, если окажется хотя бы на порядок меньше дисперсии наблюденных значений выхода . В этом случае предсказание по найденному уравнению будет существенно лучше предсказания по среднему .

Для отыскания математического описания по данным пассивного эксперимента методом регрессионного анализа в настоящее время широко применяют универсальные цифровые вычислительные машины. Разработаны стандартные программы для всех выпускаемых ЦВМ.

Сложность вычислительного алгоритма регрессионного анализа при его машинной реализации может быть оценена следующими приближенными соотношениями:

1) числом команд (порядка 800—1200);

2) числом ячеек памяти, которая необходима для хранения информации и результатов вычислений:

при вводе численных значений каждой переменной по столбцам табл. II. 1

при вводе численных значений каждой переменной по строкам табл. II. 1

3) количеством операций:

где а — коэффициент, зависящий от типа машины и конкретного вида программы ;

— число экспериментов;

— число переменных;

— число определяемых коэффициентов уравнения регрессии.

Полученная в результате вычислений математическая модель может быть в дальнейшем использована для управления производственным объектом [3]. В простейшем случае, пользуясь найденным уравнением, можно предсказывать по текущим значениям входных параметров величины на выходе объекта.

1
Оглавление
email@scask.ru