Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше
Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике
§ 3. Задача восстановления регрессии
Два множества элементов связаны функциональной зависимостью, если каждому элементу может быть поставлен в однозначное соответствие элемент Эта зависимость называется функцией, если множество векторы, а множество скаляры. Однако существуют и такие зависимости, где каждому вектору х ставится в соответствие число полученное с помощью случайного испытания, согласно условной плотности Иначе говоря, каждому х ставится в соответствие закон согласно которому в случайном испытании реализуется выбор у.
Существование такого рода зависимостей отражает наличие стохастических связей между вектором х и скаляром у. Полное знание стохастических связей требует восстановления условной плотности Задача же восстановления условной плотности чрезвычайно трудна. Однако часто на практике (например, в задачах обработки результатов измерения) нужно знать не плотность а лишь одну из ее характеристик: функцию условного математического ожидания, т. е. функцию, которая каждому ставит в соответствие число равное математическому ожиданию скаляра у
Функция называется регрессией, а задача восстановления функции условного математического ожидания — задачей восстановления регрессии.
Рассмотрим постановку этой задачи. В некоторой среде, которая характеризуется плотностью распределения вероятностей случайно и независимо появляются ситуации х. В этой среде работает преобразователь, который каждому вектору х ставит в соответствие число у, полученное в результате реализации случайного испытания согласно закону Ни свойства среды ни закон вообще говоря, неизвестны. Однако известно, что существует регрессия
Потребуется по случайной независимой выборке пар
восстановить регрессию, т. е. в классе функций отыскать функцию а, наиболее близкую к регрессии
Задача восстановления регрессии является одной из основных задач прикладной статистики. К ней приводится проблема интерпретации результатов прямых экспериментов. Пусть интересующая нас закономерность связывает функциональной зависимостью величину у с вектором х
Пусть нашей целью является определение функциональной зависимости в ситуации, когда в любой точке х может быть проведен прямой экперимент по определению этой зависимости, т. е. проведены прямые измерения величины Однако вследствие несовершенства эксперимента результат измерения определит истинную величину с некоторой случайной ошибкой. Иначе говоря, в каждой точке х удается определить не величину а величину где ошибка эксперимента,
Считается (эта гипотеза и определяет возможность интерпретации экспериментов), что ни в одной точке х условия эксперимента не допускают систематической ошибки, т. е. математическое ожидание измерения функции в каждой фиксированной точке х равно значению функции в этой точке
Кроме того, будем считать, что случайные величины независимы. В этих условиях необходимо по конечному числу прямых экспериментов восстановить функцию Таким образом, интересующая нас зависимость есть регрессия (1.7), а суть проблемы состоит в отыскании регрессии по последовательности пар
В задачах интерпретации результатов прямых экспериментов принято различать два типа экспериментов: закрытый и открытый. Закрытый эксперимент предполагает, что закон по которому определяется выбор экспериментальных точек, исследователю не известен.
Открытым экспериментом считается такой эксперимент, в котором закон выбора точек измерения известен исследователю (его часто задает сам исследователь). Итак, задача восстановления регрессии содержит проблему интерпретации результатов прямых экспериментов.
В свою очередь задача восстановления регрессии сводится к задаче восстановления зависимостей.
В самом деле, рассмотрим функционал
где обозначено
Покажем, что если регрессия принадлежит классу то она минимизирует функционал (1.8), если же регрессия не принадлежит то минимум достигается на ближайшей к регрессии функции а. Близость функций понимается в следующем смысле (в метрике
Действительно, обозначим
Тогда функционал (1.8) может быть записан в виде
В этом выражении третье слагаемое равно нулю, так как в силу (1.7)
Таким образом, мы установили, что
Так как первое слагаемое не зависит от а, то точка минимума совпадает с точкой минимума второго слагаемого, и, следовательно, минимум достигается на регрессии,