Главная > Справочник по прикладной статистике. Том 2
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

11.2. ПОДГОНКА МОДЕЛЕЙ ПО ДАННЫМ

11.2.1. СТРУКТУРА ДАННЫХ

Структура линейной модели строго следует из структуры данных. Массив данных должен иметь следующий вид. Для каждой из различных единиц (объектов) одинаковой природы измерены значения некоторой зависимой переменной и объясняющих переменных. Данные организуются в виде прямоугольного массива, каждая строка которого соответствует единице (объекту), а каждый столбец

— переменной.

Массив данных имеет следующий вид:

Такой массив может быть рассмотрен либо как множество вектор-столбцов с компонентами либо как матрица данных с Этот массив имеет элементов.

Многие наборы данных выходят за рамки этой структуры. Такими будут, например, массивы данных с пропущенными значениями, массивы с несколькими зависимыми-переменными и массивы без зависимой переменной, которые используются в многомерном статистическом анализе. Предположение об однородности объектов также является некоторым ограничением. Из однородности следует, что результат анализа данных не должен зависеть от перестановки строк таблицы. Это условие, в частности, исключает из рассмотрения временные ряды, где важен порядок наблюдений, и данные, где объекты имеют различные веса. Это имеет место при анализе стратифицированных выборок. Исключается также и случай, когда объекты разбиваются на несколько кластеров.

Результаты анализа не должны зависеть и от перестановки объясняющих переменных. Порядок столбцов в матрице данных не должен добавлять какую-нибудь значимую информацию.

Поскольку эти ограничения достаточно серьезны, тем более неожиданными являются мощность и гибкость приложений теории линейных моделей.

Параметрическая структура линейной модели проявляется следующим образом. Для каждого объекта ожидаемое значение зависимой переменной задается выражением

или в векторной записи

Как ожидаемое значение так и значение линейного предиктора зависит от номера Однако коэффициенты одинаковы для всех объектов. Подгонка модели эквивалентна оцениванию этих параметров и параметра

Параметр масштаба не зависит от но теория легко может быть распространена на случай такой зависимости с помощью взвешивания, т. е. при замене на где — известные веса. Это позволяет включить и случай нормально распределенной зависимой переменной, которая в действительности есть усредненное значение независимых наблюдений. Такое расширение теории до некоторой степени позволяет снять ограничения, связанные с требованием однородности объектов в матрице данных.

1
Оглавление
email@scask.ru