11.2. ПОДГОНКА МОДЕЛЕЙ ПО ДАННЫМ
11.2.1. СТРУКТУРА ДАННЫХ
Структура линейной модели строго следует из структуры данных. Массив данных должен иметь следующий вид. Для каждой из различных единиц (объектов) одинаковой природы измерены значения некоторой зависимой переменной и объясняющих переменных. Данные организуются в виде прямоугольного массива, каждая строка которого соответствует единице (объекту), а каждый столбец
— переменной.
Массив данных имеет следующий вид:
Такой массив может быть рассмотрен либо как множество вектор-столбцов с компонентами либо как матрица данных с Этот массив имеет элементов.
Многие наборы данных выходят за рамки этой структуры. Такими будут, например, массивы данных с пропущенными значениями, массивы с несколькими зависимыми-переменными и массивы без зависимой переменной, которые используются в многомерном статистическом анализе. Предположение об однородности объектов также является некоторым ограничением. Из однородности следует, что результат анализа данных не должен зависеть от перестановки строк таблицы. Это условие, в частности, исключает из рассмотрения временные ряды, где важен порядок наблюдений, и данные, где объекты имеют различные веса. Это имеет место при анализе стратифицированных выборок. Исключается также и случай, когда объекты разбиваются на несколько кластеров.
Результаты анализа не должны зависеть и от перестановки объясняющих переменных. Порядок столбцов в матрице данных не должен добавлять какую-нибудь значимую информацию.
Поскольку эти ограничения достаточно серьезны, тем более неожиданными являются мощность и гибкость приложений теории линейных моделей.
Параметрическая структура линейной модели проявляется следующим образом. Для каждого объекта ожидаемое значение зависимой переменной задается выражением