11.4. ЗАКЛЮЧЕНИЕ
Особенности подхода к обработке пропущенных данных, описанного в этой главе, заключаются в следующем.
Предполагается, что строки таблицы данных состоят из значений полиномиальных функций одной переменной на некотором носителе.
Рассматривается только случай, когда носитель
на котором экспериментально определяются значения этих функций, дискретный, естественно упорядоченный и его элементы разбивают числовую прямую на интервалы равной длины.
Аппроксимация проводилась методом наименьших квадратов, поскольку он «...мало чувствителен к выбору носителя, если имеется достаточное число точек и они удобно распределены...», и ему «...отдается предпочтение всякий раз, когда требуется приблизить некоторую функцию, определяемую экспериментально» [9]. При таком подходе много вопросов еще требуют изучения, например, влияние пропущенных данных и определение «порога» значимости метода; случай «нерегулярного» носителя; взвешивание параметров, использование других базисов многочленов (например, многочленов Лежандра) или других аппроксимирующих функций (функции Гаусса, синусов и т. п.);
применение других процедур (аппроксимация в смысле Чебышева, среднеквадратичная при помощи некоторых частичных степенных рядов и т. п.)- И наконец, остается проблема выбора входных параметров, главным образом, числа классов (степень многочленов можно подогнать). Это, несомненно, оказывает сильное влияние на результаты.
ЛИТЕРАТУРА
(см. скан)