10.3.2. Выбор порядка сплайна, числа и положения узлов.
Это важная и ответственная задача, по своей методической роли эквивалентная выбору класса аппроксимирующих функций в обычном регрессионном анализе. От ее успешного решения существенно зависит, удастся ли при анализе данных использовать все преимущества, представляемые сплайнами, или нет. Здесь трудно дать рекомендации, верные для всех практических задач.
Однако, следуя [2581, мы попытаемся высказать некоторые общие соображения для случая, когда наблюдений относительно немного или они распределены крайне неравномерно вдоль оси регрессора. В этих условиях желательно:
1) использовать сплайны 3-го порядка;
2) вводить настолько мало узлов, насколько это возможно. На интервал между узлами иметь не менее 4 или 5 наблюдений. Это правило вызвано тем, что проблема «сверхподгонки» представляет для сплайнов реальную опасность;
Рис. 10.2. Базисные сплайны с равноотстоящими узлами: а) ; б)
3) иметь не более одной экстремальной точки (максимум или минимум) на интервале. Желательно, чтобы эта точка приходилась на центр соответствующего интервала, а точки перегиба линии регрессии были в окрестности узлов.
Другой подход к выбору узлов можно найти в [197, 245].