2.7.3. НОРМАЛИЗУЮЩИЕ ПРЕОБРАЗОВАНИЯ
Поскольку нормальные наблюдения сравнительно легко исследовать, часто бывает полезным преобразовать данные в приближенно нормальные.
а) Логарифмическое преобразование. Положительные переменные с положительной асимметрией. Данные, которые могут принимать любые положительные значения, часто происходят из распределения с положительной асимметричной п.р.в. [см. II, раздел 9.10.1], напоминающего логарифмически нормальное распределение [см. II, раздел 11.5], гамма-распределение [см. II, раздел 11.3] или распределение
[см. II, раздел 11.4]. Если случайная переменная X распределена как логарифмически нормальная переменная, то ее логарифм будет нормальным (по определению). С помощью логарифмического преобразования можно добиться только приближенной нормальности для
Рис. 2.7.1. Графики ф.р. распределения
и распределения
на логарифмической вероятностной бумаге
случаев, когда оно применяется к случайным переменным, распределение которых лишь качественно напоминает логарифмически нормальное распределение. На рис. 2.7.1 изображены графики функции распределения (ф.р,) распределения
с различными значениями числа степеней свободы, а прямая линия соответствует ф.р. логарифмически нормального распределения (таким образом разграфленная бумага называется логарифмически вероятностной бумагой (ср. с разделом 3.2.2, а)).
б) Логарифмическое преобразование переменных, значения которых ограничены сверху или снизу. Преобразование Фишера для коэффициента корреляции. Если значения случайной переменной X заведомо лежат в интервале
то значения преобразованной переменной
могут изменяться от
Тем самым не исключается, что
может быть приближенно нормальной переменной.
Это преобразование рекомендуется в случае коэффициента корреляции. Коэффициент корреляции
рассчитанный по выборке
пар
из двумерной нормальной совокупности [см. II, раздел 13.4.6], а именно
[см. раздел 2.5.7], имеет значения, лежащие в интервале
Выборочное распределение
сильно скошено, его точная форма зависит от значения
коэффициента корреляции в исходной генеральной
совокупности. Преобразованная статистика [см. § 2.5.7]
имеет почти нормальное выборочное распределение с математическим ожиданием
и дисперсией
(приближенно).
Это преобразование заметно упрощает вопрос о точности
как оценки
[см. пример 5.2.2].
в) Нормализующие преобразования распределения
Хотя для распределения
[см. раздел 2.5.4, а) и гл. 7] существует много таблиц, иногда удобнее работать с приближенно нормальной функцией от
Обычно для
-переменной с и степенями свободы используются следующие два преобразования:
1) для
переменная
приближенно распределена по стандартному нормальному закону; это приближение неплохо действует также для
Большую точность дает вариант:
приближенно нормальная стандартная переменная.
Например, при
вероятность того, что
-переменная будет превышать 51,805, равняется 0,100; аппроксимация (2.7.11) дает
где
откуда
т.е. ошибка составляет 0,2%. Аппроксимация (2.7.10), для которой
считается слишком малым, дает приближенное значение 0,98, т.е. ошибка составляет 2%.
г) Преобразование с помощью интеграла вероятности. Пробиты. В принципе любая непрерывная случайная переменная поддается точной нормализации с помощью преобразования интеграла вероятности: если
в точке х обозначить через
то преобразованная переменная
будет иметь равномерное распределение в области (0,1) [см. II, разделы 1.4 и 10.7]. Если обозначить ф.р. стандартной нормальной переменной в точке у через
[см. II, раздел 11.4.1], то случайная переменная
будет равномерно распределена в области (0,1). Таким образом, преобразование X в
заданное соотношением
или
Рис. 2.7.2. S-образная кривая
будет преобразовывать X в стандартную нормальную переменную.
Величина
или чаще (чтобы избежать отрицательных значений)
называется пробитом
разделах 2.7.4 и 6.6 описывается практическая реализация этой идеи. Подробное обсуждение ее применительно к исследованиям типа «доза — эффект» можно найти в книге [Finney (1971)]. Другое преобразование такого же рода — преобразование типа «логит» можно найти в работе [Ashton (1972)]. В этом случае вероятность
заменяется на