1.2. Оптимизационная формулировка основных задач прикладной статистики и проблема устойчивости статистического вывода
1.2.1. Связь между оптимизационной формулировкой основных задач прикладной статистики и проблемой устойчивости статистического вывода.
Выше упоминалось, что основные проблемы статистической обработки данных могут быть сформулированы в виде общей оптимизационной задачи (при соответствующем выборе оптимизируемого критерия качества метода) таким образом, что и методы математической статистики, и методы логико-алгебраического подхода конструируются в качестве решений этой задачи. Покажем, как при надлежащем выиоре оптимизируемого критерия качества метода и класса допустимых решений можно в рамках единого унифицированного подхода получать известные методы и модели в задачах:
статистического исследования зависимостей;
классификации объектов или признаков;
сжатого представления данных.
Кроме того, введение критериев качества метода (п. 1.1.2) позволяет реализовать один полезный подход к отысканию таких методов статистической обработки, которые дают устойчивые по отношению к варьированию
исходных допущений (относительно природы и точности регистрации обрабатываемых данных) выводы. В частности, предлагается многократно решить оптимизационную задачу, определяющую наилучший метод статистической обработки данных, для различных критериев качества метода, например для критериев, образующих целое параметрическое семейство. В результате будет получено множество статистических выводов: каждому критерию соответствует свой наилучший метод, а каждому наилучшему методу — свой статистический вывод. Из полученного таким образом множества статистических выводов следует выбрать один или несколько относительно мало меняющихся при переходе от одного критерия к другому в достаточно широкой области их варьирования [7], [79], [92].
Целесообразность и актуальность подобного способа статистической обработки данных обусловлены тем, что на практике, как правило, ни априорная информация о вероятностной природе обрабатываемых данных, ни знание «физического» механизма исследуемого явления не доставляют нам тем не менее достаточных доводов, на основании которых можно было бы строго обосновать выбор какой-то одной модели и соответственно какого-то одного критерия качества метода. А это значит, что целесообразно запастись целым классом допустимых моделей (критериев). Именно поэтому статистические выводы, основанные на столь широко разработанном и применяемом принципе максимального правдоподобия, Оказываются часто уязвимыми с точки зрения устойчивости своих «хороших» свойств (реализация этого принципа основана на априорном постулировании какого-то определенного типа закона вероятностного распределения обрабатываемых данных).
Конкретнее определенная форма реализации идеи получения устойчивых статистических выводов применительно к задаче статистического оценивания отражена в § 10.4.