6.5.3. Вклад факторного типологического анализа
Вносимые изменения состоят, с одной стороны, в «сжатии» данных при помощи факторного типологического анализа, что позволяет определить самые подходящие (т. е. объясняющие самую большую долю инерции) системы осей (7 или 8 в зависимости от данных), а с другой стороны, в использовании формулы восстановления данных в терминах локальных факторов.
Рис. 6.14
Вся обучающая выборка предварительно «ответвляется» на одну из систем осей (наиболее подходящую в смысле меры близости сжимается, затем восстанавливается исходя из локальных факторов системы оставшихся осей.
Систему сжатия-восстановления можно представить в виде схемы, как показано на рис. 6.14.
При восстановлении речи также отмечается отчетливое улучшение результатов (лучшая внятность и большее сжатие обучающих выборок).
Для примера приведем (см. [11]) результаты сравнения рассмотренных систем сжатия-восстановления на обучающих выборках логатом, структура которых наиболее показательна:
(см. скан)
Таблица показывает преимущество системы по второй схеме. Для выборки, кодировка которой первоначально требовала 64 бит, теперь можно обойтись только 23 или 24 битами. Таким образом, расход составляет 3/8 первоначального, т. е. на расход всего лишь