18.2. Визуализация данных

<< Предыдущий параграф

Следующий параграф >>

<< Предыдущий параграф

Следующий параграф >>

Пред.

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

128

129

130

131

132

133

134

135

136

137

138

139

140

141

142

143

144

145

146

147

148

149

150

151

152

153

154

155

156

157

158

159

160

161

162

163

164

165

166

167

168

169

170

171

172

173

174

175

176

177

178

179

180

181

182

183

184

185

186

187

188

189

190

191

192

193

194

195

196

197

198

199

200

201

202

203

204

205

206

207

208

209

210

211

212

213

214

215

216

217

218

219

220

221

222

223

224

225

226

227

228

229

230

231

232

233

234

235

236

237

238

239

240

241

242

243

244

245

246

247

248

249

250

251

252

253

254

255

256

257

258

259

260

261

262

263

264

265

266

267

268

269

270

271

272

273

274

275

276

277

278

279

280

281

282

283

284

285

286

287

288

289

290

291

292

293

294

295

296

297

298

299

300

301

302

303

304

305

306

307

308

309

310

311

312

313

314

315

316

317

318

319

320

321

322

323

324

325

326

327

328

329

330

331

332

333

334

335

336

337

338

339

340

341

342

343

344

345

346

347

348

349

350

351

352

353

354

355

356

357

358

359

360

361

362

363

364

365

366

367

368

369

370

371

372

373

374

375

376

377

378

379

380

381

382

383

384

385

386

387

388

389

390

391

392

393

394

395

396

397

398

399

400

401

402

403

404

405

406

407

408

409

410

411

412

413

414

415

416

417

418

419

420

421

422

423

424

425

426

427

428

429

430

431

432

433

434

435

436

437

438

439

440

441

442

443

444

445

446

447

448

449

450

451

452

453

454

455

456

457

458

459

460

461

462

463

464

465

466

467

468

469

470

471

472

473

474

475

476

477

478

479

480

481

482

483

484

485

486

487

488

489

490

491

492

493

494

495

496

497

498

499

500

501

502

503

504

505

506

507

508

509

510

511

512

513

514

515

516

517

518

519

520

521

522

523

524

525

526

527

528

529

530

531

532

533

534

535

536

537

538

539

540

541

542

543

544

545

546

547

548

549

550

551

552

553

554

555

556

557

558

559

560

561

562

563

564

565

566

567

568

569

570

571

572

573

574

575

576

577

578

579

580

581

582

След.

Вернуться к книге

Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ

ZADANIA.TO

18.2. Визуализация данных

18.2.1. Роль визуализации в разведочном анализе данных.

Как выше указывалось, основное назначение РАД — дать компактное и понятное для исследователя описание структуры данных или структуры зависимости переменных. Визуализация данных, которая предполагает получение тем или иным способом их графического отображения, так что исследователь может просто путем непосредственного визуального анализа этого изображения определить, имеет ли место одна из моделей структуры данных (а, б, в, г), является, по-видимому, наиболее наглядным способом описания.

Графическое отображение (гистограммы, диаграммы рассеивания) может быть получено непосредственно в пространстве исходных переменных. Однако «информативное» графическое отображение многомерных данных получается с помощью методов РАД, нацеленных на выявление перечисленных структур данных и зависимостей (например, главных компонент, анализа соответствий, целенаправленного проецирования и т.д.). В результате применения этих методов получаются образы объектов, переменных и (для неколичественных переменных методом соответствий анализа) категория в виде точек обычно размерности 1-3. Выходная размерность данных может быть и больше 3, но для графического отображения все равно берутся какие-либо одна, две или три их координаты, обычно при этом первые координаты более информативны и используются для визуального анализа в первую очередь. Быстро возрастающая роль визуального анализа многомерных данных стимулирована широким распространением и доступностью технических (вычислительных) средств, обеспечивающих построение визуальных образов.

В 60-е и 70-е годы основным и наиболее широко использовавшимся техническим средством для представления графических форм, возникающих в статистическом анализе, служило алфавитно-цифровое печатающее устройство (АЦПУ). Существенно менее доступными были графопостроители и графические дисплеи. Тем не менее некоторые динамические формы визуального анализа были разработаны уже в начале 70-х годов именно с целью использования возможностей графического дисплея, обслуживаемого достаточно мощной ЭВМ. В качестве такого примера можно привести систему PRIME [230].

Современная графика для статистического анализа обладает всеми свойствами и преимуществами компьютерной графики — построение, обработка и модификация графических форм возможна в интерактивном режиме и за короткое время.

18.2.2. Диаграммы рассеивания.

Рассмотрим вопросы визуализации многомерных данных, связанные с использованием диаграмм рассеивания (ДР), которые являются широко распространенной, простой и эффективной формой визуального представления данных. Некоторые другие формы визуального представления данных (гистограммы, графики оценок плотности и др.) рассмотрены в [223, 11, гл. 10]. В гл. 8 книги приведены формы визуализации структур, возникающих в иерархических процедурах кластер-анализа.

ДР многомерных данных является визуальной формой представления результатов некоторого отображения исходной матрицы данных в двумерное евклидово пространство. Роль исходной матрицы данных может играть матрица «объект — свойство» или матрица близостей (отношений «объект—объект», «переменная—переменная»). В качестве отображенных на ДР единиц могут выступать объекты, переменные, категории переменных (если переменные неколичественные). Далее они будут называться отображенными единицами (ОЕ). Графические же элементы, с помощью которых ОЕ изображаются на ДР, будут называться выразительными элементами (ВЭ). В табл. 18.1 приведены основные методы анализа, порождающие информативные ДР.

Рассмотрим теперь некоторые способы, позволяющие улучшить способность ДР к отображению структурных данных.

Маркирование ОЕ. Маркирование достигается, в зависимости от технических возможностей средств графического отображения, путем вариации окраски, формы и величины ВЭ, используемых для представления на ДР отображаемых единиц — объектов, переменных, категорий.

Таблица 18.1

(см. скан)

Так, обыденной практикой в дискриминантном и кластерном анализе является выделение на ДР, путем маркирования объектов, принадлежащих к разным группам, категорий, принадлежащих к разным переменным в множественном анализе соответствий.

Другой пример — маркирование объектов, подозрительных на аномальность, на ДР, используемой в целенаправленном проецировании для выделения аномальных наблюдений (см. пример 19.3).

Маркирование может быть использовано и с целью отображения на двумерной ДР информации о некотором дополнительном третьем измерении (например, о третьей главной компоненте на ДР, соответствующей двум первым ГК). Для этого, например, объекты изображаются точками, а из этих точек восстанавливается отрезок, параллельный оси Оу (вертикальной оси). Длина этого отрезка пропорциональна значению третьей координаты, а ее направление вверх или вниз соответствует знаку этой координаты. Если количество ОЕ невелико, то можно маркировать и четвертое измерение с помощью, например, горизонтальных отрезков. Другой возможностью на цветном графическом дисплее является использование окраски и ее интенсивности. Например, красная, оранжевая и желтая окраска для положительных значений третьей координаты (диапазон значений разбивается на три градации — большие, средние, малые) и синий, циан, белый — для отрицательных значений (с аналогичным разбиением диапазона отрицательных значений на три градации). Разумеется, такие ДР могут лишь частично передать информацию о взаимном расположении точек в пространстве более чем двух измерений, и Дж. Тьюки предлагает называть эти ДР -мерными [323].

Изменение масштаба. Меняя масштабы ДР по вертикали и горизонтали, тем самым изменяем метрику двумерного изображения — визуально наблюдаемые расстояния и взаимное расположение точек (изменение масштаба соответствует некоторому линейному преобразованию ОЕ в двумерном пространстве). Тем самым можно добиться более выраженного визуального представления тех или иных структур на ДР.

Один из простых технических приемов изменения масштабов состоит в следующем. Обычно при построении ДР задаются ее размеры — количество строк (линий) по оси и интервалов по оси

Размах значений ОЕ по оси делится на число строк, а размах значений по оси - на число интервалов. Полученные частные и являются масштабами измерений. Меняя задаваемое на ДР число строк и интервалов, можно добиться таким образом и изменения масштабов.

Рис. 18.1. Проекция точек, концентрирующихся вокруг параболической кривой

На рис. 18.1, а представлено облако точек, которые концентрируются вокруг некоторой кривой. Сжатие по оси делает эту структуру более выраженной, что и демонстрирует рис. 18.1, б.

При построении ДР часто используются и нелинейные преобразования координат ОЕ, например логарифмический масштаб и т. д., что в ряде случаев позволяет выявить дополнительные структурные особенности в данных.

18.2.3. Динамические формы диаграмм рассеивания

Многооконные ДР. Новые возможности для визуального анализа представляет одновременное изучение нескольких ДР для одного и того же множества ОЕ.

На экране дисплея создается несколько окон, в каждом из которых высвечивается своя ДР. При этом отображения исходной матрицы данных могут быть получены как в рамках применения одного какого-либо статистического метода (например, главных компонент), так и при применении нескольких методов (например, целенаправленное проецирование для выделения кластерной структуры (см. § 19.4) и главных компонент (см. гл. 13)). Конечно, рассмотрение изображений на нескольких ДР полезно и в статическом режиме. Однако введение динамических элементов позволяет использовать качественно новые возможности [183, 315].

Простым, но эффективным приемом является использование подвижного окна, положение и размеры которого управляются пользователем. Окно движется по одной из ДР и ОЕ, попавшие внутрь этого окна, маркируются одновременно на всех ДР. Для каких целей может быть использовано подвижное окно? Приведем только некоторые возможные применения.

Одно из возможных использований — проверка предположения о том, что выделяемое сгущение ОЕ на какой-либо ДР действительно представляет собой кластер в исходном многомерном пространстве, а не является просто свойством данной проекции. Для этого подвижное окно накладывают на сгущение и наблюдают, как расположены те же самые точки на других ДР. Если на какой-либо ДР ВЭ, соответствующие выделенным с помощью подвижного окна ОЕ, разбросаны равномерно по всему экрану, то, значит, сгущение не является кластером. Если же на всех экранах выделенная совокупность ОЕ распределена компактно, уверенность в том, что полученное образование действительно некоторый кластер, возрастает. Конечно, ДР нужно выбирать так, чтобы расстояния между ОЕ на них были бы величины одного порядка.

Другое возможное использование состоит в изучении условных распределений. Действительно, фиксация точек внутри подвижного окна на какой-либо из ДР соответствует тому, что рассматриваем на других ДР распределение ОЕ, удовлетворяющих условиям , где — границы окна; х, у — координаты точек на ДР с подвижным окном. На рис. 18.2 показана ситуация, когда точки, достаточно равномерно распределенные внутри подвижного окна на левой ДР (рис. 18.2, а), концентрируются вокруг некоторой кривой линии на другой ДР (рис. 18.2, б).

Наконец, наиболее обыденный путь использования подвижного окна состоит в использовании его для идентификации ОЕ.

Для этой же дели может служить и подвижный маркер в виде креста, стрелки и т. д.

Вращение. Другим приемом, позволяющим изучать ДР в динамике, является получение последовательности ДР, полученных путем вращения трехмерного облака ОЕ вокруг некоторой оси, и изучения его двумерных проекций в фиксированном направлении.

Рис. 18.2. Две проекции одного и того же множества объектов: а) пунктиром дано положение подвижного окна, крестами выделены точки, попавшие внутрь подвижного окиа; б) положение тех же точек на другой проекции

Таким образом, можно выбрать наиболее интересные двумерные проекции трехмерных точек. Итак, пусть имеем некоторое отображение наших ОЕ в трехмерное пространство (например, пространство трех первых главных компонент или трех направлений целенаправленного проецирования по какому-либо из критериев и т. д.). Расположим оси на экране дисплея, а ось — перпендикулярно к нему. Начнем теперь вращать пространство вокруг оси или а направление проекции пусть остается ортогональным экрану. Выберем для определенности ось Координаты ОЕ вдоль этой оси не меняются, а вертикальные координаты получаются из следующих уравнений:

или

Если координаты у и z были нормированы, то новая координата у также нормирована (имеет единственную дисперсию).

Обычно значение t берется с малым шагом и, если ЭВМ позволяет пересчитывать и подавать на экран дисплея ДР достаточно быстро, возникает плавная картина модификации изображения, своего рода фильм.

Вращение, задаваемое уравнением (18.1), отличается от задаваемого (18.2). Чтобы увидеть это, продифференцируем их по t. Имеем

Скорость изменения положения точек по вертикали для вращения (18.2) не зависит от t. В то же время для вращения (18.1) скорость изменяется с изменением угла вращения и в начале вращения скорость зависит только от неотображаемой визуально координаты (это явление называется параллакс-эффектом [183]).

18.2.4. Обработка диаграмм рассеивания с помощью статистических методов.

Рассмотренные ранее приемы манипуляции ДР, хотя и оказываются эффективными на практике, носят тем не менее технический характер. Способы обработки ДР, приведенные в настоящем параграфе, основаны на статистических идеях, и их целью является повышение «контрастности» структур, представленных на ДР, что позволяет легче обнаружить их визуально.

Рассматриваемый ниже подход основан на выделении -ближайших соседей (см. гл. 7) для каждой ОЕ на ДР. При этом -ближайших соседей выделяются либо в двумерном пространстве, соответствующем ДР, либо в исходном -мерном пространстве. В качестве метрик может использоваться практически любая метрика, перечисленная в гл. 6, 11. Таким образом, данная процедура управляется тремя факторами: числом соседей; типом метрики; пространством переменных.

После выделения -ближайших соседей получаем для каждой точки радиус минимальной сферы, в которую попали соответствующие -соседей. Радиус такой сферы является монотонно убывающей функцией от оценки плотности распределения в данной точке по методу -ближайших соседей. Теперь можно поступить по крайней мере двумя способами: 1) удалить заданный процент (5, 10, 20 %) точек с минимальной локальной плотностью; 2) позволить точкам двигаться в направлении градиента оценки плотности (подробнее см. [233]).

Если на ДР есть какая-либо структура (например, кластерная), то обычно в результате одной из этих процедур она становится более выраженной визуально (см. [323]).

<< Предыдущий параграф

Следующий параграф >>

Оглавление

ПРЕДИСЛОВИЕ
ВВЕДЕНИЕ. КЛАССИФИКАЦИЯ И СНИЖЕНИЕ РАЗМЕРНОСТИ. СУЩНОСТЬ И ТИПОЛОГИЗАЦИЯ ЗАДАЧ, ОБЛАСТИ ПРИМЕНЕНИЯ
B.1. Сущность задач классификации и снижения размерности и некоторые базовые идеи аппарата многомерного статистического анализа
В.2. Типовые задачи практики и конечные прикладные цели исследований, использующих методы классификации и снижения размерности
В.3. Типологизация математических постановок задач классификации и снижения размерности
В.4. Основные этапы в решении задач классификации и снижения размерности
ВЫВОДЫ
Раздел I. ОТНЕСЕНИЕ К ОДНОМУ ИЗ НЕСКОЛЬКИХ КЛАССОВ, ЗАДАННЫХ ПРЕДПОЛОЖЕНИЯМИ И ОБУЧАЮЩИМИ ВЫБОРКАМИ
1.1.1. Критерий отношения правдоподобия как правило классификации.
1.1.2. Основные математические модели.
1.1.3. Классификация посредством задания границы критической области.
1.1.4. Функция потерь.
1.1.5. Другие многомерные распределения.
1.2. Характеристики качества классификации
1.2.2. Изменение порога критерия.
1.2.3. Условная вероятность быть случаем.
1.2.4. Аналитические меры разделимости распределений.
1.3. Два класса, заданные генеральными совокупностями
1.3.2. Древообразные классификаторы.
1.3.3. Метод потенциальных функций.
1.3.4. Поиск характерных закономерностей.
1.3.5. Коллективы решающих правил.
1.4. Отбор информативных переменных
1.4.2. Функции потерь.
1.4.3. Схемы последовательного испытания наборов признаков.
1.5. Три и более полностью определенных класса
1.5.2. Модель нескольких многомерных нормальных распределений с общей ковариационной матрицей.
1.5.3. Упорядоченные классы.
ВЫВОДЫ
Глава 2. ТЕОРЕТИЧЕСКИЕ РЕЗУЛЬТАТЫ КЛАССИФИКАЦИИ ПРИ НАЛИЧИИ ОБУЧАЮЩИХ ВЫБОРОК (ДИСКРИМИНАНТНЫЙ АНАЛИЗ)
2.1. Базовые понятия дискриминантного анализа
2.1.2. Основные виды ошибок.
2.1.3. Функции потерь.
2.2. Методы изучения алгоритмов ДА
2.2.2. Инвариантность и подобие алгоритмов.
2.2.3. Методы выработки рекомендаций.
2.3. Подстановочные алгоритмы в асимптотике растущей размерности
2.4. Статистическая регуляризация оценки обратной ковариационной матрицы в линейной дискриминантной функции для модели Фишера
2.5. Отбор переменных
2.6. Метод структурной минимизации риска
ВЫВОДЫ
Глава 3. ПРАКТИЧЕСКИЕ РЕКОМЕНДАЦИИ ПО КЛАССИФИКАЦИИ ПРИ НАЛИЧИИ ОБУЧАЮЩИХ ВЫБОРОК (ДИСКРИМИНАНТНЫЙ АНАЛИЗ)
3.1. Предварительный анализ данных
3.2. Оценивание отношения правдоподобия
3.3. Сводка рекомендаций по линейному дискриминантному анализу
3.4. Оценка качества дискриминации
3.5. Рекомендации для k >= 3 классов
ВЫВОДЫ
Глава 4. ПРИМЕНЕНИЯ ДИСКРИМИНАНТНОГО АНАЛИЗА
4.1. Группы риска и сравнительные испытания
4.2. Методы описания риска развития события
4.3. Другие применения ДА
ВЫВОДЫ
Раздел II. КЛАССИФИКАЦИЯ БЕЗ ОБУЧЕНИЯ: МЕТОДЫ АВТОМАТИЧЕСКОЙ КЛАССИФИКАЦИИ (КЛАСТЕР-АНАЛИЗА) И РАСЩЕПЛЕНИЕ СМЕСЕЙ РАСПРЕДЕЛЕНИЙ
Глава 5. ОСНОВНЫЕ ПОНЯТИЯ И ОПРЕДЕЛЕНИЯ, ИСПОЛЬЗУЕМЫЕ В МЕТОДАХ КЛАССИФИКАЦИИ БЕЗ ОБУЧЕНИЯ
5.2. Расстояния между отдельными объектами и меры близости объектов друг к другу
5.3. Расстояние между классами и мера близости классов
5.4. Функционалы качества разбиения на классы и экстремальная постановка задачи кластер-анализа. Связь с теорией статистического оценивания параметров
ВЫВОДЫ
Глава 6. КЛАССИФИКАЦИЯ БЕЗ ОБУЧЕНИЯ (ПАРАМЕТРИЧЕСКИЙ СЛУЧАЙ). РАСЩЕПЛЕНИЕ СМЕСЕЙ ВЕРОЯТНОСТНЫХ РАСПРЕДЕЛЕНИИ
6.1. Понятие смеси вероятностных распределений
6.2. Общая схема решения задачи автоматической классификации в рамках модели смеси распределений (сведение к схеме дискриминантного анализа)
6.3. Идентифицируемость (различимость) смесей распределений
6.4. Процедуры оценивания параметров модели смеси распределений
6.4.2. Процедуры, базирующиеся на методе моментов.
6.4.3. Другие методы оценивания параметров смеси распределений.
6.5. Рекомендации по определению «исходных позиций» алгоритмов расщепления смесей распределений
ВЫВОДЫ
Глава 7. АВТОМАТИЧЕСКАЯ КЛАССИФИКАЦИЯ, ОСНОВАННАЯ НА ОПИСАНИИ КЛАССОВ «ЯДРАМИ»
7.1. Эвристические алгоритмы
7.2. Алгоритмы, использующие понятие центра тяжести
7.2.2. Последовательные процедуры.
7.3. Алгоритмы с управляющими параметрами, настраиваемыми в ходе классификации
7.4. Алгоритмы метода динамических сгущений
7.4.3. Автоматическая классификация неполных данных.
7.5. Алгоритмы метода размытых множеств
7.5.2. Алгоритмы нечеткой классификации.
7.6. Алгоритмы, основанные на методе просеивания (решета)
ВЫВОДЫ
Глава 8. ИЕРАРХИЧЕСКАЯ КЛАССИФИКАЦИЯ
8.2. Методы и алгоритмы иерархической классификации
8.3. Графические представления результатов иерархической классификации
8.4. Приложения общей рекуррентной формулы для мер близости между классами
8.5. Быстрый алгоритм иерархической классификации
ВЫВОДЫ
Глава 9. ПРОЦЕДУРЫ КЛАСТЕР-АНАЛИЗА И РАЗДЕЛЕНИЯ СМЕСЕЙ ПРИ НАЛИЧИИ АПРИОРНЫХ ОГРАНИЧЕНИИ
9.1. Разделение смесей при наличии неполных обучающих выборок
9.2. Классификация при ограничениях на связи между объектами
9.3. Классификация на графах
ВЫВОДЫ
Глава 10. ТЕОРИЯ АВТОМАТИЧЕСКОЙ КЛАССИФИКАЦИИ
10.1. Математическая модель алгоритма автоматической классификации (ААК)
10.2. Базисная модель алгоритма АК, основанного на описании классов ядрами
10.3. Иерархическая структура многообразия алгоритмов АК
10.4. Исследование сходимости алгоритмов АК
ВЫВОДЫ
Глава 11. ВЫБОР МЕТРИКИ И СОКРАЩЕНИЕ РАЗМЕРНОСТЕЙ В ЗАДАЧАХ КЛАСТЕР-АНАЛИЗА
11.2. Метрики для задач кластер-анализа с неколичественными переменными
11.3. Алгоритмы классификации с адаптивной метрикой
11.4. Оценка метрики с помощью частично обучающих выборок
ВЫВОДЫ
Глава 12. СРЕДСТВА ПРЕДСТАВЛЕНИЯ И ИНТЕРПРЕТАЦИИ РЕЗУЛЬТАТОВ АВТОМАТИЧЕСКОЙ КЛАССИФИКАЦИИ
12.1. Некоторые средства оценки результатов кластер-анализа
12.2. Связь между показателями качества прогноза переменных, метрикой и некоторыми критериями качества классификации в кластер-анализе
12.3. Некоторые методические рекомендации
12.4. Средства, помогающие интерпретации результатов
ВЫВОДЫ
Раздел III. СНИЖЕНИЕ РАЗМЕРНОСТИ АНАЛИЗИРУЕМОГО ПРИЗНАКОВОГО ПРОСТРАНСТВА И ОТБОР НАИБОЛЕЕ ИНФОРМАТИВНЫХ ПОКАЗАТЕЛЕЙ
13.1. Сущность проблемы снижения размерности и различные методы ее решения
13.2. Определение, вычисление и основные числовые характеристики главных компонент
13.3. Экстремальные свойства главных компонент. Их интерпретация
13.4. Статистические свойства выборочных главных компонент; статистическая проверка некоторых гипотез
13.5. Главные компоненты в задачах классификации
13.6. Нелинейное отображение многомерных данных в пространство низкой размерности
ВЫВОДЫ
Глава 14. МОДЕЛИ И МЕТОДЫ ФАКТОРНОГО АНАЛИЗА
14.1. Сущность модели факторного анализа, его основные задачи
14.2. Каноническая модель факторного анализа
14.2.2. Вопросы идентификации модели факторного анализа.
14.2.3. Определение структуры и статистическое исследование модели факторного анализа.
14.2.4. Факторный анализ в задачах классификации.
14.3. Некоторые эвристические методы снижения размерности
14.3.2. Метод экстремальной группировки признаков.
14.3.3. Метод корреляционных плеяд.
14.3.4. Снижение размерности с помощью кластер-процедур.
ВЫВОДЫ
Глава 15. ЭКСПЕРТНО-СТАТИСТИЧЕСКИЙ МЕТОД ПОСТРОЕНИЯ ЕДИНОГО СВОДНОГО ПОКАЗАТЕЛЯ ЭФФЕКТИВНОСТИ ФУНКЦИОНИРОВАНИЯ (КАЧЕСТВА) ОБЪЕКТА (СКАЛЯРНАЯ РЕДУКЦИЯ МНОГОКРИТЕРИАЛЬНОЙ СХЕМЫ)
15.1. Латентный единый (сводный) показатель «качества». Понятия «выходного качества» целевой функции и «входных переменных» (частных критериев)
15.2. Исходные данные
15.3. Алгоритмические и вычислительные вопросы построения неизвестной целевой функции
15.3.2. Оценивание неизвестных параметров целевой функции при балльных экспертных оценках выходного качества.
15.3.3. Оценивание неизвестных параметров целевой функции при экспертных ранжировках и парных сравнениях объектов.
15.4. Применение экспертно-статистического метода построения латентного интегрального показателя к решению практических задач
ВЫВОДЫ
Глава 16. МНОГОМЕРНОЕ ШКАЛИРОВАНИЕ
16.1. Метрическое многомерное шкалирование
16.2. Неметрическое многомерное шкалирование [307, 261, 260, 152]
16.3. Шкалирование индивидуальных различий (ШИР)
ВЫВОДЫ
Глава 17. СРЕДСТВА АНАЛИЗА И ВИЗУАЛИЗАЦИИ НЕКОЛИЧЕСТВЕННЫХ ДАННЫХ
17.1. Анализ соответствий для двухвходовых таблиц сопряженностей
17.1.2. Проекции строк и столбцов. Связь с анализом главных компонент.
17.1.3. Интерпретация главных компонент в анализе соответствий.
17.1.4. Присвоение числовых меток строкам и столбцам.
17.2. Множественный анализ соответствий (МАС)
17.3. Алгоритмы оцифровки неколичественных переменных
ВЫВОДЫ
Раздел IV. РАЗВЕДОЧНЫЙ СТАТИСТИЧЕСКИЙ АНАЛИЗ И НАГЛЯДНОЕ ПРЕДСТАВЛЕНИЕ ДАННЫХ
Глава 18. РАЗВЕДОЧНЫЙ АНАЛИЗ. ЦЕЛИ, МОДЕЛИ СТРУКТУР ДАННЫХ, МЕТОДЫ И ПРИЕМЫ АНАЛИЗА
18.1. Цели разведочного анализа и модели описания структуры многомерных данных
18.2. Визуализация данных
18.3. Преобразования данных в разведочном анализе данных
18.4. Использование дополнительных (иллюстративных) переменных и объектов
18.5. Основные типы данных и методы, используемые в разведочном анализе данных
ВЫВОДЫ
Глава 19. ЦЕЛЕНАПРАВЛЕННОЕ ПРОЕЦИРОВАНИЕ МНОГОМЕРНЫХ ДАННЫХ
19.1. Цель и основные понятия целенаправленного проецирования
19.2. Проекционные индексы, подходящие для выделения кластеров
19.3. Выявление эллипсоидальной кластерной структуры (восстановление дискриминантного подпространства)
19.4. Проекционные индексы для дискриминантного анализа
19.5. Выделение аномальных наблюдений
19.6. Выделение нелинейных структур в многомерных данных
19.7. Регрессия на основе целенаправленного проецирования
19.8. Восстановление плотности и связь с томографией
19.8.2. Вычислительная томография и прикладная статистика.
19.8.3. Алгоритм восстановления плотности по ее проекциям на основе принципа минимальной вариабельности.
19.8.4. Алгоритм восстановления плотности по ее проекциям на основе принципа максимума энтропии.
19.9. Некоторые вопросы вычислительной реализации и практические приемы целенаправленного проецирования
ВЫВОДЫ
Глава 20. ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ЦЕЛЕНАПРАВЛЕННОГО ПРОЕЦИРОВАНИЯ И ТОМОГРАФИЧЕСКИХ МЕТОДОВ АНАЛИЗА ДАННЫХ
20.1. Проекции многомерных распределений и их свойства
20.2. Радиальные распределения
20.3. Теория процедур оптимизации проекционных индексов
ВЫВОДЫ
Глава 21. ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ДЛЯ ЗАДАЧ СОКРАЩЕНИЯ РАЗМЕРНОСТИ И КЛАССИФИКАЦИИ
21.1. Программное обеспечение прикладного статистического анализа для ПЭВМ
21.2. Проблемы и опыт создания интеллектуализированного программного обеспечения по многомерному статистическому анализу
ВЫВОДЫ
СПИСОК ЛИТЕРАТУРЫ