2.2. Математическое представление
2.2.1. Представление изображения в ортогональном базисе
Различные аспекты цифровой обработки изображений нельзя рассматривать в отрыве от цифрового запоминания двумерных массивов чисел, представляющих отдельные значения яркости, полученные из исходной фотографии или сцены либо определенные с помощью телевизионной передающей трубки. Однако дикретизированное и квантованное изображение представляет собой просто матрицу положительных чисел (возможно, довольно большого размера), над которой в ЦВМ могут производиться линейные и нелинейные операции широкого класса. Поэтому цифровая обработка изображений может быть сведена к
анализу манипуляций с большими матрицами, связанных с выполнением таких операций обработки, как преобразование, разложение, представление и реставрация. В данном разделе некоторые из таких операций исследуются с использованием аппарата матричной алгебры и, в частности, векторных внешних произведений.
Условимся рассматривать матрицу
как дискретизированное и квантованное изображение; при этом
строка и
столбец матрицы соответствуют пространственным координатам х и у изображения
Таким образом, можно записать
где нелинейный оператор
выражает действие дискретизатора и квантователя. Примем, что
имеет размер
Методы, пригодные для изображений, выражаемых неквадратными матрицами, рассматриваются в значительной части литературы; однако мы здесь воздержимся от их обсуждения, поскольку это не может существенно повлиять на излагаемые принципы. Обобщенное линейное разделимое преобразование матрицы изображения
может быть записано в виде
где
изображение, подвергнутое унитарному преобразованию,
и
унитарные операторы, а индекс
обозначает транспонирование матрицы. Унитарность
и
означает, что
Отсюда следует, что преобразование, обратное (2.9), можно записать в виде
Если раскрыть обозначения
записав
где
векторы, образованные из столбцов
и
то получим
Если матрицу а записать в виде суммы
то отсюда следует, что
Внешнее произведение можно интерпретировать как «изображение», так что сумма по всем комбинациям внешних произведений с соответствующими весами
восстанавливает исходное изображение
Для некоторых видов преобразований такой подход позволяет дать исключительно удобную интерпретацию аппроксимаций с сохранением выбранных коэффициентов.
В качестве графической иллюстрации этого процесса рассмотрим пример на фиг. 2.2, а. Здесь изображение
разлагается в сумму
матриц ранга 1 с соответствующими коэффициентами
Матрицы ранга 1 представляют двумерные базисные изображения, примерами которых служат тригонометрические функции для разложения по Фурье и бинарные функции для разложения по Уолшу.
Выбор преобразований, выражаемых матрицами
и
вполне произволен. Эти матрицы могут выбираться как из одних и тех же, так и из различных базисных функций. Так, например, матрица
может быть составлена из функций Уолша,
из функций Фурье, т. е. синусов и косинусов. В этом частном случае столбцы матрицы изображения разлагаются в ряд по функциям Уолша (прямоугольным функциям), а строки — в ряд по комплексным экспонентам (синусам и косинусам).
Хотя это и не следует явно из (2.16), при соблюдении определенных условий это выражение можно интерпретировать как разложение по сингулярным значениям (РСЗ), а в данном случае — как разложение изображения по его сингулярным векторам [1, 2]. Если
диагональная матрица ранга
(т. е. если в
имеется лишь
положительных диагональных элементов)
то
Из (2.17) с очевидностью следует, что уменьшение
влечет за собой сокращение числа степеней свободы, определяющих изображение
Располагая собственные значения в порядке монотонного убывания, мы получаем наиболее эффективное среднеквадратичное представление изображения с помощью наименьших (усеченных) множеств сохраняемых составляющих
Этот факт используется в следующем разделе. Кроме того, метод РСЗ обеспечивает удобный переход к псевдоинверсии матриц, что имеет важное значение для обсуждаемой ниже реставрации изображений в случае разделимой пространственно-зависимой функции рассеяния точки.
Резюмируя, заметим, что РСЗ состоит просто в определении сингулярных (или собственных) векторов для
Затем полученные сингулярные векторы и значения могут быть использованы для эффективного (в среднеквадратичном смысле) представления изображения
Тот, кто знаком с методом разложения на главные компоненты, может отождествить матрицы
с выборочными строчными и столбцовыми ковариационными матрицами; при этом РСЗ подобных статистически определенных процессов переходит в разложение изображения по собственным изображениям. Однако читателю следует воздержаться от вывода, что метод РСЗ совпадает с разложением Карунена — Лоэва. В действительности эти разложения не одинаковы, и их различия обсуждаются в последующих разделах.
Обращаясь вновь к фиг.
мы видим, что РСЗ изображения
содержит лишь
членов с весовыми коэффициентами, которые выражаются корнями из соответствующих сингулярных значений. Входящие в это разложение матрицы ранга 1 также представляют собой ортогональные базисные изображения, но «настроенные» непосредственно на данное конкретное изображение, благодаря чему они обеспечивают единственное разложение по оптимальному базису.