ТЕОРЕТИЧЕСКИЕ ПРЕДПОСЫЛКИ РЕШЕНИЯ ЗАДАЧ ОБРАБОТКИ ГРАФИЧЕСКИХ ЦИФРОВЫХ ИЗОБРАЖЕНИЙ, ПРЕДСТАВЛЯЕМЫХ СКАЛЯРНЫМИ ПОЛЯМИ
М.В. Буйневич, доктор технических наук, профессор; М.Д. Маслаков, доктор технических наук, профессор, Санкт-Петербургский университет ГПС МЧС России. Ю.Ф. Болтов, кандидат технических наук, доцент.
Санкт-Петербургский государственный университет телекоммуникаций имени проф. М.А. Бонч-Бруевича
Доказывается целесообразность представления цифровых изображений в виде скалярных полей. Исследуется поведение функции Грина в двухмерном пространстве. Обосновывается возможность построения поля «особых точек» на основе Лапласиана. Показывается возможность построения поля диполей на основе уравнений Гельмгольца и построения поля «особых точек» на основе векторного уравнения Ламе.
Ключевые слова: цифровое изображение, скалярное поле, функция Грина, Лапласиан, уравнения Гельмгольца, векторное уравнение Ламе
THEORETICAL BACKGROUND OF THE SOLUTIONS OF TASKS OF DIGITAL PROCESSING OF GRAPHIC IMAGES REPRESENTED BY SCALAR FIELDS
M.V. Buinevich; M.D. Маslakov.
Saint-Petersburg university of State fire service of EMERCON of Russia.
Yu.F. Boltov. Bonch-Bruevich Saint-Petersburg state University of Telecommunications
The reasonability of representation of digital images in the form of scalar fields is proved. The behavior of the Green's function in a two-dimensional space is researched. The possibility of construction of a field of «singular points» on the basis of the Laplacian is proved. The possibility of construction of a field of dipoles on the basis of the Helmholtz equations and construction of a field of «singular points» on the basis of a vector of the Lame equation are shown.
Keywords: digital image, scalar field, the Green's function, the Laplacian, the Helmholtz equations, Lame vector equation
Введение
Традиционно для обработки цифровых графических изображений применяется либо растровая, либо векторная модель представления. Первая идеально подходит для обработки фотографических изображений (доминируют незначительные перепады градаций яркости), которые хорошо сжимаются популярным форматом JPEG. Вторая - для рисованных или начерченных изображений (доминируют контуры в виде резких перепадов яркости), которые хорошо математически описываются разнообразными геометрическими фигурами, что дает возможность адекватно представить и хранить подобные изображения. В случае если принципиально разные типы графической информации присутствуют на одном изображении, то «в идеале» требуется модель представления, которая позволила бы обрабатывать их по-разному: с учетом как «векторной природы», так и плавных
изменений градаций яркости. Теоретическим предпосылкам создания подобной модели в интересах эффективного решения задач обработки цифровых графических изображений посвящена настоящая статья.
Концепция представления графических изображений скалярными полями
При построении модели воспользуемся возможностями, заключенными в представлении графических изображений скалярными полями. Это позволит, в частности, разделить изображение на две части, представляющие собой его различные ипостаси. Одна будет состоять из значений резких перепадов цветности и их координат, на основе которых можно построить некоторое поле «особых точек»; вторая будет представлять собой разность исходного изображения и поля, построенного на множестве «особых точек».
В качестве механизма построения поля резких перепадов используем функцию Грина. Функция Грина - это поле единичного точечного источника в правой части некоторого уравнения математической физики [1]. Теперь поле любого источника можно получить, умножив функцию Грина на коэффициент, который стоит в правой части соответствующего уравнения.
В качестве источника рационально использовать диполь, который позволяет описать разрывы (резкие перепады цветности) поля. В общем случае уравнение математической физики связано с некоторой физической средой, и величина разрыва в точке источника типа диполя определяется не только коэффициентом перед функцией Дирака в правой части уравнения, но и реакцией среды. Однако для работы с изображениями вполне приемлемой и целесообразной является безразмерная форма описания, при которой разрыв в поле определяется только коэффициентом в правой части, но не параметрами среды.
Построение поля «особых точек» на основе Лапласиана
В качестве основы для построения поля «особых точек» можно выбрать практически любое уравнение математической физики. В первую очередь построим модель представления на основе Лапласиана. Этот выбор предопределён тем, что Лапласиан содержится в качестве составной части в большинстве других уравнений.
Лапласиан для точечного источника, амплитуда которого равна единице, имеет вид:
где и - градации цветности; х, у - текущие координаты; х0, уо - координаты точечного источника.
Индекс г принимает значения: 1, 2, 3, что соответствует трём цветовым плоскостям (красный, зелёный, синий); в этой модели каждая цветовая область обрабатывается независимо от других.
Решение уравнения gi (х, у, х0, у0) представляет собой функцию Грина и имеет вид:
Очевидно, что на бесконечности значение этой функции обращается в ноль. Пусть теперь требуется найти поле диполя, ориентированного вдоль оси х. Тогда следует изменить выражение (1) следующим образом:
,
где кх - проекция нормали к контуру на ось х.
Поле одиночного диполя, ориентированного вдоль оси х, несложно вычислить, используя линейность Лапласиана:
-х^у-Уо) = кхдх{х -х^у-7о) = (2)
Аналогично вычисляется поле диполя, ориентированного вдоль оси у:
ау{х -Хо,у- Уо) =
(3)
В силу той же линейности Лапласиана поле произвольно ориентированного в плоскости диполя О (х - хо, у - у0) будет представлять собой алгебраическую сумму правых частей выражений (2) и (3).
Неограниченное пространство в реальных изображениях сужается до его размеров, но даже в этом случае количество операций, необходимое для построения поля «особых точек», чрезвычайно велико; оценим его. Для определения вклада в поле одного диполя нужно просканировать все изображение. Количество операций пропорционально количеству «особых точек», умноженных на количество пикселей, содержащихся в этом изображении. Например, при размере изображения 512*512 и количестве «особых точек» порядка 5 % от общего количества пикселей затраты на построение поля «особых точек» сопоставимы с затратами, которые требуются для того, чтобы просканировать это изображение порядка 12 тыс. раз. Общее количество операций при этом достигает величины 236/20.
Для сокращения количества операций, производимых при построении поля «особых точек», обрабатывать изображение целесообразно «плавающим окном», в центре которого
располагается текущий диполь. Окончательно в векторной форме поле точечного диполя Сц произвольной ориентации записывается в виде:
г /V ~ „ _ 1 V*" Vм , (-1У%(У-;По) \
где хг0 = х0 + 21а; у0 = у0 + 2/а; ¡0 - единичный вектор вдоль оси х; у'о - единичный вектор вдоль оси>\
Суммарное поле «особых точек» записывается в виде:
ШЛ) = И, (МЛ - -V:1 У - У с'.ООсРх ОчОс) ~ к ^У СЧ • Ус)) ¿¿¿У, (5)
где Бх (х0, у0) и Бу (х0, у0) - распределение производных в «особых точках» соответственно по х и по у.
Как следует из выражения (4), при равенстве х = хг0 и при у = уг0 подынтегральное выражение в интеграле (5) стремится к бесконечности. Однако это обстоятельство на сходимость интеграла не влияет; техника взятия подобных интегралов в теории аналитических функций хорошо разработана [1].
Поле диполей в дискретном пространстве
Полученная выше, формула (5), в конечном счёте, позволяет рассчитать в заданном окне поле точечного источника, расположенного в центре окна. Однако воспользоваться
этой формулой при обработке изображений можно только переведя их в цифровой формат [2].
В качестве первого шага, связанного с переходом в дискретное пространство, следует интеграл (5) с учётом выражения (4) заменить рядом:
и fv тт\ _ ^Д'е.'Уа vwo у1'-*-
2лп »^О^-ж-п^+О-Уп)3 Г
(6)
где и LtU^ - перепады градаций цветности по х и по у в соответствующих «особых
точках» X.tl = Xq -Ь 2ta и уп = yQ -Ь 2jet:, Xq и yQ - координаты «особых точек».
В последнем выражении в качестве промежуточного преобразования применено скалярное произведение, в результате чего в отличие от (5) в нем пропала зависимость от единичных векторов i0 и j0.
Для вычисления ряда (6) теперь нельзя воспользоваться контурными интегралами. С другой стороны, если бы исходные интегралы не содержали особенностей, то при переходе в цифровой формат можно было ограничиться результатами, полученными на первом шаге. Однако в базовых интегралах содержатся полюса, соответствующие «особым точкам» (знаменатели в подынтегральной функции в источниках обращаются в нуль). Наличие же хотя бы в одном из членов ряда знаменателя, который равен нулю в «особой точке», приводит к расхождению ряда. Вообще говоря, значение поля, вычисляемое по интегралу, и значение поля, определяемое на основе суммы ряда, совпадает, если расстояние от «особых точек» до края окна превышает несколько пикселей. Поэтому, если бы дело шло только об определении поля, можно было бы отказаться от вычислений вблизи «особой точки», сделав эту зону «запрещённой». Однако отсутствие перепада градаций цветности в точке разрыва при вычитании из исходного изображения поля «особых точек» приводит к наличию такого же перепада в остаточном поле, что делает предложенную технологию разделения исходного изображения на две части бесполезной.
Подобная ситуация связана с конечными размерами дискретной «особой точки» в том плане, что реальный пиксель не является бесконечно малой величиной, с которой оперирует функция Дирака. Расхождения ряда можно избежать, если «спрятать» эту особенность в середину пикселя; в таком случае в выражении (6) хп и уп заменяются, соответственно,
на Xq = X.fi — Q.5 и Уо" = уп — 0.5. Такое выражение уже не содержит вычетов, и поэтому
данный ряд сходится. Очевидно, что при этой операции происходит выход за пределы дискретной топологии, характерной для представления изображений, и фактически используется модель скалярного поля. Однако этот шаг не решает все проблемы, возникающие при обработке «особых точек» на изображениях.
Очередной шаг, связанный с переводом обобщённых функций с локальными носителями из непрерывного пространства в дискретное пространство, требует следующих пояснений. Цель построения поля «особых точек» в дискретном пространстве - это выделение из изображения резких перепадов градаций цветности, и в непрерывном пространстве указанная цель эффективно достигается использованием функции Грина, которая непрерывна (вместе со всеми производными) во всем пространстве, кроме «особых точек». Говоря другими словами, если на нулевом фоне (общее решение Лапласиана равно нулю) существует область «особых точек», то, определив частное решение этого уравнения и вычтя его из исходного поля, в результате получим нулевой остаток. Приемлемое поле «особых точек» в дискретном пространстве должно себя вести аналогичным образом.
В модели на основе непрерывного пространства функция Дирака и её производные сосредоточены в одной точке; в точке скачка производной это обстоятельство способствует качественному отличию непрерывного пространства от дискретного формата. Снять это
различие для источников типа «диполь» позволяет введение поправок к дискретному полю, предназначение которых - скорректировать значение поля, создаваемой «особой точкой», «спрятанной» в центр пикселя. При этом введение поправок должно быть произведено в рамках модели скалярного поля, то есть, обладать следующими свойствами: поддерживать полюс первого порядка в середине пикселя, в котором размещена «особая точка»; в интервале от центра пикселя до границы иметь зависимость, качественно совпадающую с поведением поля точечного источника в непрерывном пространстве вблизи особенности; на расстоянии более двух пикселей практически не влиять на значение поля.
Поправки, которые удовлетворяют этим требованиям, могут быть заданы в следующем виде:
зе^^Л-1О1« &
где с - эмпирический коэффициент, который может быть определён экспериментальным путем.
С учетом результатов программного моделирования [3] суммарные поправки к координатам «особой точки» х^ и уд" можно записать в виде:
0.068
0.068
&хп=х?+ -——— — 0.5 ,Д7т = 7£н—
(7)
Поправки, определённые подобным образом, практически не влияют на значение поля при удалении от «особой точки» на два-три пикселя, но оказывают существенную коррекцию в её окрестностях.
Окончательная формула для построения поля «особых точек» с учётом всех определённых поправок теперь выглядит следующим образом:
II/ , ч _ 1 ^11» ТГ1К1
Выражение (8) является основой для вычисления скалярного поля «особых точек» и, следовательно, для получения остаточного поля. На рис. 1 представлен результат разделения начального изображения на поле «особых точек» и остаточное поле.
а) б) в)
Рис. 1. Результат перевода изображения в дискретное пространство на основе функции Грина: а) исходное изображение; б) поле «особых точек»; в) остаточное поле
Поле «особых точек» данного изображения вычисляется на основе совокупности перепадов в его «особых точках» и ), поэтому в поле «особых точек»
теоретически сохраняются все резкие перепады, имеющие место в исходном изображении. Изображение сканируется матрицей (скользящим окном) размером 2 Win* (2 Win-1). Здесь 2Win - размер матрицы вдоль оси диполя, а 2Win—1 - поперечные размеры матрицы. Вклад данного диполя в общее поле &U в окне определяется по формуле:
ЛГ/ = AU*Xxy + &U%Yxy,
где компоненты матрицы Xxy — соответствуют в дискретном пространстве полю диполя, ориентированного вдоль оси x; аналогично вдоль оси у.
Сумма вкладов в данную точку поля всех источников, для которых она находится в пределах их окон, образует значение поля источников в этой точке. То есть, вклад каждой «особой точки» в поле точек ограничивается заданным окном, в центр которого помещается данный источник. Зная количество источников, нетрудно оценить количество операций, необходимое для построения их поля. Пусть количество «особых точек» составляет n % от общего количество пикселей плоского изображения размером w*h. Тогда количество операций Nop приближённо может быть рассчитано по формуле:
Nop ~ w*h*n*(2* Win—1)*2* Win/100.
Если размеры изображения 512*512, n = 10 и Win = 32, то Nop ~ 230/10 ~ 108. На рис. 2 представлены результаты вычисления функции Грина, адаптированной к дискретному пространству.
Рис. 2. Результаты вычисления функции Грина для Win = 32
Видно, что эта функция представляет собой всплеск, то есть, фактически вейвлет нового типа. Этот вейвлет ориентирован перпендикулярно плоскости рисунка, что даёт возможность отобразить резкий перепад градации одной выборкой; для этого только следует обработать соответствующий пиксель как «особую точку».
Возможности построения поля диполей на основе уравнения Гельмгольца
Исследуем возможности применения для построения модели уравнения Гельмгольца как представителя иного вида линейных уравнений, учитывающих «волновую природу» поля. Волновое уравнение, представляющее собой частный случай уравнения Гельмгольца, имеет следующий вид [4]:
д2У __ д'2 Ц 1 д2У _ ^
где I - время; х, у - координаты в плоскости.
После стандартных преобразований и записи в правую часть уравнения точечного источника (особой точки), уравнение можно записать в виде:
0+0 + ^1/ = 6(х-х0)6(у-у0)
где хо иуо - координаты «особой точки»; к - волновое число.
Частное решение этого уравнения для диполя имеет вид:
д(х,У, = п/2 ■ У^ктХ (9)
где источник У\(кг) представляет собой функцию Неймана первого порядка («особую точку») и расположен в точке с координатами (о,о).
В силу симметрии (9) нулевые значения естественным образом будут образовывать круг, поэтому в отличие от Лапласиана, в котором окно обрабатывается по координатам х и у, в этом случае обработка будет осуществляться на основе одной переменной, которая изменяется в пределах от «особой точки» (источника) до первого нуля функции Неймана, что существенно уменьшит время на формирование окна. Однако круглые зоны имеют и недостатки - круглое окно хуже обрабатывает на краях изображения, представляющих собой прямые линии.
Поле «особых точек» на основе векторного уравнения Ламе
Продолжая «волновую тему», обратимся к наиболее общей форме представления физических явлений и процессов - векторному полю, частным случаем которого выступает скалярное поле. Для чего рассмотрим очередное уравнение математической физики -векторное уравнение Ламе [5], которое описывает распространение продольных и сдвиговых волн в упругой изотропной среде, и в двухмерном случае имеет следующий вид:
, (1о)
где // и Л - коэффициенты Ламе; р - плотность среды; и = у, £) - вектор смещения среды.
С применением уравнения Ламе для обработки изображений связаны два обстоятельства: во-первых, в теоретическом плане следует распространить теорему разложения Гельмгольца на поле продольных волн и поле сдвиговых волн при наличии
в области существования «особых точек»; во-вторых, размер окна должен быть увеличен до размеров всего изображения.
Представим уравнение (10) в виде суммы полей, для чего введём в его правую часть два элементарных источника типа диполя, соответственно ориентированных вдоль оси х и вдоль оси у. Расщепим элементарный источник общего вида на два точечных источника: пусть один возбуждает продольные волны, а другой - сдвиговые. В этом случае частное решение уравнения Ламе можно будет представить в виде суммы продольных и сдвиговых волн, независимо распространяющихся в неограниченном пространстве. Спроектируем уравнение на координатные оси; добавим и отнимем соответствующие одинаковые члены и перегруппируем правые части. Возьмем ротор от правых и левых частей; получим уравнение, в левой части которого заведомо отсутствуют члены, связанные с безвихревым полем.
После несложных преобразований получим решение исходного уравнения (10) в виде суммы двух векторных решений. Поле двух диполей можно представить теперь в виде:
СГу<ЛЛ = - - Уо) + С?/СЛЛ)> (П)
а'н^г)
£ дхду2 дхду2
4тс
дх2ду
(12)
где А, = {Ах и Ау} - коэффициенты, пропорциональные перепадам градаций цветности соответственно по х и у; И^ (Ат) - функция Ханкеля первого рода нулевого порядка
(является функцией Грина для уравнения Гельмгольца, поэтому её подстановка в (12) обращает это соотношение в ноль во всей плоскости, кроме «особой точки», что позволяет упростить выражения для диагональных компонент матрицы (зг^у0) .
Выражения (11) и (12) представляют собой математическую модель представления на основе векторного уравнения Ламе.
Увеличение окна до размеров изображения приводит к существенному увеличению времени обработки графической информации, что усложняет последующее использование этого уравнения для обработки изображений.
Однако применяя специальные краевые условия, изложенные в работе [6], можно построить окно любого размера и для данного случая. При квазистатическом приближении также можно использовать результаты, полученные выше для Лапласиана, а именно, воспользоваться введёнными при переходе в дискретное пространство поправками (7). Учёт при этом матричного характера решения уравнения (12) позволяет построить полноценную (с точки зрения разделения изображения на поле «особых точек» и остаточное поле) математическую модель представления цифровых графических изображений.
Заключение
1. Представление графической информации скалярными полями позволяет адаптировать функцию Грина к дискретному пространству. В результате суммарное поле всех источников, построенное на основе функции Грина, представляется множеством резких перепадов градации цветности (так называемое, поле «особых точек») и остаточным (сглаженным) полем. Для реализации механизма раздельной обработки этих полей использованы возможности, заложенные в уравнениях математической физики.
73
2. Выбор Лапласиана в качестве основы для построения поля «особых точек» позволил максимально формализовать и технологизировать (упростить) этот процесс. Введение дополнительных поправок к дискретному полю позволяет вычислить скалярное поле «особых точек».
3. Использование уравнения Гельмгольца для построения поля диполей за счет наличия волнового числа позволяет ускорить обработку графических изображений с незначительной потерей качества.
4. Применение векторного уравнения Ламе для представления графических изображений создает дополнительные возможности по их обработке, однако требует дополнительных исследований.
Литература
1. Картан А. Элементарная теория аналитических функций одного или нескольких комплексных переменных. М.: Изд-во иностранной литературы, 1963. 298 с.
2. Болтов Ю.Ф. Сжатие графической информации на основе её представления в виде полевой структуры // Телекоммуникации. 2008. № 12. С. 30-35.
3. Болтов Ю.Ф. Обработка визуальной информации на основе ее представления в виде скалярных или векторных полей: концепция, математические модели и алгоритмы. СПб.: СПбГУТ, 2010. 184 с.
4. Владимиров В.С. Уравнения математической физики. 4-е изд. М.: Наука. Гл. ред. физ.-мат. лит., 1981. 512 с.
5. Ландау Л.Д., Лифшиц Е.М. Теоретическая физика. Т. 7: Теория упругости. 4-е изд., испр. М.: Наука. Гл. ред. физ.-мат. лит., 1987. 248 с.
6. Болтов Ю.Ф., Григорьев И.Н. Поле элементарного источника волн упругих деформаций в твёрдом волноводе с прямоугольным сечением // Акустический журнал. 1978. Т. 24. Вып. 3. С. 334-338.
References
1. Kartan A. Jelementarnaya teoriya analiticheskih funkcij odnogo ili neskol'kih kompleksnyh peremennyh [Elementary theory of analytic functions one or several complex variables]. Moscow.: Izd-vo inostrannoj literatury, 1963, 298 p. (In Russ.).
2. Boltov Yu.F. Szhatie graficheskoj informacii na osnove eyo predstavleniya v vide polevoj struktury [Compression of graphical information on basis of its presentation in the form of field structure] // Telekommunikacii [Telecommunications]. 2008. № 12. pp. 30-35. (In Russ.).
3. Boltov Yu.F. Obrabotka vizual'noj informacii na osnove ee predstavleniya v vide skalyarnyh ili vektornyh polej: koncepciya, matematicheskie modeli i algoritmy [Visual information processing on the basis of its presentation in the form of scalar or vector fields: concept, mathematical models and algorithms]. Saint-Petersburg.: SPbGUT, 2010. 184 p. (In Russ.).
4. Vladimirov V.S. Uravneniya matematicheskoj fiziki [Equations of mathematical physics]. 4 ed. Moscow: Nauka. Gl. red. fiz.-mat. lit., 1981. 512 p. (In Russ.).
5. Landau L.D., Lifshic E.M. Teoreticheskaya fizika [Theoretical physics]. Vol. 7: Teoriya uprugosti [Theory of elasticity]. 4 ed. Moscow: Nauka. Gl. red. fiz.-mat. lit., 1987, 248 p. (In Russ.).
6. Boltov Yu.F., Grigor'ev I.N. Pole ehlementarnogo istochnika voln uprugih deformacij v tvyordom volnovode s pryamougol'nym secheniem [Field of the elementary source of waves of elastic deformation in a solid waveguide with a rectangular cross section] // Akusticheskij zhurnal [Acoustic journal]. 1978. Vol. 24. Is. 3. pp. 334-338. (In Russ.).