Научная статья на тему 'Метрическое сравнение результатов сегментации изображений'

Метрическое сравнение результатов сегментации изображений Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
314
41
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Егорова Елена Андреевна, Киношенко Дмитрий Константинович, Машталир Сергей Владимирович, Шляхов Дмитрий Владиславович

Предлагается использовать сравнение разбиений поля зрения в качестве базы для сопоставления изображений. На произвольных конечных разбиениях вводится функционал, оценивающий их сходство, и доказывается, что он представляет собой метрику. Обсуждаются результаты моделирования метрических свойств разбиений.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Егорова Елена Андреевна, Киношенко Дмитрий Константинович, Машталир Сергей Владимирович, Шляхов Дмитрий Владиславович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Metric matching of image segmentation results

It is offered to use mathes of partitions of a field of viev as a base for image matching. The similyrity functional is introduced on arbitrary finite partitions, and what it represents the metric is proved. Results of partitions metric properties explorations are considered.

Текст научной работы на тему «Метрическое сравнение результатов сегментации изображений»

КОМПЬЮТЕРНЫЕ _

УДК681.51.007

МЕТРИЧЕСКОЕ СРАВНЕНИЕ РЕЗУЛЬТАТОВ СЕГМЕНТАЦИИ ИЗОБРАЖЕНИЙ

ЕГОРОВА Е.А., КИНОШЕНКО Д.К.,

МАШТАЛИР С.В., ШЛЯХОВ Д.В._____________

Предлагается использовать сравнение разбиений поля зрения в качестве базы для сопоставления изображений. На произвольных конечных разбиениях вводится функционал, оценивающий их сходство, и доказывается, что он представляет собой метрику. Обсуждаются результаты моделирования метрических свойств разбиений.

Введение

Любая автоматическая интерпретация изображений связана с разделением полезной и мешающей информации. Первый шаг в этом плане - сегментация, т.е. поиск классов эквивалентности в поле зрения видеодатчика относительно выбранного признакового пространства, как правило, связанного с предметной областью. В простейших случаях сегментация сводится к поиску «однородных» областей. При этом используются методы, основанные на выделении, слиянии-расщеплении областей [1,2], построении контурных препаратов [3-5], локальном или глобальном анализе функций распределения яркостей (текстурные [6,7], гистограммные [8], фрактальные подходы [9]), различном комплексировании специализированных алгоритмов [10-14]. Основным результатом сегментации является разбиение (реже - покрытие) видеокадра, которое представляет собой входную информацию для этапа анализа «содержания» изображения. Принято различать недостаточную (граничная ситуация - исходное, попиксельное представление изо бражения) или избыточную (предельная ситуация - все изображение соответствует одному классу) сегментацию. Определение степени адекватности разбиения изображения реальному содержанию наблюдаемой сцены - весьма сложная задача, которая не всегда легко решается и человеком. Одним из важнейших инструментов принятия решения о необходимости трансформаций разбиений (в частности, объединения или дробления классов) является объективное сравнение результатов сегментации изображений. Естественным образом такое сравнение, по крайней мере предварительно, должно проводиться на совокупностях множеств, соответствующих найденным областям «однородности» изображений, т. е. на разбиениях или покрытиях поля зрения видеодатчика.

Цельюработы является изучение метрических свойств разбиений для оценки сходства изображений по результатам сегментации, что позволит учитывать избыточность или дефицит информации наряду с ее многозначностью на этапе тематической интерпретации видеокадров.

В задачах обработки изображений (в качестве меры их сходства) используется целый ряд метрик. Вместе с использованием традиционных (метрика Минковского и ее частные случаи - евклидово и Манхэттенское расстояния) активно проводятся исследования по введению расстояний, учитывающих специфику анализа визуальной информации. Диверсификация поисковых видеосистем с запросами «ad exemplum» приводит к введению новых метрик, в том или ином смысле удовлетворяющих трактовке изображений. Следует выделить такие подходы: трансформация локальной информации в структурное сходство [15], учет связных пиков гистограмм [16], анализ минимальной «стоимости» преобразований законов распределения применительно к цвету и текстуре [17], метрические свойства гауссовых смесей [18], динамическая активизация различных наборов признаков при сравнении различных изображений [19], множественный анализ классов с использованием расстояний хи-квадрат [20], иерархическая классификация со сходством типа метрики Махаланобиса [21], отображение свойств эталонной сегментации в пространство анализируемых изображений [22], учет наборов функций сходства, основанных на свойствах энтропии [23], использование псевдометрик, например, при нейросетевой семантической классификации [24]. Однако в этих метриках слабо используется информация о форме компонентов изображений, которая часто является ключевой при интерпретации. Традиционные методы анализа формы областей базируются на их последовательном выделении и вычислении признаков. Задача работы - построение метрики, интегрально учитывающей все элементы разбиений (результаты сегментации изображений).

Метрика на разбиениях изображения, индуцированных сегментацией

Рассмотрим произвольное множество A (поле зрения видеодатчика) и его разбиения на собственные подмножества Пі с конечным числом элементов, т.е.

П і = {Pl,...,Pn},

где Pk с A, k = 1,n, Uk=1Pk = A, Pi П Pj = 0,i,j = 1,n,i *j.

Будем считать, что на A с R2 задана некоторая мера p(A) (площадь, количество точек, попадающих в область, и т.п.) и она конечна, откуда следует и конечность мер для элементов произвольных разбиений.

Введем функционал на множестве произвольных разбиений П = {P[,...,Pn}, G = {G1,...,Gm} множества A:

РИ, 2006, № 2

55

n m

P( n,G) =EE [ P(Pk А01)ц(Рк n Gj)], (1)

к=11=1

где « Д » - операция симметрической разности множеств.

Подчеркнем, что изучение метрических свойств разбиений для оценки сходства изображений по результатам сегментации сводится к проверке выполнения аксиом рефлексивности, симметричности и неравенства треугольника. Отметим, что конечность разбиений будет использована нами только при доказательстве неравенства треугольника.

Нетрудно заметить, что из вида функционала (1) непосредственно следует, что он удовлетворяет аксиоме симметричности. Докажем рефлексивность. Будем считать, что разбиение П состоит из n элементов, тогда

р(п,п) = £ £ №дрмр п р) =

n к=11=1 n

= £ [ц(Ркдрмр npi)]+2 £ [ц(Ркдроц(Рк пPi)],

к=1 к,1=1

к>1

т.е. р (П, П) состоит из n слагаемых с совпадающими номерами, а значит, и с совпадающими элементами

разбиения, и из n2 - n слагаемых с различными элементами разбиения. Первая группа слагаемых состоит из нулей, так как р (РДРк) = 0, для к = 1,n, а вторая группа дает нулевые слагаемые, поскольку

р (Рк П Р1) = 0 для Vк,1 = 1,n и к ф1. Таким образом, в одну сторону рефлексивность доказана.

Покажем рефлексивность в обратную сторону, т.е. пусть для двух, в общем случае, различных разбиений п и G имеет место р (П, G) = 0. Поскольку все слагаемые функционала (1) положительны, то он равен 0 только тогда, когда каждое из них равно 0. Выберем некоторый элемент разбиения pеП . В исходном функционале он входит в набор «нулевых» слагаемых p(pAgi)p(pf|gi) = 0, где 1 = 1,m , G = {g1,...,gm}. Если предположить, чтоp не является элементом разбиения G, то для всех gl є G выполняется р(pAgl) Ф 0 . Но тогда для всех номеров 1 должно выполняться р (p П gl) = 0. Однако это возможно только тогда, когда p Ф 0 , так как p є A, а весь набор G = {g1,...,gm} покрывает множество A. В то же время p - элемент покрытия П этого же множества A и, естественно, p Ф0 . Тогда найдутся элементы разбиения G , покрывающие p и имеющие с ним непустые пересечения (рис.1). Но тогда для этих элементов р (pAgO Ф 0 , т.е. получаем противоречие.

В итоге можно утверждать, что произвольный элемент pеП является элементом G или ПсG .Ясно, что в силу симметрии аналогично можно показать G сП, т.е. П = G. Таким образом, рефлексивность доказана.

Рис. 1. Пересечение покрытий Р и G множества А

Для конечного множества A = {1,...,N} и множества его разбиений Т a на конечный набор подмножеств зафиксируем элемент ПєТА, т.е. П = {pk...,pn},

где pi с A, ^n=1pi = A и pi П pj = 0 , когда i Ф j. Тогда функционал (1) можно представить в виде

p(n,G) = 'Z'Z\piAgj||pi Пgj| (2)

i=1j=1

Нетрудно заметить, что если к множеству A добавить (N +1) - й элемент, то разбиение П є Та может трансформироваться двумя способами: с одной стороны, этот элемент может добавляться как отдельно взятый элемент разбиения:

П'= {РЬ..., Pn, Pn+1}, (3)

гдеП'єТa',A' = {1,...,N +1}; с другой сторонні, он может « вливаться» в один из элементов разбиения п, тогда новое разбиение множества д' будет выглядеть так:

П' = {Pb...,(PbN +1),..., Pn}, (4)

здесь к = 1,п. Трансформацию вида (3) обозначим р( П), а вида (4) - через Рк(П) также при к = 1,n.

Выше было установлено, что функционал p(n,G) удовлетворяет условиям симметричности и рефлексивности. Докажем неравенство треугольника, и тогда этот функционал действительно метрика на Та .

Рассмотрим несколько вспомогательных утверждений, необходимых для доказательства. Нетрудно заметить, что если над элементами G, Пе Та выполнить трансформацию Fi, то функция (2) изменится: область определения станет Та', А'= {1,2,...,N +1}. При этом новый функционал р'(П', G') связан с первоначальным, а именно, вид функционала принципиально не меняется и остается в нотации (2).

Утверждение 1. Для любых двух разбиений n,G множества A имеет место

р (n,G) = p'(Fb(n ),F0(G)), (5)

где F0(n),F0(G) єТа' , А' = {1,2,...,N +1}. Доказательство. С учётом того, что F0( П) = П'= {p1,...,pn,(N +1)},

Fd(G) = G' = {g1,...,gn,(N +1)},

(2) может быть представлено в виде

56

РИ, 2006, № 2

n m - n

р'(П', G') = Ё Ё | pi Agj I Pi n gj I + Ё [ |pi A(N +1)| x 1=1J=1 m ,,i=1

X |pi П (N +1)|] + X gjA(N +1) gj n (N +1) + (6)

j=1

+ |(N +1)A(N +1)| |(N +1) П (N +1)|.

Ясно, что в равенстве (6) первое слагаемое представляет собой р(П, G), два последующих равны 0, так как|pi П (N +1) = |gj П(N +1) = 0 при Vi = 1, n, j = 1,m,

а в силу того, что |(N + 1)A(N +1)| = 0, зануляется

последнее слагаемое. Таким образом, получаем равенство (5), что и требовалось.

Утверждение 2. Для произвольных разбиений П, G множества A и любого номера se{1,...,m} имеет место

р'(РЬ(П),3№)) = р (n,G) + 2|gs |, (7)

где F0(H),Fs(G) є Fa' , A' = {1,2,...,N +1}. Доказательство. Исходя из определения (4), имеем

F0( П) = П'= {p1,...,pn,(N +1)},

Fs(G) = G'= {g1,...,(gs,N + 1),...,gm}.

Тогда

n m n

р'(П', G') = Ё Ё |pi Agj I |pi П gj I + Ё [|pi A(gs, (N +1))| X

i=1j=1 i—1

j*s m ,

X |pi n(gs,N +1)|] + £ |(N + 1)Agj||(N +1)ngj| + j=1

Vs

+ | (N +1) A(gs,N + 1)||(N +1) П (gs,N +1)|. Нетрудно заметить, что при любых i = 1, n, s = 1, m |pi A(gs, N +1)| = |pi Ags I +1,

ІРІ n (gs , N +1)| = |pi n gs 1 - (8)

Далее, для Vj = 1, m

|(N +1) П gj| = 0 (9)

и, наконец,

|(N + l)A(gs, N +1)| = |gs |, |(N + l)n(g.,N + l)| = l. (10)

Учитывая равенства (8) - (10), получаем

n m n

р'(П', G') = Ё Ё | pi Agj I |pi П gj I + Ё [(|pi Ags I +1) x

i=1j=1 i=1

j^S n m n

X |pi П gs|] + |gs | =[ Ё Ё | pi Agj I |pi n gj I+Ё [|pi Ags IX

i=1j=1 i=1 (11)

x |pi n gs I]+Ё |pi П gs| +| gs|.

i—1

Ясно, что в правой части равенства (11) слагаемое в квадратных скобках представляет собой не что иное, как р(n,G), а с учетом того, что П = {p1,...,pn} -разбиение множества A, и при этом gs с A, то zn=1|pi П gs| = |gs| . Следовательно, окончательно

p'(n',G') = р (П, G) + 2 |gs |,

т.е. получаем равенство (7). Утверждение 2 доказано. Замечание 1. Нетрудно понять, что в силу симметрии для любых разбиений П, G множества A и произвольного номера k e{1,...,n} будет иметь место следствие утверждения 2 в виде аналога равенства (7):

р'ШП)Т0^)) =р (n,G) + 2|pk|,

где Fk(П), F0(G) ?a- , A'= {1,2,...,N +1}.

Утверждение 3. Если зафиксировать два произвольных номера k e{1,...,n} и s e{1,...,m} и рассмотреть два произвольных разбиения П, G множества A, то будет выполняться равенство

р'ШПШО)) = p(n,G) + 2|pkAgs|,

где Fk(П), Fs(G) є Fa' , A' = {1,2,...,N +1}. Доказательство. Поскольку

Fk( П) = {p1,...,(pk,N + 1),...,pn},

Fs(G) = {g1,...,(gs,N + 1),...,gm}, (12)

то для функционала p' и равенств (12) находим

р'(п', G,) = Ё Ё |pi Agj I |pi n gj I+ i=1 j=1

i* kj^s

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

+ І |piA(gs,(N +1)) |pi П(gs,N +1)| + i=1 i^k m

+ Ё |(pk,N + 1)Agj||(pk,N +1)Пgj| + (13)

j=1

Vs

+| (pk,N +1) A(gs,N + 1)||(pk,N + 1) П (gs,N +1)|. Учитывая (10), а именно,

|pi A(gs ,N + 1)| = |pi Ags 1 + 1, |pi П (gs ,N +1)| = |pi П gs I, можем представить (13) в виде

p'(n',G') = £ ||piAgj||pi П gj +

i=1 j=1

i*k j*s

n Jm

+ Ё ( |pi Ags | +1) |pi П gs | + Ё ( |pk Agj I + ^ |pk П gj I +

i=1 j=1

i*k j*s

+ |pkAgs|(|pk П gs| +1).

При этом имелось в виду, что

|(pk, N +1) A(gs, N +1)| = |pk Ags I,

|(pk,N + l)n(gs,N + l)| = (|pk ng.| + l).

Таким образом, имеем

РИ, 2006, № 2

57

n m n

Р'(П', G') = [ Ё E |piAgj I |pi n gj I + E |pi Ags IX

i=1 j=1 i—1

i *kj*s i^k

m n

X |p^lgs|] + E |pk Agj| |p^lgj| + E |pil"lgs| + j=1 i=1

m j*s i^k (14)

+ E |pkHgi| + |pkAg^|p^lg^ + |pkAgs|. j=1

j^s

С учетом того, что слагаемые, стоящие в квадратных скобках равенства (14) вместе со слагаемым этого же равенства вида |pkAgs| |pk П gs|, дают p(n,G), можно далее представить р'(П', G') в виде

р'(П', G') = р(П, G) + ( £ |к П gs | - |p^ng^> +

i=1

+(Е |pk n gj I - |pk n gs |)+|pk Ags|. (15)

j=1

Здесь в каждой из круглых скобок мы фактически добавили и вычли по одному слагаемому |pk П gs |. Но

суммы вида En=1|pi П gs| и E“1pk П gj| рассматривались при доказательстве утверждения 2, т.е. каждая из них равна

u m

Е |pk П gs| = |gs|, Е |pk п gj| = |pk|. (16)

j=1 j=1

Тогда из (15) и (16) имеем

р'(П\G') = р(П, G) + (|рк | + |gs | - 2|рк П gs |) + |pkAgs I ■

Осталось заметить, что поскольку для любых конечных множеств A и B | ЛАБ |=| A | +1 B | —21A П B |, то

p'(ir,G') = p(n,G) + 2|pkAgs|,

т. е. утверждение 3 доказано.

Замечание 2. При выполнении «добавки» одного элемента к конечному множеству A трансформаций над произвольной парой разбиений этого множества n,G є ТЛ кроме тех, которые рассмотрены в формуле (16), быть не может.

В результате рассмотренных утверждений и замечаний можно сформулировать теорему.

Теорема. Функционал (2), заданный на Тл хТл, где Л - конечное множество, а Тл - множество разбиений Л на конечный набор подмножеств, является метрикой.

Доказательство. Заметим, что фактически доказывать будем только неравенство треугольника, поскольку выше симметричность и рефлексивность функционала (2) доказана для любой меры. Доказательство проведем методом математической индукции по количеству элементов множества Л.

Начнем с базы индукции. Когда мощность множества Л равна 1 или 2, то мы сталкиваемся с вырожденной ситуацией, в которой полагаем, что неравенство треугольника имеет место. Допустим N = 3, т.е. обозначая A = {a,b,c}, получаем, что Т л имеет вид

Т Л = {[(a), (b), (c)],[(a), (b, c)],

[(b), (a, c)], [(c), (a, b)], [(a, b,c)]}.

В принципе выбор трех точек (элементов) множества T л может быть осуществлен C5 = 10 вариантами, а именно:

1. [(a),(b),(c)]; [(a),(b,c)]; [(b),(a,c)];

2. [(a),(b),(c)]; [(a),(b,c)]; [(c),(a,b)];

3. [(a),(b),(c)]; [(a),(b,c)]; [(a,b,c)];

4. [(a),(b),(c)]; [(b),(a,c)]; [(c),(a,b)];

5. [(a),(b),(c)]; [(b),(a,c)]; [(a,b,c)];

6. [(a),(b),(c)]; [(c),(a,b)]; [(a,b,c)];

7. [(a),(b,c)]; [(b),(a,c)]; [(c),(a,b)]; (17)

8. [(a),(b,c)]; [(b),(a,c)]; [(a,b,c)];

9. [(a),(b,c)]; [(c),(a,b)]; [(a,b,c)];

10. [(b),(a,c)]; [(c),(b,a)]; [(a,b,c)].

Ясно, что из набора (17), с точностью до обозначения, можно считать эквивалентными следующие варианты:

а) 1,2,4; б) 3,5,6; в) 8,9,10. (18)

Таким образом, надо рассмотреть из групп (18) по одному представителю, и мы приходим к четырем ситуациям, например: 1, 3, 8 и 7.

Обозначим элементы множества Та точками Mi, т.е. M1 = [(a),(b),(c)], M2=[(a),(b,c)], M3 = [(b),(a,c)], M4 = [(c),(a,b)], M5 = [(a,b,c)]. Тогда достаточно исследовать 4 треугольника: AM1M2M3; AM1M2M5; AM2M3M5; AM1M2M4.

Замечание 3. Поясним технику подсчета функционала (2) в общем случае. Для двух конечных разбиений П = {p1,...,pn} и G = {g1,...,gm} следует формировать две (n х m) матрицы Тд и Тр вида

Тд= (ТІ), ТП = (j

где T=|piAgj|, Tpj = |pi Пgj|, i = 1n, j = 1,m. Затем эти матрицы можно поэлементно перемножать, т.е.

Сд n = (Сд p), где C1^ n = , а далее если все эле-

менты (n х m) матрицы Сд р просуммировать, то полученная сумма дает значение функционала (2).

Далее заметим, что два элемента множества Та можно выбрать С2 = 10 способами, если не учитывать порядок выбора. При этом в силу определенной симметрии (с точки зрения обозначений элементов) множеств Mi можно сразу заметить, что

p(M1,M2) = p(M1, M3) = p(M1,M4),

p(M2,M3) = p(M2,M4) = p(M3,M4),

p(M5,M2) = p(M5,M3) = p(M5,M4),

а случай p(M1,M5) должен быть рассмотрен отдельно. Таким образом, надо вычислить всего лишь четыре расстояния. Используем для вычислений описанную в замечании 3 методику.

58

РИ, 2006, № 2

1) p(Mi,M5) = 6:

Тд( Мі,Мз)=

( 2 > ( 2 ^

2 ,Tn( Mi,My)= 1 ,Сд n(Mi,M5)= 2

V 2 J I1; Ч 2 У

2) p(MbM2) = 2:

Тд (Mi,M2)

( 0 3 ^ 2 1

Tn (Mi,M2)

(0 0 'ї

Сд n(Mi,M2)

0 i

V0 i У

(i 0 Ї 0 i ,

3) p(M2,M3) = 4 :

треугольника будет выполняться для добавок Ар, представленных на рис. 4, то оно будет иметь место и для функционала р', заданного на множестве A'x A',

где |A'| = N +1, т.е. индуктивный переход будет обоснован. Таким образом, требуется доказать неравенство треугольника фактически для добавок Ар, вычисляемых по формулам, которые непосредственно следуют из утверждений i—З и замечания i:

р(П',С') =

р(П,0), р(П,0) + 2|gk|, р(П,0) + 2|gs|, р(П,в) + 2|pk Ags

П'= F0 (П), G'= F0(G), П'= Fk(n),G' = F0(G), П'= Fb(n),G' = FS(G), ,П'= Fk (П), G'= FS(G).

тд(M2,M3) = (21J, Tn(M2,M3) = (01),

Сд n(M2,M3) = (0 1).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4) p( М2,Мз)

Тд(М2,Мз) =(2), Tn(M2,M5)42), CдП(М2,Мз)42).

Рис. 3. Треугольники: AM2M3M5 , AM2M3M4

Рассматриваемые треугольники схематично иллюстрируются рис. 2, 3.

4 ' 6

Рис. 2. Треугольники: AM1M2M3 , ДМ1М2М5

Окончательно получаем, что неравенство треугольника всегда имеет место. Таким образом, база математической индукции при |A = 3 обоснована.

Перейдем к доказательству индуктивного перехода. Допустим, неравенство треугольника имеет место для множества А мощности N. Рассмотрим множество мощности N +1 и его произвольное конечное разбиение П' є TA', где A' = {1,2,.N +1} .

Выделим элемет^+1. Возможны два варианта: либо в разбиении п' он является изолированным, либо попадает в какую-то группу элементов. При этом ясно, что A = A' \{(N +1)} будет множеством мощности N , и разбиение получено трансформацией вида (3)П' = F0(П) или вида (4) П' = Fk(n), гдеП eTA -разбиение множества А. Нетрудно понять, что для любых трех разбиений П', G', Q' множества A' их попарные расстояния имеют вид (рис. 4), где для функционалов р(П^) ; р(П^) ир(G,Q) неравенство треугольника имеет место по предположению индукции, так как n,Q, G є Ta - конечные разбиения на множестве А мощности N. Тогда, если неравенство

Возникает восемь различных ситуаций, которые схематично представлены на рис. 5.

Рис. 4. Попарные расстояния для разбиений П', G', Q' Следует отметить, что на рис. 5 напротив сторон треугольников явно указаны величины добавок Ар . Из рис.5 видно, что для ситуаций 1), 2), 3), 5) неравенство треугольника очевидно выполняется. Ситуации 4), 6), 7) сводятся к одной, показанной на рис. 6, где a,b,c обозначают произвольные конечные множества. Ситуация 8) требует выполнения неравенства треугольника для операции аДЬ. Проверим неравенство треугольника для рис. 6. Для этого надо показать: |a| + |b|-|aAb| >0 и |аДЬ|+|а|-|Ь| >0.Принимая во внимание, что |aAb| = |a| + |b[ - 2 |a П b|, получаем |a| + |b - |aAb| = 2 |a П b| ^ 0

и |aAb|+|b _| b = |a|+N _ 2|a П b|+|a| -| b = 2(|a| - |a flb|) = = 2 |a\b| > 0, что и требовалось.

Остается проверить неравенство треугольника для симметрической разности, т.е. то, что для любой тройки множеств A, B, С выполняется

|АДВ| + |АДС|>|ВДС|.

РИ, 2006, № 2

59

Рис. 6

Из рис. 7 видно, что без ограничения общности имеем

І адв| = |Di I+|d2 I+|d5 I+|d6 I, |aac| = |d1|+|D3|+|d6|+|d7|, |bac| = |d3 I+|d5 I+|d2 I+|d7 I,

где Di,i = 1,7 легко выразить черезA,B,C (например, Di = [A\(A П C)]\[(A П B)\(A П B П C)] и т.д.). Тогда из (19) получаем

|AAB| + |AAC| -| BAC| = 2|d1 + 2|D6| +

+ [|D^ + | d5 +| D3| + |D^ - |D2|-I Ds| - |D3-| D7p =

= 2(|Di| + |D6|) > 0,

что и требовалось доказать. Тем самым мы завершили доказательство индуктивного перехода, а следовательно, и всей теоремы.

Рис. 7. Общий случай расположения трех множеств

Обсуждение результатов и перспектив исследования

В работе на конечных разбиениях поля зрения видеодатчика введен функционал, позволяющий сравнивать изображения, и доказано, что он представляет собой метрику, откуда следует теоретическая значимость исследований. Главное назначение этой метрики - инструмент анализа разбиений, полученных на ранних этапах обработки изображений, для выбора и комбинирования результатов сегментации на этапе интерпретации видеоданных, откуда следует практическая ценность работы. При этом, с одной стороны, возникает возможность объективного интегрального сравнения алгоритмов сегментации, с другой - введение операций над разбиениями создает предпосылки для получения лучшего в смысле заданного критерия разбиения, позволяющего достоверно выделять объекты или области интереса.

Экспериментальные исследования показали, что введенная метрика хорошо согласуется по результатам сравнения с традиционными формами сопоставления изображений. Более того, в задачах, когда форма объектов играет принципиальную роль, результаты в большей степени отвечают точности сравнения. На рис. 8 приведены примеры микроизображений гисто-

60

Рис. 8. Примеры исходных изображений для экспериментального исследования метрики (1)

РИ, 2006, № 2

логических препаратов, на рис. 9 - результаты простейшей (многопороговой) сегментации этих изо бр а-жений после эквализации гистограмм и медианной фильтрации (с окном 5 х 5). На рис. 10 приведен пример поиска изображения (а) в евклидовой метрике и разбиения (б) в предложенной.

Одним из перспективных направлений использования метрики являются базы видеоданных с запросами «ad exemplum», так как в этом случае разбиения можно трактовать как признаки изображения, характеризующие его геометрические свойства.

Следует подчеркнуть, что метрику (2) можно использовать и для сравнения покрытий поля зрения: для этого достаточно факторизовать покрытия, т.е. рассматривать возникающие пересечения как элементы индуцированного разбиения. Большой интерес представляет и уточнение метрики для сравнения частично упорядоченных относительно вложения результатов сегментации, поскольку учет вложений позволит управлять степенью детализации представления изобр а-жений на этапе их интерпретации.

Литература: 1. Brox T., Farin D., de With P.H.N. Multi-Stage Region Merging for Image Segmentation / Proceedings of the 22nd Symposium on Information Theory in the Benelux. Enschede, The Netherlands IEEE Benelux Information Theory Chapter. 2001. P. 189-196. 2. Chung R.H.Y., Yung N.H.C., CheungP.Y.S. An Efficient Parameterless Quadrilateral-Based Image Segmentation Method // IEEE Transactions on Pattern Analysis and Machine Intelligence. Vol. 27, No. 9. 2005. P.1446-1458. 3.Lu S., WangZ., Shen J. Neuro-fuzzy synergism to the intelligent system for edge detection and enhancement // Pattern Recognition. Vol. 36, No 10. 2003. P. 2395-2409. 4. Bezdek J. C., Chandrasekhar R., Attikiouzel Y. A geometric approach to edge detection // IEEE Transactions on Fuzzy Systems. 1998. Vol. 6, No 1. P. 52-75. 5. ShinM.C., Bowyer K.W., Goldgof D.B. Comparison of edge detectors through

use in an object recognition task // Computer Vision and Image Understanding. 2001. Vol. 84, No 1. P. 160-178. 6. Jain A.K., Farrokhnia F. Unsupervised texture segmentation using Gabor filters // Pattern Recognition. 1991. Vol. 24, No

12. P. 1167-1186. 7. Chen J., Pappas T.N., Mojsilovic A., Rogowitz B.E. Adaptive perceptual color-texture image segmentation // IEEE Transactions on Image Processing. Vol. 14, No 10. 2005. P. 1524-1536. 8.ZhangH, Gao W., Chen X., Zhao D. Learning informative features for spatial histogram-based object detection / Proc. IEEE International Joint Conference on Neural Networks (IJCNN 2005). Montraal. 2005. P. 1806-1811.9. Lee P.S., Ewe H. T. Individual Recognition Based on Human Iris Using Fractal Dimension Approach. / / Lecture Notes in Computer Science. Vol. 3072. Berlin Heidelberg: Springer-Verlag. 2004. P. 467-474. 10. Mucoz X., Freixenet J., CutH X., MartH J. Strategies for image segmentation combining region and boundary information / / Pattern Recognition Letters. 2003. Vol.24, No 1-3. P. 375-392.

11. Caelli T., Reye D. On the classification of image regions by color, texture and shape // Pattern Recognition. 1993. Vol. 26, No 4. P 461 -470. 12.DiplarosA., Gevers T., Patras I. Combining color and shape information for illumination-viewpoint invariant object recognition // IEEE Transaction on Image Processing. 2006. Vol. 15, No 1. P. 1-11. 13. Callaghan R.J., Bull D.R. Combined morphological-spectral unsupervised image segmentation // IEEE Transaction on Image Processing. 2005. Vol. 14, No 1. P. 49-62. 14. ZhangD. Improving image retrieval performance by using both color and texture features / Proceedings of IEEE 3rd International Conference on Image and Graphics (ICIG04). Hong Kong. 2004. P. 172-175. 15. Gao X., Wang T., Li J.A. Content-based image quality metric / In: Slezak, D., et al. (eds.): Rough Sets, Fuzzy Sets, Data Mining, and Granular Computing. Lecture Notes in Computer Science. Vol. 3642. Berlin Heidelberg: Springer-Verlag. 2005. P. 31-240. 16. Traina A.J.M., Traina Jr.C., Bueno J.M., Chino F.J.T., Azevedo-Marques P. Efficient content-based image retrieval through metric histograms // World Wide Web. 2003. Vol. 6, No 2. P. 157-185. 17. Rubner Y., Tomasi C., Guibas L.J. The Earth Mover’s Distance as a metric for image retrieval // International Journal of Computer Vision. 2000. Vol. 40, No 2.

у' ыЯИЕ # 4k Ж „л

ш ж

1 J - - 9

Рис. 9. Результаты многопороговой сегментации изображений, представленных на рис. 8

1 2 3 4 5 6 7 8 9 10 11 12

Рис. 10. Пример поиска изображения в евклидовой метрике и по разбиениям

РИ, 2006, № 2

61

P. 99-121. 18. Sfikas G., Constantinopoulos C., Likas A., Galatsanos N.P. An analytic distance metric for Gaussian mixture models with application in image retrieval / In: Duch W., et al. (eds.): Artificial Neural Networks: Formal Models and Their Applications. Lecture Notes in Computer Science. Vol. 3697. Berlin Heidelberg: Springer-Verlag. 2005. P.835840. 19. Li B., Chang E., Wu Y. Discovery of a perceptual distance function for measuring image similarity // Multimedia Systems. 2003. Vol. 8, No 6. P. 512-522. 20. Gao, X., Wang, T, Li, J.:°A Content-based image quality metric / In: Slezak D., et al. (eds.): Advances in Visual Information Systems. Lecture Notes in Computer Science. Vol. 1929. Berlin Heidelberg: Springer-Verlag. 2000. P. 407-418. 21. PartridgeM., JabriM. Hierarchical feature extraction for image recognition // Journal of VLSI Signal Processing. Vol. 32, No 1-2. 2002. P. 157-167. 22. Khan A., Aylward E., Barta P., MillerM.I., BegM.F. Semiautomated basal ganglia segmentation using large deformation diffeomorphic metric mapping / In: Duncan J.S., Gerig, G. (eds.): Medical Image Computing and Computer-Assisted Intervention. Lecture Notes in Computer Science. Vol. 3749. Berlin Heidelberg: Springer-Verlag. 2005. P. 238245. 23. Cheng W., Xu D., Jiang Y., Lang C. Information theoretic metrics in shot boundary detection / In: Khosla, R., et al. (eds.): Knowledge-Based Intelligent Information and Engineering Systems. Lecture Notes in Computer Science. Vol. 3683. Berlin Heidelberg: Springer-Verlag. 2005. P. 388394. 24. Wang D., MaX., Kim Y. Learning pseudo metric for intelligent multimedia data classification and retrieval // Journal of Intelligent Manufacturing. 2005. Vol. 16, No 6. P. 575-586.

Поступила в редколлегию 07.06.2006 Рецензент: д-р техн. наук, проф. Бодянский Е.В.

Егорова Елена Андреевна, аспирантка кафедры информатики ХНУРЭ. Научные интересы: обработка изображений и распознавание образов. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 70-21-419, e-mail: [email protected].

Киношенко Дмитрий Константинович, аспирант кафедры информатики ХНУРЭ. Научные интересы: базы видеоданных. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 7021419, e-mail: [email protected].

Машталир Сергей Владимирович, канд. техн. наук, ассистент кафедры информатики ХНУРЭ. Научные интересы: распознавание образов. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 70-21-419, e-mail:

[email protected].

Шляхов Дмитрий Владиславович, студент группы ИНФ-02-3 факультета ПММ ХНУРЭ. Научные интересы: обработка изображений. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 70-21-419.

УДК512.563.6

КОНТРОЛЬ ДОСТОВЕРНОСТИ МИНИМИЗАЦИИ ЛОГИЧЕСКИХ ФУНКЦИЙ

РУБАНОВ В.Г., КОРОБКОВА Е.Н.____________

Проводится анализ способа контроля достоверности результата минимизации, основанный на сжатии области определения функций по различным переменным и представлении их в точках сжатой области в форме упорядоченной дизъюнктивной матрицы с соседним размещением элементов и последующей многоверсионной минимизацией.

1. Постановка проблемы, цель и задачи исследования

Ошибки, допущенные при синтезе цифровых устройств вообще и минимизации в частности, вызывают дополнительные затраты при их последующем обнаружении и исправлении. Следует заметить, что при моделировании, отладке и верификации обнаруживаются только те ошибки, которые искажают заданный алгоритм функционирования. Ошибки же в минимизации, не искажающие алгоритм, а только усложняющие схемную реализацию цифрового устройства, не обнаруживаются. В последние годы вопросы минимизации логических функций вновь стали актуальными. Это обусловлено все более широким спектром выпускаемых специализированных интегральных схем (ИС), а также внедрением в практику проектирования программируемых логических интегральных схем

62

(ПЛИС). При разработке специализированных ИС каждый лишний вентиль и каждый лишний его вход требуют дополнительной площади кристалла, что ведет к усложнению ИС, и как следствие, к увеличению её стоимости.

В программируемых структурах число вентилей в конкретной ПЛИС фиксировано. Поэтому можно подумать, что проблемы лишних вентилей нет. И это действительно так, но только до тех пор, пока не вышли за пределы её возможностей и должны перейти на схемы большего объема, что опять-таки ведет к увеличению стоимости. Возникает проблема контроля достоверности получаемых при минимизации результатов, решение которой позволит избежать дополнительных затр ат [ 1 ].

Анализ публикаций, посвященных минимизации логических функций, показал, что число работ в этой области настолько велико, что уже простое перечисление их представляет собой далеко не тривиальную задачу [2]. Однако, несмотря на такое число работ, в подавляющем их большинстве вопросу анализа достоверности получаемого при минимизации результата должного внимания не уделялось, в то время как этот вопрос является первостепенным не только при ручных способах минимизации, но и при программных. При ручных способах минимизации ошибки неизбежны принципиально, причем на самых различных этапах её проведения. При программных способах также возможны ошибки, как в самой программе, так и при её выполнении.

РИ, 2006, № 2

i Надоели баннеры? Вы всегда можете отключить рекламу.