Научная статья на тему 'Поиск максимального независимого множества в нечетком графе'

Поиск максимального независимого множества в нечетком графе Текст научной статьи по специальности «Математика»

CC BY
326
20
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Прикладная информатика
ВАК
RSCI
Область наук
Ключевые слова
ГРАФ / МАКСИМАЛЬНОЕ НЕЗАВИСИМОЕ МНОЖЕСТВО / КЛИКА / НЕЧЕТКАЯ КЛИКА / НЕЧЕТКАЯ ЛОГИКА

Аннотация научной статьи по математике, автор научной работы — Герман Ю. О., Герман О. В.

Представлен оригинальный подход к отысканию максимального независимого множества (максимальной клики) в нечетком графе. Подход базируется на представлении нечетких отношений формулами многозначных логик Я. Лукасевича и использованием их для интерпретации модальных отношений. Модальность типа «возможно» интерпретируется формулой трехзначного исчисления со значением истинности не ниже 0,5; модальность типа «необходимо» интерпретируется формулой трехзначного исчисления со значением истинности, равным 1. Введены правила исчисления выводов в нечетких модальных системах, позволяющие находить трехзначные эквиваленты произвольных модальных формул.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Search for the maximum-size independent set in a fuzzy graph

Аn original approach to find a maximum-size independent set in a fuzzy graph is presented together with the necessary formalization technique. The approach is oriented at practical usage in applied artificial intelligent systems using fuzzy logic and modal logic concepts. The problem may be encountered in face recognition with some possible distortions. The vertices stand for the points in the face image with approximately similar color and brightness. Obviously, in the case of image distortion the arcs in the graph may be assigned with the values in 0,1-diapason. A fuzzy graph contains some nodes (arcs) with indefinite measure of their belonging to the graph. The situation may appear when no constrict classifying rules exist as explained in the paper. One can use a measure of 0.5 to interpret indefiniteness. This an interpretation enables one to apply modal logic for problem formalization and solving. The modality of the type «possible» is interpreted by the 3-valued formula with truth value not less than 0.5; the modality of the type «necessary» is interpreted by the 3-valued formula with the truth value equal to 1. The approach represented in the paper may be interesting for the researchers engaged in the recognition and classifying problems.

Текст научной работы на тему «Поиск максимального независимого множества в нечетком графе»

-ч ПРИКЛАДНАЯ ИНФОРМАТИКА / JOURNAL OF APPLIED INFORMATICS

Vol. 10. No. 2 (56). 2015 '

Ю. О. Герман, ассистент Белорусского Национального технического университета, Минск, Беларусь,

[email protected]

О. В. Герман, канд. техн. наук, доцент Белорусского государственного университета информатики и радиоэлектроники, Минск, Беларусь, [email protected]

Поиск максимального независимого множества в нечетком графе

Представлен оригинальный подход к отысканию максимального независимого множества (максимальной клики) в нечетком графе . Подход базируется на представлении нечетких отношений формулами многозначных логик Я . Лукасевича и использованием их для интерпретации модальных отношений . Модальность типа «возможно» интерпретируется формулой трехзначного исчисления со значением истинности не ниже 0,5; модальность типа «необходимо» интерпретируется формулой трехзначного исчисления со значением истинности, равным 1. Введены правила исчисления выводов в нечетких модальных системах, позволяющие находить трехзначные эквиваленты произвольных модальных формул .

Ключевые слова: граф, максимальное независимое множество, клика, нечеткая клика, нечеткая логика

Введение

Задача отыскания максимального независимого множества (ЗМНМ) вершин графа (и ассоциированная с ней задача отыскания максимальной клики (ЗМК) в графе) представляет одну из широко востребованных прикладных комбинаторных проблем. В частности, ее решение может требоваться в системах формирования кластеров документов при построении поисковых механизмов, распознавании образов (например, кластер образуют пикселы примерно одного цвета), проектировании систем экологического мониторинга (например, определении схожих по экологическим параметрам зон), размещении датчиков и т. д. Один этот перечень показывает практическую значимость рассматриваемой проблемы. Проиллюстрируем сказанное примером. Пусть дано изображение яблока на рис. 1.

Дефектная часть изображения выделена серым цветом. При распознавании весь образ яблока должен быть «ухвачен»

вместе с дефектной частью, хотя «технически» дефектная часть образует отдельный кластер. Эта проблема вписывается в рамки решаемой задачи о максимальном независимом множестве (пикселей) в нечетком графе (серый цвет интерпретируется как неопределенность. Алгоритмы решения задач ЗМНМ (ЗМК) базируются на методах комбинаторного поиска типа «ветвей и границ» или «отсечений». Достаточно полный обзор точных и эвристических методов для ЗМК дан в [1]. Лучшая сложностная оценка от числа вершин п для точных алгорит-

Рис. 1. Изображение яблока с нежелательным

серым кластером Fig. 1. An apple image with unwanted grey cluster

Том 10. № 2 (56). 2015

мов экспоненциальна и составляет O (1,21") [1; 2]. Для нечеткого варианта можно отметить, например, [3-5]. В [4] представлено определение нечеткого графа и связанных с ним понятий. Для нечеткого варианта ЗМНМ (ЗМК) предлагается использовать аппарат нейросетей, генетических алгоритмов или нечеткого математического программирования [5]. Первые два подхода эвристические и не гарантируют отыскание требуемого оптимального множества. При использовании нечеткого математического программирования решается несколько задач «четкого» математического программирования для графов, соответствующих различным градациям (уровням) нечеткой меры. Поскольку ответ не единственный, то не очевидно, какой результат выбирать в качестве окончательного ответа.

В настоящей работе сформулирована задача поиска максимального нечеткого независимого множества (максимальной нечеткой клики) с наибольшей по размеру «четкой» частью. Эта специфическая особенность требует привлечения нового аппарата. Такой аппарат основан на использовании многозначных логик Я. Лукасевича. Как следует из статьи, предложенный подход вполне можно использовать как основание для сведения «нечетких» задач математического программирования к четким. Основа такого сведения представлена в работе [6].

Формализация задачи

Известна следующая теорема [1]. Пусть дана задача оптимизации с трехзначными переменными:

max ^ wx,,

i=1,n

x + Xj < 1, V/, j e E, (1)

x i e {0; 0,5; 1},

где Е представляет множество пар вершин, сопоставленных ребрам графа.

Пусть в любом оптимальном решении (ослабленной) задачи (1) без учета усло-

вия х1 е {0; 0,5; 1} некоторые переменные х* равны 1. Тогда существует оптимальное решение (усиленной) задачи (1) с х1 е {0,1}, содержащее х*.

Теорема (1) может быть использована для решения точного варианта ЗМНМ (ЗМК) при интерпретации графа в трехзначном исчислении. Если идет речь о нечетком графе, то данная теорема позволяет найти максимальное независимое множество вершин четкого аналога нечеткого графа, но не гарантирует, что этот граф будет содержать максимальную по размеру «четкую» часть исходного нечеткого графа. В этой работе мы заинтересованы в отыскании именно максимального независимого подмножества нечеткого графа с наибольшей по размеру «четкой» частью. Начнем с определений.

Ребро графа будем считать нечетким, если определенно не известно, входит оно в граф или нет. Ребро считаем «четким», если определенно известно, что оно входит в граф. Граф с нечеткими ребрами кодируем матрицей смежности А с элементами а,, такими, что

а, ¡ = 1, если ребро ((, ¡) — четкое; а(/ = 0,5, если ребро ((, ¡) нечеткое.

Для иллюстрации рассмотрим корреляционную матрицу признаков С^..., С8, представленную на рис. 2. Известно, что коэффициент (линейной) корреляции показывает тесноту связи двух (случайных) величин. Чем ближе коэффициент корреляции по абсолютной величине к «1», тем теснее связь. Также известно [7], что значение коэффициента корреляции выше 0,7 характеризует сильную связь, а менее 0,5 — слабую. Значение коэффициента корреляции в диапазоне от 0,5 до 0,7 является неопределенным, т. е. не позволяет однозначно судить о тесноте связи. На практике часто возникает задача минимизации числа признаков, описывающих сложную систему. Очевидно, если признаки сильно связаны, то их можно заменить одним.

Vol. 10. No. 2 (56). 2015

Гц С, С2 Сз С4 С5 С6 С7

С1 1 0,6 0,2 0,8 0,9 0,9 0,8

С2 0,6 1 0,1 0,02 0,9 0,07 0,78

Сз 0,2 0,1 1 0,76 1 0,19 0,82

С4 0,8 0,02 0,76 1 0,77 0,07 0,61

С5 0,9 0,9 1 0,77 1 0,1 0,02

С6 0,9 0,07 0,19 0,07 0,1 1 0,79

С7 0,8 0,78 0,82 0,61 0,02 0,79 1

Рис. 2. Корреляционная матрица признаков Fig. 2. Sign correlation matrix

По матрице на рис. 1 можно построить нечеткий граф (рис. 3), причем соединим ребром вершины i и j, если р/у < 0,7 (т.е. признаки либо недостаточно сильно связаны, либо связь отсутствует). Примем вес ребра равным 0,5, если 0,5 < pj < 0,7; в противном случае вес ребра равен «1».

0,5 \ ^Л 1 7

Рис. 3. Нечеткий граф для матрицы на рис. 1 Fig. 3. Fuzzy graph of the matrix on fig. 1

Требуется разбить вершины на минимальное число кластеров, причем в один и тот же кластер могут попасть либо вершины, не связанные ребрами, либо связанные ребром с весом 0,5. В силу ранее сказанного из каждого кластера можно взять по одной вершине.

Модифицируем указанную задачу (1) нужным нам образом.

Определение 1. А. (Нечетким) независимым множеством нечеткого графа назовем любое множество его вершин, никакие две из которых не связаны четким ребром

(таким образом, допускается связь нечеткими ребрами).

Б. Ядром нечеткого независимого множества Y считаем подмножество его вершин Yc с Y, никакие две из которых не соединены нечетким ребром.

Определение 2. Пусть для нечеткого графа определены два независимых множества Y2. Говорим, что Y максимально предпочтительнее (м-предпочтительнее) Y2, если размер его ядра больше размера ядра

Определение 3. Нечеткое независимое множество Y называется м-максимальным, если оно имеет ядро максимального размера, а при условии равенства размеров ядер содержит наибольшее общее число вершин.

Целью настоящей статьи является отыскание м-максимального независимого множества нечеткого графа.

Так, для графа на рис. 2 одно из м-максимальных множеств суть {3; 4; 5}. Отметим, что есть и другие максимальные множества, например {1; 2; 7}, но последнее не является м-максимальным, так как содержит ребро с весом 0,5.

Для достижения цели мы привлекаем аппарат многозначных логик Я. Лукасевича. Будем интерпретировать понятие нечеткого ребра x¡ ¡ как отношение (формулу) с квантором возможности ◊xjj (читается «возможно, что вершины j и j связаны ребром»). Таким образом, начнем рассмотрение с «наиболее простого» случая — интерпретации задачи в терминах модальной логики. Будем использовать трехзначную логику Лу-касевича как модель для модальной логики с кванторами необходимости (□) и возможности (◊) [6; 8]. Формула x имеет значения val( x) = {0; 0,5; 1} в трехзначной логике Лукасевича, где 0 означает «невозможно», 0,5 — «неопределенно» и 1 - «необходимо». Далее принимаем □x о val(x) =1,

◊x о val(x) > 0,5, т.к. —◊x = □—x о val(x) = 0

с учетом того, что

val(0x) и val(-0x) с {0; 0,5; 1).

134

Том 10. № 2 (56). 2015

Отсюда можно непосредственно установить:

□true о val(true) =1 о true, □false о val(false) =1 о false, □0,5 о val (0,5) =1 о false, ◊true о val(true) > 0,5 о true, 0false o val(false) > 0,5 о false,

00,5 o val(0,5) > 0,5 o true.

Представленные выше соотношения между □x, Ox и формулами трехзначной логики Я. Лукасевича доказаны А. Тарским [8] и могут быть проверены непосредственно. Пусть a[m(a)] обозначает формулу, которая допускает только те интерпретации, в которых val(a) > ma. можно рассматривать как нечеткую степень истинности формулы а. Тогда

Ox = m(x) > 0,5,

□—y = m(—y) = 1.

Заменим трехзначные формулы двоичными векторными формулами, как предложено в [6], т.е.

x = (x1, x2), —x = (—1x2, —x.|), y = (y1, y2), —y = (—y2, —y 1). Для любой трехзначной формулы мы допускаем следующие векторные значения: (1, 1) - «истинно», (1, 0) - «неопределенно», (0, 0) - «ложно».

Замечание. Везде далее принимается недопустимость интерпретации а = (а1, а2) = = (0, 1) для любой формулы а.

Воспользуемся следующим соответствием между трехзначными формулами и их векторным представлением

x v y = (x V yvx2 V y2),

—x ^ (—, —

x & y = (x1 & y1,x2 & y2),

—y = (—y 2,—y 0,

x ^ y = —x V y = (—x2 V y1, —x1 V y2).

Допустимость указанных представлений легко проверяется на основании таблиц истинности для трехзначных операций, представленных ниже (табл. 1).

Таблица 1. Определение трехзначных логических операций

Table 1. Definition of the 3-valued logical

V 0 0,5 1

0 0 0,5 1

0,5 0,5 0,5 1

1 1 1 1

& 0 0,5 1

0 0 0 0

0,5 0 0,5 0,5

1 0 1/2 1

0 0,5 1

0 1 1 1

0,5 0,5 0,5 1

1 0 0,5 1

—1 0 0,5 1

1 0,5 0

Пусть x трехзначная (векторная формула) и у двухзначная пропозициональная переменная. Пропозициональная двухзначная переменная у может быть представлена как трехзначная формула, которая не допускает значение 0,5, т. е.

у = ( У1, У2 )& ( У1У2 V у 1 у2) = ( У1У2 , У1У2 ). Отсюда находим

x V у = V у1у2,X2 V у1у2), x & у = (x1& у1у2,X2& улу2), x ^ у = —x Vу = (^2 Vу1у2,^ V у1у2).

Аналогично для —у можно записать

-у = ( у 2 V "У 1, -у 2

Рассмотрим формулу с трехзначными переменными x, у:

0x V у. (2)

Можно последовательно переписать (2) в виде

т(х) > 0,5 V (у1, у2),

т(х) > 0,5 = (1, 0) V (1,1) = x1,

т(х) > 0,5 V (у1, у2) = V у1, X1 V у2).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Vol. 10. No. 2 (56). 2015

Для систематического использования формул вида

У(Уг V а), У(Уг л а), где

V представляет О или □ и г обозначает 3-значную формулу, тогда как а есть строгая булевская переменная с двумя возможными значениями 0 и 1, используем следующие соотношения

У (У г V а) = У(Уг) V а, У (У г л а) = У(Уг) л а.

Отсюда, например,

□ (Ох V —х2 —х1) = □ (Ох) V —х2 —х1 = □(х1) V

такой вид — рис. 4 (получается непосредственно на основании рис. 3).

'ч2 ^U <1 = <1

21 <1 = <i

Допустимость подобного представления основана на формуле Шеннона, где а, строгая булевская переменная:

У (г V а) = а л (У^ие) V —а л (Уг) = а V У г, У (г л а) = а л (Уг) V —а л (У false) = а л Уг.

Полезно запомнить следующие эквивалентности между формулами модальной и трехзначной логик:

х = х1 х2; Ох = х1, □х = □(х1, х2) = х1 х2 (4)

(последние две формулы предполагают, что х не содержит модальных кванторов). Для двоичных f, G, Н

(f • G,f • H) = (G,H) • f,

(5)

Di D2 D3 D4 D5 D6 D7

Di 0 0,5 1 0 0 0 0

D2 0,5 0 1 1 0 1 0

D3 1 1 0 0 0 1 0

D4 0 1 0 0 0 1 0.5

D5 0 0 0 0 0 1 1

D6 0 1 1 1 1 0 0

d7 0 0 0 0,5 1 0 0

Рис. 4. Матрица смежности нечеткого графа Fig. 4. Adjacency fuzzy graph matrix

Формулировку (1) теперь можно записать таким образом:

D1 + D2 + D3 + D4 + D5 + D6 + D7 ^ max

D v —D3, hD2 v —D3, D2 v—D4, -¡D2 v —D6,

"A v—D6,

D v— D6, D v— D6,

(6)

например, (х1х2, х1х2) = х1х2 • (1,1) = х1х2.

Приведенных сведений достаточно, чтобы приступить к решению задачи о м-мак-симальном независимом множестве (клике) нечеткого графа.

описание подхода к решению

Снова обратимся к постановке (1). Очевидным образом будет проще изложение строить на конкретном примере. Пусть матрица А смежности нечеткого графа имеет

—05 V —07,

0(—01 V —02),

0(—04 V —07).

Используя двоичную интерпретацию модальных формул, перепишем систему в «чистых» булевских переменных. Введем представления

0,. = (х, У;), ; = 1,7;

V-Ds = (-Уг, -хг) V (—У8, ^) =

= (-Уг V У3,-хг v-xs);

◊(-0г v-Ds) = 0(-Уг V -у3 , -хг v-Xs) =

= -Уг v-Уs.

Последняя формула получена с учетом (2), (4). Имеем

136

Том 10. № 2 (56). 2015

M ■ y1 + M ■ y2 + M ■ y3 + M ■ y 4 + + M ■ y5 + M ■ y6 + M ■ y7 + X1 + (7)

+ x2 + x3 + x4 + x5 + x6 + x7 ^ max

—У1 v-Уз. X1 v-^ —Уз v— У^ —X3 v—X6

—У2 v-Уз. —1X2 v—X^ —У 4 v—У 6, —X4 v—X

—У2 v—У 4, —1X2 v X4, —У5 v— У^ —* 5 v—X6

—У2 v-Уб. —1X2 v—^ —У5 v— У7, X5 v —x7

—Уз v—У^ —X3 v—P —У1 v—У2, У 4 v— y-

—^ v У1, — X2 v У2, —X3 v У з, —X4 v У4,

—*5 v У 5 , —X6 v У 6, X7 v У7.

Формулы

-x1 V y1, -x2 V y2, V Уз, -x4 V y4,

^5 V У5, V ye, -x7 V y7

записаны в силу сделанного выше Замечания. M — положительное число, превосходящее, например, удвоенное число вершин (М = 15). Целевая функция в (7) допускает нечеткие ребра, но обеспечивает максимальный размер ядра, а при равенстве размеров ядер — наибольший общий размер м-независимого множества. Задача сведена к известной задаче линейного булевского программирования и может быть решена, например, методом Балаша [9]. Так, используя пакет ПОИСК РЕШЕНИЯ в MS EXCEL, найдем м-независимое множество: {D3, D4, D5} (есть и иные варианты). Нечетких ребер нет.

Заключение

Приведенный подход можно обобщить на случай, когда степени (не) четкости отличны от 0,5. В этом случае следует использовать многозначную логику Лукасевича, позволяющую аппроксимировать нечеткие значения четкими с требуемой точностью. Подобная техника изложена в [6; 8] и здесь мы ее не рассматриваем. Таким образом, принципиально мы достигли следующего: «смоделировали» нечеткую задачу в терминах булевской двухзначной логики, сохранив при этом «эквивалентность» обеих логических систем. Техника приведения, использо-

ванная в статье, универсальна и может быть применена для произвольных нечетких мер.

Список литературы

1. Panos M. Pardalos, Jue Xue. The maximum clique problem // Journal of global optimization, vol. 4 (3), 1994, рр. 301-328.

2. Лифшиц Ю. Точные алгоритмы и открытые проблемы // Современные задачи теоретической информатики. URL: http://download.yandex.ru/class/ lifshits/lecture02.pdf.

3. Nair P. S. Cliques and fuzzy cliques in fuzzy graphs // IFSA World Congress and 20th NAFIPS International Conference (vol. 4). Vancouver, Canada, 25-28 July, 2001.

4. Sunitha M. S. Studies on Fuzzy graphs // Depart. of mathematics. Cochin university of Science and Technology. Cochin, India, 2001.

5. Anastasiou A. Fuzzy Mathematics: Approximation Theory. Springer, 2010-456p.

6. Герман О. В. Неклассические логические исчисления // Белорусский государственный университет информатики и радиоэлектроники. Минск, 2012. — 124с.

7. Дюран Б., Одел П. Кластерный анализ. М.: Статистика, 1977. — 128 с.

8. Ивин A. A. Модальные теории Я. Лукасевича // Институт философии РАН. М., 2001. — 176 с.

9. Герман О. В., Самко А. Р., Герман Ю. О. Система вывода для нечеткой логики на основе многозначных исчислений Лукасевича // Труды Белорусского технологического университета // Физико-математические науки и информатика. Минск, 2010, VI, № XVIII. С. 190-193.

References

1. Panos M. Pardalos, Jue Xue. The maximum clique problem. Journal of global optimization, 1994, vol. 4 (3), pр. 301-328.

2. Lifshiz Yu. Tochniye algoritmy i otkrytie problemy [Exact algorithms and open problems]. Contemporary problems in theoretical informatics. URL: http:// download.yandex.ru/class/lifshits/lecture02.pdf (in Russian).

3. Nair P. S. Cliques and fuzzy cliques in fuzzy graphs. IFSA World Congress and 20th NAFIPS International Conference (vol. 4). Vancouver, Canada, 25-28 July, 2001.

Vol. 10. No. 2 (56). 2015

4. Sunitha M. S. Studies on Fuzzy graph. Depart. of mathematics. Cochin university of Science and Technology. Cochin, India, 2001.

5. Anastasiou A. Fuzzy Mathematics: Approximation Theory. Springer, 2010. 456 p.

6. German O. V. Neclassicheskiye logicheskiye is-chisleniya [Non-classical logical calculi]. Belarus-sian State university of informatics and radio-electronics, Minsk, 2012. 124 p.

7. Duran B., Odell P. Klasterniy analys. Obzor [Cluster analysis. Survey]. Moscow, Statistics Publ. 1977. 128 p. (in Russian).

8. Ivin A. A. Modalnie teorii Y. Lukasiewicha [Modal theories of I. Lukasiewicz]. Institute of Philosophy of the Russian Academy of Science. Moscow, 2001. 176 p.

9. German O. V., Samko A. R., German Yu. O. Sys-tema nechetkogo logicheskogo vivoda na base mnogoznachnyh ischisleniy Lukasiewicha [A fuzzy logic inference system on the basis of multi-valued Lukasiewicz calculi]. Proceedings of the Belarus-sian State Technological university. Minsk, Physics, mathematics and informatics, 2010, VI, no. XVIII, pp. 190-193

Yu. German, Belarussian National Technical University, Minsk, Belarus, [email protected]

O. German, Belarussian State University of Informatics and Radioelectronics, Minsk, Belarus, [email protected]

Search for the maximum-size independent set in a fuzzy graph

An original approach to find a maximum-size independent set in a fuzzy graph is presented together with the necessary formalization technique. The approach is oriented at practical usage in applied artificial intelligent systems using fuzzy logic and modal logic concepts. The problem may be encountered in face recognition with some possible distortions. The vertices stand for the points in the face image with approximately similar color and brightness. Obviously, in the case of image distortion the arcs in the graph may be assigned with the values in 0,1-diapason. A fuzzy graph contains some nodes (arcs) with indefinite measure of their belonging to the graph. The situation may appear when no constrict classifying rules exist as explained in the paper. One can use a measure of 0.5 to interpret indefiniteness. This an interpretation enables one to apply modal logic for problem formalization and solving. The modality of the type «possible» is interpreted by the 3-valued formula with truth value not less than 0.5; the modality of the type «necessary» is interpreted by the 3-valued formula with the truth value equal to 1. The approach represented in the paper may be interesting for the researchers engaged in the recognition and classifying problems. About authors:

Yu. German, Assistant, Belarussian National Technical University

O. German, PhD in Technique, Associate Professor, Belarussian State University of Informatics and

Radioelectronics

For citation:

German Yu., German O. V. Search for the maximum-size independent set in a fuzzy graph. Prikladnaya informatika — Journal of Applied Informatics, 2015, vol. 10, no. 2 (56), pp. 132-138 (in Russian).

138 i

i Надоели баннеры? Вы всегда можете отключить рекламу.