Научная статья на тему 'Построение оптимального геометрического образа неориентированного графа'

Построение оптимального геометрического образа неориентированного графа Текст научной статьи по специальности «Математика»

CC BY
150
19
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Пинчук Вячеслав Павлович

Введено понятие геометрического образа графа в n-мерном евклидовом пространстве (R^v -представление). Сформулирован критерий оптимальности R^v -представления графа, на основе понятия функции взаимодействия вершин графа построена соответствующая целевая функция. Предложен алгоритм оптимизации R^v -представления графа, изучены его свойства. На основе предложенного алгоритма создана программа, позволяющая получать оптимальные 2D и 3D-изображения графа. Показано, что для графов, число вершин которых не превышает 30, получаемые изображения позволяют визуально распознавать их изоморфность и устанавливать различные структурные свойства.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Пинчук Вячеслав Павлович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The concept of a geometric image of a graph in n-dimensional Euclid space (R^v -representation) is given. The criterion of an optimality of R^v-representation of a graph is formulated, on base of concepts of vertices interaction function of a graph the appropriate criterion function is constructed. The algorithm of optimization of R^v-representation of a graph is proposed, and its properties were investigated. On base of offered algorithm the program permitting to get optimum 2D and a 3D-images of a graph is created. Is shown, that for graphs, with number of vertices does not exceed 30, the obtained images allow visually to recognize them isomorphism and to discover various structural properties.

Текст научной работы на тему «Построение оптимального геометрического образа неориентированного графа»

Д.М.Пиза, C.B. Морщавка, Ю.В. Скоробогатов: ВЫБОР ЭФФЕКТИВНОГО МЕТОДА РАСПОЗНАВАНИЯ РАСТЕНИЙ ПО КОЭФФИЦИЕНТАМ

t -1

rk(x) = (x - mk) ■ Ck ■ (x - mk), k = 1...C , -1

(4)

где Ск - обращенная ковариационная матрица для

класса к. Структурная схема классификатора изображена на рис.3. Такой классификатор обладает рядом достоинств, по сравнению с линейным. Во-первых, он автоматически масштабирует признаки. Во-вторых, он учитывает корреляцию между разными признаками. И, в-третьих, он позволяет формировать как линейные, так и квадратичные решающие границы. К его недостаткам можно отнести относительную сложность аппаратной реализации, а также необходимость использования значительно большего количества обучающих выборок для хорошей определенности обращенной ковариационной матрицы

(желательно больше и2). Если количество таких выборок меньше количества используемых признаков и , то ковариационная матрица вырождается и найти обращенную к ней невозможно.

gk( x ) = wk ■ х + wk 0,

где:

wk = C

wk0 = -0' 5

t

mk ■ C

1

k

Рисунок 3 - Классификатор с использованием метрики Махаланобиса

Однако если допустить, что ковариационные матрицы для всех классов одинаковые, то вычисления можно существенно упростить. В этом случае после несложных преобразований получается дискриминантная функция в виде:

г

(5)

(6) (7)

Рисунок 4 - Упрощенный классификатор с использованием метрики Махаланобиса

Описанные выше четыре схемы реализации классификатора исследовались с целью нахождения оптимального по скорости и качеству варианта для разделения растений на культурные и сорные.

Результаты исследований. Для оценки эффективности работы каждого из выше перечисленных классификаторов применялись, полученные

экспериментально, КСЯ различных растений в видимом и ближнем инфракрасном диапазоне. В качестве объектов для исследования использовались: культурные растения - кукуруза, подсолнечник, сахарная свекла; сорняки - амарант, мышей, пырей, осот, лебеда, молочай, молочай ложный. В ходе экспериментов методом дистанционного зондирования были получены характеристики отражения этих растений. Для каждого вида растения проводилось 12 опытов, соответствующих различным образцам и различной ориентации относительно объектива экспериментальной установки. Основной узел установки - монохроматор, входящий в фотоэлектрический спектрофотометр "8ресо1",

обеспечивал излучение сигнала полосой 12нм в диапазоне 310...850нм с шагом в 1нм. Для каждого образца снималось 55 спектральных точек в этом диапазоне с шагом 10нм.

Так как информация об КСЯ содержится не в абсолютных значениях коэффициента отражения р(А,) , а в его изменении относительно длины волны, то потребовалась предварительная обработка

характеристик, полученных в результате экспериментов. Такая обработка заключалась в нормировании:

KL(X) = ,

(8)

Структурная схема такого классификатора (рис.4), аналогична линейному, используется такое же количество операций и требуется такой же объем памяти.

где К^(Х) - коэффициент яркости; р - усредненный

по длине волны коэффициент отражения. Так как в ходе каждого опыта оставались неизменными все параметры (кроме длины волны), от которых зависит яркость объекта изучения, то данный коэффициент яркости

m

k

соответствует КСЯ с точностью до постоянного множителя.

Для выбора наиболее эффективного из четырех предложенных классификаторов было проведено разделение на два класса 120 ранее экспериментально полученных выборок. Так как количество выборок ограничено, то для оценки вероятностей правильного распознавания использовался метод скользящего экзамена [5]. Суть этого метода заключается в том, что каждый раз при обучении одно из измерений опускается и используется только для тестирования, а все остальные используются для обучения классификатора. Вероятность правильного распознавания в этом случае оценивалась как отношение количества правильно распознанных выборок класса k к общему количеству выборок, относящихся к этому классу.

Определение наилучшего набора, состоящего из одного, двух, трех признаков проводилось методом исчерпывающего перебора. Его применение в этом случае оправдано, так как все алгоритмы частичного перебора обеспечивают субоптимальный поиск, а значит, не гарантируют нахождения наилучшего набора признаков, а всего лишь дают возможность найти лучший набор из рассмотренных. Поэтому использование этих алгоритмов при небольшом количестве отбираемых признаков не целесообразно, так как показатели распознавания при их применении могут только ухудшиться.

Результаты испытания предложенных

классификаторов сгруппированы в таблицу 1. Приведенное здесь время расчета является относительным показателем и соответствует времени классификации одной выборки программой в среде Mathcad 7 на компьютере Pentium с процессором AMD, работающем на частоте 75 МГц.

Как видно из полученных данных, наилучшие показатели распознавания обеспечиваются при использовании трех признаков и классификатора по минимуму расстояния Махаланобиса (с

различающимися ковариационными матрицами). Наибольшую скорость обеспечивает линейный дискриминатор. Но самым оптимальным вариантом является использование классификатора по минимуму расстояния Махаланобиса (с одной ковариационной матрицей) и трех признаков. Он сочетает в себе, как высокую скорость обработки, так и высокие вероятности распознавания.

Таблица 1. Показатели качества распознавания для исследуемых классификаторов

Вид дискриминан-тной функции Кол-во признаков Максимальная вероятность правильного распознавания Время расчета, мс

культурных растений сорных растений

Минимум евклидового расстояния 1 0.833 0.786 4

2 0.9444 0.845 8

3 0.9444 0.857 12

Минимум стандартизованного расстояния 1 0.833 0.810 8

2 0.889 0.917 15

3 0.889 0.952 23

Минимум расстояния Махаланоби-са при различных ковариационных матрицах для разных классов 1 0.833 0.810 9

2 0.944 0.964 28

3 0.972 0.976 55

Минимум расстояния Махаланоби- са при одинаковых ковариационных матрицах для разных классов 1 0.833 0.786 4

2 1.000 0.881 9

3 1.000 0.917 13

ВЫВОДЫ.

Было показано, что использование простых метрик в классификаторах по минимуму расстояния не позволяет достичь максимальных вероятностей правильного распознавания. Это происходит из-за того, что в этом случае не учитываются статистические характеристики второго и выше порядков. С другой стороны полный учет этих характеристик значительно уменьшает скорость обработки. Поэтому было предложено для

В.П. Пинчук: ПОСТРОЕНИЕ ОПТИМАЛЬНОГО ГЕОМЕТРИЧЕСКОГО ОБРАЗА НЕОРИЕНТИРОВАННОГО ГРАФА

классификации растений по минимуму расстояния использовать метрику Махаланобиса, но при этом использовать общую для культурных и сорных растений ковариационную матрицу. Оптимальные показатели качества распознавания для такого классификатора достигаются при использовании трех спектральных признаков.

ПЕРЕЧЕНЬ ССЫЛОК

1. Заявка на патент №94010291 (Украина). МКИ А01 В 39/18.

Способ прополки пропашных культур и устройство для его

осуществления/ Пиза Д.М., Пиза А.Д., Татарчук И.Н.-Заявл. 17.12.92 г.

2. Рачкулик В.И., Ситникова М.В. Отражательные свойства и состояние растительного покрова.- Л: Гидрометеоиздат, 1981.-287с.

3. Разработка научных основ создания комплекса машин для принципиально новой экологически чистой технологии обработки пропашных культур: Отчет о НИР (заключит.)/ Запорожский государственный технический университет (ЗГТУ); Руководитель Д.М. Пиза., Запорожье,1996.-45с.: ил.-Отв. исполн. С.В.Морщавка, В.П.Дмитренко.

4. Дуда Р., Харт П. Распознавание образов и анализ сцен. -М.: Мир, 1976., 326 с.

5. Абрамович Н.С., Ковалев А.А., Плюта В.Е. К вопросу о классификации природных образований по их оптическим характеристикам при малых объемах выборок. - Исслед. Земли из космоса, №4, 1985, с. 105-111.

УДК 519.17+681.3.06

ПОСТРОЕНИЕ ОПТИМАЛЬНОГО ГЕОМЕТРИЧЕСКОГО ОБРАЗА НЕОРИЕНТИРОВАННОГО ГРАФА

В.П. Пинчук

Введено понятие геометрического образа графа в n-мерном

евклидовом пространстве (R -представление). Сформулирован

v

критерий оптимальности R -представления графа, на основе понятия функции взаимодействия вершин графа построена соответствующая целевая функция. Предложен алгоритм v

оптимизации R -представления графа, изучены его свойства. На основе предложенного алгоритма создана программа, позволяющая получать оптимальные 2D и 3П-изображения графа. Показано, что для графов, число вершин которых не превышает 30, получаемые изображения позволяют визуально распознавать их изоморфность и устанавливать различные структурные свойства.

Упроваджено поняття геометричного образу графу у n-

вим1рному евкл1довому простор (R -зображення).

v

Сформульовано критерий оптимальност{ R -зображення графу, на основ1 поняття функцИ взаемодИ вершин графу побудована в1дпов1дна цыьова функщя. Запропоновано алгоритм v

оптим{заци R -зображення графу, досл{джет його властивост1. На основ1 запропонованого алгоритму створена програма, яка дозволяе отримувати оптимальт 2D i 3D-зображення графу. Показано, що для графiв, число вершин яких не перевищуе 30, зображення, що отримуються, дозволяють вiзуально утзнавати ¿х iзоморфнiсть i встановлювати ¿х рiзнi структурш властивостi.

The concept of a geometric image of a graph in n-dimensional Euclid space (R -representation) is given. The criterion of an opti-

mality of RV -representation of a graph is formulated, on base of concepts of vertices interaction function of a graph the appropriate criterion function is constructed. The algorithm of optimization of

RV -representation of a graph is proposed, and its properties were investigated. On base of offered algorithm the program permitting to get optimum 2D and a 3D-images of a graph is created. Is

shown, that for graphs, with number of vertices does not exceed 30, the obtained images allow visually to recognize them isomorphism and to discover various structural properties.

1. ВВЕДЕНИЕ.

В развитии и применении теории, методов и алгоритмов обработки структурной информации важную роль играют формы и способы ее представления, среди которых особую роль играют визуальные. Основным способом представления структурной информации являются графы. Проблема визуализации графа важна потому, что сам по себе граф является достаточно абстрактным математическим понятием и весьма желательным является наличие простых средств, позволяющих "увидеть" особенности его внутреннего устройства или установить некоторые структурные отношения двух заданных графов. С другой стороны известно, что некоторые трудные проблемы теории графов непосредственно сводятся к построению стандартного способа представления графа. Примером может служить т.н. проблема канонизации: если бы удалось построить некоторое эффективно вычислимое представление не конкретного заданного графа, а его класса изоморфной эквивалентности (представление непомеченного графа), это решило бы известную проблему изоморфизма и еще ряд связанных с ней проблем.

В настоящей работе сделана попытка построения геометрического представления графа,

удовлетворяющего следующим требованиям:

- быть наглядным и удобным для практической работы с графами, в том числе для публикаций и обмена

информацией;

- быть единым для всех графов, входящих в соответствующий класс изоморфной эквивалентности.

2. ОПТИМАЛЬНЫЙ ГЕОМЕТРИЧЕСКИЙ ОБРАЗ ГРАФА

Будем рассматривать неориентированные графы без петель и кратных ребер. Под графом, как обычно, будем понимать пару (V, а) , где V - некоторое непустое множество, а - заданное на нем бинарное отношение. Следуя идее, сформулированной автором в работе [1], определим понятие геометрического образа графа следующим образом.

Пусть О - неориентированный, без петель и кратных ребер п-вершинный граф. Геометрическим образом или И-представлением графа О в декартовом пространстве Ип , будем называть набор векторов Я = {р^ р2, ..., ри} ,

„V . , .

р. е Я , г = 1 ...и , где р. - радиус-вектор 1-той вершины

графа в пространстве ЯУ. Введем понятие энергии взаимодействия вершин графа, которую будем описывать парой числовых функций вида ф8(р) , где р

есть расстояние между 1-той и ]-той вершинами в

пространстве Я

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

- р/1

V

I (рк-

(1)

к = 1

Индекс 8, принимающий значения 0,1 учитывает отношение смежности указанных вершин.

Энергию 1-той вершины определим как сумму:

и

^(Рг) = 1{(1 - ^)Ф0(|Рг - Ру|) + / (|Рг - Ру|)} , (2)

/ = 1

где - элемент матрицы смежности графа. Величину

^(Р,)

можно представлять

себе

как энергию

взаимодействия 1-той вершины со всеми остальными, включая и взаимодействие вершины с собой.

Энергию графа в И-представлении положим равной сумме энергий всех вершин графа:

Ф(Я) = I ¥(р.)

1

3. АЛГОРИТМ ОПТИМИЗАЦИИ

Особенностью сформулированной выше задачи оптимизации является большое число варьируемых параметров, равное V- и . В связи с большим порядком задачи и нелинейным ее характером стандартные методы ее численного решения оказываются

малоэффективными.

В то же время, эффективную процедуру решения задачи можно построить, если использовать идею групповой градиентной релаксации, описание которой приводится ниже.

Пусть имеем некоторый геометрический образ

Я = {р 1, р2, ..., ри} графа О в пространстве ЯУ . И пусть

Я = {р 1, ..., р.*, ..., ри} другой геометрический образ этого же графа, полученный путем перемещения 1-той вершины из точки р. в точку р.* . Покажем, что из определения целевой функции Ф(И) следует:

V. = 17и : ^(р.*) < ^(р.) ^ Ф(Я*) < Ф(Я) . (4)

Рассмотрим симметричную матрицу А = {а/ , элементы которой равны

а.к =(1 - 8.к)ф 0(|р. - Р/)+8гкФ1 (|Р,- - р/к). (5)

Величина ) равна сумме элементов 1-той строки

(или 1-того столбца), а Ф(И) - сумме всех элементов матрицы А. Особенностью ее является то, что при изменении положения 1-той вершины графа изменяются значения только тех элементов матрицы, которые принадлежат 1-той строке или 1-тому столбцу. Переместим 1-тую вершину из точки р. в точку р.* ,

тогда условие ^р.*) < ¥(р.) означает, что сумма

элементов матрицы А, принадлежащих 1-той строке или 1-тому столбцу уменьшилась, в то время как сумма остальных ее элементов не изменилась. Отсюда следует справедливость (4).

Групповой градиент от функции Ф(И) определим как результат действия на нее вектор-производной следующего вида:

V =

(3)

.Э^! д Х2

д Х,

(6)

где Хк - к-тая компонента радиус-вектора 1-той

вершины. Основной итерационный цикл описываемого алгоритма базируется на следующем.

Пусть имеется непрерывная и достаточно гладкая

функция вида Ф(г^ ..., ги) , где е ЯУ , и пусть для

заданных значений г^ ..., ги и заданного 1 выполнено

Ф 0 . Обозначим

Будем считать И-представление графа оптимальным,

если значение соответствующей ему энергии (3)

минимально на множестве всех возможных И-

представлений при заданной размерности пространства

V. Таким образом, проблема канонизации

геометрического представления графа сводится к задаче классической оптимизации с целевой функцией вида

(2,3) .

и

i Надоели баннеры? Вы всегда можете отключить рекламу.