Научная статья на тему 'Метод определения сходства структур графов на основе выделения частичного изоморфизма в задачах геоинформатики'

Метод определения сходства структур графов на основе выделения частичного изоморфизма в задачах геоинформатики Текст научной статьи по специальности «Математика»

CC BY
1052
205
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СХОДСТВО СТРУКТУР ГРАФОВ / ЧАСТИЧНЫЙ ИЗОМОРФИЗМ / ПОДСТАНОВКА СХОДСТВА / ДИФФЕРЕНЦИАЦИЯ ВЕРШИН / ОДНОРОДНЫЕ ГРУППЫ ВЕРШИН / GRAPH STRUCTURE SIMILARITY / PARTIAL ISOMORPHISM / SIMILARITY SUBSTITUTION / VERTICES DIFFERENTIATION / HOMOGENEOUS GROUPS OF VERTICES

Аннотация научной статьи по математике, автор научной работы — Погребной Андрей Владимирович

Актуальность работы обусловлена тем, что исследования по проблемам сходства структур ограничиваются применением косвенных признаков оценивания сходства. Необходимы эффективные алгоритмы определения сходства структур графов на основе прямых признаков в категориях изоморфизма. Такие алгоритмы могут применяться, например, для сжатия данных при работе геоинформационных систем и систем экологического мониторинга с векторными картами, для распознавания образов и в других приложениях. Исследования по применению прямых признаков для оценивания сходства на основе совмещения сравниваемых графов и выделения в них общих частей в виде изоморфных подграфов, названных частичными изоморфизмами, практически отсутствуют. Считается, что задача определения частичного изоморфизма без полного перебора подстановок сходства не может быть решена. Поэтому актуальными являются исследования по поиску приемлемых решений данной задачи при ограниченном переборе подстановок сходства. Цель исследования заключается в разработке метода определения сходства структур графов путём выделения в них наибольшей общей части, т. е. наибольшего частичного изоморфизма. Методы исследования основаны на применении прикладной теории графов, теории оптимизации и разработки алгоритмов, моделирования структуры графов сетью автоматов с целью дифференциации вершин. Результаты. Введены основные понятия и сформулированы положения концепции оценивания сходства структур графов на основе совмещения вершин и выделения общих подграфов частичных изоморфизмов. Для сокращения переборов при решении проблемы определения наибольшего частичного изоморфизма предложено использовать идеи метода дифференциации вершин с помощью моделирования структур графов на основе сетей автоматов. Разработан метод взаимозависимой дифференциации вершин в сравниваемых графах, который позволяет формировать подстановку сходства и соответствующий частичный изоморфизм, а также алгоритм поиска подстановок сходства, локализованных относительно определенных пар вершин, и алгоритм выделения подстановки с наибольшим частичным изоморфизмом. Работа алгоритма поиска подстановки сходства на основе взаимозависимой дифференциации вершин показана на примере определения сходства двух графов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The urgency of the discussed issue is caused by the fact, that known approaches for the structures similarity estimation are limited by using a set of indirect properties. Effective similarity estimation algorithms on the basis of direct properties are necessary. Such algorithms can be applied for data compression in geographic information systems and systems of ecological monitoring if they are represented on vector map, or for pattern recognition and many other applications. Research of application of direct properties for similarity estimation on the basis of the combination of compared graphs and selecting equal parts as isomorphic subgraphs are almost absent. The problem of determining the partial isomorphism without exhaustive search permutations of similarity is considered unsolvable. Therefore researches of finding acceptable algorithms for solving this problem with limited count of permutations are relevant. The main aim of the study is to develop a method for determining the graphs structure similarity by selecting the highest common parts, i.e. highest partial isomorphism. The methods used in the study are based on the applied graph theory, theory of optimization and efficient algorithms development, modeling structures using automata models for vertices differentiation. The results. Introduced basic concepts and formulated provisions of the concept of the graphs structure similarity estimation based on a combination of vertices and selection of equal subgraphs partial isomorphism. Ideas of the vertices differentiation method are suggested to be used for reducing algorithm complexity. The method of the interdependent vertices differentiation is developed, which allows to form the similarity substitution and partial isomorphism. The algorithm of searching the similarity substitutions, relative to pair of vertices, and the algorithm of selection of substitution with highest partial isomorphism are developed. The algorithm of searching similarity substitution on the basis of the interdependent vertices differentiation is shown at the example of two graphs similarity estimation.

Текст научной работы на тему «Метод определения сходства структур графов на основе выделения частичного изоморфизма в задачах геоинформатики»

УДК 519.171.1

МЕТОД ОПРЕДЕЛЕНИЯ СХОДСТВА СТРУКТУР ГРАФОВ НА ОСНОВЕ ВЫДЕЛЕНИЯ ЧАСТИЧНОГО ИЗОМОРФИЗМА В ЗАДАЧАХ ГЕОИНФОРМАТИКИ

Погребной Андрей Владимирович,

аспирант кафедры информатики и проектирования систем Института кибернетики Национального исследовательского Томского политехнического университета, Россия, 634050, г. Томск, пр. Ленина, 30. E-mail: [email protected]

Актуальность работы обусловлена тем, что исследования по проблемам сходства структур ограничиваются применением косвенных признаков оценивания сходства. Необходимы эффективные алгоритмы определения сходства структур графов на основе прямых признаков в категориях изоморфизма. Такие алгоритмы могут применяться, например, для сжатия данных при работе геоинформационных систем и систем экологического мониторинга с векторными картами, для распознавания образов и в других приложениях. Исследования по применению прямых признаков для оценивания сходства на основе совмещения сравниваемых графов и выделения в них общих частей в виде изоморфных подграфов, названных частичными изоморфизмами, практически отсутствуют. Считается, что задача определения частичного изоморфизма без полного перебора подстановок сходства не может быть решена. Поэтому актуальными являются исследования по поиску приемлемых решений данной задачи при ограниченном переборе подстановок сходства.

Цель исследования заключается в разработке метода определения сходства структур графов путём выделения в них наибольшей общей части, т. е. наибольшего частичного изоморфизма.

Методы исследования основаны на применении прикладной теории графов, теории оптимизации и разработки алгоритмов, моделирования структуры графов сетью автоматов с целью дифференциации вершин.

Результаты. Введены основные понятия и сформулированы положения концепции оценивания сходства структур графов на основе совмещения вершин и выделения общих подграфов - частичных изоморфизмов. Для сокращения переборов при решении проблемы определения наибольшего частичного изоморфизма предложено использовать идеи метода дифференциации вершин с помощью моделирования структур графов на основе сетей автоматов. Разработан метод взаимозависимой дифференциации вершин в сравниваемых графах, который позволяет формировать подстановку сходства и соответствующий частичный изоморфизм, а также алгоритм поиска подстановок сходства, локализованных относительно определенных пар вершин, и алгоритм выделения подстановки с наибольшим частичным изоморфизмом. Работа алгоритма поиска подстановки сходства на основе взаимозависимой дифференциации вершин показана на примере определения сходства двух графов.

Ключевые слова:

Сходство структур графов, частичный изоморфизм, подстановка сходства, дифференциация вершин, однородные группы вершин.

Введение

Задачи исследования свойств объектов на основе анализа их структурных характеристик составляют одно из наиболее важных и перспективных направлений развития прикладной теории графов. Графовыми моделями представляются структуры объектов самой разной природы. Это могут быть сетевые структуры энергосистем, нефтепроводов, газопроводов, систем транспорта [1-4], экологического мониторинга [5], геоинформационных систем [6], структур баз данных и программных систем [7, 8], систем распознавания образов [9], систем связи, компьютерных сетей [10], радиоэлектронных схем [11] и многих других объектов. Опережающее развитие в этих исследованиях получило моделирование зависимостей «структура-свойство», особенно для молекулярных структур в химии и биологии [12, 13]. Здесь широко используются молекулярные дескрипторы, представляющие инварианты молекулярного графа химического соединения [14].

Среди перечисленных объектов выделяются геоинформационные системы и системы экологического мониторинга, функционирование которых сопровождается большими объёмами обработки и передачи данных. Покажем на этих примерах возможность применения методов анализа структур

данных и, в частности, задачи оценивания сходства структур для сжатия данных и снижения времени передачи. С этой целью пространственная модель геоинформации в виде векторной карты представляется графовой моделью, где вершинами являются элементы векторной карты, а рёбра соответствуют топологическим отношениям между ними.

Графовая модель векторной карты разбивается на части, например квадраты. После попарного оценивания сходства графовых моделей каждого квадрата на основе полученных оценок сходства квадраты группируются в кластеры. В каждом кластере выделяется эталонная графовая модель, имеющая наибольшее сходство с другими объектами в кластере. В этом случае при передаче данных полностью передаются только эталоны кластеров, а для остальных квадратов - их отличия от эталона. Если, например, векторная карта разбита на 100 квадратов и сформировано 10 кластеров со средним сходством 80 %, то объём передаваемых данных сокращается примерно в три раза.

В пространственно-временных системах, построенных на основе сенсорных сетей, сбор данных и отображение на векторную карту осуществляется с датчиков сети. Такие системы применяются, например, для наблюдения за лесными пожарами, нефтяными пятнами, гидрологическими объекта-

ми. В этом случае тематическая информация, представленная на векторной карте, также может быть преобразована в графовую модель. Оценивая сходство структур графовых моделей через определенные промежутки времени, можно наблюдать и оценивать динамику изменений анализируемых явлений.

В комплексе исследований по решению задач в приведенных примерах систем предлагаемая статья содержит исследования для разработки метода решения задачи оценивания сходства структур обыкновенных графов. Для графовых моделей, где вершинам и рёбрам приписываются атрибуты, которые отражают, в частности, тематические особенности элементов векторной карты и их отношений, решение задачи оценивания сходства упрощается. Наличие эффективных алгоритмов оценивания сходства структур графовых моделей является основой для успешного решения задач сжатия данных и, соответственно, снижения времени передачи в системах, работающих с векторными картами.

В составе математических инструментов, разрабатываемых для анализа структурных свойств объектов и установления зависимостей «структура-свойство», методы оценивания сходства структур также занимают важное место. Среди задач анализа структур графов проблема определения сходства в виде количественной меры изоморфизма является наиболее сложной. В практических приложениях часто оказывается важнее оценить сходство структур, чем получить однозначный ответ по результатам проверки на изоморфизм, т. е. установить наличие или отсутствие полного сходства. Сюда же относится получение инвариантного описателя структуры и вычисление для него полного инварианта, по которым легко устанавливается изоморфизм графов.

Теперь уже можно констатировать, что проблема получения инвариантного описателя структуры, вычисления полного инварианта и проверки на изоморфизм успешно решена [15, 16]. Что касается сходства структур, оцениваемого частичным изоморфизмом, то заметных продвижений в решении этой проблемы не происходит. Основные исследования по проблемам сходства сосредоточены на разработке методов опосредованного оценивания сходства структур на основе сопоставления инвариантов, различных дескрипторов [17-19].

Это направление исследований получило большое развитие и практическое применение в компьютерной химии [20-23].

Известные подходы к определению сходства структур ограничиваются сравнением косвенных признаков и не рассматривают возможности применения прямых признаков, связанных с изоморфизмом. В данной статье проблема определения сходства рассматривается как выделение в сравниваемых графах О и Н максимальной общей части -графа Q. Для решения проблемы в такой формулировке необходимо перебрать все возможные подстановки вершин графов О и Н и в каждой из них определить число совместившихся рёбер, образующих общую часть. Подстановку с наибольшим числом рёбер шя в общей части Q, по аналогии с подстановкой изоморфизма, будем именовать подстановкой сходства. Если графы О и Н изоморфны, то для них подстановки сходства будут совпадать с подстановками изоморфизма.

Подстановка сходства с числом рёбер в общей части Q, в отличие от опосредованного оценивания с косвенными оценками сходства, оценивает сходство структур графов О и Н в явном виде. На рис. 1 приведён пример графов О и Н и подстановка сходства, порождающая общую часть в виде графа Q.

Общая часть в виде графа Q в графах О и Н выделена жирными рёбрами. Справа на рис. 1 показан граф Q, вершины которого соответствуют парам номеров из подстановки сходства. Первый номер в парах подстановки указывает вершину из графа О, а второй - из графа Н.

Говорить о преимуществах косвенной или явной оценок сходства нет оснований, т. к. предпочтения по их применению определяются целями анализа сходства структур. Отметим лишь, что проблема вычисления явной оценки сходства структур является сложной и относится к нереша-емым задачам. Метод выделения частичного подграфа в сравниваемых графах, предложенный в работе [24], имеет ограниченные возможности и способен сравнивать графы только с равными степенными инвариантами. Ниже предлагаются результаты исследований, направленные на разработку метода вычисления явной оценки сходства графов, которые могут содержать равные и неравные числа вершин и рёбер.

G

H

4 3 4

Рис. 1. Пример подстановки сходства Fig. 1. Example of the similarity substitution

Q

(2, 4)

(4, 1)

(1, 3)

(3, 5)

(5, 2)

1

1

5

2

5

2

3

Подстановки сходства и их оценивание

Проблему сходства будем рассматривать для двух обыкновенных графов: 0=(Ев,йв), Ев={е}, ¿=1>2,...,яе, ив={(е!1,е!г)}, и Н=(Ен,ин),

Ен={е,}, 7=1,2,...,Пн, ин={(еь,ек)}, Ц рНг^н. Будем также считать, что для сравниваемых графов в и Н соблюдается условие пв<пн. На соотношения величин тв и тн ограничения не накладываются. Предполагается, что графы в и н являются связными. При этом граф в, сформированный для подстановки сходства, может быть как связным, так и несвязным. Принимается также, что пя=пв, т. е. граф в общей части может содержать одну или несколько компонент связности, в том числе и изолированные вершины.

Решение задачи определения сходства графов в и н заключается в формировании всех подстановок сходства и выбора среди них такой подстановки, которая соответствует общей части в с наибольшим значением тя. Число перебираемых подстановок сходства при пв=пн составляет пв!, а при пв<пн увеличивается на число сочетаний из пн по пв. Для графов, содержащих более 15-20 вершин, выполнить такие переборы уже невозможно. Поэтому основные исследования при разработке метода будут направлены на сокращение перебираемых подстановок.

Величина тя, равная числу рёбер в общей части < , применима при сравнении подстановок сходства. Для оценивания сходства графов в и н нужна другая оценка, учитывающая параметры сравниваемых графов. Если графы в и н имеют равные степенные инварианты, т. е. пв=пн и тв=тн, то оценку сходства ¡¡в, н) можно определить отношением тя/тв [24]. В нашем случае, когда на параметры пв, пн и тв, тн не накладывается требование равенства, в качестве оценки сходства ¡(в,н) предлагается следующее отношение:

¡(О, Н) = (тв / пв)/тах(тО / пО, тн / пн). (1)

Величины тв/пв и тн/пн в выражении (1) определяют средние значения степеней вершин в графах в и н. Учитывая, что пя=пв, величина тя/тв также равна среднему значению степеней вершин графа в. Очевидно, что эта величина не может превысить значение тв/пв, в то время как значение тн/пн может быть превышено.

Такая ситуация вполне допустима, если (тв/пв)>(тн/пн) и при этом на множестве вершин ЕясЕн, заданном подстановкой сходства, расположен подграф вня с числом рёбер тня>тя. В этом случае, согласно (1), мы можем получить ¡¡(вн)^. Таким образом, при (тв/пв)>(тн/пн) возможно (тя/пв)>(тн/пн), что противоречит понятию оценки сходства как доли совпадения графов. Данное противоречие устраняется, если в выражении (1) величину тн/пн заменить на тня/пв. Тогда (1) запишется в следующем виде:

¡¡(О,Н) = т< /тах(тО, тнв). (2)

Заметим, что в выражении (2) граф н представлен только подграфом вня. Согласно (2) ¡(в,н)=1, если тя=тв=тня.

При оценивании сходства могут учитываться и другие факторы. Например, если при пн>пв в графе н удаётся выделить несколько подстановок сходства с наибольшими значениями тя, то это может расцениваться как увеличение сходства. Учёт подобных факторов при оценивании сходства не вызывает больших трудностей и может осуществляться исходя из целей анализа сходства в конкретных приложениях. Таким образом, для оценивания сходства структур графов на основе подстановок сходства могут использоваться различные оценки явного типа. При разработке методов анализа сходства на основе таких оценок важно научиться ограничивать перебор при выделении подстановок сходства.

Основные положения метода выделения

частичного изоморфизма

Сравнивая протекание процессов свободной и зависимой дифференциации вершин структур графов в и н с равными степенными инвариантами [16], легко установить наличие или отсутствие полного сходства структур графов. При полном сходстве графов в и н достигается полная дифференциация вершин и формируется подстановка изоморфизма. Несовпадение процессов дифференциации на любом шаге интеграции кодов структурных различий означает отсутствие полного сходства структур. В этом случае дифференциация вершин достигает некоторого состояния, по которому косвенно можно судить об уровне сходства структур сравниваемых графов.

В предлагаемом исследовании нас интересует не косвенное, а прямое оценивание сходства структур в категориях частичного изоморфизма, когда в графах в и н процесс дифференциации вершин следует подчинить поиску подстановки сходства, доставляющей наибольший частичный изоморфизм этих графов.

Введение понятия частичного изоморфизма для графов с равными степенными инвариантами является вполне естественным и отражает ситуацию, когда подстановка изоморфизма отсутствует. В этом случае подстановку с наибольшим числом совмещенных рёбер будем именовать подстановкой сходства. Такая подстановка определяет частичный изоморфизм графов в и н, которому соответствует общая часть в с наибольшим числом рёбер тя.

Для графов в и н с неравными степенными инвариантами частичный изоморфизм будем определять относительно подграфа вня, выделяемого в графе н подстановкой сходства с общей частью в. Любая подстановка вершин в сравниваемых графах в и н соответствует некоторой общей части в, содержащей тя рёбер. Здесь, как и в случае равных степенных инвариантов, частичный изомор-

физм соответствует подстановке сходства с наибольшей общей частью. В случае, если общая часть Q включает все рёбра графа О, то имеет место изоморфное вложение графа О в граф Н [7]. Согласно выражению (2) для данного случая оценка сходства ¡л(О,Н)=1.

Задача определения частичного изоморфизма графов О и Н со степенными инвариантами 8(О)^Б(Н) требует перебора и анализа Сдхпд\ подстановок. При определении изоморфизмНа проблему переборов удалось решить на основе метода дифференциации вершин, в котором модель структуры графа представляется сетью автоматов [16]. Функционирование такой динамической системы в дискретном времени позволило улавливать разнообразие отношений между структурными различиями и на этой основе дифференцировать вершины структуры. Поэтому в предлагаемом методе оценивания сходства структур графов основные надежды на сокращение переборов также связываются с применением процессов дифференциации вершин.

Подстановка сходства и подстановка изоморфизма имеют принципиальные отличия. Главное отличие заключается в том, что в подстановке сходства допускается любая пара вершин из множества ЕдхЕН, а в подстановке изоморфизма, например, пары вершин с разными степенями недопустимы.

Для пар вершин в подстановке сходства не существует характеристик, равенство которых воспринималось бы как необходимое условие частичного изоморфизма. Это говорит о том, что никакие базовые (вычисляемые), скрытые и виртуальные структурные различия [16] не могут непосредственно применяться в процессе дифференциации вершин при поиске подстановки сходства и соответствующего частичного изоморфизма в виде графа Q.

Таким образом, можно констатировать, что главным препятствием для применения метода дифференциации вершин является отсутствие базового структурного различия для формирования начальной дифференциации. Совпадение таких структурных различий у вершин в парах подстановки сходства должно было бы восприниматься как необходимое условие частичного изоморфизма.

Метод дифференциации на основе сети автоматов сталкивается с аналогичной ситуацией при определении изоморфизма для однородных и симметричных графов. Начальная дифференциация в этом случае выполнялась путём введения виртуального различия. Этим же правилом предлагается воспользоваться при определении частичного изоморфизма. При этом сравниваемые графы О и Н должны рассматриваться как однородные, т. к. в подстановках сходства допускаются любые пары вершин из этих графов.

Первое положение метода отражает необходимость искусственно принимать графы О и Н однородными и вводить виртуальные различия для по-

лучения начальной дифференциации. Данное положение является принципиально важным и во многом определяет сущность предлагаемого метода дифференциации вершин при поиске частичного изоморфизма. В соответствии с данным положением процесс дифференциации вершин в графах происходит на основе скрытых различий, обнаруживаемых при функционировании модели структуры в виде сети автоматов. Скрытые различия в данном случае порождаются разнообразием отношений между виртуальными различиями в соответствии со структурой графа.

Второе положение связывается с устранением несовпадений, возникающих при сравнении процессов дифференциации вершин в графах О и Н. Сравнение процессов дифференциации производится на уровне однородных групп, которые в графах О и Н на каждом шаге интеграции кодов структурных различий должны совпадать. Это достигается «удалением» несовмещающихся рёбер. При сравнении однородных групп необходимо выбрать минимальное число рёбер, удаление которых приводит к совпадению групп. Дифференциация вершин с взаимно согласованным в графах О и Н удалением рёбер названа взаимозависимой. Результатом взаимозависимой дифференциации является получение инвариантного описателя общей части в виде графа Q. На основе инвариантного описателя формируется подстановка сходства частичного изоморфизма и при необходимости полный инвариант Р^) графа Q.

Третье положение также направлено на устранение несовпадений при сравнении однородных групп вершин в графах О и Н. Согласно этому положению некоторые вершины с разными кодами структурных различий искусственно принимаются равными, т. е. различие таких вершин маскируется. Правило выполнения данной операции названо правилом маскирования. Чаще всего правило маскирования применяется в ситуациях, когда в некотором к-м состоянии моделей структур принять однозначное решение по продолжению процесса дифференциации не удаётся. После применения данного правила и выполнения одного или нескольких шагов дифференциации появляется дополнительная информация для принятия однозначного решения. Это позволяет вернуться в к-е состояние и принять решение. Алгоритм принятия решения в данном случае можно сравнить с действиями шахматиста, который перед тем как сделать очередной ход, просчитывает несколько ходов вперёд.

Четвёртое положение устанавливает основные правила организации поиска подстановки сходства 2дН с наибольшей общей частью Q. При определении изоморфизма для однородных графов О и Н с помощью алгоритма свободной (ISD-F) и зависимой (ISD-D) интеграции кодов структурных различий [15, 16] виртуальное различие в графе О вводится для одной (любой) вершины, а в графе Н -последовательно всем вершинам. Процесс диффе-

ренциации в графе О с помощью алгоритма ISD-F выступает в роли эталона при выполнении дифференциации в графе Н с помощью алгоритма ISD-D.

Аналогично при определении частичного изоморфизма с помощью алгоритма взаимозависимой (ISD-ID) интеграции кодов структурных различий о достигнутом уровне сходства будем судить по процессу дифференциации в графе О. Величиной тО обозначим число рёбер, удаленных в графе О на шагах 1,2,...,к интеграции. Чем меньше значение тО, тем выше уровень сходства.

В процессе взаимозависимой дифференциации вершин в графах О и Н текущее значение тО будем сравнивать с достигнутым ранее минимальным значением т*. Если тО>тО, то продолжать процесс дифференциации не имеет смысла. Здесь величина тО является нижней границей достигнутого ранее уровня сходства при поиске подстановки сходства по схеме метода ветвей и границ.

Использование условия тО^О для прерывания процесса дифференциации позволяет существенно сократить объем вычислений при поиске подстановки сходства. Процесс взаимозависимой дифференциации запускается пН раз после введения виртуального различия для каждой вершины графа Н. Поэтому для сокращения вычислений важно получать минимальные значения т* уже на первых запусках. На рис. 2 показана схема последовательного введения виртуальных различий для запуска процессов дифференциации при поиске подстановки сходства 1ОН в графах О и Н, содержащих 5 и 6 вершин.

Ео Ен

Zi,i Zi,2 Zi,3 zoh Zi,4 Zi,5 Zi,6

Рис. 2. Схема запуска процессов дифференциации Fig. 2. Scheme of the differentiation processes startup

В каждой подстановке Z4 одна пара вершин (e^e) задаётся при введении виртуальных различий. На рис. 2 эти пары связаны с множествами EG и EH сплошными линиями. Остальные пары в подстановках определяются в ходе взаимозависимой дифференциации. Примеры таких пар показаны пунктирными линиями. Подстановка Z13=ZGH, выделенная жирными линиями, соответствует подстановке сходства с минимальным значением m*.

Подводя итог обсуждения основных положений метода оценивания сходства структур, отметим, что они сформулированы исходя из полного отрицания возможного существования вычисля-

емых структурных различий вершин графов для определения частичного изоморфизма. Поэтому введение виртуального различия в данном случае не следует рассматривать как аналог некоторой вычисляемой характеристики, равной для пары вершин в сравниваемых графах. Здесь правильнее говорить о наделении этих вершин безусловным правом присутствовать в подстановке сходства 1 ч в качестве пары. Такие пары вершин: (е,е), е^ЕО, е^ЕН, показаны на рис. 2. Они задают начальную дифференциацию вершин в графах О и Н. При этом в ходе поиска подстановки сходства все вершины е^ЕН в паре с вершиной е1еЕО будут последовательно наделяться таким правом. Все остальные пары вершин в подстановках сходства будут определяться в процессе взаимозависимой дифференциации на основе выделения скрытых структурных различий в отношениях между вершинами.

Алгоритм вычисления подстановки сходства ^

Поиск подстановки сходства выполняется для двух графов О и Н, при условии, что в каждом из них выделено по одной вершине е1еЕО и е^ЕН, которым присвоены равные коды виртуальных различий, т. е. пара вершин (е,е/) заведомо вводится в Графы О и Н представлены списками инци-денторов еДе,))} и {еДДе^)}. При этом предполагается, что пО<пН, а соотношение между величинами тО и тН не устанавливается.

Алгоритм поиска входит в состав общего алгоритма определения частичного изоморфизма с получением подстановки сходства 1ОН. Общий алгоритм осуществляет выбор 2ОН из пН подстановок

согласно четвертому положению метода, и будет изложен в следующем разделе. Подстановка

в отличие от 1ОН, выделяется относительно одной из вершин е/ графа Н и вершины е1 графа О. При поиске подстановки для выбранной в графе О вершины е1 просматриваются все вершины е] в графе Н.

Напомним также, что подстановка 1 ц должна соответствовать графу Q с наибольшим числом рёбер т9 или минимальному числу рёбер тО, удалённых из графа О в процессе взаимозависимой дифференциации вершин в графах О и Н. Поэтому при поиске так же как и ¿ОН, будет применяться четвёртое правило, исключающее продолжение поиска заведомо неперспективного варианта.

Функциональная схема алгоритма поиска подстановки сходства 1 ц приведена на рис. 3.

В блоке 1 по заданным вершинам е1 еЕО и е^ЕН формируется начальная дифференциация вершин в виде векторов Б°(О)={й10} и Б0(Н)=Ц0}. Вершине е1 в векторе Б0(О) и вершине е/ в векторе Б0(Н) присваивается код виртуального различия ¿¡0=2 и ¿/=2. Остальные позиции в векторах Б0(О) и Б°(Н) получают коды ¿¡"=¿/=1. Значения ¿¡"и в векторах Б0(О), Б°(Н) принимаются в качестве состояний автоматов соответствующих вершин.

Рис. 3. Схема алгоритма поиска Zfi

Fig. 3. Scheme of the Zl} searching algorithm

В блоках 2 и 3 автоматы обмениваются между собой состояниями и формируют списки инциден-торов в виде {<0(.Р(<0))} и {¿Д^С/1))}. Эти списки поступают в блок 4, где выполняются основные операции взаимозависимой дифференциации вершин в графах О и Н. Основная цель выполнения 4-го блока заключается в анализе сходства списков {<0(.Р(<0))} и {¿Д^^0))} и, при необходимости, установлении взаимно-однозначного соответствия между однородными группами в этих списках. Если соответствие между однородными группами отсутствует, т. е. {¿^(¿^^{¿Д^С/))}, то оно достигается преобразованием инциденторов в записях и ^Щ^^Ыща^} так, чтобы соответствие соблюдалось, т. е.

Здесь знаки (=) обозначают отсутствие и наличие соответствия.

Алгоритм преобразования инциденторов ¥(<■) и ¥(<■) для установления соответствия между однородными группами рассмотрим на примере определения частичного изоморфизма графов О и Н, представленных на рис. 4.

G

2

1

н

11 2V3 4

X 6 ML

yC 9 П0

н

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1 2 7 \ 3

ly'C

Vs w (5

e, (F (e,)) d,°(F (d,0)) d 1( F (d 1)) df( F (d,2)) d,3( F (d,3)) d,4( F (d,4)) d/( F (d,5)) d,6( F (d,6))

1(2,3,4) 2 - 2 - 2 - 2 - 2 - 2 - 2(3,6,7)

2(1,5,7) 1(1,1,2) 3(1,1,2) 3(1,2,4) 3(2,4,5) 6 - 6 - 6(2,4,5)

3(1,6,8) 1(1,1,2) 3(1,1,2) 3(1,1,2) 3(1,1,2) 3(1,1,2) 3 - 3(1,2,8)

4(1,5,6) 1(1,1,2) 3(1,1,2) 3(1,2,4) 3(1,2,4) 3(1,2,4) 7 - 7(2,4,8)

5(2,4,7,8) 1(1,1,1,1) 1(1,1,3,3)* 4 - 4 - 4 - 4 - 4(1,5,6,7)

6(3,4,7,8) 1(1,1,1,1) 1(1,1,3,3)* 1(1,1,3,3) 1(1,3,3,5) 1(1,3,3,5) 1(1,3,5,7) 8(1,3,5,7)

7(2,5,6,8) 1(1,1,1,1) 1(1,1,1,3) 1(1,1,3,4)* 5 - 5 - 5 - 5(1,4,6,8)

8(3,5,6,7) 1(1,1,1,1) 1(1,1,1,3) 1(1,1,3,4)* 1(1,3,4,5) 1(1,3,4,5) 1(1,3,4,5) 1(3,4,5,8)

ej (F (ev )) d0 (F (d*)) d1 (F (d1)) j F (d2)) dj (F (dj)) dj4( F (d4)) d5 (F (d5)) d6 (F (d6))

1(2,3,5) 2 - 2 - 2 - 2 - 2 - 2 - 2(3,6,7)

2(1,5,7,8) 1(1,1,1,2) 3(1,1,2,3) 3(1,2,3,4) 3(1,2,3,4) 3(1,2,4,6)* 7 - 7(2,4,6,8)

3(1,4,6,7) 1(1,1,1,2) 3(1,1,1,2) 3(1,1,2,4) 3(1,1,2,4) 3(1,1,2,4)* 3 - 3(1,1,2,4)

4(3,6,9) 1(1,1,1) 1(1,1,3) 1(1,1,3) 1(1,1,3) 1(1,1,3) 1(1,1,3) 1(1,1,3)

5(1,2,7,10) 1(1,1,1,2) 3(1,1,2,3) 3(1,2,3,4) 3(2,3,4,5) 6 - 6 - 6(2,4,5,7)

6(3,4,8,9) 1(1,1,1,1) 1(1,1,1,3) 1(1,1,1,3) 1(1,1,1,3) 1(1,1,1,3) 1(1,1,1,3) 1(1,1,3,8)

7(2,3,5,10) 1(1,1,1,1) 1(1,3,3,3) 4 - 4 - 4 - 4 - 4(3,5,6,7)

8(2,6,9,10) 1(1,1,1,1) 1(1,1,1,3) 1(1,1,1,3) 1(1,1,3,5) 1(1,1,3,5) 1(1,1,5,7) 8(1,1,5,7)

9(4,6,8) 1(1,1,1) 1(1,1,1) 1(1,1,1) 1(1,1,1) 1(1,1,1) 1(1,1,1) 1(1,1,8)

10(5,7,8) 1(1,1,1) 1(1,1,3) 1(1,3,4) 5 - 5 - 5 - 5(4,6,8)

Рис. 4. Пример определения подстановки Z,i частичного изоморфизма графов G и H Fig. 4. Example of finding substitution Z i of graphs G and H partial isomorphism

8

6

6

5

1

8

5

7

H) (1, 1, 3) (1, 1, 1, 3) (1, 3, 3, 3) (1, 1, 1, 3)

(1, 1, 1) 410 • (1, 1, 3)

Рис. 5. Примеры сопоставления инциденторов Fig. 5. Example of incidentors comparison

e1(G ) (1, 1, 3, 3) (1, 1, 3, 3) (1, 1, 1, 3) (1, 1, 1, 3)

E2(G )

6

(1, 1, 3, 3) * 7 \

(1, 1, 3, 4) (1, 1, 3, 4)

E2( H) (1, 1, 3) (1, 1, 1, 3) (1, 1, 1, 3) (1, 1, 1) (1, 3, 4)

В примере на рис. 4 рассмотрен общий случай, когда графы G и H имеют разные числа вершин, рёбер и произвольные значения степеней. Процесс взаимозависимой интеграции кодов структурных различий (алгоритм ISD-ID) при поиске подстановки Z во многом соответствует общим правилами дифференциации вершин [16]. Процесс дифференциации в этом случае дополняется алгоритмом анализа состояний моделей с целью установления соответствия между инциденторами в однородных группах (блок 4 на рис. 3).

Однородные группы, содержащие не менее двух вершин в графах G и H, с кодами d на k-м шаге дифференциации, будем обозначать Edk(G) и Edk(H). Из рис. 4 следует, что однородные группы E0(G) и Ef(H) по составу инциденторов F (dt0) и F(d0) разбиваются на группы E31(G), EJ(G) и E31(H), EJ(H). Для перевода моделей из состояния D1 в состояние D2 необходимо сопоставить инциденторы в соответствующих группах E11(G), E11(H) и E31(G), E31(H). Примеры сопоставления инциденторов в группах El(G), E/(H) и E2(G), E2(H) для переходов Б1^Б2и D2^D3 приведены на рис. 5.

Цель сопоставления групп заключается в выделении пар инциденторов (F(dit), F(d/)), которые в наибольшей степени соответствуют друг другу. Степень соответствия, при условии |Edk(G)|>2, будем оценивать величиной St:

S* = ("t + (ß -1) / (|E (-!)) / max(S, S ), (3)

где afj - число совпадающих пар кодов (dit,d1t), включая одну пару единичных кодов; ßt - число совпадающих пар единичных кодов в инциденто-рах F(d*) и F(d/). Чем больше величина St, тем выше степень соответствия инциденторов. В процессе дифференциации величина |E1k(G)| уменьшается, а степень соответствия возрастает. Заметим также, что для изоморфных графов G и H, при достижении полной дифференциации вершин, величина Sj=1.

В примере значения, S5,7=SJ,7=(3+0/3)/4=3/4 для k=1 являются наибольшими. На рис. 5 данные соответствия выделены жирными линиями. Тонкими линиями отмечены соответствия между па-

рами инциденторов, для которых 81,6=81,8=88,6=81,8=(2+2/3)/4=8/12. Пунктирной линией показано соответствие 81,10=(2+1/3)/4=7/12. Для к=2 наибольшее значение имеет 8?10=8210= =(3+0/2)/4=3/4, а, например, 8264=826=(2+1/2)/4=5/8, 52Мо=(2+0/2)/4=2/4.

В каждой группе пары инциденторов с наибольшими оценками 88 анализируются на предмет присвоения кодов Предпочтение отдаёт-

ся возможности присвоения уникальных кодов при наличии взаимно-однозначного соответствия, как, например, для пары ^(¿2)=(2,4,5) и адН2,3,4,5) с оценкой 823,5=3/4 из групп Е^в) и Е33(Я) на рис. 4.

Второй по предпочтению является ситуация, когда инцидентору в одной группе присваивается уникальный код, а в другой группе несколько инциденторов являются альтернативными. Такие ситуации показаны на рис. 5, где альтернативные пары выделены жирными линиями. Аналогичная ситуация возникла также в группе ЕДЯ). На рис. 4 альтернативные инциденторы помечены *. Это означает, что после достижения полной дифференциации необходимо процесс поиска % продолжить через другие альтернативные инциденторы. В примере это инциденторы Дй24), Дй82),

Третья ситуация возникает в случае, если внутри однородных групп Е/(в) и ЕДЯ) по наибольшим значениям оценок 88 выделяются новые однородные группы.

Если полная дифференциация не достигнута и ни одна из перечисленных ситуаций не возникает, то это означает наличие устойчивых групп [25]. В этом случае процесс дифференциации продолжается согласно общим правилам на основе введения виртуальных различий.

Подстановка %1,1={ег ,е/}={(1,1),(2,5),(3,3),(4,2),(5,7),(6,8),(7,10),(8,6)}, полученная в примере на рис. 4, отражает первое прохождение процесса дифференциации. Поэтому оценку сходства ¡¡Сг,Я)=11/14 можно рассматривать как нижнюю границу, которая может быть улучшена при продолжении поиска % х через аль-

тернативные инциденторы. Для сокращения вычислений при поиске через альтернативные инциденторы на каждом к-м шаге, согласно положению 4-го метода, вводится промежуточная оценка сходства, по которой определяется перспективность продолжения поиска.

Подстановке х соответствует граф Q, рёбра которого в графах О и Н на рис. 4 выделены жирными линиями, а вершины соответствуют интегральному описателю структуры (ISD) графа Q. По данному описателю можно сформировать полный инвариант Рграфа Q:

Р®)=!Ц3,8),2(3,6,7),3(1,2),4(5,6,7),5(4,6,8),6(2,4,5),6(2,4,8),8(1,5,7)}.

Алгоритм вычисления подстановки Zвн

Подстановка соответствует частичному изоморфизму графов О и Н, который локализован относительно пары вершин (в1,в]). Предлагаемый ниже алгоритм организует перебор подстановок ¿=00^, 7=1,2,...,пН и выделяет среди них подстановку £ОН, определяющую частичный изоморфизм в виде графа Q с наибольшим значением тя. В этом случае последовательно оценивается эффективность совмещения одной из вершин графа О с вершинами графа Н.

Здесь важно отметить, что в частичном изоморфизме О* графов в и Н, полученном в результате полного перебора, в соответствующей подстановке 2*вН будет присутствовать одна из пН пар (в1,в]). Если при этом удастаться доказать, что оценка тя частичного изоморфизма с подстановкой £ОН, локализованного относительно этой пары (в1,в]), совпадает с оценкой шя* подстановки £бН, то проблему частичного изоморфизма можно считать решенной. Пока такого доказательства нет, говорить о нахождении наилучшей подстановки сходства 2вН с помощью данного алгоритма можно лишь в случае, если шя=шв. О высоком сходстве графов б и Н можно говорить также, если mQ = шах^^ }.

°Ид

Рассмотрим более подробно основные операции алгоритма.

1. Формирование исходного состояния моделей графов в и Н. В исходном состоянии модели должны иметь начальную дифференциацию вершин, которая достигается введением виртуальных различий. С этой целью в графах в и Н выбирается по одной вершине е1 и е. Предпочтение отдаётся вершинам с максимальным значением степеней. Желательно также, чтобы степени вершин в паре (е;,е7) совпадали или были близки. Данным вершинам присваиваются коды <г°=<о°=2. Остальные вершины графов получают единичные коды.

Предполагается, что при выборе вершин с высокими значениями степеней создаются условия для получения с более высокой оценкой тя. Это позволяет сократить вычисления при последующем поиске подстановки 2вН.

2. Вычисление подстановки Подстановка вычисляется по алгоритму, изложенному в предыдущем разделе. После достижения первого вари-

анта полной дифференциации вершин и получения Q, как это показано на рис. 4, определяется значение нижней границы в виде числа т0вя не совместившихся рёбер графов в и Q, т°вя=тв-тя. Последующий поиск лучшего варианта осуществляется с учётом проверки на -м шаге условия тО>т0вя. Здесь тв - суммарное число рёбер в графе в, подлежащих удалению на -м шаге. При соблюдении этого условия делается переход к следующему альтернативному инцидентору. Если удаётся получить с лучшей оценкой тя, то нижняя граница т0вя пересчитывается и процесс поиска продолжается.

3. Смена вершины е7 в паре (е;,е7). Новая вершина е7 назначается в пару (ег,е7) среди тех вершин, которые не выбирались ранее и имеют степень наиболее близкую к э1. Далее с помощью операции 2 выполняется поиск для новой пары (ег,е7). При этом используется достигнутое ранее значение нижней границы т0вя. Выполнение операций 2 и 3 повторяется до выбора всех е7 из графа Н.

4. Выделение подстановки и формирование графа Q. Подстановка которая соответствует текущему значению нижней границы т°вя, принимается в качестве 2вН. По соответствующим спискам записей {<(¥(<))] определяется граф Q и его полный инвариант Р^). Достигнутое сходство графов оценивается величиной ¡АвН) по выражению (2).

Оба алгоритма по большей части изложены на функциональном уровне, многие действия при этом подробно не раскрываются. Например, действия по определению оценки тв требуют дополнительной проработки. Здесь на основе анализа состояний {<■(¥(<■))} и {<-(¥(<))} необходимо выделить в графе в рёбра, которые безусловно не смогут быть совмещены. При этом может оказаться, что применение оценок тв не даст ожидаемого эффекта. В этом случае процессы дифференциации через все альтернативные инциденторы будет выгоднее доводить до конца или использовать оценки тв в особых случаях.

В изложенном виде алгоритмы оценивают сходство графов в и Н, на которые не накладываются какие-либо ограничения. Вместе с тем возможны многие частные случаи, например, когда пв=пН или, если графы относятся к определённым типам, являются однородными и т. п. Во всех этих случаях алгоритмы могут учитывать конкретную специфику. В последующих исследованиях все подобные вопросы будут решаться при более детальной алгоритмизации, программировании и проведении экспериментальных исследований по анализу эффективности применения алгоритмов для оценивания сходства структур графов.

Заключение

Сходство структур графов в статье предложено оценивать, используя меру частичного изоморфизма. Полное сходство структур графов соответствует их изоморфизму, а неполное (частичное) сход-

ство - частичному изоморфизму. В качестве меры частичного изоморфизма принято наибольшее число совместившихся рёбер, которое может быть достигнуто при переборе всех вариантов совмещения (подстановки) вершин графов.

Разработке методов поиска подстановки, доставляющей наибольшее число совместившихся рёбер, посвящена данная статья. Основу метода составляет процесс взаимозависимой дифференциации вершин в сравниваемых графах, разработанных для определения их сходства в виде частичного изоморфизма. Метод не гарантирует достижение наибольшего частичного изоморфизма, но в практических применениях вполне возможны си-

СПИСОК ЛИТЕРАТУРЫ

1. Абросимов М.Б. Графовые модели отказоустойчивости: дис. ... д-ра физ.-мат. наук. - Саратов, 2013. - 269 с.

2. Шапошников Д.Е., Ушакова М.Н. Моделирование электрических распределительных сетей на основе концепции распределенных канальных систем // Труды ННГТУ. - 2012. -№4(97). - С. 111-116.

3. Кузнецов В.Г. Графовая модель системы энергосберегающих мероприятий // ВЕЖПТ. - 2013. - № 8 (63). URL: http://cy-berleninka.ru/article/n/grafovaya-model-sistemy-energosbere-gayuschih-meropriyatiy (дата обращения: 06.04.2015).

4. Гимаров В.А., Дли М.И., Битюцкий С.Я. Задачи нестационарной кластеризации состояния нефтехимического оборудования. - М.: Нефтегазовое дело, 2004. - 9 с.

5. Система мониторинга OpenNMS. URL: http://hab-rahabr.ru/post/193682/ (дата обращения: 06.04.2015).

6. Золотовицкий А.В., Михеева Т.И., Сидоров А.В. Методы работы с графовой моделью транспортной сети в геоинформационной системе ITSGIS // Труды Международной научно-технической конференции «Перспективные информационные технологии». - 2015. - Том 2. - С. 66-70.

7. Марлей В.Е., Плотников С.Н. Алгоритм распознавания изоморфного вложения алгоритмических сетей // Вестник ВГУ-ИТ. - 2014. - № 3. - С. 72-75.

8. Касьянов В.Н. Визуализация информации на основе графовых моделей // Доклады VII Международной Азиатской школы-семинара «Проблемы сложных систем». - Ташкент, 2011. -С. 50-55.

9. Яковлев К.С., Баскин Е.С. Графовые модели в задаче планирования траектории на плоскости // Искусственный интеллект и принятие решений. - 2013. - № 1. - С. 5-12.

10. Андреев А.М., Можаров Г.П., Сюзев В.В. Многопроцессорные вычислительные системы: теоретический анализ, математические модели и применение: учебное пособие. - М.: Изд-во МГТУ им. Н.Э. Баумана, 2011. - 332 с.

11. Ильяшенко М.Б., Голдобин А.А. Решение задачи поиска изоморфизма графов для проектирования специализированных вычислителей // Радиоэлектроника, информатика, управление. - 2012. - № 1. - С. 31-36 (ISSN 1607-3274).

12. Скворцова М.И. Математические модели и алгоритмы в исследованиях связи между структурой и свойствами органических соединений: автореферат дис. д-ра физ.-мат. наук. - М., 2007. - 38 с.

туации, где оценивание сходства допустимо с некоторой погрешностью.

Основным достижением данной работы является решение, пусть и не точное, сложнейшей проблемы определения сходства структур графов на основе частичного изоморфизма. Предложенный метод создаёт теоретическую основу для разработки частных и более эффективных алгоритмов, учитывающих конкретные особенности сравниваемых графов и условия постановки задач. Развитие метода в этом направлении будет сопровождаться более полной алгоритмизацией операций, программированием и экспериментальными исследованиями эффективности.

13. Тихонина В.В., Бутенко Л.Н. Анализ взаимодействия параметров «структура-свойства» полимерных материалов // Известия ВолгГТУ. - 2010. - Т. 6. - № 8. - с. 84-86.

14. Todeschini R., Consonni V. Handbook of molecular descriptors. -Weinheim: WILEY-WCH Publishers, 2000. - 667 p.

15. Погребной А.В. Полный инвариант графа и алгоритм его вычисления // Известия Томского политехнического университета. - 2014. - Т. 325. - № 5. - С. 110-122.

16. Погребной А.В., Погребной В.К., Метод дифференциации вершин графа и решение проблемы изоморфизма // Известия Томского политехнического университета. - 2015. - Т. 326. -№6. - С. 34-45.

17. Кинг Р.Б. Химические приложения топологии и теории графов. - М.: Мир, 1987. - 560 с.

18. Baskin I., Skvortsova M. On the basis of invariants of labeled molecular graphs // Chem. Inf. Comput. Sci. - 1995. - V. 35. -№3. - P. 527-531.

19. Varmuza K. Chemometrics in practical applications. - Rijeka, Croatia: InTech, 2012. -326 p.

20. Dehmer M., Emmert-Streib F., Tsoy R.Y., Varmuza K. Quantum frontiers of atoms and molecules. - New York: Nova Publishing, 2011. - 673 p.

21. Emmert-Streib F., Dehmer M. Networks for systems biology: conceptual connection of data and function // IET Systems Biology. - 2011. - V. 5. - № 3. - P. 185-207.

22. Dehmer M., Grabner M. The discrimination power of molecular identification numbers revisited // MATCH Commun. Math. Comput. Chem. - 2013. - V. 69. - № 3. - P. 785-794.

23. De Matos S., Dehmer M., Emmert-Streib F. Interfacing cellular networks of S. cerevisiae and E. coli: connecting dynamic and genetic information // BMC Genomics. - 2013. - V. 14. -№ 324.- P. 111-134.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

24. Погребной В.К. Задача определения оценок сходства структур двух графов на основе выделения общих частей // Известия Томского политехнического университета. - 2013. - Т. 322. -№5. - С. 194-199.

25. Погребной В.К., Погребной Ан.В. Исследование полиномиаль-ности метода вычисления интегрального описателя структуры графа // Известия Томского политехнического университета. - 2013. - Т. 323. - № 5. - С. 146-151.

Поступила 11.09.2015 г.

UDC 519.171.1

METHOD OF GRAPH VERTICES DIFFERENTIATION AND SOLUTION OF THE ISOMORPHISM PROBLEM IN GEOINFORMATICS

Andrey V. Pogrebnoy,

National Research Tomsk Polytechnic University, 30, Lenin Avenue, Tomsk, 634050, Russia. E-mail: [email protected]

The urgency of the discussed issue is caused by the fact, that known approaches for the structures similarity estimation are limited by using a set of indirect properties. Effective similarity estimation algorithms on the basis of direct properties are necessary. Such algorithms can be applied for data compression in geographic information systems and systems of ecological monitoring if they are represented on vector map, or for pattern recognition and many other applications. Research of application of direct properties for similarity estimation on the basis of the combination of compared graphs and selecting equal parts as isomorphic subgraphs are almost absent. The problem of determining the partial isomorphism without exhaustive search permutations of similarity is considered unsolvable. Therefore researches of finding acceptable algorithms for solving this problem with limited count of permutations are relevant. The main aim of the study is to develop a method for determining the graphs structure similarity by selecting the highest common parts, i.e. highest partial isomorphism.

The methods used in the study are based on the applied graph theory, theory of optimization and efficient algorithms development, modeling structures using automata models for vertices differentiation.

The results. Introduced basic concepts and formulated provisions of the concept of the graphs structure similarity estimation based on a combination of vertices and selection of equal subgraphs ? partial isomorphism. Ideas of the vertices differentiation method are suggested to be used for reducing algorithm complexity. The method of the interdependent vertices differentiation is developed, which allows to form the similarity substitution and partial isomorphism. The algorithm of searching the similarity substitutions, relative to pair of vertices, and the algorithm of selection of substitution with highest partial isomorphism are developed. The algorithm of searching similarity substitution on the basis of the interdependent vertices differentiation is shown at the example of two graphs similarity estimation.

Key words:

Graph structure similarity, partial isomorphism, similarity substitution, vertices differentiation, homogeneous groups of vertices.

REFERENCES

1. Abrosimov M.B. Grafovye modeli otkazoustoychivosti. Dis. Dokt. nauk [Resiliency graph models. Dr. Diss.]. Saratov, 2013. 269 p.

2. Shaposhnikov D.E., Ushakova M.N. Modelirovanie elektriches-kikh raspredelitelnykh setey na osnove kontseptsii raspredelen-nykh kanalnykh sistem [Electrical distributing systems modeling at the basis of canal systems]. Trudy NNGTU, 2012, no. 4 (97), pp.111-116.

3. Kuznetsov V.G. Grafovaya model sistemy energosberegay-ushchikh meropriyatiy [Graph model of energy-saving measures]. Eastern-European Journal of Enterprise Technologies, 2013, vol. 63, no. 8. Available at: http://cyberleninka.ru/artic-le/n/grafovaya-model-sistemy-energosberegayuschih-meropriy-atiy (accessed 6 April 2015).

4. Gimarov V.A., Dli M.I., Bityutskiy S.Ya. Zadachi nestatsionar-noy klasterizatsii sostoyaniya neftekhimicheskogo oborudovaniya [Problems of transient clustering of the petrochemical equipment state]. Moscow, Neftegazovoe delo Publ., 2004. 9 p.

5. Sistema monitoringa OpenNMS [Monitoring system OpenNMS]. Available at: http://habrahabr.ru/post/193682/ (accessed 7 April 2015).

6. Zolotovitskiy A.V., Mikheeva T.I., Sidorov A.V. Metody raboty s grafovoy modelyu transportnoy seti v geoinformatsionnoy sisteme ITSGIS [Methods of work with the graph model of the transport network in the geographic information system ITSGIS]. Trudy Mezhdunarodnoy nauchno-tekhnicheskoy konferentsii «Per-spektivnye informatsionnye tekhnologii» [Proc. Int. Scien. and Technic. Conf. Promising information technologies]. Samara, 2015, vol. 2, pp. 66-70.

7. Marley V.E., Plotnikov S.N. Algoritm raspoznavaniya izomorf-nogo vlozheniya algoritmicheskikh setey [The algorithm of the recognition of the isomorphic enclosure of algorithmic networks]. Vestnik VGUIT, 2014, no. 3, pp. 72-75.

8. Kasyanov V.N. Vizualizatsiya informatsii na osnove grafovykh modeley [Visualization of the information on the basis of graph

models]. Doklady VII Mezhdunarodnoy aziatskoy shkoly-semina-ra «Problemi slozhnykh sistem» [Proc. 7th Int. Asian Workshop. Problems of complicated systems]. Tashkent, 2011, pp. 50-55.

9. Yakovlev K.S., Baskin E.S. Grafovye modeli v zadache planirova-niya traektorii na ploskosti [Graph models in the problem of the trajectory predicting at the plane]. Artificial Intelligence and Decision Making, 2013, no. 1, pp. 5-12.

10. Andreev A.M., Mozharov G.P., Syuzev V.V. Mnogoprotsessornye vychislitelnye sistemy: teoreticheskiy analiz, matematicheskie modeli i primenenie [Multiprocessor computing systems: theoretical analysis, mathematical models and application]. Moscow, MSTU Publ., 2011. 332 p.

11. Ilyashenko M.B., Goldobin A.A. Reshenie zadachi poiska izomor-fizma grafov dlya proektirovaniya spetsialnykh vychisliteley [Solution of the problem of graph isomorphism search for designing special computers]. Radioelektronika, Informatika, Upravlenie, 2012, no. 1, pp. 31-36.

12. Skvortsova M.I. Matematicheskie modeli i algoritmy v issledova-niyakh svyazi mezhdu strukturoy i svoystvami organicheskikh so-edineniy. Avtoref. Dis. Dokt. nauk [Mathematical models and algorithms in research of connection between structure and properties of organic compounds. Author's Abstract Dr. Diss.]. Moscow, 2007. 38 p.

13. Tikhonina V.V., Butenko L.N. Analiz vzaimodeystviya parame-trov «struktura-svoystva» polumernykh materialov [Analysis of interaction of parameters «structure-property» of polymer materials]. Izvestiya VSTU, 2010, vol. 6, no. 8, pp. 84-86.

14. Todeschini R., Consonni V. Handbook of molecular descriptors. Weinheim, WILEY-WCH Publishers, 2000. 667 p.

15. Pogrebnoy A.V. Polnyy invariant grafa i algoritm ego vychisleni-ya [Complete graph invariant and algorithm of its computation]. Bulletin of the Tomsk Polytechnic University, 2014, vol. 325, no. 5, pp. 110-122.

16. Pogrebnoy A.V., Pogrebnoy V.K. Metod differentsiatsii vershin grafa i reshenie problem izomorfizma [Method of the graph verti-

ces differentiation and solution of the graph isomorphism problem]. Bulletin of the Tomsk Polytechnic University, 2015, vol. 326, no. 6, pp. 34-45.

17. King R.B. Khimicheskie prilozheniya topologii i teorii grafov [Chemical applications of graphs topology and theory]. Moscow, Mir Publ., 1987. 560 p.

18. Baskin I., Skvortsova M. On the basis of invariants of labeled molecular graphs. Chem. Inf. Comput. Sci, 1995, vol. 35, no. 3, pp. 527-531.

19. Varmuza K. Chemometrics in practical applications. Rijeka, Croatia, InTech, 2012. 326 p.

20. Dehmer M., Emmert-Streib F., Tsoy R.Y., Varmuza K. Quantum frontiers of atoms and molecules. New York, Nova Publishing, 2011. 673 p.

21. Emmert-Streib F., Dehmer M. Networks for systems biology: conceptual connection of data and function. IET Systems Biology, 2011, vol. 5, no. 3, pp. 185-207.

22. Dehmer M., Grabner M. The discrimination power of molecular identification numbers revisited. MATCH Commun. Math. Comput. Chem, 2013, vol. 69, no. 3, pp. 785-794.

23. De Matos S., Dehmer M., Emmert-Streib F. Interfacing cellular networks of S. cerevisiae and E. coli: Connecting dynamic and genetic information. BMC Genomics, 2013, vol. 14, no. 324, pp. 111-134.

24. Pogrebnoy V.K. Zadacha opredeleniya otsenok skhodstva struktur dvukh grafov na osnove vydeleniya obshchikh chastey [Problem of estimating two graphs structure similarity on the basis of selecting common parts]. Bulletin of the Tomsk Polytechnic University, 2013, vol. 322, no. 5, pp. 194-199.

25. Pogrebnoy V.K., Pogrebnoy A.V. Issledovanie polinomialnosti metoda vychisleniya integralnogo opisatelya struktury grafa [Research of the integral structure descriptor computation method polynomiality]. Bulletin of the Tomsk Polytechnic University, 2013, vol. 323, no. 5, pp. 146-151.

Received: 11 September 2015.

i Надоели баннеры? Вы всегда можете отключить рекламу.