МЕТОД ИНВАРИАНТНОГО АНАЛИЗА ИЗОБРАЖЕНИЙ, ЗАДАННЫХ В ВЕКТОРНОЙ ФОРМЕ
Н.Ю. Иванова, А.А. Малинин, Ю.Б. Таяновская
Предлагается метод классификации векторных изображений, который может использоваться для инвариантного анализа изображений, заданных в векторной форме, и применяться для корректировки чертежей и распознавания текста.
Введение
Переход на новые информационные технологии обработки и хранения информации ставит задачи ввода уже накопленной информации в ЭВМ. Для ввода информации применяются различные методы распознавания образов [1]. Распознавание образов включает в себя такие задачи, как классификация объектов, распознавание сигналов рукописного текста, ввод в компьютер текстовых документов и чертежей [2].
Предлагаемый метод предназначен для распознавания плоских графических изображений, таких как печатные тексты и конструкторские чертежи. Методы распознавания обычно решают одну задачу, которая имеет ограничения на формат и ориентацию располагаемых объектов. Метод инвариантен к повороту и линейным искажениям, возникающим при оцифровке вводимого документа, за счет перехода от растрового представления объектов к векторному. Это позволяет избавиться от сложностей анализа двумерных массивов информации, представляющей образ.
Векторная форма изображения объекта
Объект при векторном представлении кодируется как взвешенный граф, весом вершин которого являются координаты соответствующей вершины. На рис.1 приведен такой граф и соответствующие ему матрица смежности (табл. 1) и список весовых коэффициентов вершин (табл. 2).
и1
Рис. 1. Взвешенный граф
Х1 Х2 Хз Х4 Х5
Х1 0 1 1
Х2 1 0 1
Хз 1 0 1
Х4 1 1 0 1
Х5 1 0
Вершины Х1 Х2 Хз Х4 Х5
Координаты вершин 1,45 5,6 2,12 4,89 3,77
Таблица 1. Матрица смежности Таблица 2. Весовые нагрузки вершин
Образцы, по которым производится классификация изображений объекта, задаются в виде взвешенных графов. Для этих графов вес вершин определяется допустимыми значениями угла между инцидентными ей ребрами, а вес ребер определяется признаком вида соответствующих линий, соединяющих вершины инцидентные ребрам. Таким образом, ребрам взвешенного графа ставятся в соответствие признаки, которые определяют образцы типов линий. В качестве взвешенного ребра можно использовать несколько ребер исходного графа, если их взаимное расположение удовлетворяет данному образцу типа линий. Среди образцов выделим следующие: прямая линия, кривая выпуклая линия, произвольная линия и т.д. При таком выборе образцов граф будет «похож» на изображение, которое он описывает.
Вес вершины такого графа зависит от взаимного расположения ребер графа. Для различных пар типов линий вес будет определяться по-разному, но для любой такой пары вес вершины характеризуется тремя следующими параметрами: инцидентность, угол, угол. Инцидентность равна 0, если данная вершина не инцидентна данному ребру, если же инцидентность равна 2, то данное ребро считается главным при вершине. Главное ребро используется как точка отсчета, т.е. все углы, входящие в вес, отсчитываются относительно главного ребра.
Рис. 2. Отсчет параметра «угол» в виде диапазона значений векторов
На рис. 2 показано начальное (А) и конечное (В) положение радиус-вектора относительно ребра Ш (кривая выпуклая линия изображена в виде участка исходного графа). Отсчет углов задается в виде диапазона начальное значение-конечное значение. Если угол между ребрами исследуемого графа изображения попадает в этот интервал, взаимное расположение ребер считается допустимым. Если взаимное расположение прямой и выпуклой кривой задано как (V; М), причем Ы>М, то угол начального положения должен быть больше угла конечного положения. Для векторов А и В на рис.2 этот интервал равен (110;15) и считается допустимым.
Взаимное расположение ребер будем определять из предположения, что имеется к образцов типов линий, которые задают к типов последовательностей вершин графа. Тогда количество возможных пар типов будет равно кхк. Поскольку используются два типа линий (прямая (П) и кривая выпуклая (КВ)), то возможных пар будет 4. Дадим определение для каждой из пар типов линий.
• Прямая - прямая линия (ПП), угол между прямыми определяется, как угол между направляющими векторами прямых линий.
• Прямая - кривая выпуклая линия (ПКВ), взаимное расположение прямой линии и кривой выпуклой линии задается двумя углами:
1. углом между направляющим вектором прямой и начальным положением радиус-вектора кривой;
2. углом между начальным и конечным положением радиус-вектора кривой.
• Кривая выпуклая - прямая линия (КВП), взаимное расположение кривой выпуклой линии и прямой линии задается двумя углами:
1. углом между начальным положением радиус-вектора кривой и направляющим вектором прямой;
2. углом между начальным и конечным положением радиус-вектора кривой.
• Кривая выпуклая - кривая выпуклая линия (КВКВ), взаимное расположение последовательностей данных типов задается тремя углами:
1. углом между начальными положениями радиус-векторов;
2. углом между начальным и конечным положением радиус-вектора первой кривой;
3. углом между начальным и конечным положением радиус-вектора второй кривой.
Для графа (рис.3) используются следующие типы линий: П - прямая линия, КВ -кривая выпуклая, 0 - связь отсутствует. Рассмотрим задание образца на примере данного графа. Для этого построим матрицу инцидентности (табл. 3) и таблицу весовой нагрузки вершин графа (табл. 4).
Рис. 3. Граф
Х1 Х2 Х3
и1 (2,(0,0),(0,225)) (2,(0,0),(0,330)) (0,(0,0),(0,0))
и2 (0,(0,0),(0,0)) (1,(0,0),(0,0)) (1,(0,0),(0,60))
Таблица 3. Матрица инцидентности
и1 и2
и1 КВ 0
и2 0 ПЛ
Таблица 4. Весовая нагрузка вершин
Для каждой из крайних вершин кривой выпуклой линии указываются начальное и конечное положение радиус-вектора, исходящего из данной вершины. На рис. 4, 5 показано начальное (А) и конечное (В) положение радиус-вектора в вершинах Х1 и Хк и угол между начальным и конечным положением радиус-вектора. На рисунках изображена выпуклая оболочка с вершинами Х1 и Хк.
Х1
Рис.4. Начальное положение в крайней вершине выпуклой линии
Хк
Рис. 5. Конечное положение в крайней вершине выпуклой линии Алгоритм анализа и распознавания изображения
Задача анализа и распознавания изображения формулируется следующим образом: из данного графа выделить подграф, изоморфный графу-образцу. Для этого достаточно каждой вершине графа-образца поставить в соответствие одну из вершин графа изображения таким образом, чтобы каждому ребру графа-образца соответствовал ациклический путь в графе изображения, а последовательность вершин пути удовлетворяла бы весовой нагрузке ребра графа-образца.
Для этого необходимо проверять вершины входного графа (изображения) на роль вершин графа-образца, а пути между ними - на соответствие нагрузкам ребер графа-образца. Этот процесс представляет собой рекурсивный поиск. По теореме Клини существуют такие конкретно примитивные рекурсивные функции и от одной переменной и Т^ от п+2 переменных, что для любой любой рекурсивной функции ф от п переменных найдется натуральное число е, для которого будет действительно условное равенство
Ф(х1,......Хп) = и(ну(Тп(е,Х1,.. ..,Хп,у)=0)).
Здесь е - генделев номер функции ф.
Из этой теоремы следует, что для любой рекурсивной функции ф от п переменных и для любых натуральных чисел Х],......хп имеет место условное равенство
ф (Х1,......Хп) = Фп(е,хь....,хп).
Рекурсивный поиск лучше начинать с вершин, имеющих наибольшую степень, и выбирать каждый раз из инцидентных ей вершин одну с наибольшей степенью. Процесс заканчивается, когда каждой вершине графа-образца сопоставлена вершина из графа изображения.
Классификация исследуемого графа происходит на основании сравнения его со всеми образцами путем высчитывания для каждого совпадения графа с образцом степени их соответствия. Если в процессе перебора находится образец со степенью
соответствия, равной 100%, то дальнейший поиск останавливается, а граф относится к тому классу, образец которого показал наибольшую степень соответствия.
Заключение
В статье рассмотрен оригинальный метод анализа плоского геометрического изображения, инвариантного к повороту и линейным искажениям, возникающим при оцифровке вводимого документа, что достигается за счет перехода от растрового представления объектов к векторному и позволяет избавиться от сложного анализа двумерных массивов информации, представляющих образ анализируемого изображения.
Метод позволяет достаточно точно классифицировать графические изображения, независимо от их ориентации на плоскости и наличия небольших линейных искажений, а также добовлять новые классы объектов и вводить для одного и того же класса объектов несколько образцов.
Литература
1. Бутаков Е.А., Островский В.И., Фадеев И.Л. Обработка изображений на ЭВМ. - М.: Радио и связь, 1987. 238 с.
2. Кузин Л.Т. Основы кибернетики. / Т.2. М.: Энергия, 1979. 584 с.