Построение классификатора при отсутствии части объекта на изображении

Балясный Сергей Викторович; Цудиков Михаил Борисович

УДК 681.5

ПОСТРОЕНИЕ КЛАССИФИКАТОРА ПРИ ОТСУТСТВИИ ЧАСТИ ОБЪЕКТА НА ИЗОБРАЖЕНИИ

С.В. Балясный, М.Б. Цудиков

Рассмотрен алгоритм построения системы распознавания объектов на изображении в условиях, когда искомый объект может присутствовать на изображении лишь частично, например, когда часть объекта скрыта за препятствием или когда часть объекта находится на границе кадра. Предложена структура классификатора, позволяющая использовать для распознавания и локализации объекта на изображении все его определенные признаки без их предварительной обработки.

Ключевые слова: распознавание, вектор признаков, локализация, дерево, классификация, эталон, скользящее окно.

Автоматическое распознавание образов является одним из наиболее активно развивающихся направлений искусственного интеллекта и связано с обработкой большого количества визуальной информации, например, в медицине, производстве, системах безопасности и т.д.

Задача распознавания образов заключается в классификации изображений на основе определенных признаков, причем изображения, относящиеся к одному классу образов, обладают относительно высокой степенью близости признаков. Задача получения признаков, максимально полно характеризующих рассматриваемый класс объектов и при этом минимально встречающихся у объектов, относящихся к другим классам, не имеет однозначного решения. Часто приходится иметь дело с ситуацией, когда имеется большое количество признаков объекта, которые не позволяют однозначно его классифицировать. При этом выделение наиболее характерных признаков также не представляется возможным, особенно в ситуации, когда исходное изображение содержит только часть искомого объекта.

В подобной ситуации возникает задача распознавании объекта в условиях неполной и искаженной информации о нём [1, 2, 3]. Для её решения представляется предпочтительнее не проводить выборку небольшого количества «хороших» признаков, а попытаться классифицировать объект, основываясь на большом количестве «плохих» признаков. Поэтому встает вопрос о построении классификатора, позволяющего обрабатывать большое количество данных, и имеющего при этом минимальное количество ошибок классификации.

В общем, задачу распознавания можно представим следующим образом. В пространстве образов существует множество объектов распознавания Q, каждый из которых характеризуется набором признаков

^: wGQ. Можно предположить, что существует некоторая неизвестная

функция /( : О —> М, М - (1.. , разбивающая пространство объектов Q на т классов: 0ь(?2>—> £?т - ® реальности доступно только некоторое количество наблюдаемых признаков, формирующих в свою очередь пространство наблюдений X, х(м?) - вектор признаков образа IV, воспринимаемых наблюдателем. Тогда можно сказать, что существует функция /(и>):<2—>Х, ставящая в соответствии каждому объекту м точку х(м?) в пространстве признаков, являющаяся оценкой /(и>) на основании т.е. /(м>) = /(х(м?)), xj=x(wj), ]-1,2,...,ТУ - доступная информация о функциях /(и7) и тогда (Xj,fj) - множество прецедентов. Задачу

классификации можно свести к построению функции /(и>), минимизирующую количество ошибок распознавания (рис. 1) [4, 5].

Рис. 1. Общая модель задачи классификации

Структурно классификатор представляет собой направленный граф в виде дерева, каждая ветвь которого является вектором признаков [6]. При построении дерева классификации предполагается, что если вектор Xj,j = l,2,...,N содержит признаки объекта, то и любой его подвектор

уу, у = t,t + ? = 2,3,...,ТУ также описывает объект. Совокупность

множества подвекторов исходного вектора признаков (Г(Т) является деревом классификации = представленным конечным автоматом, где О - множество промежуточных состояний, для входного вектора у], г - начальное состояние автомата для нулевого вектора признаков, Р - множество конечных состояний, g - функция переходов графа. При построении дерева для вектора признаков ст(Т1) предположим, что уже существует дерево для вектора признаков сг(Г7-1). Для определения новых финальных состояний V1 необходимо рассмотреть все финальные состояния Если состояние не имеет перехода в состояние , то со-

стояние становится новым финальным состоянием для состояния Р1 . При этом количество финальных состояний для вектора х^]-1,2,..., ТУ

равно N, а дочерние узлы корня на расстоянии одного шага содержат все уникальные состояния вектора признаков (рис. 2).

Рис. 2. Пример построения дерева классификации для двух объектов

При построении классификатора необходимо учитывать, что значения в полученном векторе признаков не будут в большинстве своём точно совпадать со значениями эталонного вектора. Для правильного отнесения элемента вектора признаков исследуемого объекта к тому или иному эталону каждый узел дерева классификации рассматриваем не как конкретное значение, а как некоторый диапазон, определяемый как половина расстояния до соседних узлов (рис. 3). Необходимо отметить, что на данном этапе работы алгоритма предложенный классификатор может дать ответ не о присутствии или отсутствии объекта на изображении, а только о мере сходства исследуемого вектора признаков с эталонными классами.

Для оценки степени принадлежности объекта к определенному классу необходимо определить стоимость переходам из узла уу к узлу

У]+1 как

X ecлuVyj<EQj^^ЗyjeQrl^.QrlФQj\ ^—) у П)

1/т, если е -> У] е <2п : <2„ Ф QJ,

где т - количество различных классов.

Рис. 3. Вариант представления дерева классификации

для трех эталонов

При этом, если узел уj е Qj л уj е Qn : Qn Ф Qj, то

Vy7-: i = root...j y j^. Qj л у j e £>/7 : Qn Ф Qj, т.е. если узел на отдельной

ветви дерева принадлежит нескольким классам, то все узлы, расположенные выше его, также должны принадлежать этим классам.

Использование функции скользящего окна позволяет совместить этап локализации объекта и этап его классификации. Т.к. при поиске объекта на изображении не известен его размер, то для максимальной вероятности перекрытия окном объекта следует использовать окна разного размера. Функция окна h(x,y) представляет собой локальную область двумерной функции f(x,y)

h(x,y) =

✓Y \ ч Л .А В В

f(x9y\ для--<х<—,--<у<—

2 2 2 2» (2)

О, в остальных случаях

где (х9у) - координаты центра окна; А , В - текущий размер окна. Вектор признаков м?(Ь(х,у)) точек, попавших в окно 2: л\{Ь(х9у)) с И(х,у): Ь{х,у) - особая точка, где N - длина вектора м^Ь{х,у))

Каждому положению окна на изображении, можно поставить в соответствие некоторый вектор признаков w(h(x,у)), составленный из ключевых точек, попавших в окно. Степень схожести dj вектора признаков

w(h(x,у)), найденных для текущего окна h(x,у), с эталоном Fj, содержащимся в дереве классификации d(t) = г, F, и), определяется как

В общем случае в окне может оказаться как часть объекта wоб, так и часть фонового изображения Wфон, порядок чередования точек в векторе

признаков при этом не известен. Оценка степени принадлежности вектора w(h(х,у)) к классу (у) где ? = 1,2,...,т, т - количество эталонных классов, проводится за счет определения ближайшего эталона. Каждый элемент вектора признаков может:

принадлежать одному эталону; принадлежать нескольким эталонам; не принадлежать ни одному эталону.

Функция переходов g между узлами qj и qj+1 определяется текущим значением элементом вектора признаков щ, g(qj, а^) = qj+1. При

этом степень принадлежности признака $ (аг-) определяется весом перехода dj j+1 и рассчитывается на этапе проектирования классификатора. Степень принадлежности отдельного признака к каждому классу

Таким образом, задача локализации и распознавания объекта на изображении сводится к отысканию размера и положения окна, обеспечивающего максимальный отклик на дереве классификации.

Для оценки результатов работы предложенного метода использовалось предварительно обработанное изображение контура эталонного объекта, представленные на рис. 4.

В качестве метода определения признаков, применялся модернизированный метод SIFT. Цвет точек (рис. 5, б) показывает уровень пирамиды гауссианов, на котором была найдена данная точка. Результаты отклика скользящего окна при его постоянном вертикальном размере на группе схожих по составу изображениях представлены на рис. 5, в, где видно, что максимальный отклик функции наблюдается в области искомого изображения. В то же время следует отметить, что предложенный метод классификации позволяет определять схожие с эталоном объекты, о чём могут

X wn e Fj

(3)

St (at) = X dj, j+lg(qj, ai).

(4)

"teq j

свидетельствовать повышение отклика функции окна и в областях, где расположены объекты, схожие по своим геометрическим характеристикам с эталоном (рис. 5, в).

Рис. 4. Изображение объекта, выбранного в качестве эталона с разрешением 360x660 точек

Рис. 5 Применение функции окна: а - тестовое изображение с разрешением 624x199; б - найденные ключевые точки; в - нормированный отклик функции окна для случая, когда вертикальный размер окна совпадает с размером изображения

Таким образом, представленная модель классификатора позволяет проводить локализацию и распознавание объекта на изображении, используя все его найденные признаки без их предварительной обработки с целью выделения наиболее характерных признаков или ограничения размерности пространства признаков. Эталонные объекты также располагаются в пространстве признаков произвольной размерности, что позволяет учитывать при распознавании не только наиболее характерные признаки объекта, которые в некоторых случаях могут отсутствовать, например, когда часть искомого объекта недоступна для наблюдения. Также подобная структура классификатора позволяет выявлять степень сходства между объектами на изображении, что может быть использовано в системах автоматического анализа ситуации и т.п.

Список литературы

1. Блейнхур Р. Быстрые алгоритмы цифровой обработки сигналов /пер. с англ. И.И. Грушко. М.: Мир, 1989. 448 с.

2. Дж. Стокман, Л. Шапиро. Компьютерное зрение / пер. с англ. М.: БИНОМ. Лаборатория знаний, 2006. 752 с.

3. Дэвид Форсайд, Жан Понс. Компьютерное зрение. Современный подход / пер. с англ. С.Н. Тригуб. М.: Вильямс, 2004. 928 с.

4. Методы компьютерной обработки изображений / под ред. В. А. Сойфера. М.: ФИЗМАТЛИТ, 2003. 784 с.

5. Хопкрофт Дж., Мотвани Р., Ульман Дж. Введение в теорию автоматов, языков и вычислений / пер. с англ. М.: Вильямс, 2002. 528 с.

6. Ukkonen Esko On-line construction of suffix trees // Algorithmica, 1995. Vol. 14. P. 249 - 260.

Балясный Сергей Викторович, магистр, [email protected], Россия, Тула, Тульский государственный университет,

Цудиков Михаил Борисович, канд. техн. наук, доц., [email protected], Россия, Тула, Тульский государственный университет

CONSTRUCTION OF QUALIFIER IN THE CONDITIONS OF PARTLY VISIBLE OBJECTS

S. V. Balyasny, M.B. Tsudickov

An algorithm of object recognition system construction in the conditions of partly visible objects for example then object's part is hidden behind an obstacle or located on an image's edge is considered. Qualifier structure that allows to using all of image's identified features without preliminary processing to recognize and localize an object is offered.

Key words: recognition, feature vector, localization, tree, classification, standart, sliding window.

Balyasny Sergei Vicktorovich, master of science, sergo120@,gmail. com, Russia, Tula, Tula State University,

Tsudickov Mikhail Borisovich, candidate of technical sciences, docent, tsudick-ov. mb@yandex. ru, Russia, Tula, Tula State University

УДК 004.652.4

УСКОРЕННЫЙ АЛГОРИТМ ГЕНЕРАЦИИ ЗАМЫКАНИЯ АТРИБУТОВ МНОЖЕСТВА СЕМАНТИЧЕСКИХ ЗАВИСИМОСТЕЙ

А.И. Баранчиков, А.Ю. Громов, Б.В. Костров

Предлагается модификация алгоритма получения замыкания множества атрибутов, в котором высокое быстродействие достигается за счет матричного представления входной информации. Исходные семантические зависимости, полученные в процессе анализа предметной области, представляются в формализованном виде, предпочтительном для применения предлагаемого алгоритма.

Ключевые слова: предметная область, замыкание, атрибут, матричное представление.

Разработка схем реляционных баз данных часто предполагает формирование эквивалентных покрытий исходного множества функциональных зависимостей F, полученного на этапе семантического анализа исходных данных. Предметная область обычно представлена в виде словесных утверждений о множестве ограничений накладываемых на связи между элементами данных. Одним из условий построения корректного алгоритма из данной области задач является проверка сохранения эквивалентности множества F при удалении, добавлении или модификации какой-либо функциональной зависимости определенной в рамках исходной предметной области.

Задача нахождения замыкания множества атрибутов связана с широким его использованием, в том числе в алгоритмах, ориентированных на генерацию схем реляционных баз данных [1, 2, 3].

Одним из наиболее распространенных способов определения выводимости функциональных зависимостей вида X ® Y из множества функциональных зависимостей F над схемой R, где X с R и У с R (частный случай, когда X = У не рассматривается, поскольку из аксиомы рефлексивности всегда следует X ® X), является получение замыкания множества атрибутов X +, которое определяется вместо замыкания F, что позволяет значительно сократить временную сложность алгоритма.

Построение классификатора при отсутствии части объекта на изображении Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Балясный Сергей Викторович, Цудиков Михаил Борисович

Похожие темы научных работ по математике , автор научной работы — Балясный Сергей Викторович, Цудиков Михаил Борисович

CONSTRUCTION OF QUALIFIER IN THE CONDITIONS OF PARTLY VISIBLE OBJECTS

Текст научной работы на тему «Построение классификатора при отсутствии части объекта на изображении»