УДК 004.05: 004.93'1
МЕТОД ГИБКОГО СРАВНЕНИЯ НА ГРАФАХ КАК АЛГОРИТМ РАСПОЗНАВАНИЯ ОБРАЗОВ
Арсентьев Дмитрий Андреевич
доцент кафедры информатики и информационных технологий, кандидат технических наук Московский государственный университет печати имени Ивана Федорова 127550 Россия, г. Москва, ул. Прянишникова, д. 2А аёшт@к1-еёи. ги
Бирюкова Татьяна Сергеевна
магистрант кафедры информатики и информационных технологий Московский государственный университет печати имени Ивана Федорова 127550 Россия, г. Москва, ул. Прянишникова, д. 2А (апуа19011993@шаИ.ги
Аннотация. В работе рассматривается метод гибкого сравнения на графах, как алгоритм распознавания образов, история создания метода, математическое описание, а также основные методы распознавания образов.
Ключевые слова: распознавание образов, методы распознавания образов, метод гибкого сравнения на графах, фильтры Габора.
В настоящее время задача распознавания образов применяется в различных сферах человеческой деятельности. Когда речь заходит о распознании образов подразумевается, что программа предназначена для распознавания отсканированного (сфотографированного) текста или изображения.
Одним из наиболее важных элементов распознавания образов является локализация лиц, их поиск в пространстве и вывод информации о конкретном человеке на устройство. Технология распознавания лица человека не требует биометрических показателей, не требует физического контакта с устройством распознавания лиц, и является наиболее удобной в использовании.
В целом, можно выделить три метода распознавания образов:
Метод перебора. В этом случае производится сравнение с базой данных, где для каждого вида объектов представлены всевозможные модификации отображения.
Глубокий анализ характеристик образа. В случае оптического распознавания это может быть определение различных геометрических
характеристик. Звуковой образец в этом случае подвергается частотному и амплитудному анализам.
Использование искусственных нейронных сетей. Этот метод требует большого количества примеров распознавания при обучении, либо специальной структурной нейронной сети, учитывающей специфику данной задачи. Тем не менее, его отличает более высокая эффективность и производительность.
Способ гибкого сравнения на графах относится к первому методу. Он впервые упоминается в статье «ieee transactions on computers, vol. 42, no. 3, march 1993». Эта статья стала отправной точкой данного
способа, в последующие годы он расширялся и модернизировался с учетом новых информационных решений. В ней описывается создание программы распознавания лиц, которая основывается на представлении гибких графов, где вершины отмечены крупномасштабными по отношению к местному спектру мощности, а ребра — как геометрические векторы расстояния. В вершинах графа вычисляются значения признаков, чаще всего используют комплексные значения фильтров Габора или их упорядоченных наборов — вейвлет — преобразование (всплески Габора), которые вычисляются в некоторой локальной области вершины графа локально путем свертки значений яркости пикселей с фильтрами Габора. Волны Габора дают значение для каждой волны во всех местах изображения. Таким образом, со стандартными параметрами дискретных изображений способ дает 80 (40 реальные и + 40 воображаемые) значений в любой позиции пикселя. Этот набор значений для одной позиции пикселя называют струйным.
Ребра графа взвешиваются расстояниями между смежными вершинами. Различие (расстояние, дискриминационная характеристика) между двумя графами вычисляется при помощи некоторой ценовой функции деформации, учитывающей как различие между значениями признаков, вычисленными в вершинах, так и степень деформации ребер графа.
Деформация графа происходит путем смещения каждой из его вершин на некоторое расстояние в определённых направлениях относительно ее исходного местоположения и выбора такой ее позиции, при которой разница между значениями признаков (откликов фильтров Габора) в вершине деформируемого графа и соответствующей ей вершине эталонного графа будет минимальной.
Данная операция выполняется поочередно для всех вершин графа до тех пор, пока не будет достигнуто наименьшее суммарное различие между признаками деформируемого и эталонного графов. Значение ценовой функции деформации при таком положении деформируемого графа и будет являться мерой
различия между входным изображением лица и эталонным графом. Данная «релаксационная» процедура деформации должна выполняться для всех эталонных лиц, заложенных в базу данных системы. Результат распознавания системы — эталон с наилучшим значением ценовой функции.
Рис. 1. Пример деформации графа в виде регулярной решетки
В отдельных публикациях указывается 95-97% эффективность распознавания даже при наличии различных эмоциональных выражений и изменении ракурса лица до 15 градусов. Поэтому данный метод наиболее выгоден при реализации приложения по распознанию образов.
Недостатки:
• высокая вычислительная сложность процедуры распознавания;
• низкая технологичность при запоминании новых эталонов;
• линейная зависимость времени работы от размера базы данных лиц.
На сегодняшний день метод гибкого сравнения на графах обрабатывается на мобильных устройствах, в зависимости от типа устройства, примерно за 2-4 секунды, что позволяет анализировать и выводить информацию на дисплей мобильного устройства быстро и своевременно, не затрудняя работу с приложением. Данное приложение не нагружает
мобильную платформу и процессор устройства. Однако обработка метода очень сильно зависит от оптимизации приложения.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Алексеев В. Графы и алгоритмы. Структуры данных. Модели вычислений. — М: Бином, 2009.
2. Жарких А.А. Обработка изображений на основе вейвлет преобразования в базисе Хаара над конечным полем нечеткой характеристики / А.А. Жарких // Вестник МГТУ. — том 12. — № 2. — 2009.
3. Ибрагимов В.В., Арсентьев Д.А. Алгоритмы и методы распознавания личности в условиях современных информационных технологий, // Вестник МГУП — №1. — 2015.
4. Попов Д.И. Компьютерная графика — М.: Изд-во МГУП, 2009. — 70 с.
METHOD OF FLEXIBLE COMPARISON IN GRAPHS AS ALGORITHM FOR PATTERN RECOGNITION
Dmitry Andreevich Arsentev
Moscow State University of Printing Arts 127550 Russia, Moscow, Pryanishnikova st., 2Â
Tat'yana Sergeevna Biryukova
Moscow State University of Printing Arts 127550Russia, Moscow, Pryanishnikova st., 2Â
Annotation. In this paper the method is flexible comparisons on graphs as pattern recognition algorithm, the history of creation of the method, a mathematical description, as well as the main methods ofpattern recognition.
Keywords: pattern recognition, pattern recognition methods, the method of the flexible comparison graphs, Gabor filters.