Научная статья на тему 'Выбор рабочего словаря признаков в алгоритмах распознавания изображений на основе фурье-дескрипторов'

Выбор рабочего словаря признаков в алгоритмах распознавания изображений на основе фурье-дескрипторов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
696
132
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНФОРМАТИВНЫЕ ПРИЗНАКИ / АЛГОРИТМ РАСПОЗНАВАНИЯ / ФУРЬЕ-ДЕСКРИПТОР / РАСПОЗНАВАНИЕ ИЗОБРАЖЕНИЯ / КОНТУР ОБЪЕКТА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Колючкин В. Я., Нгуен К. М.

Одной из важных и сложных задач построения эффективных систем распознавания является задача выбора рабочего словаря признаков, составленного из наиболее информативных признаков. Успешное решение этой задачи обеспечивает как снижение размерности вектора признаков, подлежащих анализу, так и повышение эффективности системы распознавания в целом. В статье рассматривается проблема сокращения признакового пространства в алгоритмах распознавания образов по контурам изображений объектов и предлагается метод её решения, основанный на поиске наиболее существенных признаков. Приведены результаты экспериментальных исследований, из которых следует, что предложенный метод позволяет существенно сократить размерность словаря признаков и повысить эффективность алгоритма распознавания образов по контурам изображений объектов изображений на основе фурье-дескрипторов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Колючкин В. Я., Нгуен К. М.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Выбор рабочего словаря признаков в алгоритмах распознавания изображений на основе фурье-дескрипторов»

НАУЧНОЕ ИЗДАНИЕ МГТУ ИМ. Н. Э. БАУМАНА

НАУКА и ОБРАЗОВАНИЕ

Эл № ФС77 - 48211. Государственная регистрация №0421200025. ISSN 1994-0408

электронный научно-технический журнал

Выбор рабочего словаря признаков в алгоритмах распознавания

изображений на основе фурье-дескрипторов

# 03, март 2014

Б01: 10.7463/0314.0699817

Колючкин В. Я., Нгуен К. М.

УДК 004.932

Россия, МГТУ им. Н.Э. Баумана уко1исЬЙ;Ь 5mtu.ru сопйлш!Ь;^;уапс1ех.ги

Введение

Как известно [1], разработка системы распознавания образов включает следующие этапы: формирование классов объектов; выбор словаря признаков и описание классов в признаковом пространстве; выбор решающих правил; статистические испытания системы распознавания; уточнение алгоритма распознавания.

Одной из важных и сложных задач построения эффективных систем распознавания является задача выбора рабочего словаря признаков, составленного из наиболее информативных признаков. Успешное решение этой задачи обеспечивает как снижение размерности вектора признаков, подлежащих анализу, так и повышение эффективности системы распознавания в целом.

В принципе, каждое цифровое изображение можно рассматривать как множество числовых признаков, заданных в пространстве, размерность которого определяется числом пикселов изображения. Однако классификация объектов (изображений) в таком пространстве практически невозможна вследствие ряда причин. Во-первых, представление изображения является избыточным, признаки оказываются сильно зависимыми. Во-вторых, обучение многопараметрических классификаторов для большой размерности признаков требует значительных ресурсов (временных, объема обучающей выборки и т. д.), причем качество таких классификаторов при реальном применении может не удовлетворять заданным требованиям. В-третьих, поиск изображения в больших базах данных с использованием большого числа признаков требует неоправданно больших вычислительных ресурсов. При преобразовании изображения в другое пространство без снижения его размерности (например, путем спектрального преобразования) эти проблемы сохраняются.

Сокращение признакового пространства осуществляется путем отбора наиболее информативных признаков, обеспечивающих необходимые временные и качественные характеристики разрабатываемой системы распознавания образов.

В [1] рассмотрены теоретические проблемы задачи выбора рабочего словаря наиболее информативных признаков при классификации объектов. В [2] предложен метод отбора информационных признаков, основанный на расчете как локальных, так и глобальных признаков с использованием алгоритма присоединения - отбрасывания признаков по выбранному критерию классификации. В [3] для уменьшения размерности словаря признаков, полученного на основе главных компонент, в задаче распознавания лица человека был использован метод линейного дискриминантного анализа. Но в литературе не освещены вопросы уменьшения словаря признаков для алгоритмов распознавания, основанных на анализе контуров изображений. Настоящая статья посвящена решению этой задачи.

Методика выбора рабочего словаря признаков

Для построения рабочего словаря признаков, обеспечивающих решение задачи распознавания, в настоящей работе предлагается алгоритм, состоящий из следующих этапов (рис. 1):

Рис. 1. Этапы построения рабочего словаря признаков

Первый этап: выделение контуров изображений объектов.

Для этой цели использован метод выделения контуров изображений объектов, основанный обработке исходных изображений оператором Превитта, пороговой сегментации и последующей морфологической обработки. Аналогично алгоритму выделения контуров, основанного на методе Канни и морфологической обработке [4], предлагаемый алгоритм может быть представлен блок схемой, изображённой на рис. 2.

Морфологические операции и процедуры

Рис. 2 - Блок схема алгоритма выделение контуров изображений

В этом алгоритме для обнаружения перепадов яркости изображения, которое получено после предварительной обработки, заключающийся в винеровской фильтрации, применяется градиентный оператор Превитта [5, 6, 7]. С использованием этого оператора модуль градиента в каждом пикселе изображения вычисляется по формуле

а=Л1 о: + а; *\ох\ +

о.

(1)

причём проекции О и О вычисляются путём свёртки изображения с матрицами вида

1 0 1" "- 1 -1 -1 "

II -1 0 1 II гу 0 0 0 • (2)

-1 0 1 1 1 1

Результат вычисления модуля градиента по формуле (1) сравнивается с порогом Т, который подбирается экспериментально. Если выполняется условие |0|>Т, пиксел считается принадлежащим контуру и ему присваивается значения яркости Ь0 = 1, в противном случае

пиксел считается принадлежащим фону и ему присваивается значения яркости Ьв = 0 .

К сегментированному изображению применяются морфологические операции и процедуры [7, 8], в том числе:

- операция дилатации бинарного изображения контура;

- процедура заполнения области внутри контура;

- процедура выделения контура.

Второй этап: формирование исходного словаря признаков.

В данной работе для формирования словаря признаков распознавания объектов по их контурным границам использованы фурье-дескрипторы [6, 7, 8]. На основе фурье-дескрипторов можно сформировать признаки, которые инвариантны к сдвигу, повороту и изменению масштаба границы объекта. В этом случае вектор признаков Х представляется в виде [4]:

X =

И К—!Е

Е

(Ц 2 )-1

Е1Г Е1ГКГ К

(3)

Значение параметра Ц, который соответствует размерности массива, описывающего контур изображения, определяет размерность К признакового пространства, а именно, К = Ц — 2.

Если упорядочить признаки, описываемые вектором Х, в порядке их возрастания, то получим вектор ХИ который определяется как

Хъ=(Х1,Х2,...,Х„),гтХ1е

Ы К\ К 1 К

К

(Ц 2)—1

, X > X,, I < ]

(4)

КГ'" КГ И' КГ' К

V У

Третий этап: определение рабочего словаря признаков.

При выполнении этого этапа известно:

• разбиение исходного множества объектов на классы 0 = ,...,Оот}, т.е. известен алфавит классов объектов;

• исходный словарь признаков Хи = (Хг,Х2,...,Хп)т .

Пусть Х]рк - , — тый признак к — того объекта, принадлежащего р — тому классу, причём:

, = 1, п; к = 1, кр ; р = 1, т.

Введём в рассмотрение следующие параметры: £ (о^,) - среднеквадратическое отклонение

(СКО) объектов внутри класса в признаковом пространстве Хи , которое вычисляется по формуле [1]

£ (О р ) =

^ ^ кр кр п

Т (ХРк — Хр1)2

кр кр—1 к=1 к=1 ,=1

(5)

и Я (о^,, - среднеквадратическое расстояние между двумя классами О^ и , которое вычисляется по формуле [1]

Я(Ор, О ) =

1 1 кр кр п

1 ■1Т Т Л (ХРк — X, )2.

к к к=1 к=1 ,=1 Р Ч 1

(6)

В формулах (5) и (6) Л — компоненты вектора , которые принимают

значения 1 или 0 в зависимости от того используется или нет данный признак.

В качестве критерия эффективности признаков можно использовать величину

Е = Я2 (О, О V£(Ор ) ■ £(О?), которая характеризует отношение расстояния между классами

к разбросу объектов внутри каждого из классов. Задача выбора признаков сводится к поиску экстремума функционала [1] вида

т

т

max minF = max min{^2(Q„,Q)/S(Q )• S(Q )} (7)

Я p,q=\,m Л p,q=\,m ^ Pll У I )

n

при условии ограничения стоимости затрат на технические средства, т.е. ^C • Л. .

] 1 j=1

Четвертый этап: испытания и корректировка алгоритма.

Для проверки эффективности рабочего словаря признаков, полученного по изложенной методике, были проведены численные эксперименты, в которых производилась сравнительная оценка вероятности правильного распознавания образов объектов при использовании исходного и рабочего словарей признаков.

В экспериментах использовались две базы данных, которые содержали по одному эталонному изображению, для объектов каждого класса.

Тестовые выборки изображений, которые использовались в экспериментах, были подготовлены из эталонных изображений. Кроме эталонных изображений, в состав тестовых выборок каждого класса объектов были включены 12 модификаций эталонных изображений, в том числе:

• 7 изображений, полученных поворотом эталонных изображений на углы в интервале 20о до 150о;

• 2 изображения, полученных масштабированием эталонных изображений с коэффициентом масштабирования, равным 0,75 и 0,5;

• 3 изображения, полученных добавлением к эталонным изображениям аддитивного шума с нормальным законом распределения и СКО, равным 0,036, 0,062, 0,073 (СКО выражено в относительных величинах от числа градаций серого полутонового изображения).

Исходный словарь признаков, полученный на основе фурье-дескрипторов в соответствии с выражениями (3) и (4), имел размерность, равную К = 98. Размерность рабочего словаря признаков определялась по результатам поиска экстремума функционала (7).

Для принятия решений об отнесении образов объектов к тому или иному классу О использовался классификатор, основанный на минимизации евклидова расстояния между вектором Хг признаков объекта ог из тестовой выборки и векторами Xк (к = 1, т ) признаков эталонных объектов, образующих алфавит классов, а именно, [1]

где евклидово расстояние ргк определяется формулой

Ртк =

Xг - X*

хг - хк )2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

. I I /

(9)

На рис. 3 представлены эталонные изображения, содержавшиеся в первой базе данных.

Рис. 3. Эталонные изображения первой базы данных

На рис. 4 представлен график зависимости значений функционала ¥, определяемого по формуле (7), от количества используемых признаков, упорядоченных по их возрастанию в соответствии с выражением (4). Из этого графика следует, что при Л = 3 функционал имеет ярко выраженный экстремум.

I

1

--- .... .... .... .... .... .... .... .... .... .... .... .... .... ..... ..... .....

О 3 6 9 12 15 18 21 24 27 30 33 36 39 42 45 48 51 54 57 50 53 86 69 72 75 78 81 84 87 90 93 96 9900

Количество признаков

Рис. 4. График зависимости значений функционала Г от количества признаков

В таблице 1, приведены значения частоты правильного распознавания при использовании всех 98 исходных признаков, а также при использовании 2, 3 и 4 признаков, упорядоченных в

соответствии с выражением (4). Номера 1, 2, 3,...,10 соответствуют номерам объектов из базы данных на рис. 3.

Таблица 1. Частота правильного распознавания первой базы данных

Объект Количество признаков

98 2 3 4

1 13/13 13/13 13/13 13/13

2 11/13 11/13 11/13 11/13

3 12/13 13/13 13/13 13/13

4 13/13 12/13 13/13 13/13

5 13/13 13/13 13/13 13/13

6 13/13 13/13 13/13 13/13

7 13/13 13/13 13/13 13/13

8 13/13 13/13 13/13 13/13

9 12/13 12/13 13/13 13/13

10 13/13 13/13 13/13 13/13

Из этой таблицы следует, что значения частоты правильного распознавания при использовании 3-х признаков равны частотам правильного распознавания при использовании 4-х признаков, но больше чем при использовании 2-х и 98 признаков. Из этого, на первый взгляд неожиданного, результата следует что, для этого набора данных достаточно использовать 3 признака вместо 98 признаков исходного словаря.

Во второй серии экспериментов использовалась вторая база данных, содержавшая 13 эталонных изображений, которые представлены на рис. 5. На рисунке 6 представлен график зависимости значений функционала Е, определяемого по формуле (7), от количества используемых признаков. Из этого графика следует, что глобальный экстремум функционала достигается при значении Л = 6 .

ШРй ШРб 13JPG

Рис. 4. Эталонные изображения второй базы данных

_I_I_I_I_I_I_I_I_I_I_I_I_I_I_I_I_I_I_I_I_I_I_I_I_I_I_I_I_I_I_I_I_и

О 3 6 9 12 15 18 21 24 27 30 33 36 39 42 46 4В 61 54 5 7 60 63 6 6 6 9 72 75 78 61 84 87 90 9 3 96 9)0»

Количество признаков Рис. 5. График зависимости значений функционала Е от количества признаков

В таблице 2, приведены значения частоты правильного распознавания при использовании всех 98 исходных признаков, а также при использовании 3, 4, 6 и 7 признаков, упорядоченных в соответствии с выражением (4). Номера 1, 2, 3,...,13 объектов соответствуют номерам эталонных объектов из базы данных, представленных на рис. 4.

Таблица 2. Частота правильного распознавания второй базы данных

Объект Количество признаков

98 3 4 6 7

1 13/13 13/13 13/13 13/13 13/13

2 11/13 11/13 11/13 11/13 11/13

3 13/13 13/13 13/13 13/13 13/13

4 13/13 13/13 13/13 13/13 13/13

5 13/13 13/13 13/13 13/13 13/13

6 13/13 13/13 13/13 13/13 13/13

7 13/13 11/13 13/13 13/13 13/13

8 13/13 13/13 13/13 13/13 13/13

9 12/13 13/13 13/13 12/13 12/13

10 13/13 13/13 13/13 13/13 13/13

11 13/13 11/13 13/13 13/13 13/13

12 13/13 13/13 13/13 13/13 13/13

13 13/13 13/13 13/13 13/13 13/13

Из таблицы 2 следует, что максимальные значения частоты правильного распознавания достигаются при использовании 4-х признаков, но не 6-ти, как следует из графика на рис. 5. Это означает, что окончательный вывод о выборе рабочего словаря признаков следует делать на основе анализа вероятностных показателей эффективности алгоритма. Тем не менее, метод анализа, использованный в этой работе, позволяет определить начальное приближение для оптимизации рабочего словаря признаков.

Заключение

На основании проведённых исследований можно сделать вывод о том, что предложенный метод анализа исходного словаря признаков в алгоритмах распознавания образов по контурам изображений объектов на основе фурье-дескрипторов позволяет определить рабочий словарь признаков, который имеет существенно меньшую размерность, чем исходный словарь признаков, и обеспечивает большую эффективность алгоритма распознавания.

Список литературы

1. Горелик А.Л., Скрипкин В.А. Методы распознавания. М.: Высшая школа, 1984. 208 с.

2. Глумов Н.И., Мясников Е.В. Метод отбора информативных признаков на цифровых изображениях // Компьютерная оптика. 2007. Т. 31, № 3. С. 73-76.

3. Кухарев Г.А. Биометрические системы: Методы и средства идентификации личности человека. СПб.: Политехника, 2001. 240с.

4. Колючкин В.Я, Нгуен К.М. Алгоритмы контурной сегментации и распознавания образов объектов систем технического зрения // Наука и образование. МГТУ им. Н.Э. Баумана. Электрон. журн. 2013. № 04. DOI: 10.7463/0413.0548084

5. Фисенко В.Т., Фисенко Т.Ю. Компьютерная обработка и распознавание изображений. СПб.: СПбГУ ИТМО, 2008. 192 с.

6. Гонсалес Р., Вудс Р. Цифровая обработка изображений: пер. с англ. М.: Техносфера, 2005. 1072 с.

7. Гонсалес Р., Вудс Р., Эддинс С. Цифровая обработка изображений в среде MATLAB: пер. с англ. М.: Техносфера, 2006. 616 с.

8. Яне Б. Цифровая обработка изображений: пер. с англ. М.: Техносфера, 2007. 584 с.

SCIENTIFIC PERIODICAL OF THE BAUMAN MSTU

SCIENCE and EDUCATION

EL № FS77 - 48211. №0421200025. ISSN 1994-0408

electronic scientific and technical journal

Selecting an informative features vocabulary for recognition algorithms

based on Fourier-descriptors

# 03, March 2014

DOI: 10.7463/0314.0699817

V.Ya. Kolyuchkin, K.M. Nguen

Bauman Moscow State Technical University, 105005, Moscow, Russian Federation

vkoluchSb smtu.ru congminh-^yandex.m

Working vocabulary of features include most informative features of objects to be recognized. The aim is to develop a method of forming a working vocabulary of features for recognition algorithms based on Fourier-descriptors of the object image contours.

To solve this problem the paper offers to use the method of functional maximization that is the ratio of the distance between the classes to the spread of objects within each of the classes represented in the feature space, which is formed on the basis of Fourier-descriptors.

To check the effectiveness of the proposed method to form a working vocabulary of features the numerical experiments have been carried out. The experiments used two databases of reference images consisting of 10 and 13 reference images. Test images obtained by rotating the reference images, by zooming, as well as by adding the noise using the normal law of distribution have been created from these images. The proposed by the author algorithm, which uses the Prewitt operator, threshold segmentation, and morphological processing has marked the contours of images. The original vocabulary of features derived from the Fourier-descriptors has dimension of 98. The vocabularies of working features having the dimensions, respectively, 3 and 4 have been formed on the basis of functional maximization for both reference images. In the course of numerical experiments the frequency of correct decisions to recognise the features of reference bases of images for the original and working vocabularies has been evaluated. It has been proved that the algorithm of recognition with the formed working vocabularies of features provides a great efficiency of automatic recognition of objects.

There are known publications, which use a similar method to form a working vocabulary of features in algorithms of human recognition by the image. But there are no publications on choosing the

vocabulary of features for recognition algorithms based on the analysis of the image contours that can be used in computer vision systems of automated production lines.

Publications with keywords: informative features of signals, recognition algorithm, fourier-descriptors, recognition images, contour objects

Publications with words: informative features of signals, recognition algorithm, fourier-descriptors, recognition images, contour objects

References

1. Gorelik A.L., Skripkin V.A. Metody raspoznavaniya [Recognition methods]. Moscow, Vysshaya shkola, 1984. 208 p. (in Russian).

2. Glumov N.I., Myasnikov E.V. [Method of selection of informative signs on digital images]. Komp'yuternaya optika - Computer Optics, 2007, Vol. 31, no. 3, pp. 73-76. (in Russian).

3. Kukharev G.A. Biometricheskie sistemy: Metody i sredstva identifikatsii lichnosti cheloveka [Biometric systems: Methods and tools for identification of person]. St. Petersburg, Politekhnika, 2001. 240 p. (in Russian)

4. Kolyuchkin V.Ya, Nguen K.M. [Algorithms of contour segmentation and pattern recognition for computer vision systems]. Nauka i obrazovanie MGTU im. N.E. Baumana - Science and Education of the BaumanMSTU, 2013, no. 4. DOI: 10.7463/0413.0548084 (in Russian).

5. Fisenko V.T., Fisenko T.Yu. Komp'yuternaya obrabotka i raspoznavanie izobrazheniy [Computer image processing and recognition]. St. Petersburg, St. Petersburg University ITMO Publ., 2008. 192 p. (in Russian).

6. Gonzales R.C., Woods R.E. Digital Image Processing. 2nd ed. Prentice Hall, 2001. (Russ ed.: Gonzales R., Woods R. Tsifrovaia obrabotka izobrazhenii. Moscow, Tekhnosfera, 2005. 1072 p.).

7. Gonzales R.C., Woods R.E., Eddins S.L. Digital Image Processing UsingMATLAB. Prentice Hall, 2003, 624 p. (Russ. ed.: Gonsales R., Woods R., Eddins S. Tsifrovaia obrabotka izobrazhenii v srede MATLAB. Moscow, Tekhnosfera, 2006. 616 p.).

8. Jähne B. Digital Image Processing. 6th ed. Springer Berlin Heidelberg, 2005. 607 p. (Russ. ed.: Jähne B. Tsifrovaia obrabotka izobrazhenii. Moscow, Tekhnosfera, 2007. 584 p.). DOI: 10.1007/3-54027563-0

i Надоели баннеры? Вы всегда можете отключить рекламу.