Вычислительные технологии
Том 17, № 5, 2012
Метод опорной гиперповерхности для идентификации изображения лица человека
В. Т. КАЛАйДА1'2, А. И. ЕЛИЗАРОВ3 1 Национальный исследовательский Томский государственный университет, Россия 2 Томский университет систем управления и радиоэлектроники, Россия 3Институт оптики атмосферы СО РАН, Томск, Россия e-mail: [email protected], [email protected]
Предложен метод идентификации человека по изображению лица, основанный на вычислении меры близости до опорной гиперповерхности р-порядка, описывающей класс эталонных изображений. Оценка порядка гиперповерхности и вида ее уравнения производится методом выделения существенных переменных на основе формализма разложения в ряд Фурье — Хаара. Проведены экспериментальные исследования распознавания лица человека по представленному методу.
Ключевые слова: идентификация изображений, опорная гиперповерхность, алгебраические моменты, проективные искажения, многомерный полином, функции Хаара, существенные переменные.
Введение
Проблеме обнаружения объектов и классификации изображений в последние годы уделяется большое внимание в системах компьютерного зрения. Интерес к таким системам вызван интенсивным развитием информационных технологий и их широким использованием в различных приложениях (банковская деятельность, шоу-бизнес, обеспечение доступа к системам вооружения и разного рода документации и др.). Особую значимость данные системы приобретают в связи с нарастающей глобальной угрозой терроризма.
При реализации систем идентификации возникает задача анализа таких объектов как "лицо" или "люди", которые сложно описать небольшим и понятным набором свойств, и, пожалуй, основным подходом в этом случае является нахождение решения с помощью набора примеров (сравнения). Трудоёмкость такого подхода состоит в том, что для решения задачи с заданной точностью необходимо иметь большие наборы примеров. Это требует создания универсальной технологии распознавания изображений, которая могла бы поддерживать большие наборы данных (105-106 точек) в пространствах размерностью 102-103 [1].
Активно развивающимся в настоящее время альтернативным методам решения данной задачи присущ общий недостаток — существенная зависимость точности распознавания от условий регистрации изображения (ракурс наблюдения, уровень освещённости, проективные искажения и т.п.) [2-5].
В работе [6] была предложена методика идентификации человека по изображению лица, частично избавленная от отмеченных выше недостатков. В качестве анализируе-
мых признаков использовались алгебраические моменты. Настоящая статья посвящена развитию данного подхода.
1. Опорная гиперповехность
Формализованное описание изображения лица человека будем представлять в виде конечного вектора характеристик x = (x(, x2,... , xn) размерностью n [6]. Опорную гиперповерхность будем описывать полиномом порядка p от n переменных:
Pn (xi, Х2,..., Xn) — ^ ^ a>IXi X2 ... Xn , (1)
I
где I = (i1, i2,... , in) — мультииндекс (набор из целых неотрицательных чисел), (ii + i2 + ... + in) < p, ai — коэффициенты полинома. Число одночленов полинома (1) N = C'n+p [7]. Под порядком полинома (1) будем подразумевать максимальную из степеней его одночленов.
Поскольку практически все методы идентификации лиц относительно преобразования масштаба работают неустойчиво, то, как и в работе [6], под классом изображений будем понимать множество одномасштабных изображений лица одного и того же человека, полученных в различных условиях съёмки. Иначе говоря, на предварительном этапе производится приведение изображений к одному масштабу.
Опорной будем называть гиперповерхность, наименее отклоняющуюся от множества векторов, описывающих изображения данного класса. В этом случае задача поиска параметров опорной гиперповерхности сводится к следующей:
м 2
А (ai,a2,... ) = ^ (рп (xj), x2j),... ^ min,
j=i
где Pn (x(,x2, ... ,xn) = 0 — уравнение гиперповерхности; a — коэффициенты полинома, описывающего опорную гиперповерхность; i = (1,N); xj) = , xj ,... , —
реализация вектора параметров для j-го изображения класса; M — количество изображений в классе.
Оценки параметров опорной гиперповерхности (ai, a2,... , a^) являются решением нормальной однородной системы линейных уравнений
ÖA (о(, a2,..., aN)/öo( = 0, ÖA (o(, a2,..., aN)/öa2 = 0,
ÖA (o(, a2,..., aN)/öaN = 0. (2)
Для оценки принадлежности анализируемого изображения к классу используется величина
б = pn (xi), x2),..., xn ^ , (3)
где Pn — опорная гиперповерхность, построенная по полученным оценкам (ai, a2,... , a^) для класса изображений, ^x^, x2m),..., x^™^ — вектор параметров анализируемого изображения.
При реализации предлагаемого подхода в прикладных системах идентификации необходимо решить две задачи: оценить величину порядка р полинома опорной гиперповерхности и выделить существенные переменные (одночлены) полинома, из которых особенно важна вторая, так как количество аргументов полинома в зависимости от порядка полинома резко возрастает. Для размерности вектора характеристик при п = 9 для р =2 N = 55, р = 3 N = 220, р = 4 N = 7865 и т.д.
Поскольку вклад каждого одночлена полинома Рп в (3) будет различен, то можно выделить группу одночленов, вносящих существенный, определяющий вклад в исключив остальные из полинома. Наиболее удобно для этой цели воспользоваться формализмом ортонормированных функций Хаара [8].
2. Выделение существенных переменных
Система ортонормированных функций Хаара строится как
_ т — 1
2 т-1
Хк (х)
при х € 1к
п т-1
— 2 2 при х € 1+,
0 при х € 1к,
где к = 2т-1 + 3; т = 1, 2,
1, 2,
2т-1, 1к
3 — 1 3
отрезок, полу-
ченный путём деления отрезка [0,1] на 2т равных частей; ^ и /+ — левые и правые половины отрезка 1к (/к = I- + 1+). Эта ортонорминованная система имеет следующее свойство [8]: любая непрерывная на отрезке [0,1] функция f (х) разлагается в равномерно сходящийся ряд по функциям системы:
<х>
f (х) = X] СкХк (х)
к=1
где ск = J f (х)хк (х) ^х — спектральные коэффициенты, полученные в результате раз-0
ложения исходной функции по базису, состоящему из функций Хаара. Для каждой функции f (х), абсолютно интегрируемой по степени р =2, справедливо равенство Пар-севаля [8]
/го
f 2(х)^х = ^ ск. к=1
(4)
Для многомерного случая рассмотрим все возможные произведения функций Хаара
Хк1 (х1) Хк2 (х2) ,...,Хк„ (хп) ,
где 1 < ки < то, 1 < V < п. Совокупность всех произведений представляет собой ор-тонормированную систему на п-мерном кубе Кп = {0 < х1 < 1, 0 < х2 < 1,..., 0 < хп < 1}. Для любой интегрируемой функции f (х1,х2,... ,хп) можно вычислить спектральные коэффициенты
ск1к2,...,кп
f (х1,х2, . . . ,хп)Хк1 (х1) Хк2 (х2) , . . . ,Хкп (хп) ^х1^х2, . . . , ¿х„
Кп
3
1
и составить кратный ряд Фурье — Хаара, который равномерно сходится для любой непрерывной функции / (х^ х2,... , Хп):
те
/ (х1, х2, . . . , Хп) = ^ Ск1к2.„кп Хк-1 (х1) Хк2 (х2) ,...,Хкп (хп) . к1,к2,...,к„ = 1
В этом случае равенство Парсеваля (4) можно записать в виде:
/те
/2 (Х1,Х2 . ..Хп) . . . = ^ С2к1М,..,кп. (5)
Кп к1,к2 ,...,кп
Если в качестве функции / (х1 , х2,...,хп) рассматривать 5 (х1,х2, ... , Хп) (3), то уравнение (5) будет характеризовать вклад каждого коэффициента разложения ск1к2.....кп в общую дисперсию отклонения вектора, описывающего изображение от гиперповерхности класса. Это свойство взято в основу алгоритма выделения существенных переменных.
Общая схема оценки параметров опорной гиперповерхности сводится к следующему.
1. Для каждого класса изображений производится оценка параметров опорной гиперповерхности (р и (а1, а2,... , аN)) путём решения системы уравнений (2) для
м
р = 1, 2, 3 ... до тех пор, пока значение а2 = ^ (5 (хр, хРр,..., хР)) не начнет уве-
т=1
личиваться. Величина р, при которой а принимает минимальное значение, выбирается в качестве порядка полинома опорной гиперповерхности.
2. Для полученного на шаге 1 полинома, описывающего опорную гиперповерхность, выделяются существенные переменные по схеме:
те
2а) положим 5о (хь Х2,..., Хп) = 5 (х1, Х2,..., Хп), по = ок1М...,ккп и г = 1;
к-1,к2,...,кп
2б) выберем ст1.Р2.....Рп — максимальный по модулю спектральный коэффициент функции 5г-1 (х1, х2, ... , Хп), вычислим
5г (Х1 , х2, . . . , Хп ) = 5г-1 (Х1 , x2, . . . , Хп) Ст1 ,т1.....тп Хт1 (х1) ХР2 (х2) . . . ХРп (хп) ;
вычислим пг для функции 5г (х1, х2, ... , Хп);
2в) если (1 — пг/пг-1 ) > е, то г = г + 1 и перейдем на шаг 2б, иначе — перейдем на шаг 3.
3. По результатам выполнения шагов 2а — 2в определяются число одночленов полинома N' < N и набор мультииндексов для существенных переменных I' = (г'ь г'2,... , г'п).
4. По полученному значению N' и множеству мультиндексов I' строится новая нормальная система однородных уравнений
дА (а1, а2,..., aN/)/да1 = 0, дА (а1, а2,..., ау/)/да2 = 0,
дА (а1, а2,..., ау/)/даУ/ = 0. (6)
В результате решения системы (6) определяются новые оценки коэффициентов одночленов (а^, а2,..., а'/) полинома Р^ (х1 , х2, ... , Хп), описывающего опорную гиперповерхность для класса изображений.
3. Экспериментальная проверка метода
Экспериментальная проверка предложенного метода идентификации проводилась на той же выборке изображений, что и в работе [6]. Выборка содержала 243 изображения лица человека из 44 различных классов. Примеры анализируемых изображений приведены на рис. 1.
Формализованное описание изображения лица человека осуществлялось вектором алгебраических моментов размерностью п = 9. Такой набор параметров достаточен для описания особенностей изображения лица [9]. Для решения нормальной однородной системы использовался алгоритм БУО, основанный на сингулярном разложении матрицы и обладающий высокой точностью и устойчивостью вычислительного процесса [10]. Размножение количества векторов класса реализововалось методом Ъоо1в1гар [6, 11]. Разложение в ряд Фурье — Хаара ограничивалось семью гармониками (х (х) , я = 1, 7). Уровень значимости е выбирался равным 0.005.
Рис. 1. Примеры изображений лица человека
Рис. 2. Относительная остаточная дисперсия
Относительное значение дисперсии отклонения для полинома первого, второго и третьего порядка
Порядок полинома p 1 2 3
a2/af 1.00 0.63 0.71
Оценка порядка полинома для всех классов анализируемых изображений (см. таблицу) показала, что для описания изображения лица человека лучшие результаты получаются для полинома второго порядка.
Шаг выделения существенных переменных представлен графиком на рис. 2. Как следует из результатов расчёта, из 55 членов полинома "существенными" являются 9-10, остальные в изменение дисперсии вносят вклад не более 10%.
Таким образом, экспериментальные исследования метода, основанного на описании класса изображений лица человека опорной гиперповерхностью, показали, что предложенный метод обеспечивает достоверную, пригодную для практического использования идентификацию (вероятность распознавания) на уровне 0.9.
Список литературы
[1] Osunay E., Freund R., Girosiy F. Training support vector machines: An application to face detection // Proc. of CVPR'97. Puerto Rico, 1997. P 130-136.
[2] Кухарев Г.А. Биометрические системы: Методы и средства идентификации личности человека. СПб.: Политехника, 2001. 240 с.
[3] Saco H., Whitehouse M., Smith A., Sutherland A. Real-time facial feature tracking based on matching techniques and its application // Proc. of IAPR. 1994. Vol. 2. P. 320-324.
[4] LeCun Y., Bengio Y. Convolutional networks for images, speech, and timeseries // The Handbook of Brain Theory and Neural Networks. Cambridge, 1995. P. 255-258.
[5] Kruizinga P., Petkov N. Optical flow applied to person identification // Proc. of Conf. on Massively. Parallel Processing Appl. and Development. Netherlands, 1994. P. 871-878.
[6] Калайда В.Т., Губанов Н.Ю. Идентификация лица человека методом опорной гиперплоскости // Вычисл. технологии. 2007. Спец. выпуск № 1: Труды отдела проблем информатизации ТНЦ СО РАН. С. 96-101.
[7] Новосёлов С.И. Специальный курс элементарной алгебры. М.: Высшая школа, 1962. 564 с.
[8] Соболь И.М. Многомерные квадратные формулы и функции Хаара. М.: Наука, 1969. 288 с.
[9] Калайда В.Т. Применение методов морфологического анализа для задач идентификации полутоновых изображений // Оптика атмосферы и океана. 2003. Т. 16, № 9. С. 862-865.
[10] Стренг Г. Линейная алгебра и ее применение. М.: Мир, 1980. 454 с.
[11] Good P. Permutation, Parametric, and Bootstrap Tests of Hypotheses. Springer, 2005, XVI. 376 p.
Поступила в 'редакцию 15 марта 2012 г., с доработки —17 апреля 2012 г.