Научная статья на тему 'Классификация биометрических параметров пользователя с помощью вероятностных методов'

Классификация биометрических параметров пользователя с помощью вероятностных методов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
369
64
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Классификация биометрических параметров пользователя с помощью вероятностных методов»

3. Вентцель Е.С., Овчаров Л.А. Теория случайных процессов и ее инженерные приложения: Учеб. пособие для втузов. 2-е изд. стер. - М.: Высш. шк., 2000.

Ю.А. Брюхомицкий

Россия, г. Таганрог, ТРТУ

КЛАССИФИКАЦИЯ БИОМЕТРИЧЕСКИХ ПАРАМЕТРОВ ПОЛЬЗОВАТЕЛЯ С ПОМОЩЬЮ ВЕРОЯТНОСТНЫХ МЕТОДОВ

В современных технологиях информационной безопасности все большее распространение получают биометрические системы идентификации (БСИ), основанные на использовании уникальных биометрических характеристик человека. Особую группу составляют динамические БСИ, реализующие идентификацию человека по рукописному, клавиатурному почерку и голосу. Возможность сохранения тайны парольной фразы дает этим системам дополнительное преимущество перед другими БСИ и является предпосылкой существенного повышения предоставляемой ими степени защиты [1].

В динамических БСИ, использующих особенности рукописного и клавиатурного почерков, процедура идентификации/аутентификации пользователя реализуется обычно в два этапа. На первом этапе соответствующие биометрические характеристики личности преобразуются в некоторый вектор V информативных биометрических параметров, представляемый в Ж-мерной ортогональной системе координат. Компоненты вектора V формируются в результате прямых измерений параметров почерка (клавиатурного) [2] или путем вычисления ортогональных функционалов по полной реализации вводимой пользователем парольной фразы [1, 3, 4]. Компоненты вектора V в общем случае обладают внутренней корреляцией. На втором этапе решается задача классификации вектора V, на «своего» или «чужого». Для этого чаще всего применяются геометрические методы классификации, использующие различные меры близости [1, 3, 4], а также методы, основанные на использовании искусственных нейронных сетей [5, 6].

Геометрические методы достаточно просты в реализации, но имеют высокий уровень ошибок классификации. Нейросетевые классификаторы потенциально более точны, однако в них обычно используются многослойные перцептроны с сигмоидальными функциями активации, которым свойственны неопределенно долгий процесс обучения, возможность возникновения тупиков, паралича сети, а также серьезная проблема формирования обучающих примеров «чужих» пользователей.

Задача классификации (разделения) входных биометрических векторов V на «своих» (вектор V+) и «чужих» (вектор V-), в общем случае сводится к выбору метода построения дискриминантной функции g(V), реализующей указанное разделение. В свою очередь, выбор метода построения g(V) зависит от характера классифицируемых объектов.

Если параметры классов объектов a priori неизвестны, то функция g(V) задается в явном виде с использованием m действительных параметров - весов:

g(V) = g(V, Wb W2, ..., Wm). (1)

Из множества различных классов функции g(V), которые могут быть заданы выражением (1), из каких-либо практических соображений (точность, быстродействие, простота и т.п.) выбирается один из возможных: линейные, кусочнолинейные, квадратичные, и др. [5]. Последующее обучение классификатора в выбранном классе сводится к некоторой процедуре подбора весов w1, w2, ..., wm. К такому методу построения дискриминантной функции g(V) относятся, в частно-

сти, все упомянутые выше геометрические методы, а также методы, использующие обучаемые ИНС.

В том случае, если параметры классов объектов a priori известны, можно воспользоваться параметрическими методами обучения, когда функцию g(V) задают в явном виде от параметров обучающего множества [7].

В настоящей работе предлагается параметрический классификатор, использующий принципы работы вероятностных нейронных сетей (ВНС). ВНС основаны на реализации методов Байеса, когда решение о принадлежности предъявленного образца тому или иному классу выносится на основе выбора наиболее вероятного класса из тех, которым может принадлежать образец. При этом требуется оценка функции плотности распределения вероятностей для каждого класса, которая получается на основе рассмотрения учебных данных. Формальное правило состоит в том, что класс с наиболее плотным распределением в области неизвестного экземпляра имеет преимущество по сравнению с другими классами. Оценка функции плотности распределения вероятностей выполняется по методу Парцена (Parzen), в котором используется весовая функция, имеющая центр в точке, представляющей учебный образец. Такая весовая функция называется функцией потенциала или ядром. Чаще всего в качестве ядра используется функция Гаусса [8].

В отличие от ВНС предлагаемый метод не требует реализации нейронной сети как таковой. Это становится возможным, благодаря ряду особенностей, возникающих при классификации биометрических параметров.

В БСИ задачу классификации биометрических параметров многих пользователей без нарушения общности всегда можно свести к задаче разделения только на два класса: «свой» - вектор V+ и «чужой» - вектор V”. Это становится возможным благодаря принятой в БСИ двухступенчатой процедуре идентификации/аутентификации. На первом этапе по предъявленному пользователем идентификатору в структуру классификатора вносятся соответствующие биометрические параметры (эталон) данного пользователя для проведения второго этапа - биометрической аутентификации. В этом случае классификатор реализуется с использованием только одной дискриминантной функции g(V), знак которой будет определять принадлежность предъявленного вектора V к одному из двух классов: V+, V”.

Кроме того, в классификаторах БСИ желательно использовать для обучения только учебные образцы вектора V+, поскольку формирование обучающего множества векторов V” представляет серьезную проблему [5, 6].

Учитывая указанные особенности БСИ, зададим область распределения биометрических параметров некоторого «своего» пользователя множеством учебных

данных, содержащих L векторов V+, i = 1, L, случайно распределенных в N-

мерном пространстве, где каждый вектор V+, i = 1, L представлен своими N компонентами:

V+ = i , V2 — VN X j = 1 N, i = 1 L

Оценку функции плотности распределения вероятностей для одного учебного вектора V1N (при /=1) зададим в виде функции Гаусса [8]

II +11

V - V+

9(V) = exp -V------2J- , (2)

2ц 2

где ц - параметр, задающий ширину функции ф(У).

Оценка функции плотности распределения вероятностей для всего класса учебных векторов Уг+, I = 1, Ь образуется суммированием функций (2)

Ф(У) = 1 ехр

і=1

V - у;

2ц2

її 2 Л

(3)

В выражении (3) параметр ц, задавая ширину каждой функции ф(У), определяет их взаимное влияние на результирующую функцию Ф(У). Для повышения точности классификации возможно проведение дополнительного анализа учебных данных на предмет установления статистических характеристик распределения значений компонент вектора У,, характерного для каждого «своего» пользователя, с последующим индивидуальным заданием параметра ц по каждой компоненте учебного вектора.

Все множество учебных данных Уг+, і = 1, Ь можно представить матрицей

(4)

При покомпонентном представлении векторов выражение (2) будет иметь вид

( N \

+ + +

^1 V1 2 • •• V Ь

+ + +

У2 1 У2 2 • •• V2 Ь

+ + . +

VN1 VN 2 • V Ь

ф(У) = ехр

,=1

(5)

Все входные данные классификатора (векторы V и Уг+) удобно нормализовать к единичной длине:

(V, )н =

І

I'

У=1

(VII)н =

УП

2 2 2 v^^ + ^1 + ••• + V^V1

Я

\

N

(6)

(7)

Е (у д)2

]=1

Оценка функции плотности распределения вероятностей для одного учебного вектора У]+ (при г-1) при покомпонентном представлении и нормализованных входных данных образуется подстановкой (6) и (7) в (5). После раскрытия выражения в скобках и простых преобразований получим

V

У

у; =

V

У

V

V

2

ф(У) = ехр

='Ё >

1=1

V я

N N

ЁV2 • Ё (^*1>2 1=1

(V Р2

N

= ехр

1 д £ Ё'

2^ • V

1

N N

^v;2 • № І Ё (V Р2 1=1

- 2

= ехр

Ё (V Л)2

1=1

Оценка функции плотности распределения вероятностей для всего класса учебных векторов Уг+, г = 1, Ь при покомпонентном представлении и нормализованных входных данных будет иметь вид

Ь | , N

Ф(у) = Ё ехр -2 Ё (V] )н • (V,! )н-1

(8)

Дискриминантную функцию я(У), реализующую разделение входных биометрических векторов V на «своих» (вектор У+) и «чужих» (вектор V-), можно задать в виде разности между реально полученным при аутентификации значением

уровня плотности распределения вероятностей Ф(У) и минимально допустимым значением плотности Фп(У+) для «своего» пользователя:

£(У) = Ф(У)-Фп (У+).

Тогда знак дискриминантной функции §(У) будет определять принадлежность предъявленного СБИ вектора V к одному из двух классов: V и V-

1 (класс У+), если g (У) > 0;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

0 (класс У-), если g(У) < 0.

Пороговое значение уровня плотности распределения вероятностей Фп(^) можно получить двумя способами.

При малом числе учебных данных (Ь < 20) целесообразно прямое измерение

Фп(^), получаемое из выражения (8) при (V])н = (V])н, с введением допуска 5 на возможную ошибку «своего» пользователя:

Ь ( 1 N Л

g (У)

Ь -г N

Фп(У +) = Ёехр -2Ё^])н]2-1

г-1 1=1

-5.

Величину допуска 5 целесообразно задавать опытным путем, исходя из величины возможной ошибки первого рода, свойственной данному «своему» пользователю.

При достаточно большом числе образцов (Ь > 20), учитывая, близкий к нормальному, закон распределения биометрических параметров пользователя, становится целесообразным воспользоваться статистическими оценками математического ожидания и дисперсии биометрических параметров «своего» пользователя. В этом случае пороговое значение уровня плотности распределения вероятностей может быть вычислено следующим образом:

2

1

+

2

У

+

V

У

У

Ь ( . N '

фп(V+) = ЁехР —Ет + %■ • С[Ь,(1 -РО]}2 -1 ,

г-1 ^ Н- -=1

где Шу, сти- - соответственно математическое ожидание и среднее квадратическое отклонение биометрических параметров «своего» пользователя;

С[Ь,(\-Р\)\ - коэффициент Стьюдента, задаваемый, исходя из числа учебных образцов Ь и величины ошибки первого рода Р\ (вероятность ложного отказа «своему» пользователю).

Для вычисления математических ожиданий т■ и дисперсий ст 2 могут быть использованы обычные статистические оценки

Классификатор, реализующий предложенный метод, получается очень простым, допускает использование неточных данных и обеспечивает приемлемую точность классификации даже на небольших наборах учебных данных, что свойственно БСИ.

Работа выполнена при поддержке грантов РФФИ: № 03-07-90075, № 04-07-90137

1. Иванов А.И. Биометрическая идентификация личности по динамике подсознательных движений. - Пенза: Изд-во Пенз. гос. ун-та, 2000. - 188 с.

2. Широчин В.П., Кулик А.В., Марченко В.В. Динамическая аутентификация на основе анализа клавиатурного почерка. -

http://www.masters.donntu.edu.ua/2002/fvti/aslamov/ffles/bio autentification.htm.

3. Брюхомицкий Ю.А., Казарин М.Н. Система аутентификации личности по почерку / Сборник трудов научно-практической конференции с международным участием «Информационная безопасность». Таганрог: 2002. С. 22-29.

4. Брюхомицкий Ю.А., Казарин М.Н. Метод биометрической идентификации пользователя по клавиатурному почерку на основе разложения Хаара и меры близости Хэмминга / Известия ТРТУ. Тематический выпуск «Материалы V международной научно-практической конференции «Информационная безопасность». Таганрог: 2003. № 4(33). С. 141-149.

5. Брюхомицкий Ю.А., Казарин М.Н. Метод обучения нейросетевых биометрических систем на основе построения аппроксимированных областей / Известия ТРТУ. Тематический выпуск «Материалы V международной научно-практической конференции «Информационная безопасность». Таганрог: 2003. № 4(33). С. 155-159.

6. Брюхомицкий Ю.А., Казарин М.Н. Метод обучения нейросетевых биометрических систем на основе копирования областей / Электронный журнал «Перспективные информационные технологии и интеллектуальные системы». 2003. №3 (15). С. 17-23. -http://pitis.tsure.ru.

7. НильсонН. Обучающиеся машины/Пер. с англ. - М.: Мир, 1967. - 180 с.

8. Каллан Р. Основы концепции нейронных сетей.: Пер. с англ. - М.: Изд. дом «Вильямс», 2001. - 287 с.

г=1

БИБЛИОГРАФИЧЕСКИМ СПИСОК

i Надоели баннеры? Вы всегда можете отключить рекламу.