УДК 004.93'1+004.354
ИДЕНТИФИКАЦИЯ ПОЛЬЗОВАТЕЛЯ ПЭВМ ПО РУКОПИСНОМУ ПАРОЛЮ:
ЭКОНОМИЧЕСКИЕ АСПЕКТЫ
Б.Н. Епифанцев, П.С. Ложников, А.В. Еременко
В статье рассматривается задача формирования пространства информативных признаков для идентификации пользователя ПЭВМ по рукописному паролю. Предложен способ идентификации личности по рукописному паролю. Получены оценки разделяющих качеств выбранных признаков, проведено их ранжирование по информативности. Получено значение ошибки второго рода для разработанного метода распознавания. Приводится расчет стоимости аппаратного обеспечения в зависимости от показателя надежности разработанного метода (уровня ошибки второго рода)
Ключевые слова: идентификация, динамический планшет, верификация
В настоящее время активно совершенствуются различные механизмы обеспечения
информационной безопасности в корпоративных, ведомственных и домашних сетях. Особенное внимание уделяется предотвращению
несанкционированного доступа к информационным ресурсам и сервисам. Несмотря на значительный прогресс в этой области, наиболее слабым звеном в любой системе обеспечения безопасности остается человеческий фактор [1, 2], а именно надежная идентификация пользователя. По данным ФБР, более 70% случаев несанкционированного доступа к данным приходится не на внешние атаки, а на нарушения режима идентификации пользователя
биометрический признак, ошибка второго рода, графический
внутри организации. При реализации контроля доступа в большинстве случаев применяют различные комбинации парольных и аппаратных идентификаторов, реже биометрические данные. Вопросы использования паролей и ключей в достаточной степени проработаны, а проблемы эксплуатации давно известны. Биометрия в защите информации - относительно новое направление. На основании данных консалтинговой компании Acuity Market Intelligence составлена сводная характеристика наиболее распространенных методов биометрической идентификации, см. табл. 1.
Таблица 1
Характеристика методов биометрической идентификации
Объект идентификации Средняя стоимость терминального устройства, тыс. руб. Ошибка верификации второго рода, %
Отпечатки пальцев 3 0,001
Изображение лица 3 1
Радужная оболочка глаза 15 0,0001
Геометрия ладони 16 0,2
Голос 2 1
Сетчатка глаза 100 0
По данным той же организации за 2008 г., системы идентификации личности по рукописному паролю занимали 1% в структуре рынка коммерческих биометрических систем. Информация по ошибкам второго рода для данного вида систем довольно противоречива. При этом прямой конкурирующей технологией принято
рассматривать метод идентификации по отпечаткам пальцев. Цель работы состоит в том, чтобы внести определенность по данному вопросу - уточнить вероятность ошибки второго рода и стоимость
Епифанцев Борис Николаевич - СибАДИ, д-р техн. наук, профессор, тел. (3812) 25-04-80,
Е-шаД epifancev_bn@sibadi.org
Ложников Павел Сергеевич - СибАДИ, канд. техн. наук, доцент, Е-шаП lps@sibadi.org
Еременко Александр Валериевич - СибАДИ, аспирант, Е-шаП 4eremenko@gmail.com
необходимого аппаратного обеспечения для создания такой системы.
Достижение поставленной цели зависит от качества решения задачи выделения признаков и сжатия данных. Количество признаков,
необходимое для успешного решения задачи распознавания, зависит от разделяющих качеств выбранных признаков. Задача выбора признаков усложняется обычно тем обстоятельством, что соответствующие возможности измерения важных признаков сдерживаются экономическими факторами, так функция измерения угла наклона пера к поверхности графического планшета заложена только в более дорогой профессиональной линейке графических планшетов. Доступными различительными признаками в этой ценовой категории являются: положение пера в плоскости графического планшета хф и у(.(), давление кончика
пера на чувствительную к нажатию поверхность планшета р(^), угол наклона пера к плоскости графического планшета (Г:, угол Ауу СО
поворота пера относительно нормали к плоскости Оху. На основе перечисленных функций строится пространство признаков.
Изучение свойств полученного пространства признаков проводилось с использованием нескольких видов анализа: корреляционного
анализа первичных сигналов, оценки разделяющих качеств признаков, ранжирования признаков по информативности. Для выполнения всех запланированных экспериментов была
сформирована база данных рукописных паролей, для этого 15 пользователей с разной стабильностью почерка и периодом обучения работе с графическим планшетом зарегистрировали по 21 примеру своей подписи. Первый вид анализа направлен на устранение избыточности информации внутри формируемого пространства признаков, его результаты сведены в табл. 2, 3, 4 и показывают, какие сигналы дублируют информацию о динамике движения светового пера и, следовательно, подлежат исключению из формируемого пространства.
Таблица 2
Коэффициенты корреляции между функциями внутри основной группы сигналов
Пользователь
1 2 3 4 5 6 7 8 9 10
х/у -0,334 -0,069 0,156 -0,333 -0,312 -0,108 -0,259 -0,280 0,055 -0,243
х/р 0,473 0,163 0,154 0,673 0,351 0,129 0,579 0,342 0,431 0,180
у/р 0,361 0,180 0,430 -0,079 0,183 0,267 0,109 0,223 0,341 0,122
Как видно из табл. 2, корреляция между первичными сигналами х(ї), у(ґ), р(ї), в основном, не превышает 0,5, что говорит об отсутствии тесной линейной связи внутри данной группы сигналов. Каждая из анализируемых функций несет в себе новую информацию о динамике перемещения пера в регистрируемых графическим планшетом
измерениях, которая не дублируется остальными из рассматриваемой группы сигналов функциями. В табл. 3, 4 представлен детальный корреляционный анализ функции угла наклона Пх() к плоскости Оху, доступной в профессиональных моделях графических планшетов.
Таблица 3
Подробные результаты корреляционного анализа функции угла наклона Пх() на избыточность для 20
реализаций подписей трех пользователей
Номер
реализаци
1
2
3
4
5
6
7
8
9
10 11 12
13
14
15
16
17
18
19
20 среднее
Пользователь 1
аХу(ґ)/х(ґ ) Пху(г)/у(г ) Пху(г)/р(г )
0,879 -0,131 0,360
0,812 0,030 0,396
0,875 0,000 0,646
0,801 -0,056 0,651
0,931 0,315 0,654
0,909 -0,210 0,528
0,885 -0,137 0,569
0,926 0,155 0,635
0,790 0,017 0,535
0,891 0,016 0,646
0,958 -0,009 0,574
0,864 0,138 0,653
0,697 0,021 0,329
0,516 0,198 0,420
0,343 0,384 0,523
0,507 0,221 0,654
0,781 0,044 0,562
0,868 -0,054 0,460
0,619 0,051 0,741
0,871 -0,269 0,648
0,786 0,036 0,559
Пользователь 2
Пху(г)/х(г ) Пху(г)/у(г ) Пху(г)/р(г )
0,255 0,700 -0,015
0,167 0,676 0,058
0,438 0,514 0,302
0,299 0,585 0,232
0,335 0,670 0,347
0,137 0,739 0,147
0,360 0,652 -0,027
0,593 0,410 0,510
0,329 0,600 0,325
0,457 0,538 0,521
0,414 0,614 0,351
0,333 0,602 0,322
0,263 0,651 0,132
0,372 0,589 0,197
0,367 0,694 0,503
0,413 0,542 0,489
0,365 0,666 0,396
0,321 0,672 0,346
0,412 0,589 0,306
0,329 0,621 0,493
0,359 0,609 0,304
Пользователь 3
Пху(г)/х(г ) Пху(г)/у(г ) ОхуА)/ р(г)
0,050 0,547 0,404
-0,336 0,723 0,202
0,027 0,562 0,292
-0,254 0,650 -0,104
0,212 0,610 0,253
-0,230 0,496 0,050
-0,233 0,590 0,145
-0,040 0,411 0,154
-0,160 0,345 0,146
-0,195 0,670 -0,014
0,242 0,499 0,344
0,221 0,525 0,370
-0,324 0,533 -0,007
-0,120 0,700 0,300
0,066 0,394 0,184
-0,003 0,386 -0,090
0,005 0,611 0,308
-0,429 0,482 -0,072
-0,033 0,514 0,230
0,254 0,559 0,259
-0,064 0,548 0,164
На основании результатов анализа можно наклона и функциями из основной группы сигналов.
говорить о широком диапазоне вариативности Большинство значений коэффициентов корреляции
коэффициентов корреляции между функцией угла смещены в сторону верхней границы найденного
диапазона и показывают высокую линейную связь между функциями. Коэффициент, определяющий прямую взаимосвязь между сигналами, находится в обратно пропорциональной зависимости с объемом отличительной информации о процессе воспроизведения рукописного пароля, который описывают эти функции. Таким образом, функция угла наклона Пх() к плоскости Оху дублирует часть информации о динамике перемещения пера, которую несут в себе хф, уф, рф. Тем не менее, исследуемая на данном этапе функция была сохранена в формируемом пространстве признаков. Такое решение объясняется следующими причинами. Рассмотрим наихудшие результаты
анализа функции 0^), см. табл. 2 для пользователя 1, значения коэффициентов корреляции не настолько высоки, чтобы говорить о полном дублировании информации, которую несут функции из основной группы сигналов. В тоже время, для представителя другого класса пользователей (табл. 1, пользователь 3), функция 0ху(() содержит значительное количество новой информации о динамике движения пера. При практической реализации системы распознавания следует ожидать незначительный прирост вероятности
идентификации пользователей ПЭВМ в результате добавления в пространство признаков функции изменения угла наклона пера.
Таблица 4
Средние коэффициенты корреляции между функцией угла наклона (?) к плоскости Оху и другими
сигналами, поступающими от графического планшета
Средние коэффициенты корреляции между функциями 0ху(г)/х(г) °ху(1)/у(г) ОхуАУр®
Пользователь 1 0,77265477 0,3926908 0,56036949
Пользователь 2 0,50937312 0,5337718 0,48929578
Пользователь 3 0,72210862 0,4202679 0,46924111
Пользователь 4 0,35926289 0,6093531 0,30368327
Пользователь 5 0,77263480 0,0251408 0,52227492
Пользователь 6 -0,06399386 0,5475554 0,16411689
Пользователь 7 0,62627449 0,2938082 0,27238908
Пользователь 8 0,49904261 0,5708540 0,12805767
Пользователь 9 0,77646794 0,3069436 0,64206361
Пользователь 10 0,78095131 0,2549689 0,66545197
Пользователь 11 0,75177608 0,3771963 0,68840957
Пользователь 12 0,87615059 0,3949843 0,28210391
Пользователь 13 0,52258929 0,2154999 0,40947998
Пользователь 14 0,78614515 0,0363078 0,55917803
Пользователь 15 0,75683493 0,2747083 0,50843628
среднее 0,62988485 0,3502701 0,44430344
В табл. 2, 3, 4 отсутствуют результаты корреляционного анализа функции изменения угла поворота пера С?) относительно нормали к плоскости Оху, так как этот признак был исключен из формируемого пространства на этапе оценки разделяющих качеств признаков, см. табл. 5.
Функции хф, у(^), рф, Пх() можно трактовать как описание процессов, протекающих в интервале О - :■ - ' , соответствующем времени
воспроизведения пароля. С целью упрощения обработки сигнала и устранения избыточности информации было принято решение о преобразовании сигналов из системы координат г(!:} в систему координат - зависимость амплитуды составляющих сигнал гармонических колебаний от частоты [3, 4]. В результате каждая из функций была представлена в виде ряда Фурье с конечным числом членов разложения 16. Далее в ходе эксперимента были составлены эталоны 15 пользователей после аппроксимации распределения значений информативных признаков для 20
реализаций подписи нормальным законом [5]. Реализация под номером 21 использовалась в качестве заявляемой подписи, принадлежность которой классу «своих» пользователей необходимо проверить. Таким образом, было проведено 15 экспериментов, размер базы данных составлял 15 эталонов. Принятие решения при этом опиралось на стратегию Байеса, в которой априорной вероятностью считается апостериорная вероятность, вычисленная на предыдущем шаге, а количество зарегистрированных эталонов соответствует количеству первоначально выдвигаемых гипотез о принадлежности предъявленного образца рукописного слова к какому-либо эталону [6]. Полученные в ходе эксперимента финальные вероятности байесовских гипотез сведены в табл. 5. На основании усредненных собранных результатов признаки были ранжированы по информативности в порядке ее убывания: 1^.(0, СО ^СО (О, см. табл. 5, столбцы 2, 3, 4, 5, 6, рис. 1.
Таблица 5
Финальные вероятности байесовских гипотез, полученные в экспериментах по идентификации «своих»
пользователей
№1 чоа РЦ; г=1_П1-р^ 4 Р = 1-Р*.:}
1 2 3 4 5 6 7 8
Пользователь 1 0,578 0,644 0,623 0,087 0,645 0,943 0,948
Пользователь 2 0,562 0,579 0,625 0,602 0,668 0,941 0,946
Пользователь 3 0,632 0,641 0,617 0,299 0,024 0,951 0,955
Пользователь 4 0,606 0,623 0,629 0,505 0,024 0,947 0,952
Пользователь 5 0,624 0,617 0,144 0,550 0,486 0,949 0,954
Пользователь 6 0,592 0,650 0,632 0,489 0,024 0,945 0,950
Пользователь 7 0,617 0,521 0,344 0,452 0,024 0,949 0,953
Пользователь 8 0,544 0,639 0,535 0,589 0,154 0,939 0,944
Пользователь 9 0,635 0,601 0,429 0,607 0,024 0,951 0,955
Пользователь 10 0,613 0,591 0,619 0,583 0,024 0,948 0,953
Пользователь 11 0,606 0,621 0,645 0,637 0,024 0,947 0,952
Пользователь 12 0,616 0,628 0,529 0,554 0,024 0,948 0,953
Пользователь 13 0,654 0,642 0,584 0,641 0,024 0,954 0,958
Пользователь 14 0,463 0,653 0,547 0,332 0,024 0,928 0,934
Пользователь 15 0,305 0,488 0,344 0,613 0,024 0,907 0,915
среднее 0,576 0,609 0,523 0,503 0,148 0,943 0,948
РЯНЙ
0 1 2 3 4 5
Р[ХНЙ
1 2 3 — 10
4 5 6 13
- 7 а 15 __
,
0 1 2 3 4 5 6 7
Ру1НЙ
9 10 11 12 13 14 15
РШ(Н|)
9 10 11 12 13 14 15
12
- ^ Т
0 1 2345 6789 10 11 I 12 13 14 15
_
10
"
15
-
0123456789 10 11
I
12 13 14 15
Финальные вероятности байесовских гипотез, полученные для каждого признака пространства в
отдельности
Оценить вероятность распознавания Р пользователя по всем признакам становится
возможным, используя следующую формулу:
где р.г, - итоговые апостериорные вероятности А-го
признака /-го пользователя.
Раздельно были оценены вероятности идентификации пользователей по трем функциям, входящим в группу основных сигналов, а также по всей совокупности расширенного пространства признаков, см. таблицу 5, столбцы 7 и 8 соответственно. Как видно из полученных
результатов, теоретическая вероятность
распознавания увеличилась в среднем на 0,005 с 0,943 до 0,948, что говорит о невысокой эффективности использования дополнительного признака, доступного в более дорогих моделях графических планшетов.
По своей сути метод распознавания, основанный на стратегии Байеса, лишь находит ближайший эталон к проверяемой подписи, но не способен различать «свои» и «чужие» для системы подписи. Решить такую задачу становится возможным с помощью комбинирования алгоритмов идентификации и верификации. В этом
случае процедура идентификации осуществляет поиск наиболее вероятного эталона подписи в базе данных, а процедура верификации подтверждает или опровергает принадлежность найденного эталона к группе «своих» для системы пользователей. Критерием для определения схожести или различия подписей является расстояние между предъявляемым вектором признаков и центром эталона пользователя. С этой целью было принято решение разделить сформированное пространство признаков на два подмножества: первое, включающее в себя векторы математических ожиданий и среднеквадратичных отклонений нормированных амплитудных спектров обрабатываемых функций, используется для идентификации подписи пользователя; второе, состоящее из векторов математических ожиданий и среднеквадратичных отклонений корреляционных
моментов между функциями, предназначено для верификации наиболее вероятной гипотезы, в том случае, если на этапе идентификации был превышен установленный порог распознавания. Добавление информации о динамике воспроизведения
рукописного пароля в виде коэффициентов корреляции между функциями из основной группы сигналов в эталоны пользователей предоставляет следующие преимущества. Полученные для каждой подписи = 13 коэффициентов корреляции
описывают похожесть формы сигналов, так как формы сигналов от реализации к реализации подписи остаются практически неизменными, получаем резерв информации, необходимый для верификации пользователя.
Для оценки надежности разработанного
способа идентификации проводился эксперимент, в котором для 15 пользователей 100 раз была проведена попытка идентификации для двух версий пространства признаков. Также моделировалась попытка идентификации злоумышленником, пытающимся подделать подпись
зарегистрированного пользователя. В результате были найдены ошибки первого и второго рода для среднестатистического пользователя.
Вероятность ошибки второго рода составила 0,01 в эксперименте идентификации по трем признакам х(^, уф, рф и 0,005 для пространства из четырех признаков. Достигнутые результаты позволяют сделать вывод о правильном выборе подхода в решении задачи идентификации пользователя по динамике написания паролей. Указанные характеристики системы распознавания могут быть воспроизведены для сформированного пространства признаков на графических планшетах ценовой категории до 2 тыс. руб., измеряющих положение пера в плоскости графического планшета хф и уф, давление кончика пера на чувствительную к нажатию поверхность планшета рф, моделях графических планшетов, измеряющих угол наклона пера к плоскости графического планшета (?)
(ценовая категория 10-15 тыс. руб.) [7]. Бюджетный вариант предложенной системы идентификации личности по рукописному паролю выглядит вполне конкурентоспособным по отношению к системам распознавания по отпечаткам пальцев в силу своей более низкой стоимости (табл. 1) и положительного субъективного отношения к процедуре
идентификации (отсутствие ассоциации с
криминалистическими системами). Решение о выборе конкретной модели графического планшета будет приниматься конечным потребителем на основании найденного соотношения
затраты/безопасность.
Литература
1. Соколов И.А., Будзко В.И., Синицин И.Н. Построение информационно-телекоммуникационных систем высокой доступности // Наукоёмкие технологии. - 2005. - № 6. - Т. 6 // Системы высокой доступности. - 2005. - № 1. - Т. 1. - С. 6-14.
2. Программно-аппаратные средства обеспечения информационной безопасности. Защита программ и данных: Учеб. пос. для вузов / Белкин П.Ю., Михальский О.О., Першаков А.С. и др. - М.: Радио и связь, 1999. - 168 с.
3. Гольденберг Л.М., Матюшкин Б. Д., Поляк М.Н. Цифровая обработка сигналов: Учебное пособие для вузов.- М.: Радио и связь, 1990.- 256 с.
4. Толстов Г.П. Ряды Фурье: Учебное пособие для вузов.-М.: Наука, 1980. - 347 с.
5. Вентцель Е.С. Исследование операций. Задачи, принципы, методология: Учеб. пособие для втузов. - 2-е изд., стер. - М.: Высш. шк., 2001. - 208 с.
6. Епифанцев Б.Н., Ложников П.С., Еременко А.В. Инфокоммуникационные системы и технологии: проблемы и перспективы: Монография. - Спб.: Изд-во Политехн. ун-та, 2007. - 592 с.
7. Ложников П.С., Еременко А.В. Идентификация личности по рукописным паролям // Мир измерений. - 2009. №4(98). - С. 11-17.
Сибирская государственная автомобильно-дорожная академия (СибАДИ)
IDENTIFICATION OF COMPUTER USERS BY HANDWRITTEN PASSWORD:
ECONOMICAL ASPECTS
B.N. Epifancev, P.S. Lozhnikov, A.V. Eremenko
The article considers a task of creating a space of informative characteristics to identify a computer user by a handwritten password. It suggests a method of personal identification by a handwritten password and demonstrates an assessment of distinguishing qualities for the selected characteristics and their ranking based on an information value. The article presents a false-reject rate for a developed method of identification. It shows a calculation for a cost of hardware depending on a reliability rate of the developed method (a false-reject rate)
Key words: identification, dynamic biometrical characteristic , false-reject rate, graphic tablet, verification