Научная статья на тему 'Усовершенствование идентификации пользователей по клавиатурному почерку'

Усовершенствование идентификации пользователей по клавиатурному почерку Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
320
53
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИДЕНТИФИКАЦИЯ / IDENTIFICATION / КЛАВИАТУРНЫЙ ПОЧЕРК / KEYBOARD RHYTHM / ПАРАМЕТРИЧЕСКОЕ ОБУЧЕНИЕ / PARAMETRIC TRAINING / КОВАРИАЦИОННАЯ МАТРИЦА БИОМЕТРИЧЕСКОЙ АУТЕНТИФИКАЦИИ / COVARIANCE MATRIX OF BIOMETRIC AUTHENTICATION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Стародубов Константин Владимирович, Громов Юрий Юрьевич

В качестве объекта усиления была выбрана парольная аутентификация. В процессе работы были проанализированы существующие методы классификации пользователей при использовании метода биометрической аутентификации по клавиатурному почерку. Также был рассмотрен подход к выявлению ключевых параметров характеристики клавиатурного почерка пользователя. Проведено исследование с целью определения оптимального значения коэффициента Стьюдента, отвечающего за уменьшение ошибки первого рода.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Стародубов Константин Владимирович, Громов Юрий Юрьевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

IMPROVEMENT OF USER IDENTIFICATION BY KEYBOARD RHYTHM

Keyboard rhythm is an important element of processing the input (primary) data at user identification. The input data can be classified as the data characterizing certain qualities of authenticated users. Signs, being processed, allow receiving standard characteristics of the user. Password authentication is chosen as the object of system protection. We analyze the existing methods of user classification when using the method of biometric authentication by keyboard rhythm. We also discuss the approach to identifying the key parameters of user’s keyboard rhythm. The research purpose consists in determining the optimal value of Student’s t-test, which is responsible for reducing the error of the first kind.

Текст научной работы на тему «Усовершенствование идентификации пользователей по клавиатурному почерку»

ш®

ИННОВАЦИИ В ИНФОРМАТИКЕ,

www.volsu.ru

ВЫЧИСЛИТЕЛЬНОЙ ТЕХНИКЕ И УПРАВЛЕНИИ

DOI: https://doi.org/10.15688/jvolsu10.2017A1

УДК 004.056 ББК 32.973.26

УСОВЕРШЕНСТВОВАНИЕ ИДЕНТИФИКАЦИИ ПОЛЬЗОВАТЕЛЕЙ ПО КЛАВИАТУРНОМУ ПОЧЕРКУ

Константин Владимирович Стародубов

Старший преподаватель кафедры информационных систем и защиты информации, Тамбовский государственный технический университет [email protected]. ги

ул. Советская, 106, 392000 г Тамбов, Российская Федерация

Юрий Юрьевич Громов

Доктор технических наук, профессор,

директор института автоматики и информационных технологий, Тамбовский государственный технический университет [email protected]. ги

ул. Советская, 106, 392000 г. Тамбов, Российская Федерация

о

(N

Аннотация. В качестве объекта усиления была выбрана парольная аутентификация. В процессе работы были проанализированы существующие методы классифи-^ кации пользователей при использовании метода биометрической аутентификации по ^ клавиатурному почерку. Также был рассмотрен подход к выявлению ключевых пара-« метров характеристики клавиатурного почерка пользователя. Проведено исследова-¡1 ние с целью определения оптимального значения коэффициента Стьюдента, отвечаю-^ щего за уменьшение ошибки первого рода.

И Ключевые слова: идентификация, клавиатурный почерк, параметрическое обу-

^ чение, ковариационная матрица биометрической аутентификации.

0

1 а

н В задаче идентификации пользователя пу- важным этапом является обработка входных @ тем использования клавиатурного почерка (первичных) данных. Входные данные можно

классифицировать как характеризующие те или иные качества аутентифицируемых пользователей. Признаки, подвергаясь обработке, позволяют получить эталонные характеристики пользователя.

Задача биометрической идентификации пользователя по особенностям клавиатурного почерка - это выделение идентифицирующих компонентов у(0 из функции &(0, которая определяет исходные данные для идентификации в процессе измерения временных характеристик клавиатурного почерка пользователя, выделяя 0(0 и А,(0 из исходной функции &(0. Очевидно, что из-за невозможности построения модели набора текста единственным приемлемым решением является анализ и хранение статистических данных о клавиатурном почерке большого числа пользователей и создание эмпирических зависимостей 0(0 и

Вероятность идентификации пользователя по времени удержания клавиш клавиатуры в зависимости от длины ключевой фразы является более стабильной характеристикой клавиатурного почерка, чем время между нажатиями клавиш (пауз) клавиатуры. Процесс нажатия клавиши на клавиатуре является подсознательным для пользователя. Характер входной функции мало меняется для большинства пользователей независимо от их квалификации и опыта работы с клавиатурой. Составляющая у(0 характеризуется временем удержания клавиш идентифицирующим лицом при наборе текста.

Время между нажатиями на клавиатуру можно считать менее стабильной характеристикой клавиатурного почерка, чем время удержания клавиш. Вероятность правильной идентификации от пауз между нажатиями клавиш имеет максимум своего значения при длине ключевой фразы в 8-10 символов. Ключевые фразы малой длины, максимум до двух слов, пользователь набирает подсознательно. Подсознательные движения стабильны до тех пор, пока в них не вмешивается сознательный уровень набора текста. У квалифицированных работников на клавиатуре наблюдается эффект включения сознательного мышления и остановок в наборе текста для принятия решения. В соответствии с этим можно утверждать о том, что в системах аутентификации

пользователя по клавиатурному почерку не рекомендуется использовать слишком длинные выражения в качестве ключевой фразы, так как это приводит к тому, что пользователь начинает «осмысленно» выполнять набор текста, что может создать больше ошибок идентификации. Таким образом, можно утверждать, что время между нажатиями клавиш наиболее полно передает характер составляющей 0(0 функции клавиатурного почерка &(0. Исключение составляющей 0(0 из функции &(0 осуществляется введением корреляционной функции Д(0, эмпирически получаемой из анализа эталонных статистических данных. Так как характер корреляционной функции Д(0 должен выбираться в зависимости от опыта работы пользователя с клавиатурой, необходимо ввести параметр L, который является корреляционной функции и составляющей 0(0.

Для работы системы биометрической динамической идентификации по клавиатурному почерку легальный пользователь должен предъявить L эталонных подписей, то есть пройти обучение программного комплекса. Эталонные значения пользователя соответствуют L реализациям вектора биометрических параметров У={У1, У2, ..., Уь}.

В динамических биометрических системах идентификации, основанных на клавиатурном почерке, распределение векторов биометрических параметров У в У-мерном пространстве можно рассматривать равным нормальному [2], полученные векторы у, г = 1, L можно задать в виде функции плотности нормального распределения векторов У с неизвестными средними, которая при L ^ да в ортогональной системе координат описывается гиперэллипсоидом рассеивания. Компоненты биометрических векторов у г = 1, ь коррелиро-ваны между собой, оси гиперэллипсоида рассеивания не параллельны осям координат. Формула гиперэллипсоида идентификации пользователя - это контроль попадания вектора его биометрических параметров У внутрь У-мерной области, описываемой гиперэллипсоидом рассеивания [1].

Метод обучения состоит из трех последовательных этапов:

Этап 1. Выявляется зависимость диск-риминантных функций g(У) от параметров,

характеризующих функцию плотности нормального распределения векторов V

Этап 2. Множество векторов V; оцениваются величины этих параметров.

Этап 3. Принимается вероятным, что оценки являются правильными значениями параметров, и они подставляются в выражение для g(V), полученное на этапе 1.

Идентификацию пользователя, набравшего тест на клавиатуре и получившего параметры в виде вектора V, можно рассматривать как задачу классификации вектора V на (М + 1) классов - по числу М зарегистрированных в системе пользователей («свои») плюс один класс для всех остальных не зарегистрированных в системе пользователей («чужие»). До идентификации пользователь аутентифициру-ет себя парольной системой аутентификации. При этом предварительно зарегистрированные в системе биометрические параметры данного пользователя могут использоваться как параметры классификатора. Это обстоятельство позволяет без нарушения общности свести задачу классификации вектора V на (М + 1) классов к задаче классификации только на два класса: «свой» - вектор VC, и «чужой» - вектор V При наличии в системе многих зарегистрированных пользователей после аутентификации каждого из них достаточно поочередно внести в классификатор в качестве эталона соответствующие ему параметры (один из М зарегистрированных векторов VC).

Распределение пользователей на две области - «свой» (вектор VC) и «чужой» (вектор Vч) - параметрический классификатор может реализовать с использованием только одной дискриминантной функции g(V), знак которой будет определять принадлежность предъявленного вектора V к одному из двух классов: V,-, и Уч. При этом области распределения биометрических параметров всевозможных «чужих» в совокупности можно рассматривать как интегральную область «все чужие», расположенную вокруг компактной области «свой».

Пусть в общем случае область распределения биометрических параметров «своего» пользователя задана множеством образцов ус, состоящим из Ь векторов V i = 1, ..., Ь, нормально распределенных в ^-мерном пространстве ортогональной системы координат,

а каждый вектор V,., i = 1, ..., Ь, представлен своими N компонентами

V,. =

^ ..., vJ, ..., VN } ] _ 1, N .

(1)

Центр распределения векторов VCi находится в точке (^1, ..., ^ЛГ), которая определяется N математическими ожиданиями

т-Л= ^ mv2= ^ ..., mvN = Центральные моменты второго порядка распределения векторов V,. образуют квадратную матрицу моментов (ковариационную матрицу):

Q _ X Л _

Х11 Х12 Х 21 ^22

ХШ Х N 2

(2)

где

V _ \ _ М^ - 5J - ^ ) = ^ при/ _ щ 1 ,к _ —

Щсол^щ* при.| ф к] , ,

Для нормального закона распределения векторов V,.., . = 1, ..., Ь, функция плотности распределения имеет вид:

/v2, ... vN)_

1

ехр

X к

N N

1Цл,(VJ - 5 щ )(vk - ш)

2

J■_1 к_1

(3)

где det X- определитель ковариационной матрицы <2 _ ■к| |.

Коэффициенты Лjk составляют матрицу Л_||Л ^Ц, обратную ковариационной матрице

< _1 Ы1.

Для вычисления коэффициентов Лщ используется стандартная формула

Л,

+к Мщ

det X,

(4)

где Мщ - минор определителя det|Xщк|| , получаемый из него вычеркиванием щ-й строки и к-го столбца.

Выражение, фигурирующее в показателе экспоненты функции плотности нормального распределения векторов V является по-

X

ложительно-определенной квадратичной формой. Поверхности, на которых эта квадратичная форма постоянна

111 IL Л jk (vj - 5 j Xvk - 5k ) = c°nst;

(5)

являются поверхностями равных плотностей вероятностей в У-мерном пространстве и представляют собой гиперэллипсоиды, которые группируются вокруг точки (^1, ..., Е,ы).

Обозначая константу в правой части выражения через к2, получим:

1 IL IL л jk (vj - 5 j )vk - 5 k) = k 2.

(6)

Константа к задает коэффициент пропорциональности между длинами а.главных полуосей гиперэллипсоида и соответствующими среднеквадратическими отклонениями s.:

a = k-a; a = k-a; ..., aN = k-aN.

(7)

Для оптимального решения задачи классификации из всех поверхностей равных плотностей вероятностей целесообразно выбрать ту, которая характеризует рассеивание векторов Ус . относительно точки (^

..., Эта поверхность соответствует так называемому единичному гиперэллипсоиду, у которого главные полуоси равны соответствующим среднеквадратическим отклонениям а с2, ..., то есть для единичного гиперэллипсоида к = 1, и преобразуется к виду

• к(у.-а*-5>1. (8)

Из-за ограниченной статистики биометрических образцов, предъявляемых на стадии регистрации «своим» пользователем, всегда остается вероятность того, что образец, предъявленный этим же пользователем при аутентификации, выйдет за пределы зафиксированного в эталоне диапазона. Для уменьшения этой вероятности дополнительно задается величина допуска между областями «свой» и «все чужие» в виде коэффициента Стьюдента С\Ь, (1-Р1)], исходя из заданной ошибки первого рода (вероятность Р. ложного отказа «своему» пользователю) и числа Ь предъявленных на стадии регистра-

ции образцов. Введение указанного допуска в уравнение:

11" 11Г=1 V - 5. X* - 5 к )=№, (1 - Р )]}2.(9)

Используем полученное выражение (20) для формирования дискриминантной функции g(У), разделяющей области «свой» и «все чужие»:

1 NN

g(V) = 211Лj • k(Vj -5j)(vk-5k)-

j=l k=1

-№, (1 - ^)]}2

(10)

Уравнение g(У) = 0 в этом случае будет определять искомую разделяющую поверхность, а знак функции g(У) - принадлежность входного вектора У к одному из двух классов: «свой» или «чужой» (попадание в область «все чужие»):

g(У < 0, если У е Ус, g(У > 0, если У е У

(11)

(12)

Идентификация пользователей сводится к проверке: попадает ли предъявленный пользователем вектор биометрических параметров У в эталонную область сформированных на основе эталонных параметров У.

В качестве основы для усиления был взят метод парольной аутентификации, который обладает рядом положительных качеств, описанных ранее. В качестве «усилителя» предлагается идентификация по клавиатурному почерку, являющаяся одним из методов динамической аутентификации по биометрическим данным. Усиления аутентификации возможно использовать в качестве самостоятельного модуля, который будет выполнять идентификацию по клавиатурному почерку методом параметрического обучения классификатора, содержащего необходимые данные из пользовательского приложения, так называемый вектор входных параметров.

Для использования возможностей библиотеки нужно в пользовательское приложение внедрить модуль подключения библиотеки, состоящий из процедур сбора данных и двух функций, одна из которых будет передавать

данные для регистрации нового пользователя, а вторая - для идентификации пользователей.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Само пользовательское приложение может содержать свой механизм парольной аутентификации и использовать тот, который был реализован в процессе выполнения данной работы. Данная возможность библиотеки позволяет как усиливать уже существующие системы парольной аутентификации, так и внедрять системы аутентификации в приложения, которые до этого не имели такой системы.

СПИСОК ЛИТЕРА ТУРЫ

1. Брюхомицкий, Ю. А. Метод обучения ней-росетевых биометрических систем на основе копирования областей / Ю. А. Брюхомицкий, М. Н. Каза-рин // Перспективные информационные технологии

и интеллектуальные системы. - 2003. - N° 3 (15). -С. 17-23. - Электрон. текстовые дан. - Режим доступа: http://pitis.tsure.ru. - Загл. с экрана.

2. Иванов, А. И. Биометрическая идентификация личности по динамике подсознательных движений / А. И. Иванов. - Пенза : Изд-во Пенз. гос. ун-та, 2000. - 188 с.

REFERENCES

1. Bryukhomitskiy Yu.A., Kazarin M.N. Metod obucheniya neyrosetevykh biometricheskikh sistem na osnove kopirovaniya oblastey [Method of Training Neural Network Biometric Systems based on Copying Domains]. Perspektivnye informatsionnye tekhnologii i intellektualnye sistemy, 2003, no. 3 (15), pp. 17-23. URL: http://pitis.tsure.ru.

2. Ivanov A.I. Biometricheskaya identifikatsiya lichnosti po dinamike podsoznatelnykh dvizheniy [Biometric Identification of the Personality According to the Dynamics of Subconscious Movements]. Penza, Izd-vo Penz. gos. un-ta, 2000. 188 p.

IMPROVEMENT OF USER IDENTIFICATION BY KEYBOARD RHYTHM

Konstantin Vladimirovich Starodubov

Senior Lecturer, Department of Information Systems and Information Protection, Tambov State Technical University [email protected]. ru

Sovetskaya St., 106, 392000 Tambov, Russian Federation

Yuriy Yuryevich Gromov

Doctor of Technical Sciences, Professor,

Director of the Institute of Automation and Information Technologies, Tambov State Technical University [email protected]. ru

Sovetskaya St., 106, 392000 Tambov, Russian Federation

Abstract. Keyboard rhythm is an important element of processing the input (primary) data at user identification. The input data can be classified as the data characterizing certain qualities of authenticated users. Signs, being processed, allow receiving standard characteristics of the user.

Password authentication is chosen as the object of system protection. We analyze the existing methods of user classification when using the method of biometric authentication by keyboard rhythm. We also discuss the approach to identifying the key parameters of user's keyboard rhythm. The research purpose consists in determining the optimal value of Student's t-test, which is responsible for reducing the error of the first kind.

Key words: identification, keyboard rhythm, parametric training, covariance matrix of biometric authentication.

i Надоели баннеры? Вы всегда можете отключить рекламу.