Научная статья на тему 'Технология скрытой идентификации пользователей ПЭВМ'

Технология скрытой идентификации пользователей ПЭВМ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
136
27
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Покусаева Ольга Алексеевна

В настоящее время существуют порядка десяти различных систем идентификации пользователей ПЭВМ. Их применение на практике ограничивается не достаточно приемлемыми показателями распознавания пользователей. В данной работе рассматривается способ повышения эффективности идентификации пользователей путем создания комплексированной системы, использующей три независимых признака человека: тремор, клавиатурный почерк, голос. Разработанная методика распознавания пользователей в процессе экспериментов позволила идентифицировать 50 пользователей с уровнем ошибок первого и второго рода 0,01 %.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Покусаева Ольга Алексеевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Технология скрытой идентификации пользователей ПЭВМ»

УДК 007+681.322+681.5.015.42

О. Д. ПОКУСАЕВА

Сибирская

автомобильно-дорожная академия

ТЕХНОЛОГИЯ

СКРЫТОЙ ИДЕНТИФИКАЦИИ ПОЛЬЗОВАТЕЛЕЙ ПЭВМ_

В настоящее время существуют порядка десяти различных систем идентификации пользователей ПЭВМ. Их применение на практике ограничивается не достаточно приемлемыми показателями распознавания пользователей. В данной работе рассматривается способ повышения эффективности идентификации пользователей путем создания ком-плексированной системы, использующей три независимых признака человека: тремор, клавиатурный почерк, голос. Разработанная методика распознавания пользователей в процессе экспериментов позволила идентифицировать 50 пользователей с уровнем ошибок первого и второго рода - 0,01 %.

Широко применяемые способы распознавания пользователей ПЭВМ основаны на использовании паролей, смарт-карт, электронных ключей и т.д. Технологии преодоления таких преград, разработанные в последнее десятилетие, хорошо известны. Поэтому актуальность задач повышения надежности автоматической идентификации зарегистрированных пользователей и обнаружения вторжений незарегистрированных лиц при взаимодействии с терминалами распределенных сетей продолжает расти.

Технологии последних лет, направленные на решение таких задач, основаны на использовании статических признаков субъектов (отпечатки пальцев, изображение сетчатки глаза, форма ладони и т.д.). Основная линия критики этого направления — не обеспечивается скрытость процесса идентификации, процедуры съема информации настораживают «чужого» и вызывают неоднозначное отношение у «своих».

Переход к алгоритмам идентификации человека по его динамическим характеристикам (особенности произношения и написания паролей, ввод их с клавиатуры и т.д.) позволяет снять обозначенную проблему «обеспечения скрытости». Но порождает новую — надежность идентификации лиц недостаточна в целом ряде приложений, Вот вывод фундаментального издания 2000 года «Специальная техника и информационная безопасность» (1 ]: «Задача диагностики личности по речи в настоящее время корректно существует только в постановочной части. ... Нанастоящем этапе развития криминалистической фоноскопии надежды на эффективное решение диагностических задач почти призрачны».

Направление по созданию систем распознавания дикторов по особенностям речевого сигнала сформировалось более 40 лет назад. Количество опубликованных работ по данному направлению уже в начале 80-х годов превысило тысячу. Аналитические обзоры публикаций позволили сделать крайне важный вывод. Наиболее информативные признаки (характер спектральной плотности звуков, плотность переходов речевых сигналов через нуль и т.д.) при последовательном применении позволяют резко увеличивать надежность распознавания. Однако после достижения границы в 90% затраты на увеличение последующей доли процента резко растут, включение

в процесс идентификации новых признаков становится все более дискуссионным. Эта закономерность имеет общий характер и проявляется в любой из известных автору предметных областей. Новые признаки оказываются коррелированны с базовыми и их применение обеспечивает незначительный прирост надежности распознавания.

В каком-то смысле аналогичная ситуация наблюдалась в измерительной технике в 60-70-х годах XX века. Внутренние нормы датчика определяют достижимую границу точности измерения при заданной динамике изменения регистрируемых величин. Существенное увеличение точности удалось достичь через измерение интересующей величины несколькими независимыми датчиками и применением соответствующей процедуры обработки полученных данных [2]. Такой подход получил название технологии комп-лексирования, реализующей известный принцип накопления в теории обнаружения сигналов.

Число независимых динамических признаков взаимодействующего с ПЭВМ оператора ограничено. Прежде всего следует выделить особенности так называемого клавиатурного почерка. Печатание текста с использованием клавиатуры характеризуется работой 20 мышц плечевого пояса на каждой руке. Человек не может сразу выполнить сложные движения. По современным представлениям в процессе обучения он подбирает удачные решения поставленной задачи и запоминает их путем неоднократных повторений (тренировок) [3]. Программы управления мышцами запоминаются в подсознательной сфере, запускаются сознанием и реализуются автоматически. Каждый индивид находит свое решение задачи управления — вот идеологическая основа методов идентификации личности по динамике воспроизведения быстрых подсознательных движений.

Алгоритм идентификации личности по клавиатурному почерку заключается в следующем. На стадии обучения (построения эталонного описания субъекта) пользователю предлагается набрать определенную фразу (пароль) п раз. При вводе фразы система фиксирует интервалы времени между нажатием очередной и отпусканием предыдущей клавиши I. и общее время набора фразы Т. Интервалы между нажатиями клавиш зависят от времени набора фразы, поэтому к выбранным признакам (1. | = 1 ..т гп — число

§ I

к

а л х

к •&

я н к

4>

л

В

о я

Ё о п. <и 00

0,983--

0,9011--

0,8192-

0,7373- -

£ 0,6554--

и

о X 0,5734 -

Й ф 0,4915- -

а, (и 0,4096 - -

0,3277 -

0,2458 -

0,1636 -

0,08191

1 23456789 1011 12131415

№ признака

Рис. 1. Динамика формирования вероятностей гипотез.

Рис. 2. Динамика формирования вероятности.

сочетаний клавиш в пароле) применялась операция нормирования, вследствие чего были получены не зависящие от времени набора характеристики пользо-

вателя

к

Л,

уч I у I

Применив критерий согласия Пирсона х2 для проверки гипотезы о виде распределения вероятностей ампли туд сигналов печати на клавиатуре, был сделан вывод о «нормальности» этих распределений.

Проведенное исследование показало независимость признаков, это снимает ограничения на использование формулы гипотез Байеса при решении задачи идентификации пользователей ПЭВМ по особенностям клавиатурного почерка. Формула имеет вид

Р{И,)Р{х\н,)

На первом шаге априорные вероятности гипотез Р(Н,).....Р(НК) берутся равными 1/к. Условные плотности вероятностей значения признаках для]-й гипотезы рассчитывается по нормальному закону:

1

где Р(х/Н^ — вероятность гипотезы Н( при поступлении на вход решающего устройства признака величиной X,, Р(Н) — априорная вероятность осуществления гипотезы Н|, Р(х/К) — апостериорная вероятность признака х,для]-й гипотезы, к. — число зарегистрированных пользователей.

Количество зарегистрированных эталонов соответствует количеству первоначально выдвигаемых гипотез к о принадлежности предъявленного образца к какому-либо эталону.

где т1 и о: — математическое ожидание и среднеквадратичное отклонение 1-й ячейки эталона соответствующей ему гипотезы. Решение принимается на последнем шаге в пользу той гипотезы, для которой апостериорная вероятность оказывается большей.

Нам удалось оценить информативность «клавиатурного почерка» для целей идентификации операторов ПЭВМ. На рис.1 приведен пример изменения вероятностей гипотез при вводе пароля «Любят родину не зато, что она велика, а зато, что своя». Номера признаков на рис,1 соответствуют сочетаниям клавиш (лю, юб,..., оя). Процесс формирования вероятности лидирующей гипотезы представлен на рис. 1 жирной линией, тонкими линиями - всех остальных.

Масштабное исследование данного направления идентификации операторов путем увеличения их числа и увеличения длины и содержания паролей позволило нам оценить предельные оценки: из 100 пользователей с установившимися навыками работы с клавиатурой вероятность правильного распознавания составила 0,98. Это предельная цифра.

Другой динамический признак — особенности произношения пароля. Число работ, посвященных этому направлению, чрезвычайно велико. Для решения поставленной задачи в качестве признака диктора мы использовали устойчивость кривых гласных звуков. Установлено, что коэффициенты корреляции между кривыми, отражающими гласные звуки в пароле, составляет для одного диктора в среднем 0,8, для разных дикторов — 0,3. Свертка текущего сигнала пароля с эталонами разных гласных идентифицируемых дикторов позволяет построить процедуру их идентификации с использованием теории статистических решений. Финальные вероятности принадлежности дикторов определяются в конце произношения пароля. Получаемые кривые подобны кривым на рис. 1 и при длинных реализациях фраз достигают уровня правильного распознавания -0,96.

Последний из использованных нами динамических признаков — особенности тремора при обводе паролей. Точная обводка представленного на экране монитора пароля (мышью, световым пером и др.) невозможна. Отклонения при обводе от эталонной записи характеризует быстродействие и точность системы управления двигательными навыками. Коэффициент корреляции кривых отклонений одного пользователя в среднем превышает 0,8, для разных — падает до 0,15. Использование технологии проверки гипотез Байеса для распознавания пользователей «по тремору» также имеет предел на уровне 0,96 и дальнейшее повышение этой цифры сопряжено с большими затратами.

Есть основание полагать, что все перечисленные признаки пользователей ПЭВМ независимы и при-

менение их совокупности позволит с меньшими за- | тратами повысить надежность распознавания.

Переложив теорию комплексирования датчиков в сферу распознавания образов, мы получили теоретическую базу для реализации комплексированной системы идентификации.

Путем последовательного применения трех независимых признаков пользователя ПЭВМ, вероятность распознавания былаповышена с 98% до 99,9%. На рис.2 представлен график динамики вероятности.

Разработанная методика идентификации пользователей в комплексированной системе распознавания, в процессе экспериментов позволила идентифицировать 50 человек с уровнем ошибок первого и второго рода менее 0,01%. Подобная цифра достаточна, чтобы удовлетворить потребности большинства потребителей такого рода устройств.

Библиографический список

1. Специальная техника и информационная безопасность: Учебное пособие под ред. В.И.Кирина. — Москва: Академия МВД России, 2000. - 787 с.

2. Е.Е. Жуковский, Т.Д. Киселева, С.М. Мандельштам, Статистический анализ случайных процессов. — Ленинград: Гидрометео-издат, 1976. - 407 с.

3. Иванов А.И. Биометрическая идентификация личности по динамике подсознательныхдвижений. — Пенза: Иэд-во Пензенского государственного университета, 2000. - 188 с.

ПОКУСАЕВА Ольга Алексеевна, аспирант кафедры информационной безопасности.

Календарь конференций

Международная научная конференция Паралльные вычисления и задачи управления - РАСО '2006

02 - 04.10.2006 Россия, Москва

Официальные языки: русский, английский

НАПРАВЛЕНИЯ

■ Проблемы управления и глобально-распределенная компьютерная среда

• Общие методологии моделирования, идентификации, управления, самоорганизации и программирования

• Модели прикладных задач и методы их исследования

■ Параллельные и распределенные вычисления в задачах моделирования, идентификации, управления и самоорганизации

• Модели параллельных и распределенных вычислений и систем

• Проблемы интеграции данных, программ, процессов и систем в глобальной компьютерной среде

• Архитектуры параллельных вычислительных систем и задачи управления

■ Архитектуры распределенных вычислительных и управляющих систем в компьютерных сетях

• Технологии программирования параллельных и распределенных систем

• Проблемы совместного проектирования и синтеза параллельных программ и архитектур

• Надежные вычисления и защита информации в распределенных компьютерных средах

• Компьютерные системы с самообучением и самоорганизацией

• Презентации проектов вычислительных и управляющих систем с параллельной и/или распределенной обработкой информации

Срок подачи заявки и тезисов - 01.05.2006.

Адрес: 117997, Москва, Профсоюзная ул., 65. Институт проблем управления им. В. А. Трапезникова РАН.

i Надоели баннеры? Вы всегда можете отключить рекламу.