Научная статья на тему 'ИСПОЛЬЗОВАНИЕ НЕЙРОННЫХ СЕТЕЙ В ДИСТАНЦИОННЫХ ОБРАЗОВАТЕЛЬНЫХ ТЕХНОЛОГИЯХ ДЛЯ ИДЕНТИФИКАЦИИ ОБУЧАЮЩИХСЯ'

ИСПОЛЬЗОВАНИЕ НЕЙРОННЫХ СЕТЕЙ В ДИСТАНЦИОННЫХ ОБРАЗОВАТЕЛЬНЫХ ТЕХНОЛОГИЯХ ДЛЯ ИДЕНТИФИКАЦИИ ОБУЧАЮЩИХСЯ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
837
108
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДИСТАНЦИОННОЕ ОБУЧЕНИЕ / НЕЙРОННЫЕ СЕТИ / ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ / ОБУЧЕНИЕ НЕЙРОННОЙ СЕТИ / ИСКУССТВЕННЫЕ НЕЙРОНЫ / ФУНКЦИЯ АКТИВАЦИИ / СИНАПСЫ / СКОРОСТЬ ОБУЧЕНИЯ НЕЙРОННОЙ СЕТИ / ФУНКЦИЯ ПОТЕРИ / ОБУЧАЮЩИЙ НАБОР

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Козлова О. А., Протасова А. А.

Цель исследования. Целью настоящего исследования является изучение проблематики особенностей технологий обучения современных искусственных нейронных сетей для проведения процедуры однозначной аутентификации обучающихся по заранее сформированной эталонной базе цифровых биометрических характеристик санкционированных пользователей в сфере дистанционных образовательных технологий.В современном мире искусственные нейронные сети успешно применяются как в прикладной, так и в научной областях. Задача аутентификации личности человека, которая реализуется с использованием искусственных нейронных сетей, находит практическое применение при решении таких задач, как защита государственных и корпоративных информационных ресурсов, робототехника, системы управления доступом, информационный поиск, системы контроля и т.д., а уже начинает находить применение в сфере дистанционных образовательных технологий. В марте 2021 года Правительство Российской Федерации разработало постановление, на основании которого высшим учебным заведениям разрешается использовать дистанционные образовательные технологии. Проводя дистанционно мероприятия промежуточной и итоговой аттестации, а также контролируя текущую успеваемость обучающихся как дистанционной формы обучения, так и студентов очной и очно-заочной формы при временном переходе на дистанционную форму обучения в условиях пандемии, возникает проблема идентификации личности обучающегося для достижения однозначного распознавания санкционированных пользователей с целью достоверного оценивания результатов обучения, которую и можно решить, применяя современные технологии искусственных нейронных сетей.Материалы и методы. В качестве материалов и методов были использованы методы обзора научной литературы по тематике исследования, методы сбора, структурирования и анализа полученной информации.Результаты. Результаты проведенного исследования позволяют сделать следующие выводы: для решения задачи аутентификации обучающихся в системах дистанционного образования необходимо вначале сформировать собственно базу эталонов биометрических характеристик санкционированных пользователей, с которыми будут сопоставляться с биометрические данные идентифицируемого пользователя, а для процедуры распознавания нейронную сеть необходимо заранее обучить на специальных обучающих наборах (dataset). Процедуру идентификации необходимо повторять несколько раз в течение сеанса работы, чтобы обеспечить подтверждение личности санкционированного пользователя.Заключение. Реализуя поставленную цель - исследование проблематики особенностей технологий обучения современных искусственных нейронных сетей для проведения процедуры однозначной аутентификации обучающихся по заранее сформированной эталонной базе цифровых биометрических характеристик санкционированных пользователей в сфере дистанционных образовательных технологий, и опираясь на результаты, полученные в ходе обобщения и анализа существующего опыта и собственных исследований, авторы выделили два независимых этапа в алгоритме реализации задачи идентификации личности обучающегося: формирования эталонной базы цифровых биометрических характеристик санкционированных пользователей и аутентификация пользователя по сформированной ранее эталонной базе, а также выявили, что при обучении нейронной сети необходимо учитывать достаточно большое количество различных атрибутов, влияющих на нее. При недостаточном числе обучающих наборов (dataset) нейронные сети начинает воспринимать ошибки как надежную информацию, что в результате приведет к необходимости переобучения нейронных сетей. При достаточно большом числе обучающих наборов (dataset) появляется больше версий зависимостей и изменчивостей, что дает возможность создавать достаточно сложные модели машинного обучения нейросетей, в которых основное место занимает переобучение.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Козлова О. А., Протасова А. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE USE OF NEURAL NETWORKS IN DISTANCE EDUCATION TECHNOLOGIES FOR THE IDENTIFICATION OF STUDENTS

Purpose of the research. The purpose of this research is to study the problems of the features of teaching technologies of modern artificial neural networks for carrying out the procedure of unambiguous authentication of students according to a pre-formed reference base of digital biometric characteristics of the authorized users in the field of distance educational technologies.In the modern world, artificial neural networks are successfully used in both applied and scientific fields. The problem of authenticating a human personality, implemented using artificial neural networks, finds practical application in solving problems such as the protection of state and corporate information resources, robotics, access control systems, information retrieval, control systems, etc., and is already beginning to find application in the field of distance educational technologies. In March 2021, the Government of the Russian Federation developed a decree on the basis of which higher educational institutions are allowed to use distance learning technologies. Conducting remotely activities of intermediate and final certification, as well as monitoring the current progress of both distance learning students and full-time and part-time students with a temporary transition to distance learning in a pandemic, the problem of identifying the student’s personality arises in order to achieve unambiguous recognition of the authorized users for the purpose of reliable assessment of learning outcomes, which can be solved using modern technologies of artificial neural networks.Materials and methods. Methods of reviewing scientific literature on the research topic, methods of collecting, structuring and analyzing the information obtained were used as materials and methods.Research results. The results of the study allow us to draw the following conclusions: to solve the problem of authenticating students in distance education systems it is first necessary to form the actual base of biometric characteristics of the authorized users, which will be compared with the biometric data of the identified users, and for the recognition procedure, the neural network must be trained in advance on special trainers datasets. The identification procedure must be repeated several times during a session to ensure that the identity of the authorized user is verified.Conclusion. Realizing the set goal to study the problematics of learning technologies of modern artificial neural networks for carrying out the procedure of unambiguous authentication of students according to a pre-formed reference base of digital biometric characteristics of authorized users in the field of distance learning technologies, and relying on the results obtained in the course of generalization and analysis of existing experience and our own studies, the authors identified two independent stages in the algorithm for the implementation of the task of identifying the student’s personality: the formation of a reference base of digital biometric characteristics of authorized users and user authentication according to the previously formed reference base, and also revealed that when training a neural network, it is necessary to take into account a sufficiently large number of different attributes affecting it. With an insufficient number of training sets (datasets), neural networks begin to perceive errors as reliable information, which, as a result, will lead to the need to retrain neural networks. With a sufficiently large number of training sets (dataset), more versions of dependencies and variability appear, which makes it possible to create rather complex machine learning models of neural networks, in which retraining takes the main place.

Текст научной работы на тему «ИСПОЛЬЗОВАНИЕ НЕЙРОННЫХ СЕТЕЙ В ДИСТАНЦИОННЫХ ОБРАЗОВАТЕЛЬНЫХ ТЕХНОЛОГИЯХ ДЛЯ ИДЕНТИФИКАЦИИ ОБУЧАЮЩИХСЯ»

УДК 004.032.26 О.А. Козлова1, А.А. Протасова2

DOI: http://dx.doi.org/10.21686/1818-4243-2021-3-26-35

1 Российский экономический университет имени Г. В. Плеханова,

Москва, Россия 2 Университет «Синергия», Москва, Россия

Использование нейронных сетей в дистанционных образовательных технологиях для идентификации обучающихся

Цель исследования. Целью настоящего исследования является изучение проблематики особенностей технологий обучения современных искусственных нейронных сетей для проведения процедуры однозначной аутентификации обучающихся по заранее сформированной эталонной базе цифровых биометрических характеристик санкционированных пользователей в сфере дистанционных образовательных технологий. В современном мире искусственные нейронные сети успешно применяются как в прикладной, так и в научной областях. Задача аутентификации личности человека, которая реализуется с использованием искусственных нейронных сетей, находит практическое применение при решении таких задач, как защита государственных и корпоративных информационных ресурсов, робототехника, системы управления доступом, информационный поиск, системы контроля и т.д., а уже начинает находить применение в сфере дистанционных образовательных технологий. В марте 2021 года Правительство Российской Федерации разработало постановление, на основании которого высшим учебным заведениям разрешается использовать дистанционные образовательные технологии. Проводя дистанционно мероприятия промежуточной и итоговой аттестации, а также контролируя текущую успеваемость обучающихся как дистанционной формы обучения, так и студентов очной и очно-заочной формы при временном переходе на дистанционную форму обучения в условиях пандемии, возникает проблема идентификации личности обучающегося для достижения однозначного распознавания санкционированных пользователей с целью достоверного оценивания результатов обучения, которую и можно решить, применяя современные технологии искусственных нейронных сетей. Материалы и методы. В качестве материалов и методов были использованы методы обзора научной литературы по тематике исследования, методы сбора, структурирования и анализа полученной информации.

Результаты. Результаты проведенного исследования позволяют сделать следующие выводы: для решения задачи аутентификации обучающихся в системах дистанционного образования необходимо вначале сформировать собственно базу эталонов

биометрических характеристик санкционированных пользователей, с которыми будут сопоставляться с биометрические данные идентифицируемого пользователя, а для процедуры распознавания нейронную сеть необходимо заранее обучить на специальных обучающих наборах (dataset). Процедуру идентификации необходимо повторять несколько раз в течение сеанса работы, чтобы обеспечить подтверждение личности санкционированного пользователя.

Заключение. Реализуя поставленную цель — исследование проблематики особенностей технологий обучения современных искусственных нейронных сетей для проведения процедуры однозначной аутентификации обучающихся по заранее сформированной эталонной базе цифровых биометрических характеристик санкционированных пользователей в сфере дистанционных образовательных технологий, и опираясь на результаты, полученные в ходе обобщения и анализа существующего опыта и собственных исследований, авторы выделили два независимых этапа в алгоритме реализации задачи идентификации личности обучающегося: формирования эталонной базы цифровых биометрических характеристик санкционированных пользователей и аутентификация пользователя по сформированной ранее эталонной базе, а также выявили, что при обучении нейронной сети необходимо учитывать достаточно большое количество различных атрибутов, влияющих на нее. При недостаточном числе обучающих наборов (dataset) нейронные сети начинает воспринимать ошибки как надежную информацию, что в результате приведет к необходимости переобучения нейронных сетей. При достаточно большом числе обучающих наборов (dataset) появляется больше версий зависимостей и изменчивостей, что дает возможность создавать достаточно сложные модели машинного обучения нейросетей, в которых основное место занимает переобучение.

Ключевые слова: дистанционное обучение, нейронные сети, искусственный интеллект, обучение нейронной сети, искусственные нейроны, функция активации, синапсы, скорость обучения нейронной сети, функция потери, обучающий набор.

Oksana A. Kozlova1, Alla A. Protasova2

1 Plekhanov Russian University of Economics, Moscow, Russia 2 Synergy University, Moscow, Russia

The Use of Neural Networks in Distance Education Technologies for the Identification of Students

Purpose of the research. The purpose of this research is to study the problems of the features of teaching technologies of modern artificial neural networks for carrying out the procedure of unambiguous authentication of students according to a pre-formed reference base of digital biometric characteristics of the authorized users in the field of distance educational technologies.

In the modern world, artificial neural networks are successfully used in both applied and scientific fields. The problem of authenticating a

human personality, implemented using artificial neural networks, finds practical application in solving problems such as the protection of state and corporate information resources, robotics, access control systems, information retrieval, control systems, etc., and is already beginning to find application in the field of distance educational technologies. In March 2021, the Government of the Russian Federation developed a decree on the basis of which higher educational institutions are allowed to use distance learning technologies. Conducting remotely

activities of intermediate and final certification, as well as monitoring the current progress of both distance learning students and full-time and part-time students with a temporary transition to distance learning in a pandemic, the problem of identifying the student's personality arises in order to achieve unambiguous recognition of the authorized users for the purpose of reliable assessment of learning outcomes, which can be solved using modern technologies of artificial neural networks.

Materials and methods. Methods of reviewing scientific literature on the research topic, methods of collecting, structuring and analyzing the information obtained were used as materials and methods. Research results. The results of the study allow us to draw the following conclusions: to solve the problem of authenticating students in distance education systems it is first necessary to form the actual base of biometric characteristics of the authorized users, which will be compared with the biometric data of the identified users, and for the recognition procedure, the neural network must be trained in advance on special trainers datasets. The identification procedure must be repeated several times during a session to ensure that the identity of the authorized user is verified.

Conclusion. Realizing the set goal - to study the problematics of learning technologies of modern artificial neural networks for carrying

out the procedure of unambiguous authentication of students according to a pre-formed reference base of digital biometric characteristics of authorized users in the field of distance learning technologies, and relying on the results obtained in the course of generalization and analysis of existing experience and our own studies, the authors identified two independent stages in the algorithm for the implementation of the task of identifying the student's personality: the formation of a reference base of digital biometric characteristics of authorized users and user authentication according to the previously formed reference base, and also revealed that when training a neural network, it is necessary to take into account a sufficiently large number of different attributes affecting it. With an insufficient number of training sets (datasets), neural networks begin to perceive errors as reliable information, which, as a result, will lead to the need to retrain neural networks. With a sufficiently large number of training sets (dataset), more versions of dependencies and variability appear, which makes it possible to create rather complex machine learning models of neural networks, in which retraining takes the main place.

Keywords: distance learning, neural networks, artificial intelligence, neural network training, artificial neurons, activation function, synapses, neural network learning rate, loss function, training set.

Введение

Технологии искусственного интеллекта все более и более глубоко входят в нашу жизнь, и современный мир уже вряд ли сможет когда-либо существовать без их использования. Усиление внимания к проблеме разработки и использования искусственных нейронных сетей, создаваемых на базе технологий искусственного интеллекта, связано с успешным использованием нейронных сетей для решения не только теоретических научных проблем, но и различного рода конкретных прикладных задач. Решение задач идентификации личности человека, реализуемое посредством искусственных нейронных сетей, находит практическое применение при решении таких задач, как защита государственных и корпоративных информационных ресурсов, робототехника, системы управления доступом, информационный поиск, системы контроля и т.д., а уже начинает находить применение в сфере дистанционных образовательных технологий.

Актуальность выбранной темы — использование нейронных сетей в дистанционных образовательных технологиях для идентификации обучающихся — обусловлена тем, что

начавшаяся в 2020 году во всем мире пандемия короновируса коснулась всевозможных областей жизни и деятельности людей, и привела к тому, что технологии искусственного интеллекта, связанные с распознаванием и идентификацией образов, стали в течение последнего года еще более востребованными в сфере дистанционного образования.

Теоретический анализ литературы [1, 2, 3] позволяет выделить перспективное направление разработки: применение возможностей искусственных нейронных сетей в дистанционных образовательных технологиях для идентификации обучающихся.

Первые методы и алгоритмы идентификации и распознавания образов были разработаны еще в конце XIX века британским ученым Фрэнсисом Гальтоном для использования в криминалистике [4]. В 1964 г. выдающийся американский учёный, один из основателей теории искусственного интеллекта Вудро Уилсон (Вудди) Бледсоу внес существенный вклад в теорию распознавания образов — разработал методику автоматического распознавания лиц [5]. Такео Канаде, один из ведущих исследователей в области компьютерного зрения, япон-

ский ученый-компьютерщик, разработал программу, с помощью которой стало возможным выделять отдельные фрагменты лица [6]. В 2015 году на международном конкурсе технология распознавания лиц FindFace, разработанная российской компанией NtechLab, была признана лучшей, и она сумела опередить разработки Гугла [7, 8].

В современном мире искусственного интеллекта и компьютерных технологий технология аутентификации лица применяются в всевозможных сферах деятельности людей[9,10]:

• при пересечении границы: для сравнения биометрического изображения лица человека в загранпаспорте с его лицом;

• для идентификации при банковских операциях;

• при подготовке документов, удостоверяющих личность;

• для сравнения лица водителя автомобиля с лицами, хранящимися в базе данных владельцев водительских прав;

• для оплаты услуг и др.

Однако, на текущий момент, технология идентификации лица не применяются в сфере образования. Новизной исследования можно считать поиск новых потенциальных

применений этой технологии, а именно — изучение возможностей применения искусственных нейронных сетей для идентификации личности обучающегося с целью достижения однозначного распознавания санкционированных пользователей для достоверного оценивания результатов обучения в дистанционных образовательных технологиях. Задача распознавания и аутентификации личности обучающегося относится к классу технически сложных задач, которые требуют не только систематизации существующих методик решения, но и разработки новых методик и алгоритмов.

Федеральный закон № 482-ФЗ от 31 декабря 2017 г. «О внесении изменений в отдельные законодательные акты Российской Федерации» [11] и вступившие в силу 30 июня 2018 года изменения, внесенные в соответствующие законодательные акты, предоставляют право государственным органам, банкам и другим организациям Российской Федерации проводить удаленную идентификация физических лиц с использованием персональных биометрических данных в случаях, предусмотренных законом.

Правительства Российской Федерации распоряжением от 30 июня 2018 г. № 1322-р утвердило форму согласия на обработку персональных данных и биометрических персональных данных[12].

Постановление Правительства Российской Федерации от 2 марта 2021 г. № 301 [13] предусматривает использование ВУЗами дистанционных технологий, применяя которые можно однозначно идентифицировать личность обучаемого при проведении текущего контроля успеваемости, при проведении промежуточной и итоговой аттестации как для студентов дистанционной формы обучения, так и для

студентов очной и очно-заочной формы при временном переходе на дистанционную форму обучения в условиях пандемии.

Доступ к Интернету практически из любой точки мира предоставил возможности как для разработки систем дистанционного образования, так и для их использования обучающимися.

Концепции дистанционного образования в Российской Федерации была утверждена в 1995 г. [14] Однако, разработка системы дистанционного образования была начата несколько раньше [15]: начиная с 1990 г. было организовано дистанционное обучения рыбаков на Дальнем Востоке, (РИУ «Тантал»), с 1991 г. в МИМ «Линк», с 1992 г. в СГА, с 1996 г. в МЭСИ, с 2000 г. в ФГНУ «Российский государственный институт открытого образования».

Полнофункциональная платформа дистанционного образования предоставляет возможность максимально использовать современные информационные технологии и потенциал интернета для обеспечения высокого качества дистанционного образования, которое в некоторых случаях может даже превосходить очную модель обучения, и включает в себя помимо основных еще и дополнительные функционалы, такие как:

• видеолекции;

• вебинары;

• интерактивные тесты;

• анимированные уроки;

• электронные учебники; и т.д.

Внедрение дистанционного обучения весной 2020 г. в связи с пандемией выявило ряд проблем, связанных с различными сторонами использования дистанционных образовательных технологий, одной из которых является достоверность оценивания результатов обучения. Вполне реальной может оказаться ситуация, что

санкционированный пользователь сам заинтересован в том, чтобы под его учетными данными проверку контроля успеваемости несанкционированно проходил посторонний человек, который с целью получения более высокого результата проверки будет выдавать себя за санкционированного пользователя. В этом случае для идентификации санкционированного пользователя не может быть применена стандартная схема распознавания, что ставит перед разработчиками систем дистанционного образования достаточно серьезную задачу достоверного распознавания санкционированных пользователей.

Необходимым условием решения этой задачи является не только своевременная идентификация пользователей в системе дистанционного образования, но также и выбор эффективных методов построения адекватных моделей и алгоритмов идентификации распознавания санкционированных пользователей. При выборе алгоритмов распознавания санкционированных пользователей необходимо оценивать реальность угрозы несанкционированного доступа в систему [16, 17].

Реализацию задачи идентификации личности обучающегося можно представить в виде двух независимых этапов [18]:

• первый этап (назовем его этапом формирования базы эталонов биометрических характеристик санкционированных пользователей) заключается в фиксации персональных биометрических данных в процессе сканирования лица человека 2D/3D датчиком, преобразовании результатов сканирования в пакет цифровых данных, которые основаны на уникальности внешности каждого человека, и добавления в базу цифровых данных;

• второй этап (назовем его этапом аутентификация пользователя) заключается в скани-

рование лица человека 2D/3D датчиком, преобразовании результата сканирования в цифровые данные, сравнения полученных данных с данными, хранящимися в эталонной базе данных биометрических характеристик санкционированных пользователей, наполненной цифровыми данными по лицам пользователей на этапе формирования базы, далее эти два цифровых набора сравниваются, и полное совпадение и дает возможность удостовериться, принадлежит ли лицо на фотографии или на видеозаписи одному и тому же человеку. Этап аутентификации пользователя можно разделить на две части: первая — обнаружение и локализация лица пользователя на фотографии или на видеозаписи, и вторая — непосредственно аутентификация пользователя. В случае необходимости при решении первой задачи может быть произведена предобработка изображения.

Процедуру проверки необходимо повторять несколько раз в течение сеанса работы данного пользователя, чтобы обеспечить подтверждение личности санкционированного пользователя.

Алгоритм первого этапа — формирования эталонной базы цифровых биометрических характеристик санкционированных пользователей — представлен на рис. 1.

Алгоритм второго этапа — аутентификация пользователя по сформированной ранее эталонной базе цифровых биометрических характеристик санкционированных пользователей — представлен на рис. 2.

База с эталонами персональных биометрических данных санкционированных пользователей в системе должна быть сформирована на начальном этапе. Затем система определяет при каждом входе пользователя в систему его личные биометрические характеристики, которые и сравниваются с хранящимся в базе

Рис. 1. Формирование эталонной базы цифровых биометрических характеристик санкционированных пользователей.

Fig.1. Formation of a reference base of digital biometric characteristics of the authorized users

Рис. 2. Аутентификация пользователя по сформированной ранее эталонной базе цифровых биометрических характеристик санкционированных пользователей.

Fig. 2. User authentication against the previously formed reference base of digital biometric characteristics of the authorized users

биометрическим эталоном. В случае совпадения пользователь распознается как санкционированный.

Для того чтобы задача распознавания и идентификации личности обучающегося при дистанционном обучении была реализована полностью, процедуру проверки личности обучающегося необходимо выполнять не только при первичном входе в систему, но и повторять несколько раз в течение сеанса работы пользователя, чтобы обеспечить подтверждение личности санкционированного пользователя в течение всего времени работы.

Процедура аудентифика-ции и подтверждения личности санкционированного пользователя может быть осуществлена с использованием нейросетей. Нейронные сети — это попытка разработки искусственного интеллекта, основой которого является нелинейная вычислительная модель, реализующая обучение нейросети на обучающих наборах.

Современные нейронные сети решают разнообразные задачи, например, задачи визуализации, задачи принятия решений, задачи классификации, и много других, механизмы решения которых по сложности можно сопоставить с механизмом работы мозга [19].

При обучении нейросети для распознавания санкционированных пользователей применяется так называемый обучающий набор (dataset), в который включены образцы биометрических характеристик, которые будут сопоставляться с хранящимся в системе биометрическим эталоном.

Рассмотрим более подробно алгоритм обучения нейросети.

Элементами для анализа и обработки информации в нейронных сетях являются искусственные нейроны, каждый нейрон обладает функцией активации, важнейшая цель которой — «стандартизация» данных на выходе из нейрона.

Каждый нейрон имеет некоторое количество входов, называемыми синапсами, каждому входу соответствует с весами, начальный вес, заданный случайным образом. Именно синапсы и выполняют функции регулируемых параметров, которые совершают преобразование нейросети в параметризованную систему. Также каждый нейрон имеет функцию активации, результатом которой является выходная (результирующая) информация, получающаяся исходя из заданной входной информации, и один выход.

Искусственная нейросеть включает в себя три составляющих слоя, которые связанны друг с другом в определенном порядке [20]:

• входной;

• вычислительный;

• выходной.

Функция входных нейронов, из которых состоит первый слой нейросети (или Input Nodes), заключается в передаче входной информации на следующий, вычислительный, слой.

Функция вычислительного (или Hidden Nodes) слоя состоит в том, что они принимают информацию от входных нейронов первого слоя. Вычислительный слой по-другому называют скрытым слоем, и именно он выполняет функцию передачи информации на последний, выходной слой. В вычислительном слое с поступившими к нему входными данными производятся необходимые вычисления. Определение числа вычисли -тельных слоев и количества нейронов в каждом вычислительном слое является одной из важнейших задач создания нейросетей.

И последний, результирующий (или Output Nodes) слой — выходной, именно он и выдает конечный результат работы нейросети.

1. Модель искусственной нейронной сети [21] можно

представить таким образом (см. рис 3):

Входной слой

Выходной слой

Рис. 3. Схема искусственной нейросети

Fig. 3. Diagram of an artificial neural network

Проанализируем принципы обучения искусственной нейросети.

Обучение (тренировка) нейронных сетей — это процесс оптимизации весов, при котором сеть достигает необходимой точности, и при этом минимизируется погрешность предсказания.

Обучение нейронных сетей может быть, как контролируемым (обучение с учителем), так и неконтролируемым [22].

При обучении нейронных сетей с учителем (или контролируемое обучение — supervised learning) применяются размеченные наборы данных, в которых содержатся как входные данные, так и ожидаемые результаты. В случае если результат, который нейронная сеть сгенерировала, оказывается ошибочным, нейросеть имеет возможность откорректировать свои вычисления. Таким образом этот процесс продолжается до того момента, когда нейро-сеть перестанет делать ошибки и наконец выдаст ожидаемый результат, то есть процесс обучения можно назвать итерационным.

При втором способе обучения — обучении с помощью неконтролируемого обучения, нейросети самостоятельно выполняют логическую классификацию и систематизацию

входных данных, а не используют размеченные наборы данных, как при первом способе.

2. Стандартно обучение нейронных сетей состоит из двух этапов [23]: этапа прямого распространения ошибки и этапа обратного распространения ошибки. В процессе первого этапа — прямого распространения ошибки — вырабатывается предсказание ответа. В процессе второго этапа — обратного распространения ошибки — минимизируется ошибка между предсказанным и фактическим ответом.

На первом этапе начальные веса (обозначим их как v) для входных данных (обозначим их как xj) задаются случайным образом. Для формирования вычислительного слоя (Hidden Nodes) необходимо выполнить расчеты: начальные веса умножают на входные данные: Yi = (xi х vi) + (x2 х vi); Y2 = (xi * v2) + (x2 х v2);

Уз = (Xi * v3) + (X2 х vз), где у i — выходные данные;

X j — входные данные;

vi — начальный вес, заданный случайным образом.

Чтобы получить на выход нейронной сети результатные данные, их необходимо передать через функцию активации (Activation function) из вычислительного (скрытого) слоя. Функция активации представляющую собой нелинейную функцию вида:

Z = F (у),

где Z — результат функции активации;

yt — выходные данные.

Функция активации [24] является одним из наиболее мощных инструментов и оказывает существенное воздействие на результаты работы нейронных сетей. Глубокие сети без функции активации лишаются существенной доли своих способностей к обучению. Функция активации применяется для масштаби-

рования результата перед его пересылкой активациям следующего слоя. В каждом слое функция активации используется непосредственно перед принятием решения о конкретной величине значения активации. Значения для активации последующего слоя вычисляются с учетом значений весов, смещений и активаций предшествующих слоев. Именно функция активации определяет информацию, которая будет транслироваться в выходной слой, и какие для этого необходимо активировать нейроны. Функция активации относится к нелинейным функциям. К наиболее распространенным функциям активации можно отнести следующие функции: ELU, Maxout, ReLU, Leaky ReLU, Sigmoid, tanh.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Этап прямого распространения ошибки приведен на рис. 4.

В процессе второго этапа (обратного распространения ошибки) минимизируется ошибка между предсказанным (Z) и фактическим ответом (Z). Для этого высчитывается суммарная ошибка (Total Error), которая вычисляется как разность между ожидаемым значением Z, взятого из обучающего набора, и результатным значением Z, полученном на этапе прямого распространения ошибки, являющегося, как уже было сказано выше, первым этапом обучения ней-росети, и обрабатываемых далее функцией потерь (Loss function).

Функция потери (Loss function) дает оценку качества

Рис. 4. Этап прямого распространения ошибки

Fig. 4. Stage of direct error propagation

результатов работы нейронной сети в целом. Главной целью функции потери является минимизация расхождения между расчетными и реальными параметрами. Функция потери измеряет насколько «качественно» работает нейросеть по отношению конкретного обучающего набора и предполагаемых результатов. Данная функция одномерна, наиболее часто используемой функцией потери и одной из самых лёгких в использовании является функция среднеквадратичного отклонения. Кроме нее еще используются экспоненциальная (AdaBoost), Кросс-энтропия и некоторые другие функции.

Принцип работы этапа обратного распространения ошибки, являющегося вторым

VI

V2 О

V3

£ = LF(Z, Z)

где

vi = vi - (А, * Л(£) / Л( vi)) V2=V2-(X* Ä(E)/A(V2» v з = V3 - * Д(£) / Д( v з))

Рис. 5. Этап обратного распространения ошибки Fig. 5. Stage of error back propagation

этапом обучения нейросети (см. на рис 5).

Затем по каждому весу вычисляется частная производная ошибки (Д(£)/Д(у)), отражающая вклад каждого веса в общую ошибку (Total loss).

Полученные частные производные ошибки перемножаются с величиной скорости обучения нейронной сети (Learning rate, которую обозначим А), которая является одним из очень важных параметров. В случае недостаточной скорости обучения работа нейронной сети может существенно отличаться от оптимальных параметров, даже несмотря на продолжительное по времени обучение. В случае, если скорость обучения нейронной сети будет слишком высокой, сеть будет слишком быстро выдавать ответы.

Чтобы получить обновленные веса, необходимо из соответствующих начальных весов вычесть результат ранее полученного умножения. В результате получим:

V! = Vi - (А X Д(£) / Д(^));

V2 = V2 - (А X Д(£) / Д^2));

v3 = V3 - (А X д(£) / Д^3)), где Vi — обновленный вес;

Д(£) / Д( v j) — частная производная ошибки; А — скорость обучения нейронной сети.

Вычислительный слой необходим для определения формы базовой функции в данных, а для того, чтобы произвести сдвиг функции для ее частичного совпадения с исходной функцией, необходимо к вычислительному слою добавить веса, которые называются смещениями. Они инициализируются случайным образом и

обновляются, как и вычислительный слой.

Вывод

Результаты проведенного анализа позволяют сделать следующие выводы: для решения задачи идентификации обучающихся в системах дистанционного образования необходимо создать базу эталонов биометрических характеристик санкционированных пользователей, с которыми будут сопоставляться биометрические данные идентифицируемого пользователя, а для процедуры распознавания нейронную сеть необходимо заранее обучить на специальных обучающих наборах (dataset). Реализуя машинное обучение нейронной сети, необходимо учитывать использование достаточно большого количества различных атрибутов, влияющих на нее, поэтому необходимо эти атрибуты по возможности обобщить и представить в виде массива. Однако обобщение этих атрибутов может привести к ряду проблем. Может возникнуть смещение из-за неверных предположений. Большое смещение может привести к явлению, называемому недообучением. При недообучении алгоритм не учитывает некоторые взаимосвязи между целевыми переменными и признаками. Даже несущественные отклонения из-за недостаточного исследования атрибутов в обучающем наборе могут привести к увеличению дисперсии, а это, в свою очередь, приводит к тому, что нейросеть начинает воспринимать ошибки как надежную

информацию, что в результате приведет к необходимости переобучения нейросети. При достаточно большом числе обучающих наборов (dataset) при обучении и переобучении ней-росети появляется больше версий зависимостей и изменчи-востей, что дает возможность создавать достаточно сложные модели машинного обучения нейросетей, в которых основное место занимает переобучение.

Несмотря на то, что технологии распознавания лиц в настоящее время уже используются в целом ряде областей — от науки до применения в государственных системах безопасности, дальнейшее внедрение технологий распознавания лиц в сферы практического применения еще впереди.

Серьезные перспективы в будущем, несомненно, имеет использование нейронных сетей в дистанционных образовательных технологиях для идентификации обучающихся. Нейронные сети, используя способности к обучению и переобучению на базе заложенных в них цифровых биометрических характеристик санкционированных пользователей, способны решать такие сложные задачи, как достоверность распознавания санкционированных пользователей и достоверность оценивания результатов проводимых дистанционно мероприятий промежуточной и итоговой аттестации, что имеет огромное значение для дальнейшего развития дистанционного образования, как в нашей стране, так и во все мире.

Литература

1. Стефаниди А.Ф., Лебедев А.А., Матвеев Д.В. Исследование робастности алгоритмов распознавания лиц на изображениях // Вопросы применения цифровой обработки сигналов. 2018. Т. 8. № 4. С. 174-179.

2. Воронин И.В., Зияутдинов В.С., Скуднев Д.М. Применение искусственных нейронных се-

тей для биометрической идентификации личности // Современные тенденции развития науки и производства. V Международная научно-практическая конференция: в 2-х томах. Западно-Сибирский научный центр. 2017. С. 107—109.

3. Дружин Д.С., Фролова М.А. Возможность использования нейронных сетей для идентификации личности // Дни российской науки —

2020. Тезисы докладов II Отраслевого научного форума. 2020. С. 62-65.

4. Чабан Л.Н. Теория и алгоритмы распознавания образов. Учебное пособие. М.: МИИГАиК, 2004. 70 с.

5. История автоматизированного распознавания лиц [Электрон. ресурс]. Режим доступа: https://deepfakechallenge.com/the-secret-history-of-facial-recognition/. (Дата обращения: 30.04.2021).

6. Lucas B.D., Kanade T. An Iterative Image Registration Technique with an Application to Stereo Vision. Proc. 7th Intnl. Joint Conf. on Artificial Intelligence. Vancouver, British Columbia. 1981. С. 674-679.

7. Ntechlab — дополняя интеллект. Режим доступа: https://ntechlab.ru. (Дата обращения: 07.05.2021).

8. Как Google распознает изображения [Электрон. ресурс]. Режим доступа: https:// policies.google.com/technologies/pattern-recognition?hl=ru. (Дата обращения: 12.05.2021).

9. Amazing Uses for Face Recognition [Электрон. ресурс]. Режим доступа: https://www.facefirst. com/blog/amazing-uses-for-face-recognition-facial-recognition-use-cases/. (Дата обращения: 12.05.2021).

10. Пешкова И. Кто и как использует технологии распознавания лиц в России [Электрон. ресурс]. Режим доступа: https://rb.ru/longread/ facialrecognition/. (Дата обращения: 12.05.2021).

11. Федеральный закон от 31.12.2017 № 482-ФЗ «О внесении изменений в отдельные законодательные акты Российской Федерации» [Электрон. ресурс]. Режим доступа: http://www.kremlin. ru/acts/bank/42711. (Дата обращения: 14.05.2021).

12. Распоряжение Правительства РФ от 30 июня 2018 г. № 1322-р «Об утверждении формы согласия на обработку персональных данных, необходимых для регистрации гражданина РФ в единой системе идентификации и аутентификации, и иных сведений, если такие сведения предусмотрены федеральными законами в указанной системе, и биометрических персональных данных гражданина РФ в единой информационной системе персональных данных, обеспечивающей обработку, включая сбор и хранение биометрических персональных данных, их проверку и передачу информации о степени их соответствия предоставленным биометрическим персональным данным гражданина РФ» [Электрон. ресурс]. Режим доступа: https://www.garant.ru/products/ipo/prime/ doc/71879372/. (Дата обращения: 14.05.2021).

13. Постановление Правительства РФ от 2 марта 2021 г. № 301 «Об утверждении Положения об особенностях проведения промежуточной аттестации в 2021/2022 учебном году по образовательным программам высшего образования - программам бакалавриата, программам специалитета, программам магистратуры, предусматривающих использование дистанционных образовательных технологий, обеспечивающих идентификацию личности посредством единой информационной системы

персональных данных, обеспечивающей обработку, включая сбор и хранение биометрических персональных данных, их проверку и передачу информации о степени их соответствия предоставленным биометрическим персональным данным физического лица» [Электрон. ресурс]. Режим доступа: https://www.garant.ru/products/ipo/prime/ ёос/400313204/. (Дата обращения: 14.05.2021).

14. Постановление Госкомвуза РФ от 31 мая 1995 г. №6 «О состоянии и перспективах создания единой системы дистанционного образования в России» [Электрон. ресурс]. Доступ из системы ГАРАНТ. Режим доступа: https://base. garant.ru/181033/. (Дата обращения: 14.05.2021).

15. Малькова Т.В. Становление системы дистанционного обучения в российской федерации: к истории проблемы // Наука и школа. 2009. № 1. С. 63-65.

16. Протасова А. А., Козлова О. А. Современные технологии идентификации лица: исследование алгоритма работы и использование // Прикладная информатика. 2020. Т. 15. № 2. С. 131-143. DOI: 10.37791/2687-0649-2020-15-2-131-143.

17. Трегубенко Л.А., Слащёв И.С., Клименко А.В. Современные подходы к процедуре идентификации лиц // Вестник современных исследований. 2019. № 3. 6(30). С. 182-186.

18. Лиховидов В.Н., Герасимец И.В., Кор-нюшин П.Н. Применение нейронных сетей для формирования эталонов в системах биометрической идентификации личности // Информационное противодействие угрозам терроризма. 2006. № 7. С. 52-63.

19. Зелинов М. А. Изучение работы нейронных сетей: нейронные сети основы, использование нейронных сетей в экономике // Сборник трудов международной научной конференции «Гуманитарные науки в современном вузе: вчера, сегодня, завтра». 2019. С. 880-885.

20. Дружин Д.С., Фролова М.А. Результаты реализации алгоритма идентификации личности // Актуальные проблемы и пути развития энергетики, техники и технологий. Сборник трудов VI Международной научно-практической конференции. 2020. С. 269-273.

21. Галушкин А.И. Нейронные сети: основы теории. М.: Горячая линия-Телеком, 2012. 496 с.

22. Забашта А.Ю., Хохлов С.А., Скорикова С.А. Анализ существующих алгоритмов распознавания лиц // Современная наука: актуальные проблемы теории и практики. Серия: Естественные и технические науки. 2017. № 7-8. С. 42-45.

23. Селедец И.Е., Борунов Д.И., Рычков В.А. Основы машинного обучения // Синергия наук. 2020. № 44. С. 407-414.

24. Онуфриева Т.А., Сухова А.С. Применение нейронных сетей в разработке электронных обучающих ресурсов // Южно-сибирский научный вестник. 2020. № 6(34). С. 194-197. DOI: 10.25699/к7125-9820-7795-е.

References

1. Stefanidi A.F., Lebedev A.A., Matveyev D.V. Investigation of the robustness of algorithms for face recognition in images. Voprosy primeneniya tsifrovoy obrabotki signalov = Questions of the use of digital signal processing. 2018; 8; 4: 174-179. (In Russ.)

2. Voronin I.V., Ziyautdinov V.S., Skudnev D.M. Application of artificial neural networks for biometric identification of a person. Sovremennyye tendentsii razvitiya nauki i proizvodstva. V Mezhdunarodnaya nauchno-prakticheskaya konferentsiya: v 2-kh tomakh = Modern trends in the development of science and production. V International Scientific and Practical Conference: in 2 volumes. West Siberian Scientific Center. 2017: 107-109. (In Russ.)

3. Druzhin D.S., Frolova M.A. Possibility of using neural networks for personal identification. Dni rossiyskoy nauki — 2020. Tezisy dokladov II Otraslevogo nauchnogo foruma = Days of Russian Science - 2020. Abstracts of the II Industry Scientific Forum. 2020: 62-65. (In Russ.)

4. Chaban L.N. Teoriya i algoritmy raspoznavaniya obrazov. Uchebnoye posobiye = Theory and algorithms for pattern recognition. Tutorial. Moscow: MIIGAiK; 2004. 70 p. (In Russ.)

5. Istoriya avtomatizirovannogo raspoznavaniya lits = History of automated face recognition [Internet]. Available from: https://deepfakechallenge.com/ the-secret-history-of-facial-recognition/. (cited 30.04.2021). (In Russ.)

6. Lucas B.D., Kanade T. An Iterative Image Registration Technique with an Application to Stereo Vision. Proc. 7th Intnl. Joint Conf. on Artificial Intelligence. Vancouver, British Columbia. 1981: 674-679.

7. Ntechlab — dopolnyaya intellect = Ntechlab -Complementing Intelligence. Available from: https://ntechlab.ru. (cited 07.05.2021). (In Russ.)

8. Kak Google raspoznayet izobrazheniya = How Google recognizes images [Internet]. Available from: https://policies.google.com/technologies/pattern-recognition?hl=ru. (cited 12.05.2021). (In Russ.)

9. Amazing Uses for Face Recognition [Internet]. Available from: https://www.facefirst. com/blog/amazing-uses-for-face-recognition-facial-recognition-use-cases/. (cited 12.05.2021).

10. Peshkova I. Kto i kak ispol'zuyet tekhnologii raspoznavaniya lits v Rossii = Who and how uses face recognition technology in Russia [Internet]. Available from: https://rb.ru/longread/ facialrecognition/. (cited 12.05.2021). (In Russ.)

11. Federal Law of December 31, 2017 N 482-FZ «On Amendments to Certain Legislative Acts of the Russian Federation» [Internet]. Available from: http://www.kremlin.ru/acts/bank/42711. (cited 14.05.2021). (In Russ.)

12. Order of the Government of the Russian Federation of June 30, 2018 No. 1322-r «On approval of the consent form for the processing of

personal data required for registration of a citizen of the Russian Federation in the unified identification and authentication system, and other information, if such information is provided for by federal laws in this system. , and biometric personal data of a citizen of the Russian Federation in a unified information system of personal data that provides processing, including collection and storage of biometric personal data, their verification and transfer of information on the degree of their compliance with the provided biometric personal data of a citizen of the Russian Federation « [Internet]. Available from: https://www.garant.ru/products/ipo/prime/ doc/71879372/. (cited 14.05.2021). (In Russ.)

13. Decree of the Government of the Russian Federation of March 2, 2021 No. 301 «On the approval of the Regulation on the specifics of intermediate certification in the 2021/2022 academic year for educational programs of higher education -bachelor's programs, specialist programs, master's programs, providing for the use of distance learning technologies that provide identification of a person through a unified information system of personal data, providing processing, including the collection and storage of biometric personal data, their verification and transfer of information on the degree of their compliance with the provided biometric personal data of an individual « [Internet]. Available from: https://www.garant.ru/products/ipo/prime/ doc/400313204/. (cited 14.05.2021). (In Russ.)

14. Resolution of the State Committee for Higher Education of the Russian Federation of May 31, 1995 No. 6 «On the state and prospects of creating a unified system of distance education in Russia» [Internet]. Dostup iz sistemy GARANT = Access from the GARANT system. Available from: https://base.garant.ru/181033/. (cited 14.05.2021). (In Russ.)

15. Mal'kova T.V. Formation of the distance learning system in the Russian Federation: to the history of the problem. Nauka i shkola = Science and school. 2009; 1: 63-65. (In Russ.)

16. Protasova A.A., Kozlova O.A. Modern technologies of face identification: research of the algorithm of work and use. Prikladnaya informatika = Applied Informatics. 2020; 15; 2: 131—143. DOI: 10.37791/2687-0649-2020-15-2-131-143. (In Russ.)

17. Tregubenko L.A., Slashchov I.S., Klimen-ko A.V. Modern approaches to the procedure for identifying persons. Vestnik sovremennykh issledovaniy = Bulletin of modern research. 2019; 3; 6(30): 182—186. (In Russ.)

18. Likhovidov V.N., Gerasimets I.V., Kornyushin P.N. The use of neural networks for the formation of standards in systems of biometric identification of a person. Informatsionnoye protivodeystviye ugrozam terrorizma = Information Counteraction to the Threats of Terrorism. 2006; 7: 52-63. (In Russ.)

19. Zelinov M. A. Studying the work of neural networks: basis neural networks, the

use of neural networks in economics. Sbornik trudov mezhdunarodnoy nauchnoy konferentsii «Gumanitarnyye nauki v sovremennom vuze: vchera, segodnya, zavtra» = Proceedings of the international scientific conference «Humanities in a modern university: yesterday, today, tomorrow». 2019: 880-885. (In Russ.)

20. Druzhin D.S., Frolova M.A. Results of the implementation of the personality identification algorithm. Aktual'nyye problemy i puti razvitiya energetiki, tekhniki i tekhnologiy. Sbornik trudov VI Mezhdunarodnoy nauchno-prakticheskoy konferentsii = Actual problems and ways of development of energy, engineering and technology. Proceedings of the VI International Scientific and Practical Conference. 2020: 269-273. (In Russ.)

21. Galushkin A.I. Neyronnyye seti: osnovy teorii = Neural Networks: Foundations of Theory.

Сведения об авторах

Оксана Александровна Козлова

Ведущий специалист отдела научных

мероприятий и защиты интеллектуальной

собственности Управления организации НИР,

Российский экономический университет

им. Г.В. Плеханова,

Москва, Россия

Эл. почта: [email protected]

Алла Александровна Протасова

Старший преподаватель кафедры информационного менеджмента и компьютерных технологий

Университет «Синергия», Москва, Россия Эл. почта: [email protected]

Moscow: Hotline-Telecom; 2012. 496 p. (In Russ.)

22. Zabashta A.YU., Khokhlov S.A., Skorikova S.A Analysis of existing face recognition algorithms. Sovremennaya nauka: aktual'nyye problemy teorii i praktiki. Seriya: Yestestvennyye i tekhnicheskiye nauki = Modern science: actual problems of theory and practice. Series: Natural and technical sciences. 2017; 7-8: 42-45. (In Russ.)

23. Seledets I.Ye., Borunov D.I., Rychkov V.A. Fundamentals of machine learning. Sinergiya nauk = Synergy of Sciences. 2020; 44: 407-414. (In Russ.)

24. Onufriyeva T.A., Sukhova A.S. Application of neural networks in the development of electronic learning resources. Yuzhno-sibirskiy nauchnyy vestnik = South Siberian Scientific Bulletin. 2020; 6(34): 194-197. DOI: 10.25699/k7125-9820-7795-e. (In Russ.)

Information about the authors

Oksana A. Kozlova

Leading Specialist of the Department of Scientific Events and Protection of Intellectual Property of the Office of the Organization of Research and Development

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Plekhanov Russian University of Economics,

Moscow, Russia

E-mail: [email protected]

Alla A. Protasova

Senior Lecturer, Department of Information Management and Computer Technologies Synergy University, Moscow, Russia E-mail: [email protected]

i Надоели баннеры? Вы всегда можете отключить рекламу.