Научная статья на тему 'ИСПОЛЬЗОВАНИЕ МЕТОДОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ ДЛЯ ПРОГНОЗИРОВАНИЯ ТРЕНДОВ'

ИСПОЛЬЗОВАНИЕ МЕТОДОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ ДЛЯ ПРОГНОЗИРОВАНИЯ ТРЕНДОВ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1
1
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
анализ данных / контент-маркетинг / прогнозирование трендов / искусственный интеллект / машинное обучение / интеллектуальный анализ данных / ChatGPT / data analysis / content marketing / trend forecasting / artificial intelligence / machine learning / data mining / ChatGPT

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Сазонова Анна Сергеевна, Кузьменко Александр Анатольевич, Филиппова Людмила Борисовна, Курдин Артем Алексеевич

В данной статье представлен анализ методов интеллектуальной аналитики данных, применяемых для исследования статистики популярных видеохостингов. Рассматриваются статистический анализ, кластеризация, машинное обучение и методы обработки естественного языка. Эти методы позволяют выявлять закономерности в поведении аудитории, прогнозировать популярность контента, оптимизировать стратегии продвижения. В статье показано, как применение передовых технологий искусственного интеллекта открывает новые возможности для глубокого понимания предпочтений зрителей и тенденций на видеохостингах. Разработанная информационно-аналитическая система способна извлекать ценные знания из больших данных для принятия эффективных управленческих решений.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Сазонова Анна Сергеевна, Кузьменко Александр Анатольевич, Филиппова Людмила Борисовна, Курдин Артем Алексеевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MODELS AND METHODS FOR ANALYZING WEATHER CHANGES UNDER THE INFLUENCE OF ENVIRONMENTAL FACTORS

This article presents an analysis of the methods of intelligent data analytics used to study the statistics of popular video hosting sites. Statistical analysis, regression analysis, clustering, machine learning, time series analysis, network anal-ysis and natural language processing methods are considered. These methods allow us to identify patterns in audience be-havior, predict the popularity of content, and optimize promotion strategies. The article shows how the use of advanced arti-ficial intelligence technologies opens up new opportunities for a deep understanding of viewers' preferences and trends on video hosting sites. The developed information and analytical system is able to extract valuable knowledge from big data for making effective management decisions.

Текст научной работы на тему «ИСПОЛЬЗОВАНИЕ МЕТОДОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ ДЛЯ ПРОГНОЗИРОВАНИЯ ТРЕНДОВ»

3. Deng J., Dong W., Socher R., Li L.-J., Li K., & Fei-Fei L. ImageNet: A large-scale hierarchical image database // 2009 IEEE Conference on Computer Vision and Pattern Recognition. 2009. P. 248-255. DOI:10.1109/CVPR.2009.5206848 (дата обращения: 10.05.2024).

4. Прокопеня А.С. Сверточные нейронные сети для обработки речи // 57-я научная конференция аспирантов, магистрантов и студентов учреждения образования "Белорусский государственный университет информатики и радиоэлектроники": тезисы докладов. Минск: БГУИР, 2021. С. 14-15.

5. Day O., Khoshgoftaar T. M. A survey on heterogeneous transfer learning // J Big Data. Florida Atlantic University College of Engineering and Computer Science, Boca Raton, USA. 2017. № 4(1). P. 29. DOI:10.1186/s40537-017-0089-0.

6. Stevens S. S., Volkmann J., Newman E. B. A Scale for the Measurement of the Psychological Magnitude Pitch. 1937. 188 p.

7. Мубаракшина Р.Т. Методы и средства распознавания эмоций по голосу // Неделя науки СПбПУ: материалы научной конференции с международным участием. Санкт-Петербург: ФГАОУ "Санкт-Петербургский политехнический университет Петра Великого". 2019. С. 31-34.

8. Lu Y., Luo L., Huang D., Wang Y., Chen L. Knowledge Transfer in Vision Recognition: A Survey // ACM Comput. Surv. V. 53, № 2. 2020. P. 37.

9. Emotional Crowd Sound [Электронный ресурс]. URL: https://ieee-dataport.org/open-access/emotional-crowd-sound (дата обращения: 10.05.2024).

10. Lech M., Stolar M., Bolia R., Skinner M. Amplitude-Frequency Analysis of Emotional Speech Using Transfer Learning and Classification of Spectrogram Images // Adv. Sci. Technol. Eng. Syst. J. 2018. № 3(4). Pp. 363-371. DOI:10.25046/aj030437.

Рудакова Полина Андреевна, аспирант, swinol. polina1998@gmail. com, Россия, Тула, Тульский государственный университет.

Семенов Тимофей Александрович, студент, semenov. [email protected], Россия, Тула, Тульский государственный университет

EMOTION RECOGNITION IN CROWD SOUNDS THROUGH SPECTROGRAM ANALYSIS BY CONVOLUTIONAL

NEURAL NETWORKS

P.A. Rudakova, T.A. Semenov

The paper proposes a method of emotion recognition in crowd sounds using convolutional neural networks (CNN) and transfer learning. Crowd audio recordings are converted into chalk spectrograms, which are then fed to a pre-trained AlexNet network modified to classify the crowd's emotional states (approval, disapproval, neutrality). The experiments conducted on the Emotional Crowd Sound dataset showed a high emotion recognition accuracy of92.54%. The results confirm the effectiveness of the proposed approach and indicate that it can be applied to analyse mass audio streams in real-world environments. Finally, the prospects of using different spectral scales and extending the method to other datasets are discussed.

Key words: emotion recognition, chalk spectrograms, convolutional neural networks (CNNs), transfer learning, cross-entropy loss function, gradient descent.

Rudakova Polina Andreevna, postgraduate, swinol.polina1998@gmail. com, Russia, Tula, Tula State University,

Semenov Timofey Alexandrovich, student, semenov. timofeisemyonov@yandex. ru, Russia, Tula, Tula State

University

УДК 004.021

DOI: 10.24412/2071-6168-2024-10-316-317

ИСПОЛЬЗОВАНИЕ МЕТОДОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ ДЛЯ ПРОГНОЗИРОВАНИЯ ТРЕНДОВ

А.С. Сазонова, А.А. Кузьменко, Л.Б. Филиппова, А.А. Курдин

В данной статье представлен анализ методов интеллектуальной аналитики данных, применяемых для исследования статистики популярных видеохостингов. Рассматриваются статистический анализ, кластеризация, машинное обучение и методы обработки естественного языка. Эти методы позволяют выявлять закономерности в поведении аудитории, прогнозировать популярность контента, оптимизировать стратегии продвижения. В статье показано, как применение передовых технологий искусственного интеллекта открывает новые возможности для глубокого понимания предпочтений зрителей и тенденций на видеохостингах. Разработанная информационно-аналитическая система способна извлекать ценные знания из больших данных для принятия эффективных управленческих решений.

Ключевые слова: анализ данных, контент-маркетинг, прогнозирование трендов, искусственный интеллект, машинное обучение, интеллектуальный анализ данных, ChatGPT.

Введение. В настоящее время видеохостинги, играют важную роль в распространении информации и развлекательного контента. Огромные объемы данных, генерируемые этими платформами, открывают широкие возможности для их анализа и извлечения ценных знаний. Актуальность разработки специализированных информационно-аналитических систем для исследования статистики видеохостингов обусловлена рядом факторов.

316

Глубокий анализ пользовательской активности позволяет выявлять тренды и предпочтения аудитории, что крайне важно для оптимизации контент-стратегии как отдельных блогеров и каналов, так и крупных медиа-компаний. Мониторинг динамики просмотров, лайков, комментариев дает возможность оперативно реагировать на изменение спроса и предлагать зрителям актуальный контент.

Исследование огромного массива данных о видео позволяет определять факторы вирусности и популярности контента в сети. Выявление закономерностей и корреляций между характеристиками видео и откликом аудитории открывает возможности для создания высокоэффективного вирусного контента.

Системы анализа данных видеохостингов незаменимы для оптимизации рекламных кампаний и контент-маркетинга. Изучение охвата аудитории, ее лояльности, конверсий позволяет наиболее выгодно размещать рекламу и создавать вовлекающий контент для продвижения бренда.

Исследование демографии зрителей, географии просмотров, динамики роста каналов посредством инструментов анализа больших данных может быть полезно аналитикам, маркетологам, социологам для изучения тенденций в интернет-среде[6,7].

Таким образом, создание специализированной информационно-аналитической системы для комплексного исследования статистики видеохостингов является актуальной задачей, имеющей весомую практическую значимость. В данной статье на примере платформ YouTube и Rutube рассматриваются подходы к анализу пользовательской активности, выявлению трендов, определению факторов популярности видео контента в интернете.

Теоретический анализ. В разработанной информационно-аналитической системе для изучения статистики видеохостингов реализовано применение методов статистического анализа данных.

На основе собранных количественных характеристик видео, таких как длительность, количество просмотров, лайков и комментариев, в системе рассчитываются статистические показатели - среднее значение, медиана, дисперсия [1]. Это позволяет получить общую картину распределения метрик видео и выявить общие закономерности.

Среднее значение:

mean_views = — У viewsjisti, пZ-I

где n

■ количество элементов в списке viewslist. Медиана:

N = ■

i=i

views_count +1

где viewscount - количество просмотров. Дисперсия:

variance views

^ п

= — У (vlews_llstl-mean_vlews)2,

nz—i

=1

(1)

(2)

(3)

где n обозначает общее количество элементов в наборе данных, views list представляет собой отдельный элемент в наборе данных просмотров, meanviews обозначает среднее значение (среднюю арифметическую) для набора данных просмотров

Для наглядного представления распределений используются гистограммы[9]. В системе реализован расчёт корреляции Пирсона между различными характеристиками видео.

Yj1i=i(xi -x)(yi — у)

correlation views likes = . , (4)

_ _ Ш!(Xi—x)2_* (Уi—y)2 _

где Xi - элемент из списка views list, yt - элемент из списка likes_list, х - среднее значение списка views_list, у - среднее значение списка likes list, n - количество элементов в списках views_list и likes_list,

Это дает возможность определить наличие статистически значимых взаимосвязей, например, между длительностью видео и количеством просмотров или лайков. Данная взаимосвязь представлена на рисунке 1.

Распределение просмотров Распределение лайков

Количество просмотром

Распределение комментариев

□ 20040 40СЮ О ООООО BD000 100000 17DDD0 140000 lbOOOO

Распределение длительности видео

2 М>0 VJOO уьоо 10000 12S00 isooo Количество к

1000 1SOO 3000 ?ьоо мао ньоо Длительность видео (в секундах)

Рис. 1. Визуальное представление распределения данных

317

Ещё одна реализованная возможность - сравнение усредненных метрик для разных категорий видео представлена на рисунке 2. Это помогает выявлять более и менее популярные тематики контента.

Среднее количество просмотров по категориям

Среднее количество лайков по категориям

1750

£

§■ 1500 i

2 1250

s

0 *

ё 1000 н

| 750 с;

с

<и 500

4J

1 Ч

а. 250

Категория

Среднее количество комментариев по категориям

Категория

Средняя длительность видео по категориям

Категория Категория

Рис. 2. Визуализация усредненных метрик по категориям

Кроме анализа пользовательской активности на видеохостингах, в рамках разработанной информационно-аналитической системы осуществляется также глубокий статистический анализ данных новостных ресурсов за текущее время[5,8]. Пример работы программы: «Исходя из представленных данных, можно сделать вывод, что в данный момент популярностью пользуется информация о химических реакциях и процессах, связанных с использованием водорода в области возобновляемых источников энергии. В частности, интерес вызывают изучение процессов водородной электролиза, а также понимание основ химических реакций.»

Таким образом, использование статистического анализа данных позволяет нашей системе раскрывать общие закономерности и тенденции, полезные для понимания поведения аудитории видеохостингов.

Кластерный анализ - еще один эффективный метод интеллектуальной аналитики, используемый в нашей системе для исследования данных видеохостингов. Одним из ключевых инструментов кластерного анализа является евклидово расстояние, измеряющее схожесть между объектами. Формула евклидова расстояния выглядит следующим образом:

d(x, у) = jjj (Xi-yt)2, (5)

где х и V - векторы признаков объектов, а и - количество признаков. График представлен на рисунке 3.

Метод локтя

Количество кластеров Рис.З. Метод локтя

Важным элементом кластерного анализа является также центр масс кластера, вычисляемый как среднее значение объектов в кластере:

•тЫ

е с?

(6)

где Су - множество объектов в кластере], а |Су| - количество объектов в кластере].

Для оценки качества кластеризации используется функционал J, который представляет собой сумму квадратов отклонений объектов от центра своего кластера (он же метод локтя):

к

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

С;

■и

7=1 *

е С,

множество объектов в кластере ], ^ - центр масс кластера], а ||-||

(7)

норма (в дан-

где K - количество кластеров, ном случае, евклидова норма).

Суть кластерного анализа заключается в разбиении совокупности данных на группы (кластеры) таким образом, чтобы объекты внутри группы были схожи между собой, а объекты из разных групп - различались [2,10].

В контексте анализа видео, кластеризация может применяться для группировки похожих видео по тематике, жанрам, используемым хештегам и другим признакам. Также возможно сегментирование аудитории по возрасту, полу, географии и другим характеристикам. На рисунке 4 видна взаимосвязь количества комментариев от времени выхода видеоролика.

Он позволяет разделять видео и зрителей на сегменты для более точечного таргетирования контента и повышения лояльности аудитории. Это ценный инструмент для принятия маркетинговых и стратегических решений владельцами видеоканалов и рекламодателями.

Кластерный анализ видео

I I 8 • • • •

В 10 12 14 16 18

Время выхода видео в часах

Рис. 4. Кластерный анализ зависимости комментариев от времени выхода

При изучении данных о запросах в поисковых системах по определенной теме в различных странах, применяется группировка стран по сходным характеристикам потребления и создание персонализированного контента для каждого кластера. Также доступна группировка не только по странам, представленная на рисунке 5 но и районам и городам. Данные для анализа берутся из статистических сайтов, а также происходит парсинг из новостных ресурсов.

В добавок к этому на рисунке 6 представлена диаграмма интереса к данным темам за определенный период.

40 -

35 -

30 -25 -

го -

15 -10 -

Кластерный анализ потребления кофе, чая и воды

20 30 40 50

Рис. 5. Кластерный анализ 319

Интерес в течении времени к различным запросам

Рис. 6. Диаграмма интереса за определенный период

Нэ основе предоставленных данных можно сделать следующие выводы и предсказания:

1. Геополитические конфликты;

Тема войны в Израиле и Палестине, а также упоминания о возможней гражданской войне в России, свидетельствуют о высокой заинтересованности людей в геополитических конфликтах. Это может привести к росту интереса к подобным конфликтам е других регионах, таких как Южная Азия. Ближний Восток, Латинская Америка и Африка.

2. Темы мировых войн и фантастических сценариев:

Упоминания о "войне миров" и "войне судного дня4 могут указывать на интерес к фантастическим сценариям и поста пока л иптическим историям. Этот тренд может привести к увеличению популярности книг, фильмов и игр, посвященных подобным темам.

3. Актуальные темы в киноиндустрии:

Упоминания о фильмах "Война и мир" и "Фильм война" указывают на интерес общества к киноиндустрии и желание узнать о новых кино премьерах. Возможно, в ближайшие месяцы мы увидим новые фильмы, основанные на исторических событиях или фантастических сюжетах.

4. Обращение к истории:

Упоминания о Первой н Второй мировых войнах, а также о Великой Отечественной войне и гражданской войне, могут свидетельствовать о возросшем интересе к историческим событиям. Это может привести к увеличению популярности исторических романов, документальных фильмов и образовательных программ о прошлом.

5. Влияние социальных сетей:

Упоминания о темах, связанных с телеграмом и поиском онлайн контента (например, "смотреть онлайн вконтакте"), указывают на значительное влияние социальных сетей на интересы пользователей. Это может означать более высокую популярность онлайн-платформ, таких как стримингоеые сервисы, социальные медиа и мессенджеры.

Исходя из вышеперечисленных данных, можно предположить, что в ближайшие МЕСЯЦЕВ мы увидим УВЕЛИЧЕННЫЙ ИНТЕРЕС к геополитическим событиям, фантастическим сценариям, киноиндустрии, историческим событиям и влиянию социальных сетей на информационную среду.

Рис 7. Прогнозирование результатов

Для анализа тональности комментариев использовалась модель BERT, обученная на

большом корпусе текста на русском языке.

Результат анализа:

- 56% комментариев имеют нейтральную тональность

- 22% комментариев имеют положительную тональность

- 22% комментариев имеют отрицательную тональность

Рис. 8. Анализ комментариев

Текстовый анализ и обработка естественного языка являются важными методами интеллектуальной аналитики данных, применяемыми в нашей системе для исследования новостей и трендов в социальных сетях [3,11].

Цель использования этих методов - выявление скрытых тематик и предсказание будущих популярных направлений на основе анализа неструктурированных текстовых данных из новостей и постов в соцсетях.

Для начала работы пользователю необходимо определится с ключевой темой, по которой будет происходит поиск информации для дальнейшей обработки данных.

Затем выполняется этап предобработки данных, удаляются стоп-слова, приводятся к начальной форме. С помощью алгоритмов машинного обучения извлекаются ключевые слова, определяются скрытые темы, анализируются эмоциональная окраска текстов и упоминания различных объектов [4]. В частности, используется модель: gpt-3.5-turbo. На рисунке 7 прогнозирование результатов по ключевой теме «Война».

Комбинирование этих методов во временном контексте позволяет системе находить набирающие популярность темы и прогнозировать будущие тренды исходя из тональности и динамики обсуждений в новостях и социальных сетях. Это мощный инструмент анализа тенденций.

В системе также успешно применяется анализ комментариев с использованием моделей естественного языка, в частности, таких как BERT. Текстовый анализ и обработка естественного языка представляют собой ключевые методы в интеллектуальной аналитике данных, используемые для исследования новостей и трендов в социальных сетях. На рисунке 8 представлен анализ комментариев.

Заключение. В статье представлен обзор методов интеллектуального анализа данных, применяемых для исследования статистики популярных видеохостингов.

Рассмотренные подходы - статистический анализ, кластеризация, машинное обучение и методы обработки естественного языка, демонстрируют широкие возможности глубокого изучения поведения аудитории видеохостингов и выявления ценных знаний в больших данных.

Применение передовых технологий анализа данных, позволяют выявлять скрытые закономерности в предпочтениях зрителей, прогнозировать вирусность и популярность контента, оптимизировать продвижение каналов и рекламных кампаний.

Разработанная информационно-аналитическая система интеллектуального анализа статистики видеохостингов открывает новые перспективы для принятия эффективных управленческих решений владельцами каналов, маркетологами, социологами. Дальнейшее развитие методов искусственного интеллекта расширит возможности системы для извлечения полезных знаний и прогнозирования тенденций.

Список литературы

1. Статистический анализ. [Электронный ресурс]: URL: https://desktop.arcgis.com/ru/arcmap/latest/analvze/commonlv-used-tools/statistical-analvsis.htm (дата обращения: 10.05.2024).

2. Кластеризация. [Электронный ресурс] URL: https://neerc.ifmo.ru/wiki/index.php?title=%D0%9A%D0%BB%D0%B0%D1%81%D1%82%D0%B5%D1%80%D0%B8% D0%B 7%D0%B0%D 1%86% (дата обращения 10.01.2024).

3. Что такое обработка естественного языка (NLP). [Электронный ресурс]: URL: https://aws.amazon.com/ru/what-is/nlp (дата обращения: 10.01.2024).

4. Изучение и анализ данных с помощью Python. [Электронный ресурс] URL: https://learn.microsoft.com/ru-ru/training/modules/explore-analvze-data-with-pvthon (дата обращения: 10.01.2024).

5. Багдади М.А. Обзор возможностей и сравнение языков программирования pvthon и r в области анализа данных / М.А. Багдади, Б.А. Мархабаев // Инновационные механизмы управления цифровой и региональной экономикой. г. Москва, 2023. С. 282-294.

6. Воробьева А.А. Анализ данных с помощью web scraping pvthon // ФГБОУ ВО «Тамбовский государственный университет им. Г.Р. Державина». Тамбов, 2022. С. 533-544.

7. Автоматизация подготовки управляющих программ для станков с ЧПУ : учебное пособие для вузов / В. И. Аверченков, А. В. Аверченков, А. А. Жолобов [и др.]. Том Часть 1. 2-е издание, стереотипное. Москва: ООО "ФЛИНТА", 2011. 216 с. EDN SDQWMD.

8. Управление данными: лабораторный практикум / А. С. Сазонова, А. А. Кузьменко, Л. Б. Филиппова [и др.]. Москва: ООО «Директ-Медиа», 2022. 60 с. DOI 10.23681/691722. EDN KGRWNR.

9. Аверченков В.И. Оценка точности автоматизированной настройки режущего инструмента при обработке на станках с ЧПУ / В. И. Аверченков, Л. Б. Филиппова // Инженерия поверхности и реновация изделий : Материалы 11-й Международной научно-технической конференции, Ялта, 23-27 мая 2011 года. - Ялта: Ассоциация технологов-машиностроителей Украины, 2011. С. 6-8. EDN VUEOMX.

10. Филиппов Р.А. Применение микроконтроллера arduino mega 2560 для автоматизации работы микроскопа LEICA DM IRM / Р. А. Филиппов, Л. Б. Филиппова, Ю. А. Леонов // Автоматизация и моделирование в проектировании и управлении : сборник научных статей Всероссийской конференции. Брянск: Брянский государственный технический университет, 2021. С. 210-213. EDN YQUZWE.

11. Разработка аналитического инструментария для системы поддержки принятия решений тренера по баскетболу / А. С. Сазонова, Р. А. Чумаков, Ю. А. Леонов, Л. Б. Филиппова // Известия Тульского государственного университета. Технические науки. 2023. № 7. С. 549-553. DOI 10.24412/2071-6168-2023-7-549-550. EDN BKZQOO.

Сазонова Анна Сергеевна, канд. техн. наук, доцент, asazonova@list. ru, Россия, Брянск, Брянский государственный технический университет,

Кузьменко Александр Анатольевич, канд. биол. наук, доцент, [email protected], Россия, Брянск, Брянский государственный технический университет,

Филиппова Людмила Борисовна, канд. техн. наук, доцент, libv88@mail. ru, Россия, Брянск, Брянский государственный технический университет,

Курдин Артем Алексеевич, студент, [email protected], Россия, Брянск, Брянский государственный технический университет

MODELS AND METHODS FOR ANALYZING WEATHER CHANGES UNDER THE INFLUENCE OF ENVIRONMENTAL

FACTORS

A.S. Sazonova, A.A. Kuzmenko, L.B. Filippova, A.A. Kurdin

This article presents an analysis of the methods of intelligent data analytics used to study the statistics ofpopular video hosting sites. Statistical analysis, regression analysis, clustering, machine learning, time series analysis, network analysis and natural language processing methods are considered. These methods allow us to identify patterns in audience behavior, predict the popularity of content, and optimize promotion strategies. The article shows how the use of advanced artificial intelligence technologies opens up new opportunities for a deep understanding of viewers' preferences and trends on video hosting sites. The developed information and analytical system is able to extract valuable knowledge from big data for making effective management decisions.

Key words: data analysis, content marketing, trend forecasting, artificial intelligence, machine learning, data mining, ChatGPT.

Sazonova Anna Sergeevna, candidate of technical sciences, docent, asazonova@list. ru, Russia, Bryansk, Bryansk State Technical University,

Kuzmenko Alexander Anatolyevich, candidate of biological sciences, docent, [email protected]. Russia, Bryansk, Bryansk State Technical University,

Filippova Lyudmila Borisovna, candidate of technical sciences, docent, libv88@mail. ru, Russia, Bryansk, Bryansk State Technical University,

Kurdin Artyom Alekseevich, student, libv88@yandex. ru, Russia, Bryansk, Bryansk State Technical University

УДК 04.056

DOI: 10.24412/2071-6168-2024-10-322-323

ИССЛЕДОВАНИЕ АЛГОРИТМОВ ФОРМИРОВАНИЯ И ПРОВЕРКИ ЭЛЕКТРОННОЙ ПОДПИСИ

НА ОСНОВЕ ЭЛЛИПТИЧЕСКИХ КРИВЫХ

В.С. Павлова

В работе рассмотрены алгоритмы формирования и проверки электронной подписи на основе ГОСТ 34.10-2018, ECDSA(Elliptic Curve Digital Signature А^опЛт)и СТБ 34.101.45-2013 и представлены результаты исследования по применимости алгоритмов в различных условиях реализации. Исследование проводилось с помощью программной реализации алгоритмов на языке программирования Python. Результаты исследования могут быть для применения на различных объектах, подлежащих защите.

Ключевые слова: электронная подпись, эллиптические кривые, схема Шнорра, ГОСТ 34.10-2018, ECDSA, СТБ 34.101.45-2013

С развитием цифровых технологий растёт необходимость в контроле целостности данных, доказательстве их подлинности и защите от подделки. Для удовлетворения данным потребностям в настоящее время в автоматизированных системах применяются алгоритмы проверки с использованием электронной цифровой подписи. Под электронной подписью (ЭП) понимается раздел электронного документа, с помощью которого подтверждается авторство, время подписания документа и его неподдельность. Согласно ГОСТ 34.10-2018, общепризнанная схема генерации электронной подписи состоит из следующих этапов [1]:

1. Генерация ключей (подписи и проверки подписи);

2. Формирование подписи;

3. Проверка подписи.

После подписания сообщения к нему добавляется электронная подпись размером 512 или 1024 бит, и текстовое поле. В текстовом поле могут содержаться метаданные отправителя, в частности, дата и время передачи сообщения. Схематическое представление сообщения, верифицированного с помощью ЭП, показано на рисунке 1:

+

Дополнение

Рис. 1. Схема сообщения, подписанного электронной цифровой подписью

у2 = х3 - 1 у2 = х3 + 1 у2 = х3 - Зх + 3 у2 = х3 — 4-х

у2 = х3 -х

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

t.Q t.i iU Jb XV

4

2

1

-i

-1 5 н 3 —j ! 3 -i i Э

Рис. 2. Эллиптические кривые различных форм

Основным объектом всех рассматриваемых методов является эллиптическая кривая Е, которая задаётся уравнением [1]:

i Надоели баннеры? Вы всегда можете отключить рекламу.