Научная статья на тему 'СОВРЕМЕННЫЙ ПОДХОД К ДИАГНОСТИКЕ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ'

СОВРЕМЕННЫЙ ПОДХОД К ДИАГНОСТИКЕ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ Текст научной статьи по специальности «Техника и технологии»

CC BY
3
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
Диагностика / вычислительные системы / интеллектуальные технологии / предиктивный анализ / мониторинг / тестирование / прогнозирование / Diagnostics / computing systems / intelligent technologies / predictive analysis / monitoring / testing / forecasting

Аннотация научной статьи по технике и технологии, автор научной работы — Кучеренко Александр Алексеевич, Сонина Светлана Дмитриевна, Литвинова Елена Александровна

В работе рассматривается возможность применения интеллектуальных систем для повышения эффективности диагностики вычислительных систем

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по технике и технологии , автор научной работы — Кучеренко Александр Алексеевич, Сонина Светлана Дмитриевна, Литвинова Елена Александровна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MODERN APPROACH TO THE DIAGNOSIS OF COMPUTING SYSTEMS

The work considers the possibility of using intelligent systems to improve the efficiency of computer system diagnostics

Текст научной работы на тему «СОВРЕМЕННЫЙ ПОДХОД К ДИАГНОСТИКЕ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ»

УДК 004

Кучеренко А.А., Сонина С.Д., ЛитвиноваЕ.А.

СОВРЕМЕННЫЙ ПОДХОД К ДИАГНОСТИКЕ ВЫЧИСЛИТЕЛЬНЫХ

СИСТЕМ

Kucherenko A.A., Sonina S.D., Litvinova E.A. MODERN APPROACH TO THE DIAGNOSIS OF COMPUTING SYSTEMS

Введение

Диагностика вычислительных систем играет ключевую роль в обеспечении их надежности,

производительности и устойчивости. С ростом сложности вычислительных архитектур и увеличением объемов обрабатываемых данных возрастают требования к методам диагностики. Современные вычислительные системы включают множество взаимосвязанных компонентов, таких как серверы, сети, базы данных и устройства хранения. В железнодорожной отрасли, где используются автоматизированные

системы управления движением (АСУД), системы сигнализации и мониторинга, сбои в вычислительных системах могут привести к значительным финансовым потерям и угрозам безопасности.

Диагностические системы

традиционно основывались на мониторинге параметров и

тестировании. Однако этих подходов часто недостаточно для своевременного прогнозирования неисправностей и обеспечения проактивного подхода.

Анализ последних исследований и публикаций

Ключевая роль диагностики заключается в своевременном выявлении

и прогнозировании неисправностей в серверных системах, сетевых

устройствах, хранилищах данных и программном обеспечении.

Современные методы диагностики можно разделить на три основные категории: мониторинг, тестирование и предиктивный анализ.

Мониторинг представляет собой процесс непрерывного наблюдения за ключевыми параметрами

вычислительной системы, включая загрузку процессора, объем

используемой памяти, температуру оборудования, сетевую активность и состояние хранилищ данных. Данный метод часто реализуется посредством специализированных инструментов, таких как Zabbix [1], Nagios [2] или Prometheus [3], которые обеспечивают сбор данных в режиме реального времени и предоставляют пользователю визуализацию состояния системы.

Основными преимуществами

мониторинга являются его

оперативность, которая позволяет выявлять аномалии в реальном времени, удобство интеграции с существующими системами, а также простота настройки, что делает данный подход доступным для большинства стандартных вычислительных архитектур. Однако, мониторинг носит реактивный характер, фиксируя проблемы только после их возникновения, и обладает ограниченной способностью к прогнозированию, что

снижает его эффективность для предотвращения сбоев. Кроме того, сбор и обработка значительных объемов данных могут увеличивать нагрузку на систему и негативно влиять на её производительность.

Тестирование представляет собой процесс выполнения заранее

определённых сценариев, направленных на оценку работоспособности системы в различных условиях эксплуатации. Оно может проводиться в нескольких формах, включая функциональное тестирование для проверки соответствия системы заданным требованиям, нагрузочное тестирование для оценки её производительности под высокой нагрузкой, интеграционное тестирование для проверки взаимодействия между компонентами, а также регрессионное тестирование для выявления возможных нарушений функциональности после внесения изменений.

Основными преимуществами

тестирования являются его высокая точность, которая позволяет детально анализировать поведение системы, и возможность предотвращения сбоев путём выявления потенциальных проблем ещё до развертывания системы в рабочей среде. Также тестирование обладает универсальностью, что делает его применимым как для проверки аппаратного обеспечения, так и программных компонентов.

Тем не менее, тестирование требует значительных временных и ресурсных затрат, что особенно ощутимо в случае сложных систем. Кроме того, тестовые сценарии не могут охватить все возможные ситуации, что приводит к неполноте проверки. Ещё одним ограничением является статичность процесса, так как тестирование проводится в условиях, заранее заданных разработчиком, что

снижает его адаптивность к изменяющимся обстоятельствам.

Предиктивный анализ представляет собой подход, основанный на использовании исторических данных и алгоритмов машинного обучения для прогнозирования потенциальных

неисправностей и оценки оставшегося срока службы компонентов системы. Этот метод позволяет выявлять скрытые закономерности и зависимости в данных, которые могут указывать на вероятность возникновения сбоев или снижение производительности системы в будущем.

Одним из ключевых преимуществ предиктивного анализа является его способность заблаговременно

обнаруживать потенциальные проблемы, что позволяет организациям принимать проактивные меры по их устранению. Кроме того, применение этого подхода способствует оптимизации процессов обслуживания, снижая связанные с ними затраты за счёт предотвращения незапланированных простоев. Ещё одним значимым достоинством предиктивного анализа является его интеллектуальная природа: модели машинного обучения способны адаптироваться к изменениям в поведении системы, улучшая точность прогнозов.

Однако для успешного применения предиктивного анализа необходимы большие объемы качественных данных, которые могут быть труднодоступными или дорогостоящими для сбора и хранения. Кроме того, разработка и настройка алгоритмов требуют специализированных знаний в области машинного обучения и анализа данных, что усложняет внедрение предиктивного подхода. Ещё одним фактором, ограничивающим его использование, является высокая стоимость, связанная с необходимостью применения сложных

алгоритмов и создания соответствующей инфраструктуры.

Однако вышеизложенные подходы не всегда эффективны для прогнозирования сбоев. Современные подходы используют машинное обучение, например классификацию или кластеризацию, для анализа данных и выявления аномалий. Работа [4] демонстрирует успешное применение автоэнкодеров для выявления аномалий в работе серверов, а в [5] используется ансамблевый подход, который сочетает предиктивную аналитику и методы классического машинного обучения. Эти исследования подчеркивают, что интеграция интеллектуальных систем в диагностику позволяет не только прогнозировать сбои, но и минимизировать их влияние.

Цель работы

Целью работы является анализ современных подходов к диагностике вычислительных систем и обоснование применения подхода с использованием интеллектуальных технологий, который позволяет прогнозировать

неисправности и минимизировать их влияние на работу вычислительных систем.

Основная часть

Интеллектуальные системы

диагностики, основанные на машинном обучении и анализе больших данных, становятся все более востребованными. Они позволяют выявлять сложные

зависимости между параметрами системы, которые трудно обнаружить традиционными методами.

Вычислительная система

представлена набором метрик, характеризующих её текущее состояние. Эти метрики включают такие параметры, как загрузка процессора (CPU), использование памяти, температура оборудования, активность сети и состояние хранилищ. Для анализа состояния системы используется вектор метрик X = {х, х2 ,K хи}, где х. -

значение i-й метрики.

Для прогнозирования вероятности сбоя используется логистическая регрессия, представленная формулой (1):

P( failure | X) - a(W ■ X + b)

(1)

где X - вектор метрик системы (входные данные);

Ж - весовые коэффициенты, обученные на данных;

а(х) = ■

1

сигмоидная

1 + х функция активации;

Ь - смещение.

Формула ограничивает

результат предсказания в диапазоне [0,1], интерпретируемом как вероятность сбоя.

Для обучения модели

используются исторические данные: метрики системы X и информация о произошедших сбоях у , где у е {0,1} (0

- отсутствие сбоя, 1 - наличие сбоя).

Функция ошибки примет следующее выражение

■ m

L = - £ [yt log (P(faiIure \Xt)) + (1 - y ) log (1 - P(faiIure | Xt))],

m t=i

(2):

где m - количество наблюдений;

P( faiIure | X ) - вероятность сбоя для

i-го наблюдения.

Оптимизация функции ошибки производится с использованием методов градиентного спуска. В качестве Метода оптимизации применяется

стохастический градиентный спуск с шагом обучения 7 = 0,01.

На рис. 1 представлены этапы работы системы диагностики и их последовательность.

Предобработ- —► Обучение —► Прогнози- —► Действия

ка данных модели рование

Рис. 1. Этапы диагностики

Процесс диагностики

вычислительных систем начинается с этапа сбора данных, где метрики системы фиксируются в реальном времени с использованием инструментов мониторинга. Затем осуществляется предобработка данных, включающая их приведение к единому формату посредством нормализации, а также удаление аномальных значений, которые могут искажать результаты анализа. На следующем этапе производится обучение модели, для чего используется архитектура LSTM, способная эффективно выявлять закономерности во временных рядах метрик. После обучения модель выполняет

прогнозирование, оценивая вероятность возникновения сбоев на основе совокупности текущих и исторических данных. Завершающим этапом является анализ результатов, в ходе которого генерируются предупреждения о возможных сбоях и рекомендации по их предотвращению или устранению.

На основе тестовой выборки была проведена оценка качества работы модели логистической регрессии, которая показала высокие результаты. Точность модели составила 92%, что свидетельствует о высокой доле правильно классифицированных

случаев. Полнота, равная 88%,

демонстрирует способность модели эффективно выявлять сбои в вычислительных системах. Значение F1-меры, равное 90%, подтверждает оптимальный баланс между точностью и полнотой, что делает модель пригодной для задач диагностики.

В рамках сравнительного анализа также были рассмотрены

альтернативные подходы. Случайный классификатор (Baseline)

продемонстрировал точность на уровне 50%, что соответствует минимальному уровню точности при случайных прогнозах. Метод опорных векторов (SVM) показал результат 91%, сопоставимый с логистической регрессией.

Таким образом, логистическая регрессия продемонстрировала не только высокие показатели качества, но и превосходство в вычислительной эффективности, что делает её предпочтительным выбором для реализации системы диагностики вычислительных систем.

Выводы

Анализ существующих методов диагностики вычислительных систем показал, что традиционные подходы, такие как мониторинг и тестирование,

остаются полезными, но имеют существенные ограничения в условиях высокой сложности современных систем. Применение интеллектуальных технологий позволяет значительно повысить точность диагностики, предсказание сбоев и автоматизацию управления вычислительными

ресурсами.

Дальнейшая разработка

Список литературы

1. Zabbix. Мониторинг сети. -URL https://www.zabbix.com/ru/network_ monitoring (дата обращения: 06.12.2024).

2. Платформа основных сервисов Nagios. - URL: https://www.nagios.org/ (дата обращения: 08.12.2024).

3. Prometheus. Расширьте возможности мониторинга и оповещения с помощью ведущего решения с открытым исходным кодом. - URL https://prometheus.io/ (дата обращения: 08.12.2024).

4. Johnson R. Anomaly Detection in Distributed Systems Using Autoencoders / R. Johnson, T. Lee, A. Kumar. // Journal of Machine Learning Applications. - 2021. - DOI 10.1109/SMC42975.2020.9283078.

5. Чернухин А.В. Построение модели предиктивной аналитики неисправностей промышленного оборудования / А.В. Чернухин, Е.А. Богданова, Т.В. Савицкая // Программные продукты и системы. -2024. - Т. 37. - № 2. - С. 254-261. - DOI 10.15827/0236235X. 142.254-261

Аннотации:

В работе рассматривается возможность применения интеллектуальных систем для повышения эффективности диагностики вычислительных систем.

Ключевые слова: Диагностика, вычислительные системы, интеллектуальные

интеллектуальной системы диагностики должна основываться на сборе больших объемов данных, их анализе с использованием методов машинного обучения и интеграции с существующими инструментами

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

мониторинга. Это обеспечит переход от реактивного подхода к проактивному управлению вычислительными

системами.

References

1. Zabbix. Network monitoring. -URL https://www.zabbix.com/ru/network_ monitoring (date of access: 06.12.2024).

2. Nagios Core Services Platform: - URL: https://www.nagios.org/ (date of access: 08.12.2024).

3. Prometheus. Expand monitoring and notification capabilities with a leading open source solution. - URL https ://prometheus. io/(date of access: 08.12.2024).

4. Johnson R. Anomaly Detection in Distributed Systems Using Autoencoders / R. Johnson, T. Lee, A. Kumar. // Journal of Machine Learning Applications. - 2021. -D0I:10.1109/SMC42975.2020.9283078.

5. Chernukhin A.V. Building a model of predictive analytics of industrial equipment failures / A.V. Chernukhin, E.A. Bogdanova, T.V. Savitskaya // Software products and systems. - 2024. -Vol. 37. - № 2. - Pp. 254-261. - DOI 10.15827/0236235X.142.254-261

технологии, предиктивный анализ, мониторинг, тестирование, прогнозирование.

The work considers the possibility of using intelligent systems to improve the efficiency of computer system diagnostics.

Keywords: Diagnostics, computing systems,

intelligent technologies, predictive analysis, Сведения об авторах

Кучеренко Александр Алексеевич

Федеральное государственное

бюджетное образовательное учреждение высшего образования «Донецкий институт железнодорожного

транспорта» (ДОНИЖТ), кафедра «Автоматика, телемеханика, связь и вычислительная техника», кандидат технических наук, доцент, e-mail: kaa- [email protected]

Сонина Светлана Дмитриевна

Федеральное государственное

бюджетное образовательное учреждение высшего образования «Донецкий институт железнодорожного

транспорта» (ДОНИЖТ), кафедра «Автоматика, телемеханика, связь и вычислительная техника», старший преподаватель, e-mail: [email protected]

Литвинова Елена Александровна

Федеральное государственное

бюджетное образовательное учреждение высшего образования «Донецкий институт железнодорожного

транспорта» (ДОНИЖТ), кафедра «Автоматика, телемеханика, связь и вычислительная техника», старший преподаватель, магистр, e-mail: ea30911@,yandex. com

monitoring, testing, forecasting.

Information about the authors

Kucherenko Alexander Alekseevich

Federal State-Funded Educational Institution of Higher Education "Donetsk Railway Transport Institute" (DRTI), Department 'Automation, Telemechanics, Communications and Computer Engineering',

Candidate of Technical Science, Associate Professor,

e-mail: kaa- [email protected]

Sonina Svetlana Dmitrievna

Federal State-Funded Educational Institution of Higher Education "Donetsk Railway Transport Institute" (DRTI), Department 'Automation, Telemechanics, Communications and Computer Engineering', Senior lecturer,

e-mail:[email protected]

Litvinova Elena Alexandrovna

Federal State-Funded Educational Institution of Higher Education "Donetsk Railway Transport Institute" (DRTI), Department 'Automation, Telemechanics, Communications and Computer Engineering',

Senior lecturer, Master's degree, e-mail: ea30911@,yandex. com

i Надоели баннеры? Вы всегда можете отключить рекламу.