«C@yL@qyiym-J©yrMaL»#9îl3),2@19 / TECHNICAL science
11
TECHNICAL SCIENCE
Акимов Александр Олегович
студент магистратуры кафедры «Компьютерные системы и сети» факультета «Информатика и системы управления» Московский государственный технический университет им. Н. Э. Баумана
г. Москва, Россия Жаров Александр Николаевич, студент магистратуры кафедры «Компьютерные системы и сети» факультета «Информатика и системы управления» Московский государственный технический университет им. Н. Э. Баумана
г. Москва, Россия DOI: 10.24411/2520-6990-2019-10214 МОДЕЛИРОВАНИЕ НАДЁЖНОСТИ РАСПРЕДЕЛЕННЫХ СИСТЕМ ХРАНЕНИЯ ДАННЫХ
Akimov Alexander Olegovich
master student of the department "Computer systems and networks» faculty "Informatics and control systems» The Bauman Moscow State Technical University
Moscow, Russia
Zharov Alexander Nikolaevich, master student of the department "Computer systems and networks» faculty "Informatics and control systems» The Bauman Moscow State Technical University
Moscow, Russia
MODELING THE RELIABILITY OF DISTRIBUTED DATA STORAGE SYSTEMS
Аннотация.
Настоящая статья посвящена исследованию необходимости моделирования процессов, которые реализуются в ходе работы распределенных системах хранения данных. Определена существенная тенденция увеличения объемов генерируемой и требующей хранения информации. Изучены основные негативные факторы, влияние которых приводит к выходу из строя накопителей информации. Рассмотрены ключевые параметры надежности распределенных систем хранения данных.
Abstract.
This article is devoted to the study of the need for modeling processes that are implemented during the work of distributed data storage systems. The essential tendency of increasing the volumes of the generated and requiring storage of information is determined. The main negative factors, the influence of which leads to the failure of data storage devices, are studied. The key parameters of reliability of distributed storage systems are considered.
Keywords: distributed data storage systems, system modeling, reliability, failure of system elements.
Ключевые слова: распределенные системы хранения данных, моделирование систем, надежность работы, отказ элементов системы.
Трансформации и преобразования во всех сферах жизнедеятельности общества, происходящие в настоящее время обусловлены влиянием процессов глобализации, его информационной открытости, а также постоянного внедрения информационных технологий. Одной из тенденций современного общества XXI века является существенный рост различного рода информации.
Она представлена обширным спектром типов данных, которые берут начало с классических баз данных с определенной структурой и заканчиваются изображениями, текстами и визуализацией, трансформированной на выбранном языке. Объемы и размеры, накопленной информации исчисляются эксабайтами и зеттабайтами, количество ее источников стремится к бесконечному множеству, типы данных разнообразны, настолько, что необходимо
использование дополнительных способов ее обработки, записи и хранения [5].
Актуальность и злободневность вопросов, связанных с работоспособностью предприятий и целых отраслей в информационный век, а также защита конфиденциальной информации, предопределяют значимость и важность надежной работы распределенных систем хранения данных. В настоящее время вышеуказанное однозначно показывает тенденцию интенсивного роста объемов данных, требующих долгосрочного хранения. Объем глобальной сферы данных измеряется исходя из объема создаваемых и воспроизводимых за год данных, а также вновь сгенерированных. По прогнозам в рамках проведенного исследования «The Digitization of the World. From Edge to Core» организацией IDC в 2025 году объем глобальной сферы данных увеличится до 175 ЗеттаБайт, что является
12
TECHNICAL SCIENCE / <<ШУШМиМ~^©У©Ма1>#9(113)),2Ш9
более чем пятикратным ростом по сравнению с 33 ЗеттаБайт в 2018 году [1].
Стоит отметить, что речь идет о задействовании ресурсов хранения, среди которых дисковые массивы, ленточные накопители, облачные хранилища и библиотеки с интерфейсом Fibre Channel. Большинство своих возможностей ресурсы хранения могут поддерживать в случае, если они включены в инфраструктуру SAN.
Коммутаторы Fibre Channel, концентраторы и маршрутизаторы - это те устройства, при помощи которых реализуется вышеуказанная инфраструктура SAN. Концентраторы применяются в целях объединения устройств, выполняющих работу в режиме Fibre Channel Arbitrated Loop. Использование концентраторов дает возможность подключать/отключать устройства в режиме без остановки работы системы, так как он автоматически сводит остальные в единую «петлю» при выходе из нее устройства и расширяет «петлю» при подключении нового устройства. Любое из вышеописанных изменений размера «петли» сопровождается крайне сложным процессом ее инициализации, который в свою очередь, многоступенчатый, и до момента его окончания обмен данными не представляется возможным.
Любое крупное образовательное, научное, производственное или сервисное предприятие в век автоматизации и информации сталкивается с проблемой предоставления большого количества ИТ-ресурсов, которые реализованы в цифровом виде при помощи различных платформ. В этой связи для них крайне важным вопросом является организация хранения вышеуказанных ресурсов для представления сервисов. Моделирование и выбор способа верификации - одни из злободневных вопросов.
Хранилища данных огромных объемов состоят из огромного количества накопителей на жёстких магнитных дисках. Степень сохранности и защищенности имеющейся информации в распределенной системе в основном зависит от применяемых жестких дисков, их надежности, а также рабочих характеристик. Обеспечение надёжности хранилища - одна из важнейших прикладных задач, сто-
ящих перед обществом, сложность реализации которой увеличивается по мере добавления новых задействованных накопителей. Одним из наиболее практичных современных решений, которые дают возможность организовывать и выполнять надежное хранение информационных массивов, измеряющихся в эксабайтах, является реализации концепции распределенных систем хранения данных (далее - РСХД).
В целях моделирования надежности необходимо учитывать потенциальные негативные виды воздействий на РСХД и хранимые в них информацию и данные. Основываясь на источнике, а также виде воздействия выделяют:
- непосредственное физическое воздействие на носители;
- несанкционированный доступ, съем с целью дальнейшего распространения полученной информации;
- вывод из строя технических средств, предназначенных для передачи, хранения и обработки информации;
- нарушение режима работы средств и технологий хранения информации;
- вывод из строя и нарушение функционирования и работы систем, которые призваны поддерживать функционирования РСХД.
Каждая из существующих РСХД представляет собой некоторую совокупность распределенных программно-аппаратных компонентов. В качестве таких аппаратных компонентов выступают обособленные серверы, которые объединены локальной вычислительной сетью. При этом самая значимая компонента - это программная составляющая реализации системы. Она же выполняет всю функциональную нагрузку системы. Организация взаимодействия отдельных узлов РСХД основывается на сервис-ориентированную архитектуру [2]. Каждый сетевой сервис включает в себя определенной количество модулей, определяющих как его функциональность, так и функциональное назначение узла РСХД, на котором размещен указанный сетевой сервис.
Рис. 1 Архитектура РСХД
«C@yL@qyiym-J©yrMaL»#9îl3),2@19 / TECHNICAL science
Сравнение потенциальных к применению методик моделирования описано Яковлевым И.П. и Царенко A.B. [4]. В целях моделирования надежности РСХД рассмотрим каким образом себя поведут ключевые показатели надежности РСХД. Остановимся на рассмотрении ключевых параметров, верифицирующих моделирование.
Ключевые показатели надежности могут быть представлены в качестве функции физических характеристик и параметров элементов и скорости их изменения в зависимости от различных факторов.
Изменение вероятности отказа можно выразить через математические параметры элемента, надежности элементов необходимо рассматривать различные свойства материалов (механические, электрические, тепловые и т. д.) и действие различных внешних и внутренних факторов, вызывающих их изменение, надежность оценивается интенсивностью отказов и т.д.
Вероятность безотказной работы (здесь и далее в том числе элемента системы, подсистемы, системы в целом) определяется, как вероятность того, что в пределах заданной наработки отказ объекта не возникнет. Вероятность безотказной работы определяется исходя из гипотезы, что в нулевой момент времени работы объект находился в исправном состоянии, а суммарная наработка объекта выполняется некоторое (t) количество времени. Момент наступления первого отказа работы - случайное событие, а наработка т от начального момента до возникновения этого события - случайная величина. Вероятность безотказной работы P(t) объекта в интервале от 0 до t включительно определяют при помощи функции надежности P (t) = P {т > t}. Здесь Р {т > t} - вероятность события, заключенного в скобки. Очевидно, что эта величина является функцией времени или наработки P(t) [3].
Показатель гамма-процентная наработка до отказа рассчитывается, как наработка, в ходе выполнения которой отказ объекта не возникнет с вероятностью gamma, выраженной в процентах. Средняя наработка до отказа (в том числе при прогоне) рассчитывается, как математическое ожидание наработки объекта до момента наступления первого отказа. Интенсивность отказов рассчитывается, как условная плотность вероятности возникновения отказа объекта, вычисляемая при условии, что до исследуемого момента времени отказа не наступало. Параметр потока отказов рассчитывается, как отношение математического ожидания числа отказов восстанавливаемого объекта за достаточно малую его наработку к значению этой наработки. Гамма-процентный ресурс рассчитывается, как суммарная наработка, в течение которой объект не достигнет предельного состояния с вероятностью у, выраженной в процентах. Средний ресурс рассчитывается,
13_
как математическое ожидание ресурса. Средний срок службы, как математическое ожидание срока службы.
Выбор модели надежности может быть произведен на основании статистического анализа данных о функционировании объектов при испытаниях или в условиях эксплуатации. Возможные варианты моделирования при помощи:
- базовой математической модели;
- аналитических динамических моделей;
- статических моделей;
- эмпирических моделей, которые основываются на анализе накопленной ранее информации о функционировании.
Учитывая вышеизложенную специфику наиболее приемлемыми, будут статические и эмпирические модели.
Подводя итоги, следует отметить, что исследуемый кластер информации о РСХД один из наиболее перспективных областей в сфере организации хранения данных. Аналитика и моделирование надежности имеет ряд технологий и решений, которые уже нашли применение в различных отраслях мировой и отечественной экономики.
Результаты, критерии и конкретные показатели эффективность определяются спецификой деятельности предприятия и задачами, поставленными на этапе планирования моделирования надежности. К свойственным всем предприятиям возможно отнести только сокращение издержек, снижение себестоимости.
Литература
1. David Reinsel, John Gantz, John Rydning / The Digitization of the World. From Edge to Core, An IDC White Paper - #US44413318
2. Ганин Дмитрий Владимирович, Климов Роман Владимирович Особенности моделирования надежности распределенных систем хранения данных // Вестник НГИЭИ. 2017. №7 (74).
3. Иваничкина Л.В., Непорада А.П. / Модель надежности распределенной системы хранения данных в условиях явных и скрытых дисковых сбоев // Труды ИСП РАН, том 27, вып. 6, 2015 г.
4. Яковлев И.П., Царенко A.B., Полесский С.Н. / Выбор модели оценки надежности для программы анализа метода решения транспортных задач // Научно-техническая конференция студентов, аспирантов и преподавателей МИЭМ НИУ ВШЭ «Московский институт электроники и математики Национальный исследовательский университет высшая школа экономики», Москва, Россия, 2016
5. [Электронный ресурс] Gilbert G. / 2017 Big Data and Analytics Forecast // Electronic data. - Washington, DC, 2017. - Mode of access: http://wiki-bon.com/2017-big-data-and-analytics-forecast/