УДК 004.75
UDC 004.75
РАЗРАБОТКА МОДЕЛИ ВЫБОРА ОБОРУДОВАНИЯ ДЛЯ ПОСТРОЕНИЯ ОПТИМАЛЬНОГО ТЕХНИЧЕСКОГО ПРЕДЛОЖЕНИЯ СИСТЕМ КОНСОЛИДИРОВАННОЙ ОБРАБОТКИ ДАННЫХ
Курлыкин Антон Сергеевич аспирант
Хализев Вячеслав Николаевич к.т.н., профессор
Институт информационных технологий и информационной безопасности, Кубанский государственный технологический университет, Краснодар, Россия
В данной статье рассматривается постановка задачи определения, оптимальной спецификации оборудования для подготовки технического предложения на поставку оборудования системы консолидированной обработки данных на основе задачи о минимальном покрытии множества
Ключевые слова: ИНТЕГРАЦИОННАЯ ПЛАТФОРМА, ИНТЕГРАЦИЯ В ОБЛАКЕ, СИСТЕМЫ ОБРАБОТКИ ДАННЫХ, КОНСОЛИДАЦИЯ РЕСУРСОВ, ПРОЕКТИРОВАНИЕ, ТЕХНИЧЕСКОЕ ПРЕДЛОЖЕНИЕ
SUITABLE HARDWARE OPTIMIZATION MODEL DEVELOPMENT FOR TECHNICAL OFFER PREPARATION IN A DATACENTER DESIGN
Kurlykin Anton Sergeevich postgraduate student
Halizev Vyacheslav Nikolaevich Cand.Tech.Sci., professor
Institute of information technologies and information security, Kuban state Technological University, Krasnodar, Russian Federation
The problem of preparing most suitable optimal technical offer for datacenter systems hardware supply using set cover problem method is considered in this article
Keywords: INTEGRATING PLATFORM, CLOUD INTEGRATION, DATACENTER, RESOURCE CONSOLIDATION, DESIGN, TECHNICAL OFFER
В настоящее время информатизация органов государственной власти, среднего и крупного бизнеса в России происходит крайне активными темпами. Принятие законодательных актов, разработка концепций развития ведомств и целевых программ финансирования приводит к необходимости внедрения различных информационных систем и их интеграции в единое информационное пространство. Задача внедрения новой информационной системы или модификации имеющейся приводит к необходимости допоставки программно-аппаратных комплексов информатизации в ведомственные подразделения.
Привлечение подрядчиков, исполняющих работы по поставке оборудования, внедрении информационных систем, по факту осуществляется на конкурсной основе. В связи с этим, системный интегратор, получивший право участия в проекте информатизации, не
может располагать полноценной и достоверной информацией о составе, структуре и состоянии ИТ-инфраструктуры объектов информатизации. Краткие и жестко лимитированные сроки подачи технико-коммерческого предложения для заключения конкурса вынуждают системных интеграторов предлагать решения, не соответствующие фактическим требованиям, либо в кратчайшие сроки проводить обследование ИТ-инфраструктуры заказчика.
Как показывает практика, проводимые обследования не могут обеспечить полноту и комплексность полученных сведений, что затрудняет проектирование, способствует подаче неверного техникокоммерческого предложения, и не обеспечивает разработку оптимального решения. Кроме того, результаты сбора исходных данных не могут нести исчерпывающей информации для принятия обоснованного однозначного решения по составу поставляемых средств информатизации.
В связи с данными факторами системный интегратор не может решить задачу разработки оптимального состава средств информатизации, предлагаемых к внедрению, выгодных ему для поставки, в установленные временные сроки, с уверенностью их успешного согласования представителем заказчика.
Стоит отметить, что в современных крупных проектах информатизации государственных ведомств последние 2 года активно прослеживается тенденция миграции существующей ИТ-инфраструктуры на системы виртуализации и консолидированной обработки данных. Данные системы имеют преимущества повышенной отказоустойчивости, гибкости в выделении вычислительных, емкостных и сетевых ресурсов, снижают зависимость информационных систем от выделения ресурсов средств вычислительной техники. Будет правильно предположить, что такая тенденция будет сохраняться и дальше.
Опыт работы показывает, что в настоящее время российскими системными интеграторами не выработаны какие-либо подходы к проектированию систем консолидации вычислительных ресурсов ведущих производителей. Существуют средства подготовки спецификаций и утилиты сайзинга - упрощенных средств расчета поставляемого оборудования для миграции заданного набора серверов на виртуальную инфраструктуру. Существующие на рынке средства поддержки принятия решения в этой области доступны только авторизованным партнерам, имеют закрытую логику работы и требуют продолжительного автоматизированного обследования ИТ-инфраструктуры, следовательно, в данной ситуации не могут быть применимы.
Резко возросший объем работы в данной области и анализ описанных проблем говорит о том, что предметная область проектирования систем консолидации вычислительных ресурсов требует системного исследования.
В настоящее время не видится решения данных проблем никаким образом, кроме как разработкой научно-методического аппарата поддержки принятия решения лицом, выполняющим обследование для выработки совместных решений с представителем заказчика в ходе обследования, и их формального согласования.
Разработка научного аппарата предполагает решение следующих задач:
- исследование существующих подходов к постановке задач, используемых в фирменных программных комплексах поддержки принятия решений при проектировании ИТ-инфраструктуры, а также инструментах сайзинга производителей оборудования и формулирование набора исходных данных для разрабатываемой математической модели;
- определение входных и выходных массивов данных, подлежащих обработке с целью оптимизации в разрабатываемой математической модели, определение математических методов, наилучшим образом подходящих для их применения в данной задаче;
- постановка задач оптимизации и сведение к задачам линейного программирования или дискретных задач размещения, вывод целевой функции и критериев ограничения.
Традиционными методами расчета спецификации оборудования внедряемой системы консолидированной обработки данных, является использование программ сайзинга от производителей. Данные системы позволяют оценить нагрузку на поставляемое оборудование, рассчитать необходимое количество компонентов системы, определить цену внедряемого решения, помочь сформировать технико-коммерческое предложение. Однако, данное программное обеспечение не несет в себе инструментов поддержки принятия решения, в нем отсутствует поддержка методов системного анализа и автоматизация принятия решений, функционал слишком примитивен. В связи с этим представлять научный интерес данные программные продукты в настоящее время не могут.
Наиболее сложным методом проектирования внедрений систем консолидированной обработки данных является система поддержки принятия решений от ведущего разработчика систем виртуализации -VMWare. Программа называется VMWare Capacity Planner, представляет собой веб-приложение, расположенное по адресу
https://optimize.vmware.com/, доступное авторизованным партнерам, и позволяет решить наиболее широкий спектр задач по данной теме. Ввиду закрытости исходного кода системы, отсутствия детальной документации, недоступности представителям ведомств, данный программный продукт целесообразно использовать лишь для детальной подготовки технических проектов. Однако, в данной статье приведена математическая модель, для
решения задач которой можно использовать данные отчетов VMWare Capacity Planner.
До настоящего времени в России научные исследования в области проектирования систем консолидированной обработки данных производились в области исследования гипервизоров и формирования предложений по модификации программного механизма. Однако в связи с тем, что на данный использование методов системного анализа для решения задачи проектирования данных систем, широко не известно, можно рассчитывать на научную новизну данной задачи.
В данной работе рассматривается совместная работа двух лиц, принимающих решение - представителя заказчика и представителя поставщика. Представитель поставщика считается экспертом в области состава предлагаемого оборудования, его характеристик, сроков поставки, гарантийных условий, представитель заказчика - в области информационных систем, требующих миграции на внедряемую инфраструктуру консолидированной обработки данных, распределения нагрузки на ИТ-инфраструктуру по времени, критериев оптимизации. Между лицами, принимающими решение, на этапе обследования отсутствует конфликт интересов.
Специфика центров консолидированной обработки данных, предполагающая их построение по модульной наращиваемой структуре, предоставляет нам возможность избежать применения графовых моделей, характеризующих взаимосвязь компонентов системы. Данное допущение позволяет избавиться от громоздких схем структурных зависимостей, использовать в расчетах лишь количественные утилизационные характеристики, что значительно упрощает расчеты в целях поддержки принятия решений.
Предлагается классифицировать архитектурные компоненты решения консолидированной обработки данных, как компоненты, обрабатывающие
нагрузку, так и вспомогательные компоненты, обеспечивающие работу компонентов обработки нагрузки в едином конструктивном решении. Взаимосвязь данных компонентов следует рассматривать как иерархическую структуру.
В данной статье рассматривается постановка задачи определения лицом, принимающим решение, оптимальной спецификации оборудования для подготовки технического предложения на участие в открытом конкурсе на право заключения контракта на поставку оборудования системы консолидированной обработки данных. Данная задача может быть сформулирована как задача о наименьшем покрытии (ЗНП) множества следующим образом.
Пусть у лица, принимающего решение, заранее определено множество аппаратных решений:
Каждое аппаратное решение скомпоновано экспертным методом из аппаратных компонентов трех уровней, представляющих собой иерархическую структуру:
- уровень 1: оборудование конструктивного уровня (серверные шкафы, серверные шасси, дисковые полки);
- уровень 2: оборудование вычислительного уровня (блейд-серверы, дисковые массивы, коммутаторы);
- уровень 3: оборудование нагрузочного уровня (процессоры,
оперативная память, жесткие диски, трансиверы и т. д.).
Каждому аппаратному решению Б поставлен в соответствие набор характеристик:
(1)
где
Мр— характеристика решения по цене;
і fi — характеристика решения по срокам поставки;
Нр— характеристика решения по срокам гарантии; і /£| — характеристика решения по качеству.
Характеристику решения по качеству необходимо представить в прямой линейной зависимости от совокупности нагрузочных характеристик. Для этого представим, что лицо, принимающее решение, также владеет результатами обследования перечня информационных систем, подлежащих миграции на инфраструктуру виртуализации, выраженными в виде функции временного распределения нагрузочных характеристик на оборудование 3 уровня. В целях упрощения расчетов предлагается рассмотреть только те нагрузочные характеристики, в отношении которых возможно построить линейную зависимость от количества компонентов оборудования (например, GTs, GB RAM, IOPS). Определим функцию временного распределения нагрузки как:
где L - значение нагрузочной характеристики.
Принимая во внимание возможность динамического выделения требуемых ресурсов для приложения, определяемую предметной спецификой данных систем, определим нижнюю границу требуемых нагрузочных характеристик, как:
if СО = /со,
(3)
(4)
Интервал между минимумом и максимумом представим в виде процентной шкалы качества решения, значение которого будет показателем Hq.
Определим набор требований к каждому аппаратному решению в виде множества:
(6)
где
Rp -требование к максимальной цене решения;
Rq -требование к минимальному качеству решения;
Rg - требование к минимальной гарантии на решение;
Rt - требование к максимальным срокам поставки решения.
Каждый Sj ассоциируем с подмножеством Rj ^Я, где jeN={1,..,n}, при этом Sj либо не удовлетворяет требованиям из Rj, либо выполняет функцию из ^.
Совокупность {я,}, j е J, J^N называется покрытием множества R, если и я, = R, j е J
Задача выбора составляющих системы по критерию максимума ее эффективности теоретически справедлива, но практически неразрешима из-за существенной нелинейности входящих в нее составляющих элементов. Как правило, набор требований (показателей качества) составляющий функциональность каждого объекта внутренне противоречив, по одному показателю предпочтение нужно отдать первому из двух элементов, по другому - наоборот, второму. Это и делает в целом задачу немонотонной, кусочно-непрерывной, а множество целевых значений задач комбинаторной оптимизации не является выпуклым.
Приведем соответствующую модель целочисленного линейного программирования (ЦЛП). Введем переменные:
1, если А'; е К . 0, иначе
(7)
Определим матрицу:
1, если > К;
0, если < К;
(8)
Для более точного учета противоречивости предпочтений выбора объектов из Б, также введем матрицу натуральных чисел В:
Определим матрицу:
Если объекты имеют конкретные числовые характеристики, отражающие их качественные параметры по реализации функции (требования), то их можно взять в качестве величин матрицы (9) ,проведя стандартную процедуру нормализации. Если таковых характеристик нет, то следует провести экспертную оценку каким либо из известных методов [6] и получить числовую характеристику качественных параметров решения каждым объектом у задачи гі.
Пусть величины Ь определяются экспертным путем, например по методу Саати, методом парных сравнений и нормализации по каждому требованию гі.
Тогда задача выбора оптимальной структуры системы из составляющих ее объектов (1) для реализации заданных функций (требований) (6) по критерию максимума качества решения задачи гі как задача ЦЛП принимает вид:
= {
-^,если/^ > К] ,0, если Я; < К}
(9)
П
-
Ґ1
(10)
; і
при условиях:
(11)
Требования из Я, согласно критериям оценки технического предложения, имеют разные весовые коэффициенты,
Введем вектор
а = {а1} а2...ат\ (д1 + а2 + - + ат) = 1
(12)
Следовательно, целевая функция (10) приобретет вид:
(13)
Причем значения вектора а могут быть определены разными способами для разных элементов - методом парных сравнений и нормализации по Саати для экспертных нечетких показателей и методом взвешенных разностей всех пар из г - для технических параметров.
Таким образом, при равных условиях:
(14)
критерий отдаст предпочтение Бк, что и требовалось.
В [7 ] показано, что решение ЗНП методом ЦЛП в общем случае не является выпуклой в пространстве Хт, поэтому неправомерно решать задачу методом линейной свертки выбора оптимальной структуры системы из множества составляющих ее объектов (1), для реализации заданных функций (требований) (6) по критерию максимума качества решения всех задач Я, как задачу ЦЛП вида:
при условиях (11). http://ej.kubagro.ru/2013/01/pdf/28.pdf
При этом фактически, введением матрицы В, мы изменили задачу (10) на задачу многокритериальной дискретной оптимизации (МДО) с критериями вида (5) для каждой функции из Я.
Один из наиболее распространенных подходов к решению многокритериальных задач оптимизации связан с понятием оптимальности по В. Парето и использованием приемов снижения критериальности задачи
- скаляризации, сведение к однокритериальной задаче различными методами: взвешенной суммы, функции скаляризации Чебышева, методом изменения ограничений.
При этом в работе [6] предложен метод решения задач МДО путем использования нелинейной свертки, чувствительной к упорядочению важности критериев не экспертным путем, а строгим вычислительным алгоритмом, например ЦЛП, применением метода изменения ограничений.
Таким образом, задачу МДО удается свести к итерационному алгоритму А1 следующего вида:
Шаг 1: Решить т раз задачу ЦЛП вида (13) при условиях (11), а также:
(16)
Шаг 2: Определить вектор X*, при котором
■' (17)
Шаг 3: Вычислить значение точки [ВтП, С*] по формуле (9), С*= С*+А; Если С* > Стах, то стоп, иначе перейти на шаг 1.
Этот алгоритм решает задачу МДО методом линейной свертки (анализа иерархий) Саати, скорректированный нелинейной сверткой. В [6,7] доказано, что так получается парето-оптимальное решение «разумного» многокритериального выбора.
Путем последовательных итераций методом уступок меняя по очереди параметры С и В, предложено строить парето-оптимальный фронт, из которого ЛПР уже может выбрать решение пользуясь экспертными знаниями.
Практическая реализация алгоритмов А1, (1), (15) показала
практическую возможность решения задач размерностью 100х50 с приемлемой точностью.
Литература
1. Я. Е. Львович, Г. Д. Чернышева, И. Л. Каширина, Воронежский государственный
технический университет, Воронежский государственный университет-
Оптимизация проектных решений в САПР на основе эквивалентных преобразований задачи о минимальном покрытии. Эл № ФС 77 - 30569. Государственная регистрация №0421100025 ЦКЬ:
2. Алексеев О. Г. Комплексное применение методов дискретной оптимизации. М: Наука, 1987. 279 с.
3. Кузюрин Н. Н. Задача линейного булева программирования и некоторые комбинаторные проблемы // Компьютер и задачи выбора. М: Наука, 1989. С. 44— 60.
4. Львович Я. Е., Каплинский А. И., Чернышева Г. Д., Черных О. И. Конструирование адаптивных схем перебора для решения дискретных задач оптимизации // Актуальные проблемы фундаментальных наук. М.: Изд-во МГТУ, 1991. С. 44—46.
5. Нгуен Минь Ханг. Применение генетического алгоритма для задачи нахождения покрытия множества. Вычислительный центр им. А. А. Дородницына РАН, Москва. Динамика неоднородных систем, 2008.
6. Ногин В. Д. Границы применимости распространенных методов скаляризации при решении задач многокритериального выбора// Методы возмущений в гомологической алгебре и динамика систем: Межвуз. сб. науч. тр. Саранск: Изд-во Мордов. ун-та, 2004, С. 59-68.
7. Ногин В.Д., Басков О.В. Сужение множества Парето на основе учёта произвольного конечного набора числовой информации об отношении предпочтения // Доклады АН, 2011, т. 438, № 4, С. 1-4.