Научная статья на тему 'Функция структурной отказоустойчивости и d-ограниченная компонента связности графа вычислительной системы'

Функция структурной отказоустойчивости и d-ограниченная компонента связности графа вычислительной системы Текст научной статьи по специальности «Математика»

CC BY
675
34
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
СТРУКТУРНАЯ ОТКАЗОУСТОЙЧИВОСТЬ / ВЫЧИСЛИТЕЛЬНАЯ СИСТЕМА / КОМПОНЕНТА СВЯЗНОСТИ

Аннотация научной статьи по математике, автор научной работы — Мелентьев Виктор Александрович

Введено понятие ^/-ограниченной компоненты связности (^/-компоненты связности) графа вычислительной системы (ВС). Исследованы функции отказоустойчивости кольцевой и полносвязной структур ВС, ограничивающие область определения этой функции для структур, промежуточных в отношении их степени.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

FUNCTION OF STRUCTURAL FAULT TOLERANCE AND d-LIMITED CONNECTED COMPONENT OF CS GRAPH

The concept of d-limited connected component in computing system graph is introduced. Fault tolerance functions for computer system of ring and completely connected structures are considered. It is shown that they bound the domain of fault tolerance functions for all other structures

Текст научной работы на тему «Функция структурной отказоустойчивости и d-ограниченная компонента связности графа вычислительной системы»

ПРИКЛАДНАЯ ДИСКРЕТНАЯ МАТЕМАТИКА

2008 Математические основы надежности вычислительных и управляющих систем № 2(2)

УДК 519.17: 681.3

ФУНКЦИЯ СТРУКТУРНОЙ ОТКАЗОУСТОЙЧИВОСТИ И ¿/-ОГРАНИЧЕННАЯ КОМПОНЕНТА СВЯЗНОСТИ ГРАФА ВЫЧИСЛИТЕЛЬНОЙ СИСТЕМЫ1

В.А. Мелентьев

Институт физики полупроводников СО РАН, г. Новосибирск E-mail: [email protected]

Введено понятие d-ограниченной компоненты связности (d-компоненты связности) графа вычислительной системы (ВС). Исследованы функции отказоустойчивости кольцевой и полносвязной структур ВС, ограничивающие область определения этой функции для структур, промежуточных в отношении их степени.

Ключевые слова: структурная отказоустойчивость, вычислительная система, компонента связности.

Известно, что повышение надежности системы основано на принципе предотвращения ее неисправностей посредством использования высоконадежных компонентов со сверхвысокой степенью интеграции, резервирования этих компонентов, поддержания облегченных тепловых и вольт-амперных режимов их работы, а также экранированием от воздействия разрушающих внешних импульсных, геомагнитных и радиационных воздействий, совершенствованием методов профилактического обслуживания и сборки аппаратуры и т.п. Понятно, что традиционное использование экспоненциальной модели в оценках надежности составляющих вычислительную систему элементов могло бы быть оправдано лишь для определения максимального числа /max отказов, ожидаемого от эксплуатации системы в течение всего срока ее службы исключительно в нормативных режимах. Но реальные условия эксплуатации, загруженность системы и качество ее распределения по элементам системы, как показано в работе [1], существенно меняют загруженность системы и ее элементов, а следовательно, надежностные показатели и ожидаемое число исправных из них. Следует учитывать также и то, что наличие минимально необходимого числа исправных элементарных машин (ЭМ) в системе не гарантирует ее работоспособность при утрате требуемых для взаимодействия ЭМ коммуникационных качеств. Отказоустойчивость следует рассматривать как условную вероятность сохранения системой работоспособности на множестве образов ее неисправностей. Как видно из этого определения, свойство отказоустойчивости системы не зависит от показателей надежности составляющих ее элементов и корреспондируется ее архитектурой, нацеленной на сохранение способности выполнения ею в реальном времени и с определенным качеством необходимого минимума функций, достаточного для получения определенного техническими требованиями результата при возникновении любого отказа или их группы в пределах заданной кратности. В работе [2] показано, что отказ от учета функциональной и соответствующей ей структурной составляющих архитектуры системы сводит анализ отказоустойчивости к частному случаю, достоверному лишь для анализа полносвязных систем, где N' = N — /, в которых число N' взаимно достижимых ЭМ и число исправных ЭМ тождественны при любой кратности / < N отказов. Понятно, что в теории больших систем, где условие полной связности практически не реализуемо, подобный подход не является достоверным.

В работе [3] автором введены показатели структурной отказоустойчивости и структурной живучести вычислительной системы, определяющие соответственно долю подмножества р а б о т о с п о с о б н ы х в множестве возможных конфигураций ВС при кратности / отказов и средневзвешенное (на этом множестве) значение определяющего работоспособность показателя качества. Общее число конфигураций системы из N ЭМ при наличии в ней / отказавших ЭМ определяется числом ClN сочетаний в группе из N элементов по /. Конфигурация в данном подходе считается работоспособной, если размер соответствующей ей компоненты связности графа ВС не менее предельного числа n элементарных машин, а ее диаметр не превышает заданного значения d. В представленной работе исследована роль структурной составляющей в формировании у ВС свойства отказоустойчивости.

1. Понятия структурной отказоустойчивости ВС и d-компоненты связности ее графа

Структурную отказоустойчивость системы из N ЭМ определим отношением числа конфигураций, сохраняющих при заданной кратности / отказов требуемое для успешного функционирования системы минимально необходимое число n элементарных машин, соответствующих заданным критериям связанности, к

общему числу CN конфигураций. Минимально необходимое число n элементарных машин обусловлено при

1 Работа выполнена при поддержке Российского фонда фундаментальных исследований (проект 05-08-01301а).

этом их производительностью, числом и трудоемкостью существенных функциональных подсистем, граничными значениями показателей реактивности системы и плотностью вероятности распределения в ней потока задач [1]. В той же работе [1] показано, что значение кратности /шах допускаемых в ВС отказов определяется не только числом N входящих в ее состав ЭМ, но и ожидаемой загрузкой системы, эффективностью алгоритмов выравнивания нагрузки, а также учитывающим неизбежные отклонения реальных условий эксплуатации элементов системы от нормативных запасом устойчивости к отказам. Таким образом, общее число N ЭМ в системе следует определять, исходя из заданного значения п, из предельного значения /шах кратности допускаемых отказов, причем в общем случае N > п + /шах, и из структуры сети связи, гарантирующей при значениях N и /шах требуемое число п взаимно достижимых ЭМ. Необходимую для нормального функционирования связанность ЭМ в системе зададим диаметром ¿, соответствующим допускаемой во взаимодействиях любой пары ЭМ задержке.

Задача анализа структурной отказоустойчивости вычислительной системы представлена здесь в терминах теории графов. В работе [3] автором впервые введено понятие толерантности графа, как способности сохранять заданные свойства при удалении из него некоторого числа вершин. Для исключения громоздких конструкций в последующем тексте уточним некоторые используемые далее определения. Так, компонента связности в теории графов определена максимальным связным подграфом G'(V', Е') графа G(V, Е). В настоящей работе введем понятие ¿-ограниченной компоненты связности (¿-компоненты связности), выделяющей в графе G(V, Е) максимальный связный подграф G/ (V/ ,Е/) с диаметром, не превышающим предельного значения ¿: Ум, уе V/ ¿(и, у) < ¿. Очевидно, что при ¿(&) < ¿ ¿-компонента связности G/(V/, Е/) совпадает с компонентой G'(V, Е') и G/(V/, Е/) = G'(V' , Е'), а при ¿^') > ¿ она является ее подграфом G/ (V/, Е/ ^ ' (V ' , Е).

Наряду с известным из теории графов определением (вершинной) связности к(О) как наименьшего числа вершин в графе G(V, Е), удаление которых приводит к несвязному или тривиальному графу, здесь введено понятие ¿-ограниченной связности к/(0) графа, определяемой как наименьшее число вершин, удаление которых приводит к появлению в графе ¿-компоненты связности V/ с меньшим, чем VI, размером. Введенные выше определения очевидным образом расширяют известное неравенство Уитни [4] до следующего: к/^О) < к(О) < Х(О) < 8^); здесь Х(О) и 8^) соответственно - значения реберной связности графа и минимальной степени его вершин. Используя введенные определения, обусловим толерантность графа наличием в нем ¿-компонент связности G/(V/, Е/)еG, размеры N/ = IV/1 которых не меньше граничного числа п при заданной кратности / отказов при том, что N — п > /. Граф G назовем (п, /, ¿)-толерантным, если для любой из множества конфигураций /-кратных отказов существует ¿-компонента связности, размер которой не меньше п. Систему, граф G которой (п, /, ¿)-толерантен, считаем при этом (п, /, ¿)-структурно отказоустойчивой. Таким образом, задача анализа отказоустойчивости системы сводится к анализу (п, /, ¿)-толерантности ее графа, равно как и суть задачи синтеза отказоустойчивой структуры ВС состоит в построении соответствующего (п, /шах, ¿)-толерантного графа. Очевидно при этом, что число вершин N ограничено снизу суммой п + /шах. Число вершин сверх этой суммы Шу = N — (п + /шах) будем называть избыточным.

2. Функция структурной отказоустойчивости ВС

Задача оценки структурной отказоустойчивости ВС с критическими значениями числа п вершин и диаметра ¿ в соответствующем ей графе поставлена впервые. Суть ее состоит в выявлении наименьшего числа / вершин, удаление которых либо переводит диаметр ¿^') компоненты связности в закритическую область - ¿(&) > ¿, либо при сохранении диаметра в докритической области ¿(&) < ¿ уменьшает число вершин в компоненте более чем на /. В обоих случаях N/ < ^/, и значение / = к^) является ¿-ограниченной связностью графа G. Если при этом / > /шах, т.е. У/< /шах N/(/) = N - /, то отказоустойчивость системы достигается уже при числе элементарных машин N = п + /шах, т.е. при нулевой вершинной избыточности - Шг = 0. Структурная отказоустойчивость системы в этом случае обусловлена избыточной связностью ее графа. Если же / < /шах, т.е. У/ |/ < / < /шах п < N'(1) < N — /, то система также может быть отказоустойчивой, но определяется это свойство уже не только коммуникационной избыточностью, недостаточной для Шу = 0, - система должна быть дополнена также некоторым избыточным числом ЭМ, т.е. должно быть N > п + /шах и Шу > 0.

Показателен в этом отношении анализ двух полярных с позиций избыточности регулярных структур: кольцевой, где число ребер |Е| минимально и не превышает N - 1, и полносвязной структуры (Ки-графа), содержащей максимально возможное число ребер - |Е| = NN - 1)/2. Реберную избыточность ШЕ кольцевой структуры с N = п + /шах примем равной нулю, а число ребер сверх п + /шах - 1 назовем избыточным.

Рассмотрим в качестве примера систему с кольцевой структурой G(V,E), в которой заданы минимально необходимое для сохранения работоспособности число п вершин и их изначальное число N > п. Считаем, что одновременно в системе может быть задействовано максимально возможное число N/ = п < N/ < N, элементарных машин в ¿-компоненте связности G/ (V/ ,Еу^) с G' (V ,Еу .) с диаметром ¿^¿^ не превышающим величины ¿ из замкнутого промежутка [п - 1, N - 1]. В соответствии с [3] значение структурной отка-

зоустойчивости 9(п, /, ¿) такой системы при кратности / отказов определяем отношением

9(п, /, ¿) = (CN)'/ CN.

Так как в кольцевом графе значение ¿ однозначно определено числом п (¿ = п - 1), то этот параметр далее можно опустить. Здесь (С1М)' = |{Ог(/)}лН|, ^¡(1)} - множество подграфов графа G, соответствующее

множеству сочетаний по / удаленных вершин графа из всех N вершин, г = 1, С^ , Н - предикат адекватности,

устанавливающий соответствие (Н = 1) или несоответствие (Н = 0) исследуемого г-го подграфа GI</) заданным выше условиям работоспособности ВС:

ЗGi'еGi(Г) ^¡') < ¿, | VI > п ^ GI</)лН = 1.

Если (С1М)' = С1М, то 9(п, /) = 1 и, следовательно, кольцевая система (п, /)-структурно отказоустойчива.

При (сN)' < сN ее структурная отказоустойчивость 9(п, /) < 1 и существует отличная от нуля вероятность утраты существенных структурных качеств, необходимых для ее работоспособности.

Очевидно, что в кольцевой ВС с N > п при кратности отказов / = 1 всегда справедливо (С^)' = С^ = N и ее структурная отказоустойчивость 9(п, 1) = 1. Условием безусловной структурной отказоустойчивости к кратности / = 2 отказов, при котором (СN)' = СN, является - 2)/2"| > п, или N> 2п + 1. Условием же безусловной структурной отказоустойчивости кольцевой ВС к произвольной кратности отказов / > 1 является N > п/ + 1. Очевидно, что это условие является также определяющим при синтезе отказоустойчивых кольцевых ВС и сетей связи. Итак, в кольцевой структуре N > п/ + 1 ^ 9(п, 1) = 1.

В табл. 1 даны результаты расчета структурной отказоустойчивости кольцевой ВС с достаточным для ее нормального функционирования значением п = 10, / = 2,5.

Перечислить работоспособные конфигурации (СN)' в кольце достаточно просто: вычислив Г^ - /)//1, получим значение минимально возможного размера компоненты связности кольцевого графа при удалении из него / вершин. Покажем это на примере N = 15, / = 3, п = 10: Г(15 - 3)/31 = 4, С135 = 455. В табл. 1 приведены размеры подграфов, получаемых при удалении 3-х вершин. Здесь N1 - размер компоненты связности, N2 и N3 - размеры других изолированных подграфов. Затененная в таблице область соответствует комбинациям, размер компоненты связности в которых превышает п = 10. Так как общее число таких комбинаций

(С35)' = 90, то 9(10, 3) = (С35)'/ С35 = 90/455 = 0,1978.

Таблица 1

№ п/п 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

Число комбинаций 15 30 30 15 30 30 30 30 15 30 30 30 15 30 30 15 15 30 5

N1 12 11 10 10 9 9 8 8 8 7 7 7 6 6 6 6 5 5 4

И2 0 0 0 1 0 1 0 1 2 0 1 2 0 1 2 3 2 3 4

N 0 1 2 1 3 2 4 3 2 5 4 3 6 5 4 3 5 4 4

В табл. 2 сведены данные расчетов функций структурной живучести рассматриваемого кольцевого графа от / (при п = 10), представленные на рис. 1.

Таблица 2

1 N п+1 15 20 21 25 30 31 35 40 41 45

2 С 2 еда 0(10,2) 66 12 0,182 105 60 0,571 190 180 0,9474 210 210 1,0

3 С3 См Сэ'(Ю 0(10,3) 286 13 0,045 455 90 0,198 1140 720 0,632 1330 945 0,711 2300 2125 0,924 4060 4050 0,998 4495 4495 1,0

4 С 4 См Сда 0(10,4) 1001 14 0,014 1365 60 0,044 4845 1680 0,347 5985 2520 0,421 12650 9025 0,713 27405 25305 0,923 31465 29791 0,947 52360 51800 0,989 91390 91350 0,9996 101270 101270 1,0

5 с5 С'(Ю 0(10,5) 3003 15 0,005 15504 1420 0,092 20349 53130 15375 0,289 142506 91141 0,64 169911 324632 291656 0,898 658008 749398 744355 0,993 1221759 1221759 1,0

о

02

Рис. 1. Структурная отказоустойчивость кольцевой ВС с п = 10

Система, все ЭМ которой связаны по полному графу, отказоустойчива уже при N = п + /шах , но число ребер в графе такой ВС увеличивается в сравнении с кольцевой структурой до NN - 1). Скачкообразное (при N = п + /) изменение значения функции структурной отказоустойчивости полносвязной ВС от 9(п, /) = 0 до 9(п, /) = 1 видно из графика этой функции при п = 10, / = 2,5 (рис. 2). Здесь же выделена область, представляющая собой разность функций структурной отказоустойчивости кольцевой и полносвязной ВС для п = 10, / = 5. Совершенно очевидно, что значения структурной живучести систем с соответственно равными значениями п и /, но с разными значениями вершинной связности 2 < кл < N - 1 лежат в построенной таким образом промежуточной области. Из рис. 2 видно, что, например, для п = 10, / = 5 при N = 25 структурная отказоустойчивость системы в зависимости от выбранного для нее графа заключена в пределах от 9(10, 5) = 0,289 при средней вершинной связности, близкой к двум (к ^ 2), до 9(10, 5) = 1,0 при к ^ N - 1.

1,0 -

0,8

*4 0,6 о

0,4

0,2

0

10 20 25 30 40 50 N

Рис. 2. Структурная отказоустойчивость полносвязной ВС и область определения

Диаметры кольцевого и полного графов существенно рознятся между собой: если в первом случае диаметр не менее чем в /шах раз превышает нижний предел числа ЭМ в работоспособной ВС, то диаметр компонент связности полного графа при любых кратностях / > N - п и конфигурациях отказов всегда равен единице. В силу ограниченности допускаемого диаметра в первом случае может быть использована лишь небольшая часть исправных ЭМ, что указывает на низкую эффективность использования суммарной мощности ВС. Число ребер |Е| в рассматриваемых кольцевом и полном графах составляет соответственно: |ЕС| = п/шах и |Е„| = (п + /шах)(п + /шах - 1). Таким образом, значения вершинной и реберной избыточностей для рассмотренных здесь случаев составляют: в системе с кольцевой структурой - Шу = ШЕ = (п - 1)(/шах - 1), а в полном графе - Шу = 0 и ШЕ = (п + /шах - 1)2.

Обозначив удельные стоимости вершин Су и ребер СЕ, переведем их в условные единицы: су = Су /(Су + СЕ), сЕ = СЕ /(Су + СЕ); таким образом, су + сЕ = 1 и в общем случае условная стоимость с^) реализации структурной отказоустойчивости ВС составляет: с^) = суШу + сЕШЕ. Сопоставление избыточных стоимостей различных вариантов дает необходимые формальные основания для выбора той или иной структуры. В рассмотренных выше случаях, повышающих до предела роль одной из составляющих (вершинной или реберной) за счет другой, условная стоимость отказоустойчивости составляет: для кольцевой ВС -

С = сг п(/шах- 1) + сЕ п(/шах -1) = п(/шах - 1) и для объединения ЭМ по полному графу - С = сЕ(п + /шах - 1)2 = = (1 - су)(п + /шах - 1)2. Очевидно, что оптимальная в отношении стоимости отказоустойчивая структура также может быть найдена среди промежуточных вариантов.

Заключение

Структурная отказоустойчивость системы определена сохранением требуемого для успешного функционирования системы минимально необходимого числа взаимосвязанных (соответствующих заданным критериям связанности) ЭМ при любой конфигурации отказов с максимально допускаемой кратностью. Показатель структурной отказоустойчивости вычислительной системы определяет таким образом долю подмножества работоспособных в множестве возможных конфигураций ВС при кратности / отказов. При этом минимально допустимое при отказах число ЭМ определяется исходя из их производительности, из набора существенных функциональных подсистем и их трудоемкости, из граничных значений показателей реактивности системы в решении этих задач, из плотности вероятности распределения потока задач и т.д.

Постановка задачи анализа структурной отказоустойчивости вычислительной системы впервые рассматривает в качестве критических параметров работоспособности минимально допустимый размер п компоненты связности графа ВС и ее предельный диаметр ¿. В связи с постановкой введено понятие ¿-ограниченной компоненты связности (¿-компоненты связности), выделяющей в графе ВС максимальный связный подграф с диаметром, не превышающим предельного значения ¿, и понятие ¿-ограниченной связности графа, определяемой как наименьшее число / вершин, удаление которых приводит к появлению в графе ¿-компоненты связности с меньшим, чем у компоненты связности, размером. Синтез отказоустойчивой системы при этом заключается в определении кратности / отказов, при которой система должна сохранять работоспособность независимо от конфигурации отказавших ЭМ, и в выборе обеспечивающей это условие структурной конъюнктуры: изначального числа исправных элементарных машин и их связности. Максимальное значение кратности /шах отказов определяется при этом коррелированными ожидаемыми условиями эксплуатации надежностными показателями используемых ЭМ, их минимально допустимым числом и планируемыми значениями вершинной и реберной избыточности исходного графа. Говоря об условиях эксплуатации, мы включаем сюда как внешние (температурные, радиационные и т.п.), так и внутренние факторы (загруженность, качества алгоритмов перераспределения нагрузки и т.п.).

В работе дано определение соответствующей указанной постановке (п, /, ¿)-структурно отказоустойчивой системы, проведено исследование полярных в отношении связности кольцевой и полносвязной структур. Показано, что при заданных значениях п, / и ¿ область размещения семейства функций структурной отказоустойчивости систем с варьируемыми соотношениями между и ШЕ ограничена снизу кольцевой (ШЕ = 0) и сверху полносвязной (Шу = 0) структурами. Введенный в работе показатель стоимости, выраженный в условных единицах относительной стоимости вершинной и реберной избыточности структуры ВС, может быть использован в качестве критерия структурной оптимизации близких по значению структурной (п, /, ¿)-отказоустойчивости систем.

ЛИТЕРАТУРА

1. Мелентьев В.А. Корреляция надежности элементов вычислительной системы реальными условиями ее эксплуатации // Вестник ТГУ. Приложение. 2007. № 23. С. 247 - 252.

2. Мелентьев В.А. Обобщенная модель отказоустойчивой системы // Вестник ТГУ. Приложение. 2007. № 23. С. 242 -246.

3. Мелентьев В.А. Толерантность графов и структурная отказоустойчивость вычислительных систем // Вестник ТГУ. Приложение. 2004. № 9(1). С. 144 - 150.

4. Харари Ф. Теория графов. М.: Мир, 1973.

i Надоели баннеры? Вы всегда можете отключить рекламу.