СИСТЕМНЫЙ АНАЛИЗ X
УДК 510.6:683.3:531
УПРАВЛЕНИЕ ЖИВУЧЕСТью СЛОЖНОй СИСТЕМЫ НА ОСНОВЕ ЛОГИКО-ВЕРОЯТНОСТНОГО прогнозирования
A. Е. Городецкий,
доктор техн. наук, профессор
И. Л. Тарасова,
канд. техн. наук, доцент
B. Ю. Зиняков,
аспирант Институт проблем машиноведения РАН, г. Санкт-Петербург
Рассматривается метод управления живучестью сложной системы с использованием моделированного изменения вероятности отказа с течением времени и деградации системы. Предлагается подход к проблеме учета связей между блоками сложной системы. Описывается алгоритм моделирования, сочетающий логико-вероятностное и логико-лингвистическое прогнозирование процессов изменения параметров во времени. Использование моделирования позволяет получить резерв времени на проведение необходимых операций по управлению живучестью системы и тем самым повысить ее надежность.
Ключевые слова — сложная логическая функция, логико-вероятностное моделирование, логико-лингвистическое моделирование, прогнозирование, управление сложной системы.
Введение
К основным принципам, которые используются для управления живучестью сложных систем, относятся адаптация; динамический естественный отбор, или горячее резервирование; стресс; компенсация и заимствование; ступор, или включение аварийного режима [1]. При отклонениях внутреннего состояния системы из-за различных поломок и отказов для обеспечения живучести традиционно используется принцип горячего резервирования, аналогичный динамическому естественному отбору, существующему в живых организмах. Сигналом для включения механизма динамического естественного отбора, т. е. переключения каналов и блоков на резервные, служит наблюдаемое превышение сверх допустимых норм изменений внутреннего состояния блоков, которое может оцениваться по величине математического ожидания (МО) их параметров или вероятности отказа [2].
Задача обеспечения живучести или надежности функционирования системы, когда отклонение внутреннего состояния превышает допустимые пределы, поставлена достаточно давно и в значи-
тельной степени изучена [3]. Однако при оценке изменения во времени сложной логической функции, описывающей отказ системы с учетом связей между блоками, за исключением простейших схем, возникают определенные сложности и неоднозначности [4]. Проблема учета влияния параметров одних блоков системы на параметры связанных с ними блоков при вычислении изменения вероятности отказа сложной системы с течением времени ее эксплуатации до сих пор не имеет приемлемого для практики решения [5], так как аналитический учет данного факта в сложной системе неизбежно приводит к весьма трудоемким вычислениям. Рассмотрим один из возможных подходов к проблеме учета связей между блоками сложной системы.
Упрощенный учет связей между блоками сложной системы
Очевидно, что с течением времени эксплуатации Т сложной системы вероятности безотказной работы ее блоков Рь бо(Т) убывают по экспоненциальному закону [6]:
р1 бо (Ч) = ехР(-аюЧ )> (1)
где ti — время эксплуатации !-го блока системы; аю — коэффициент убывания, который может быть найден из уравнения (1), так как обычно для блоков системы задаются наработка на отказ и вероятность безотказной работы Рь до^ю) в этот момент времени.
Указанное убывание вероятностей может характеризоваться соответствующим изменением МО их параметров [6]:
Рю (Т) = 1 - Ф((Ь - ть)/ст;) +
+ Ф((-Ь; -т)/ст;) =1 -р б0(Ч), (2)
где Ьь — предельно допустимое значение ^го параметра; тг — МО ^го параметра; стi — среднеквадратическое отклонение (СКО) ^го параметра; Ф(х) — интеграл вероятности, который не выражается через элементарные функции, но существуют таблицы его значений [7] либо его приближенные выражения в виде ряда с убывающими членами.
Обычно для каждого блока известны начальные значения величин Рь бо, Ьь и тю, поэтому величина СКО ( для каждого блока может быть вычислена из соотношений
р (-х<Х (-ь1) = Ф1 ((Ь1 - Що)/ () -
-Ф; (-») = (1 - р бо (Ч))/ 2; (3)
Ф(-да) = 0. (4)
Также очевидно, что приближение МО параметров ^го блока к опасному (критическому) с и, тем более, предельно допустимому Ь значению сказывается и на изменении параметров связанных с ними блоков. Например, изменение выходного напряжения блока питания естественно приводит к изменению коэффициента усиления связанного с ним блока усиления [7]. Поскольку аналитический учет взаимного влияния блоков приводит к сложным вычислениям, предлагается следующий упрощенный подход к данной проблеме.
При попадании МО т$) параметров какого-либо ^го блока в некоторый момент времени его эксплуатации tik в опасную зону с <\т^ < Ь для этого блока устанавливаем коэффициенты
w(i) = 2, и(1) = 3,
где w(i) — характеристика состояния ^го оборудования (w(i) = 0 — аварийный, w(i) = 2 — опасный, w(i) = 1 — нормальный); и(г) — характеристика удаленности ^го оборудования от аварийного или опасного оборудования (и(г) = 0 — удаленность более чем через один, и(г) = 1 — удаленность через один, и(г) = 2 — непосредственно связанный, и(г) = 3 — непосредственно сам).
■ Рис. 1. Фаззификация
После этого осуществляем сдвиг МО
ті =т,і + 5 іи)(і)и(і)т;^(ті), (5)
где ц(т;) — функция принадлежности текущего значения МО тому или иному интервалу, которая вычисляется в соответствии со следующими правилами (рис. 1):
1) если -да < ті < Ъь + тю, то ц(т) = 1;
2) если -Ъг + тю < ті < -сі+тю, то
^(т) = шах(((т; - ті0+с)/(сі - Ъ));
((т - тю + Ъ)/(Ъ - с;)));
3) если -сі + тю < ті < тю, то
ц(т;) = шах((-т;+тіо)/сі; (т; - тю+с)/С);
4) если тіо < ті < сі+тю, то
ц(ті)=тах((-ті+тіо+сі)/сі; (ті - тіо)/сі);
5) если сі+тіо < ті < Ъ + тю, то
ц(ті) = тах((ті - тіо - ьі)/(сі - ьі);
(ті - тіо - сі)/(ьі - сі));
6) если Ъг+тіо < ті < да, то ц(ті) = 1.
Затем устанавливаются у-е номера блоков, непосредственно связанных с блоком, параметры которого попали в опасную зону, и для них присваиваем значения коэффициентов связи и(у) = 1, и(у) = 2 и также осуществляем сдвиг МО:
ті =mj +<з-^(І)и( j)mj М-(ту), (6)
где ц(ту) вычисляется по тем же правилам вида 1-6.
После этого определяем номера q-х блоков, связанных с найденным і-м, через один блок и для них устанавливаем w(q) = 1, и^) = 1, и также осуществляем сдвиг МО:
т^ = т^ + aqw(q)u(q)mq^(тц). (7)
Если теперь, после пересчета МО, окажется, что у какого-то блока его абсолютное значение будет больше допустимого значения (|ті| > Ъі), то этот блок признается неработоспособным, вероятность его отказа приравнивается единице (Рю = 1)
и, соответственно, приравнивается единице вероятность отказа всей системы (Ро = 1). В противном случае следует вычислить, исходя из новых значений МО, значения вероятностей отказов всех блоков по формуле (2), а затем вычислить вероятность отказа всей системы, используя, например, полиномиальную формулу [7]
Ро = (-1)0 Е (Р;о (Т)) + (-1)1Е;у (Р;о (Т)ро (Т)) + +(-1)2Е^Р(Т)Ро (Т)Рт(Т)) + • • • + П (Р;о(Т)). (8)
Таким образом, в предлагаемом варианте учета связей между блоками системы при наступлении опасной ситуации скачком изменяют МО параметров данного и связанных с ним блоков, что позволяет в первом приближении учесть взаимовлияния параметров блоков на изменения вероятности отказов в процессе эксплуатации системы.
Моделирование изменения во времени вероятности отказа сложной системы с резервированием блоков
При моделировании изменения во времени вероятности отказа сложной системы с резервированием блоков будем считать, что система содержит Nо основных и Nр резервных блоков, и требуется определить изменение вероятности отказа Рс{у = 1} системы с течением времени Т ее эксплуатации, если известны:
— структура системы, по которой строится таблица связей между блоками;
— время наработки на отказ каждого ^о блока системы ^;
— начальная вероятность безотказной работы каждого ^о блока системы Р^ю);
— максимально допустимое (критическое) отклонение параметров ^о блока системы Ь, превышение которого говорит об отказе блока
= 1 — отказ ^о блока);
— опасное отклонение параметров ^о блока системы с, превышение которого приводит к скачкообразному увеличению отклонения параметров связанных блоков;
— отклонение параметров ^о блока системы di, превышение которого говорит о необходимости замены основного блока на резервный.
В системе с резервированием отказ системы означает, что
У = (^1о Л 21р ) Л (^2о Л 22р ) Л (г3о л 23р ) л •••
л(2^о Л Ххр ) = 1, (9)
где ziо — отказ ^о основного блока и ziр — отказ i-го резервного блока системы.
Поэтому для вычисления вероятности отказа системы, характеризующей ее надежность, в момент времени Т надо вначале вычислить вероятности конъюнктивных элементов в уравнении
(9):
Рі {^іо Л гір = і} = Ріо {^іо = 1} ■ Рі р {^ір = і} = ’’’
= Ріо (Тіо) ■ Рір (Тір) = Рі (Т), (1о)
где Тіо, Тір — время работы і-го основного и резервного блоков соответственно.
При этом:
1) поскольку нас интересует приближение блоков к аварийной ситуации, когда сі < \ті\ < Ъі, где сі — опасное значение параметра, Ъь — критическое значение параметра, либо наступления аварийного состояния, когда |ті\і > Ъі, в этих случаях в уравнении Ро(Т) = 1 - Ф((Ъ - т)/ст)+Ф((-Ъ - т)/сті) можно пренебречь значением Ф((-Ьі - т)/сті), так как Ф((-Ъ- ті)/сті) < Ф((Ьі - ті)/сті). Следовательно, можно считать, что Ріа(Тг0) = Ф((Ьі - тіо(Тіо))/5іо) и Рір(Тір) = Ф((Ьі - тір(Т і р))/5ір). Если і-й резервный блок не подключен, то Тір = о и Рір(Тір) = о;
2) если нет і-го резервного блока, то Рір(Тір) = 1;
3) если у какого-либо і-го основного блока нет резервного блока и у этого блока Ріо(Тіо) = 1 (отказ блока), то Рс{у = 1} = 1;
4) если нет ни одного і-го блока, у которого
Ріо(Тіо) = 1 и Рір(Тір) = 1 то
Рс {у = 1} = Рс (Т) = (-1)0 X і (Рі (Т)) +
+(-!)' X ї (Рі (Т)Рі (Т)) +
+(-1)2XІк(Рі (Т)Рі (Т)Рк (Т)) + • • • + Пі (Рі (Т)); (11)
5) если у какого-либо і-го основного блока в какой-либо у-й момент времени Ту отклонения параметров превысят значение di, то если есть резервный блок, его замещают этим блоком, для него устанавливают Ріо(Тіо) = 1, а для резервного блока устанавливают Тір = Т - ТЧ. Тогда Рі(Т) =
ір Ч і
=Рір(Тір) и Рс{у = 1} также рассчитывают по формуле (11);
6) если после замещения основного блока на резервный Рір(Тір) = 1, то и Рс{у = 1} = 1;
7) вероятности безотказной работы каждого і-го основного блока системы убывают с течением времени его эксплуатации ^ по экспоненциальному закону Ріо(Тіо) = ехр(-аіоТіо) (Ю), а вероятности безотказной работы каждого і-го резервного блока системы Рір(Тір) остаются постоянными до момента времени Ту их подключения вместо основного, а затем убывают с течением времени их эксплуатации Тір = Т - Ту также по экспоненциальному закону вида (1).
Алгоритм моделирования изменения во времени вероятности отказа сложной системы с резервированием блоков
С учетом изложенного выше алгоритм моделирования будет следующим.
1. Задание начальных условий:
N — количество блоков в системе;
Ф(х) — нормальная функция распределения (задается в виде таблицы с линейной интерполяцией) [7];
V — системное время, V : = о;
Т — время окончания моделирования;
Д — шаг моделирования;
С — квадратная бинарная матрица порядка N, описывающая направленный граф соединений блоков системы;
т^) — МО состояния і-го блока до учета связей в момент времени V;
МЬ(У) — приращение МО состояния і-го блока после учета связей в момент времени V; сті — СКО состояния і-го блока;
Р,(У) — вероятность отказа і-го блока в момент времени V, Р^)=Рі(о) = о,оо4 (по ГОСТ либо ТУ);
^ — время наработки на отказ і-го блока (ГОСТ либо ТУ);
Vi — момент замены і-го блока запасным (о, если замена не была произведена), V,: = о;
аі — экспоненциальный коэффициент вероятности отказа і-го блока;
Ъ — предельное значение параметров, означающее отказ і-го блока, Ъ = о,15;
сі — значение параметров і-го блока, при котором блок считается находящимся в опасном состоянии;
di — значение параметров і-го блока, при котором блок меняется на запасной;
ц^) — функция принадлежности і-го блока в момент времени V;
wi(V) — коэффициент состояния блока в момент времени V;
и,(У) — коэффициент близости опасных\кри-тичных і-х блоков в момент времени V;
ki — коэффициент резервирования і-го блока (Щ = о — нет резервного блока, ki = 1 — имеется один резервный блок, ki = 2 — имеются два резервных блока и т. д.);
Р^) — вероятность отказа системы в момент времени V
2. Вычисление СКО сті для каждого і-го блока:
— вычисляем хі=Рі(о)/2;
— по таблице [7] определяем значения функции Ф(хі);
— вычисляем сті = -Ъ/Ф(х,).
3. Вычисление экспоненциального коэффициента аі для каждого і-го блока:
а,=-1/*і ^(РДо)).
4. Вычисление вероятности отказа и математического ожидания т^у) для каждого і-го блока в момент времени V:
— вычисляем Р^) = ехр(-а^ - V));
— по таблице [4] определяем значения Ф(РДУ));
— вычисляем ть(У) = Ъ - Ф(Р^)) а,.
5. Вычисление функции принадлежности для каждого і-го блока:
— если т^у) < = -3сті, то ц^) = 1;
— если т^у) > -3а, и т(V) < - а,, то
Ц(Л = тах(ці([-35і, -<5]), ц,([-2а,, -<5]));
— если т^у) > -аі и т^) < о, то
ц^) = тах(цД[-^, о]), ц,([-а,, о]));
— если тгУ) > о и т^) < а,, то
ц^) = тах(ці([о, аД), ц([о, а*]));
— если mi(V) > а, и mi(V) < - 3а,, то
М^) = тах(ці([сті, 3а,]), цД[а,, 2а,]));
— если тьУ) > = 3аі, то ц^) = 1;
— если т,У) < -Ъ или тг(У) > Ъ, то wi(V) = о и
Pi(V) = 1 {і-й блок неисправен};
— если (ті(У) > -Ъ и тг(У) < -с,) или (ті(У) > сь и т,(У) < Ъ), то wi(V)=2 {і-й блок в опасном состоянии};
— если т,У) > - с, или тгУ) < с,, то wi(V) = 1 {блок исправен}.
6. Вычисление коэффициента близости иьУ) для каждого опасного\критичного і-го блока в момент времени V.
6.1. Если wi(V) = о {і-й блок в аварийном состоянии}, то и^) = о. При этом:
— если неисправный или опасный блок — соседний, то {и,(Г) = 3};
— если неисправный или опасный блок — через одного, и,У) = 2;
во всех остальных случаях иьУ) = о.
6.2. Если wi(V) = 2 {і-й блок в опасном состоянии}, то иьУ) = 3. При этом:
— если неисправный или опасный блок — соседний, то {и,(Г) = 2};
— если неисправный или опасный блок — через одного, и,У) = 1;
во всех остальных случаях щ(У) = о.
Определение ближайших блоков осуществляется с помощью матрицы С.
7. Вычисление приращения МО:
М^) = а iwi(V)^Ui(V)^mi(V)ц(V).
8. Вычисление математического ожидания тьУ) состояния после учета связей в момент времени V:
если ті(У) < -di или ті(У) > di, то тг(У) = т,(о), иначе
т(У) = т(У)+М(У).
9. Вычисление вероятности отказа Р^У) для каждого і-го блока.
9.1. Если wi(V) = о и Щ = о, то Р^) = 1.
■ Рис. 2. Структурная схема системы
9.2. Если wi(V) = 0 и ^ = 1, то Р^) = р(У): = 0,004 и Vi=V
9.3. Если wi(V) Ф0 и = 1 и т(У) < -di или mi(V) > di, то =V, РДУ) = pi(V): = 0,004, иначе Р^) = Ф((-Ь - т^))/() - Ф((Ь - т1(У))/а).
Определение значения функции Ф производится по таблице [7].
10. Вычисление вероятности отказа элементов декартова произведения векторар отказов блоков системы:
fij(T)=Р{р^Т)р(Т) = 1} = рДТ)р/Т).
11. Вычисление вероятности отказа системы:
р(V) = (-1)° Е; (А (Т))+(-1)1 Е ц (А (ТЦ (Т))+ +(-1)2 Е ци (А (Т)А (ТЦ (Т))+...+П А (Т))
и строим график P(V).
12. Если P(V) = 1, то останов, иначе переход к шагу 13.
13. Если V > Т, то останов, иначе V = V+Д и переход к шагу 4.
В качестве примера рассмотрим, как изменяется во времени вероятность отказа системы, структура которой имеет вид, показанный на рис. 2. Пусть N = ^1 = 5, Рбо = 0,996, тю = 0, Ь=0,15, ^ = 20 000 ч, ^2 = tоз= 15 000 ч, ^4 = = 25 000 ч и ^5 = 27 000 ч, с1=аi.
Каждый блок 1-5 системы, между которыми строится таблица связей, состоит из основного и
■ Связи между блоками системы
Опасный блок і Блоки •, связанные с опасным напрямую Блоки k, связанные с опасным через один
1 2, 3 4
2 4 5
3 4 5
4 2, 3, 5 1
5 1 2, 3
Р
■ Рис. 3. Зависимость вероятности отказа системы от времени работы:
1 — без замены; 2 — замена при d = 1,5;
3 — замена при d=2;
4 — замена при d=2,5;
5 — замена при d=3а
резервного, подключаемого при достижении критического состояния основного блока.
Результаты моделирования представлены на рис. 3.
Как видно из рисунка, резервирование блоков повышает время наработки на отказ системы тем больше, чем больше будет граничное значение параметров d, при превышении которого следует производить замену блоков на резервные. Однако одновременно уменьшается резерв времени на замену без последствий (аварий). Поэтому целесообразно проводить прогноз путем моделирования при различных значениях параметров d, а время замены оборудования выбирать в зависимости от требуемых затрат времени на ремонт тех или иных блоков и (или) от возможных последствий для системы в целом из-за их отказов.
Методы принятия решения при управлении живучестью
Рассмотрим достоинства и недостатки возможных методов принятия решения при управлении живучестью сложной системы с горячим резервированием.
1. Пусть необходимо контролировать параметры блоков х1 и при наступлении ситуации, когда хь > Ь, вместо данного блока включать аналогичный резервный.
Достоинство: простота.
Недостатки: простои (отказ) системы на время переключения и высокая вероятность ложных срабатываний при случайных кратковременных выбросах параметров.
2. Пусть необходимо контролировать параметры блоков хь, при этом вычисляют МО тг и при
наступлении ситуации, когда ть > bi, вместо данного блока включают аналогичный резервный.
Достоинство: меньше вероятность ложных срабатываний.
Недостатки: простои (отказ) системы на время переключения и выше сложность системы, чем в первом случае.
3. Пусть необходимо контролировать параметры блоков xi, при этом вычисляют текущее значение МО т, моделируют изменение во времени t МО т^) без учета связей между блоками системы, определяют по результатам моделирования возможное время Та наступления ситуации, когда ть> Ь, и в момент времени Тр = крТа, где кр < 1, вместо данного блока включают аналогичный резервный и производят устранение поломок и частичных отказов. Конкретное значение величины кр определяют операторы, исходя из опыта эксплуатации аналогичных систем.
Достоинства: меньше вероятность ложных срабатываний, малая вероятность простоев (отказов) системы на время переключения.
Недостатки: низкая точность прогноза наступления момента времени Тр = крТа, выше сложность системы, чем во втором случае.
4. Пусть необходимо контролировать параметры блоков Хр при этом вычисляют текущее значение МО т, моделируют изменение во времени t МО т^) с учетом связей между блоками системы, определяют по результатам моделирования возможное время Та наступления ситуации, когда тг > Ьг, и в момент времени Тр=крТа, где кр <1, вместо данного блока включают аналогичный резервный и производят устранение поломок и частичных отказов.
Достоинства: меньше вероятность ложных срабатываний, чем в третьем случае, меньше вероятность простоев (отказов) системы на время переключения, чем в третьем случае, выше точность прогноза наступления момента времени Тр=крТа.
Недостатки: выше сложность системы, чем в третьем случае, приближенный учет влияния параметров одних блоков на другие.
Заключение
Предложенный метод моделирования позволяет повысить точность прогноза времени наступления критической ситуации по каждому блоку системы и тем самым повысить живучесть системы за счет своевременного включения механизма резервирования. При этом можно получить резерв времени на проведение необходимых технических мероприятий по подключению резервных блоков и устранению поломок и частичных отказов.
Литература
1. Городецкий А. Е., Тарасова И. Л. Управление и нейронные сети. - СПб.: Изд-во Политехн. ун-та, 2005. - 312 с.
2. Городецкий А. Основы теории интеллектуальных систем управления. - СПб.: LAP LAMBERT Academic Publishing, 2011. - 313 c.
3. Городецкий А. Е., Дубаренко В. В. Комбинаторный метод вычисления вероятности сложных логических функций // ЖВМ и МФ. 1999. Т. 39. № 7. С. 1246-1249.
4. Рябинин И. А. Надежность и безопасность структурно-сложных систем. - СПб.: Политехника, 2000. - 248 с.
5. Городецкий А. Е., Кулик Б. А. Вычисление вероятностей логических функций при логико-вероятностном моделировании сложных систем//Матема-тическое моделирование. 2013. № 2. С. 125-136.
6. Городецкий А. Е., Тарасова И. Л. Нечеткое математическое моделирование плохо формализуемых процессов и систем. - СПб.: Изд-во Политехн. унта, 2010. - 336 с.
7. Червоный А. А., Лукьященко В. И., Котин Л. В. Надежность сложных систем. - М.: Машиностроение, 1976. - 211 с.