Богатиков В.Н. и др. Разработка технологии оценки состояния...
УДК 621.391
Разработка технологии оценки состояния промышленных систем на основе показателя безопасности и принятие решений целеустремлённого поведения агента
12 2 2
В.Н. Богатиков , А.А. Маслов , А.В. Власов , А.В. Кайчёнов ,
А.Д. Пискарева
1 Институт информатики и математического моделирования технологических процессов КНЦ РАН, лаборатория региональных
информационных систем
2
Политехнический институт МГТУ, кафедра автоматики и вычислительной техники
3
Институт экономики, управления и международных отношений МГТУ, кафедра информационных систем и прикладной математики
Аннотация. Описана технология оценки состояния промышленных систем на основе нечёткой Марковской модели, узлами которой являются интегральные показатели безопасности. Приведён алгоритм определения центра технологической безопасности. Рассмотрено поведение целеустремлённых систем.
Abstract. A technology for estimation of industrial systems conditions based on the fuzzy Markov's model with integral factors of safety used as nodes has been described. An algorithm for determining center of technological safety has been presented. The behavior of motivated systems has been considered.
Ключевые слова: технологическая безопасность, индекс безопасности, индекс риска, топологический метод, целеустремлённая система
Key words: technological safety, safety index, risk index, topological method, motivated system
1. Введение
В настоящее время активно развиваются технологии управления на основе методологий искусственного интеллекта с целью повышения потенциала самоорганизации и качества принимаемых решений в управлении промышленными системами. Основополагающими составляющими направлений развития таких технологий являются агентные технологии. Эффективность управления современными технологическими системами в большой степени зависит от уровня интеллектуальности агентов, их способности к самоорганизованному поиску резервов и ресурсов развития, способности видеть перспективы и последствия принимаемых решений (Виноградов, 2011).
Механизмы функционирования мультиагентных виртуальных сред должны обеспечивать процесс их эволюции таким образом, чтобы минимизировать риски возникновения проблемных ситуаций без разрушительных последствий. Это требует разработки специальной теории и методологии управления виртуальными организационными системами, основанными на обучении, адаптации и самоорганизации.
Объектом настоящего исследования являются безопасные промышленные системы, причём их безопасность понимается не только в прямом значении данного термина, но и как эффективность протекания технологического процесса. Например, безопасный процесс стерилизации консервной продукции обеспечивает выработку качественной продукции при минимальных затратах энергии. В случае роста энергозатрат система удаляется от безопасного состояния, и в тот момент, когда становится возможной выработка неудовлетворительной продукции, система выходит из области безопасности.
2. Область технологической безопасности
Рассмотрим один из возможных вариантов поведения агентно-ориентированной системы, основное целеустремление которой подчиняется минимизации риска последствий принимаемых решений и различных влияний внешних возмущений.
Процесс функционирования любой системы можно рассматривать как последовательную схему смены её состояний на некотором интервале времени (to; tk). Состояние системы S в каждый момент
654
Вестник МГТУ, том 16, № 4, 2013 г.
стр. 654-662
времени t из этого интервала характеризуется набором параметров этой системы, на которые накладываются ограничения q>(T,K,U) < 0, зависящие от множеств параметров {T^ K, Unp} (технологических - {Т^ i=l..I}; конструктивных - {Kj, j=l...J}; управления - {Unp, l=l..L}). Выход за эти ограничения означает переход процесса во внештатную ситуацию. Эти ограничения задают на множестве всех состояний процесса n-мерную область, в которой процесс не выходит во внештатные ситуации - это область всех работоспособных состояний процесса: Sp с S.
На основе оценки свойств системы агент с помощью когнитивных механизмов формирует субъективное представление о системе. Это представление включает область возможных состояний, законы поведения системы, оценки риска. Для расчёта безопасности требуется определить область наиболее безопасного функционирования технологического процесса в штатном режиме - область центра технологической безопасности (рис. 1). Для класса непрерывных технологических процессов, рассмотренных выше, область безопасности может быть построена по методу разделения состояний. В конечном итоге, по этому методу формируется система линейных ограничений (Богатиков, Палюх, 1995):
X<, z) < 0, (i = 1,...,I), (1)
X/, z) > 0, (i = 1,...,I), (2)
или для квазидинамических режимов:
(Xk (k), z(k)) < Dx(k + 1), (i = 1,...,I), (3)
(X^(k), z(k)) > Dx(k + 1), (i = 1,...,I). (4)
Определение центра безопасности при линейных ограничениях сводится к задаче нелинейного программирования - необходимо максимизировать сумму расстояний от точки до границ области при ограничениях (1), (2) или (3), (4):
i=I
dt (z)| ® max . (5)
i=1
Рис. 1. Область работоспособных состояний системы
3. Описание алгоритма определения центра безопасности
При заданных ограничениях Хщт) и х(тах) требуется найти диапазоны изменения коэффициентов системы aij-min) и aijmwc) (i = 1, I; j = 1, I), а также Ь,(гп,п) и Ьг-тас) (i = 1, I) таким образом, чтобы была
справедлива система ограничений (1, 2). Следует отметить, что подобного рода задачи часто встречаются при моделировании реальных систем. Как правило, бывают известны лишь диапазоны изменения переменных состояния x. В этом случае важно определить связь между текущими значениями переменных состояния и значениями, показываемыми контрольно-измерительным оборудованием. Эта связь может быть задана матрицей A, коэффициенты которой изменяются в некотором неизвестном диапазоне.
Предлагаемый метод определения центра безопасности осуществляет поиск ограничений перебором с переменным шагом. Для этого задаются начальное положение системы и минимальное значение шага. Поиск проходит в два этапа - сначала ищется матрица максимальных значений коэффициентов, а затем минимальных. Рассмотрим алгоритм поиска минимальных значений (Алексеев и др., 2009). Максимальные значения ищутся аналогично.
Матрице A (min) присваивается начальное значение, определяемое заданными коэффициентами. Затем идёт последовательное изменение (уменьшение) каждого коэффициента на величину шага, определяемую соответствующим значением матрицы шагов dA (для каждого коэффициента системы рассчитывается свой шаг, таким образом существенно повышается эффективность алгоритма). После изменения каждого коэффициента делается проверка, не вышло ли решение (1) за пределы искомого диапазона. В случае если проверка не дала положительного результата, выполняется откат -коэффициенту присваивается исходное значение. Далее вычисляется новое значение текущего
655
Богатиков В.Н. и др. Разработка технологии оценки состояния...
коэффициента - он увеличивается вдвое, если проверка была пройдена успешно. В противном случае происходит уменьшение коэффициента вдвое. Новое значение шага записывается в матрицу dA. В случае если шаг оказался меньше заданного минимального значения, текущий коэффициент более не меняется.
После того как будет сделан проход по всей матрице A(m,n\ программа анализирует матрицу шагов и смотрит, остались ли элементы, не достигшие предела. Если таковые найдены, процесс повторяется для этих элементов. Если же все элементы достигли предела, программа переходит к следующему этапу.
Проверка на принадлежность решения А-x + b = 0 диапазону (2) для коэффициентов матрицыA и вектора b, рассчитанных на очередной итерации, производится следующим образом. Большое количество раз случайным образом генерируется система коэффициентов матрицы A и вектора b из текущего диапазона. Если в каждом случае решения системы выполняются ограничения (3) и (4), проверка считается удачно пройденной. Если же хотя бы при одной из попыток решения вышли за допустимый диапазон, проверка завершается неудачно. При достаточно большом количестве испытаний надёжность метода составляет 95-97 %, что во многих случаях достаточно для практических расчётов.
После определения коэффициентов матрицы А требуется сформировать функцию цели. Из аналитической геометрии известно, что отклонение точки (х1у1^1) от плоскости, записанное в нормированном виде х-со5(«) + усоъ(Р) + zcos(g + р = 0, будет равно:
d = х1-costa) + уг^(Ь) + zi-cos(g - р. (6)
В рассматриваемом случае координаты точки образованы коэффициентами матрицы А и свободными членами b, а постоянными коэффициентами являются заранее заданные минимальные и максимальные значения переменных состояния.
В обозначениях формул (1) и (2) вектора Xic< образованы минимальными и максимальными значениями переменных состояния; z образованы коэффициентами матрицы А.
Для того чтобы не решать задачу нелинейного программирования в тех случаях, когда отклонение точки от плоскости отрицательно, надо изменить знак отрицательного d при формировании целевой функции (5).
Алгоритм формирования целевой функции следующий:
1) выбирается точка из возможного диапазона переменных z;
2) осуществляется приведение уравнений ограничений к нормальному виду;
3) определяется отклонение d, точки от , границы;
4) если отклонение d, отрицательно, то коэффициенты, с которыми данная функция входит в критерий, меняют знак на противоположный. Таким образом, в целевой функции формируется не сумма отклонений, а сумма расстояний;
5) если отклонение d, положительно, то коэффициенты, с которыми данная функция входит в критерий, не меняют знак на противоположный;
6) пункты 3-5 повторяются до тех пор, пока не определятся знаки отклонений до всех границ.
Таким образом, в целевой функции автоматически учитывается то, что осуществляется поиск
суммы расстояний точки от ограничений согласно формуле (5). На следующем шаге осуществляется решение задачи линейного программирования (5) с учётом ограничений (1) и (2), а также
zmin < z < zmax. (7)
Полученное решение будет определять координаты центра безопасности в случае равноценности границ. Если границы неравноценны, необходимо ввести веса для d,(z).
4. Оценка индекса безопасности функционирования агента в пространстве состояний
В большинстве случаев управление складывается из целеустремлений к определённым состояниям, которые в конкретных ситуациях являются наиболее предпочтительными. Основой такого управления является представление о центре - точке (S0) в пространстве состояний, которая доминирует по своим свойствам над остальной областью (рис. 1, 2). Задача управления в этом случае понимается как задача перевода свойств системы с последующей их стабилизацией из точки S в точку, как можно более близкую к области центра.
Агент оценивает ситуацию, возникающую в системе, и ставит в соответствие каждой ситуации Sj из определённого набора ситуаций Ss, характеризующего все возможные состояния объекта, некоторое управляющее решение R,. Перечень ситуаций, входящих в набор Ss, формируется агентом на основе своих знаний. Будем называть эти ситуации эталонами представлений агента. Входная ситуация ТS0 сравнивается с эталонными ситуациями S, е Ss, и определяется эталонная нечёткая ситуация, в некотором смысле наиболее близкая входной нечёткой ситуации. Модель операции сравнения можно построить,
656
Вестник МГТУ, том 16, № 4, 2013 г.
стр. 654-662
используя операцию нечёткой эквивалентности (Мелихов и др., 1990).
В отличие от набора TSs = {TS1, TS2, ..., TSn} текущих ситуаций, набор Ss = {S1, S2, ..., Sn}, (n<N)
эталонных ситуаций агента не содержит ситуаций, нечётко равных при заданном пороге равенства. Предполагается, что множество Ss полно. Таким образом, ситуация Si существует для любой входной ситуации S0. По решающей таблице для этой эталонной ситуации определяется управляющее решение. Данный подход построен на основании метода ситуационного управления (Поспелов, 1986).
Рис. 2. Оценка индекса безопасности функционирования агента в пространстве состояний (ф - множество границ области состояния агента (i = 1..n))
Для определения оценки уровня безопасности введём понятие индекса. Для оценки агентом текущего состояния системы необходимо сравнить на нечёткое равенство входную нечёткую ситуацию с нечёткой ситуацией, которая характеризует центр безопасности. При этом степень нечёткого равенства In(S x) = v(S x,S x0)&v(S x0,S x) покажет величину, которую можно определить как субъективный индекс идеала агента.
Тестовые результаты расчёта центра безопасности агента представлены на рис. 3.
Процесс принятия решений агентом может быть промоделирован на основе лингвистических переменных, с помощью которых формализуется качественная информация, представленная в словесной форме.
Вычисление индексов оценок уровня безопасности производится на основании результатов контроля функционирования системы по имеющимся функциям принадлежности. Если учитываются ущербы, которые возникают в процессе работы системы, то агент может определять и риск, который возникает при различных состояниях системы. Определение оценки индекса риска реализуется на основе того же механизма вычислений, как и оценки индекса безопасности. Риск, в данном случае, определяется как двойка <индекс безопасности, индекс ущерба>: InRisk(S ) = {In(S p), In(S d)}.
657
Богатиков В.Н. и др. Разработка технологии оценки состояния...
5. Методика расчёта оценки риска топологическим методом
Процесс функционирования системы - это непрерывная смена состояний. Смена состояний происходит под воздействием внешних и внутренних факторов. Могут возникать различные внештатные ситуации. Процесс смены состояний системы сопровождается также непрерывной сменой значений индексов безопасности или рисков и происходит это непрерывно во времени. В работе делается предположение, что смену состояний системы можно описать Марковскими случайными процессами. Марковские случайные процессы с конечным или счётным множеством возможных состояний обычно называют цепями Маркова.
Используя структурное подобие вероятностного графа и нечёткого графа для моделирования процессов смены состояний мультиагентной информационной системы, рассмотрим один из методов расчёта Марковских процессов - топологический метод (Мироненко, Палюх, 2003). Подобие графов позволяет использовать одни и те же формулы для расчёта:
• вероятности нахождения системы в некотором состоянии (индексы надёжности состояния для нечёткой системы);
• коэффициентов готовности и простоя (индексы коэффициентов готовности и простоя);
• среднего времени наработки на отказ и среднего времени восстановления (индексы времени наработки на отказ и времени восстановления).
Если при этом учитывать свойства функций принадлежности, появляется возможность проводить диагностирование информационной системы.
Обозначим Х как множество состояний системы: X = {x,-,/e/,/=1,...,n}, где х, - i-е состояние; I -множество индексов всех возможных состояний системы; n - количество возможных состояний системы.
Разобьём множество Х на два подмножества:
1. подмножество работоспособных состояний системы Хр: Xp = {xhieIp^I}, где 1р - множество индексов работоспособных состояний системы;
2. подмножество неработоспособных состояний системы Хнр: Хнр = {xi,ieJ^I}, где J - множество индексов неработоспособных состояний системы.
Нахождение системы в том или ином состоянии обусловливает случайный процесс X(t) перехода системы в пространстве её состояний. X(t) называют также траекторией системы.
Представим X(t) в виде нечёткого графа состояний G(X, W), где Х - множество вершин графа, соответствующих множеству состояний X; W - множество дуг, соединяющих вершины данного графа; Pi(t),...,Pi(t),...,P6(t) - вероятности нахождения системы в i-м состоянии; d(wiJ) - вес дуги wiJ; щ- нечёткая интенсивность перехода из состояния i в состояние j (рис. 4).
Рис. 4. Пример вероятностного графа состояний G(X, W)
658
Вестник МГТУ, том 16, № 4, 2013 г.
стр. 654-662
Если заданы интенсивности щ, то, составляя и решая систему уравнений Колмогорова, можно определить вероятности P,(t) нахождения системы в i-м состоянии, а значит, и показатели надёжности. Однако составление и решение системы уравнений Колмогорова является трудоёмкой операцией, поэтому для решения подобных задач применяют топологический метод. Топологический метод использует аппарат теории графов применительно к решению задач надёжности.
Рассмотрим решение задачи методом, который позволяет непосредственно по графу состояний G(X, W) без составления и решения уравнений Колмогорова вычислять показатели надёжности. Для этого введём некоторые определения.
Прямой путь Р из вершины х, в вершину Xj - цепь последовательно соединённых однонаправленных дуг, где каждая вершина имеет входящую и одну выходящую дуги, за исключением начальной и конечной, имеющих по одной дуге (рис. 5). Вес k-го прямого пути из вершины i в вершину j:
d ki)= п W), (8)
wij^W 41)
где W(I1Jk) - множество дуг, которые составляют k-ый прямой путь.
Рис. 5. Определение прямых путей на графе
Замкнутый контур r - прямой путь, на котором начальная и конечная вершины совпадают (рис. 6). Вес замкнутого контура г:
d (r )= П d (wj), (9)
Wj eW (r)
где W(r) - множество дуг, входящих в замкнутый контур r.
Частным случаем замкнутого контура является петля, в которой входящая и выходящие дуги сливаются в одну.
Рис. 6. Примеры замкнутых контуров
Вес петли при вершине определяется как отрицательная сумма весов дуг, исходящих из этой вершины:
d (wj )=- Z d (wj ^ (10)
jeJn
где Jn - множество индексов вершин, которые связаны с i-ой вершиной выходящими из неё дугами.
659
Богатиков В.Н. и др. Разработка технологии оценки состояния...
Соединение графа S - это частичный граф, который образуют только замкнутые контуры. Частичный граф представляет собой все вершины, некоторые дуги и петли исходного графа, которые составляют независимые замкнутые контуры (т.е. контуры, не имеющие общих вершин). Один граф может располагать несколькими соединениями (рис. 7).
Вес j-го соединения:
d (Sj )=(- 1)V- П d (r), (11)
rER(Sj)
где v - число независимых замкнутых контуров, образующих соединение; R(Sj) - множество независимых замкнутых контуров, образующих соединение.
Определитель графа AG = I d (Sj),
sjeS
где S - множество всех возможных соединений графа.
Рассмотрим методику расчёта показателей надёжности вероятностного графа топологическим методом в установившемся режиме, где топологические коэффициенты С, для каждой x, вершины графа определяются непосредственно по графу, а затем вычисляется нужный показатель по приведённым ниже топологическим формулам.
Для определения коэффициента С, необходимо:
1. Выбрать начальную вершину графа xq отдельно для определения каждого из коэффициентов С, (/=1,...,n). Начальная вершина может быть выбрана произвольно, однако выбор влияет на объём вычислений, поэтому её надо выбирать так, чтобы были длинные прямые пути.
2. Построить множество К прямых путей из начальной вершины xq в вершину x,, для которой определяется коэффициент.
3. Для каждого k-го прямого пути построить множество замкнутых контуров подграфа G{Xk} и образовать возможные комбинации независимых замкнутых контуров (множество соединений S), где G{Xk} - подграф графа G(X, W), образованный удалением множества вершин, входящих в k-ый путь и прилегающих к нему дуг.
4. Записать коэффициенты C, по найденным составляющим по формуле:
C, = I d (iq )-AG[Xk },
keK
где К - множество прямых путей из произвольно выбранной вершины хч в х,; Хк - множество вершин, входящих в k-ый прямой путь.
Используя топологические коэффициенты, основные показатели надёжности системы в установившемся режиме, можно записать:
• вероятность нахождения системы в г'-м состоянии (индекс оценки состояния надёжности вершины х,):
C
Indр = — , где n - число вершин графа;
I Cj
j=1
индекс оценки состояния коэффициента готовности системы:
IC,
feip
IndK =
I Cj
jdi
где Ip - множество индексов работоспособных состояний системы;
индекс оценки состояния коэффициента простоя системы:
IC,
Ind K = JdJ— , где J - множество индексов неработоспособных состояний системы;
Kp I Cj
jd
индекс оценки состояния средней наработки на отказ:
IndT
1o
IC, IC,
i€Ip i€Ip
f > f Л
IC, I aj IC, I a j
,€ip vjdJ V J v J€ip V
660
Вестник МГТУ, том 16, № 4, 2013 г.
стр. 654-662
где I+p - подмножество индексов граничных состояний из Хр, из которых в неработоспособное состояние можно попасть за один переход;
• индекс оценки состояния среднего времени восстановления:
IC
ieJ
I Ci
ieJ
f > f л
IC 1 a ij IC I aj
ieI+p VjeJ У ie J + VjeIp J
IndT =
где J - подмножество индексов граничных состояний из Хр, из которых в работоспособное состояние можно попасть за один переход.
Основные положения топологического метода могут быть применены для определения показателей безопасности системы в неустановившемся режиме с использованием преобразований Лапласа. Необходимо отметить, что показатели надёжности, вычисленные по нечёткой модели, должны совпадать с показателями надёжности, вычисленными по вероятностной модели. В отличие от вероятностной Марковской модели, где суммы вероятностей состояний для каждого момента времени равны единице, в нечёткой системе такое условие не накладывается на индекс надёжности. Поэтому по равенству показателей можно проводить верификацию нечёткой модели.
Алгоритм оценки состояний объекта и расчёта показателей надёжности по нечёткой модели включает следующие основные этапы:
1) ввод информации о реальной ситуации на объекте;
2) оценка индексов надёжности состояний;
3) оценка нечётких интенсивностей переходов из состояния в состояние;
4) расчёт показателей надёжности системы.
Рассмотренные в статье модель, методика и алгоритм определения показателей безопасности сложных технологических систем на основе использования нечёткой Марковской модели реализованы в виде технологии оценки состояний многоагентных распределённых систем, ориентированных на решение задач управления промышленными технологиями.
6. Целеустремление
Процесс целеустремления строится в предположении, что система находится в некотором начальном состоянии и может оценить возможные состояния на некотором перспективном горизонте своего существования. При реализации целеустремления ставится задача выбора наилучшего состояния в будущем. Для этой цели может быть использован механизм определения последовательной смены состояний на основе управляемых Марковских процессов с доходами.
Необходимо отметить, что в данном случае процесс целеустремления является моделью некоторых психофизиологических механизмов управления поведением высших живых существ.
Понятие "целеустремленная система" (ЦС) обозначает систему, осуществляющую достижение состояний, которые определяет входящая в неё целеполагающая подсистема. Средством достижения цели или желаемого состояния является осуществление ею определённого поведения, реализуемого на основе агентной системы.
В наиболее общем случае задача состоит в том, чтобы определить оптимальную стратегию поведения системы, т.е. стратегию, при которой её доход будет максимальным. Конечность числа этапов в данной задаче отражается в том, что важна смена состояний системы в течение N периодов.
Таким образом, задача поиска стратегии превращается в задачу динамического программирования. Если обозначить максимальный средний ожидаемый доход, который можно получить за этапы от n до N включительно как fn(i), то несложно вывести рекуррентное соотношение, связывающееfn(i) с числамиfn+1(j), гдеj = 1, 2, ..., m:
fn(i) = maxk{Yj=imInd + fn+ij)]}, n = 1, 2, ..., N.
Здесь k - номер используемой стратегии. Это уравнение основывается на том, что суммарный доход rj + fn+1(j) получается в результате перехода из состояния i на этапе n в состояние j на этапе n+1 с вероятностью pijk. Введём следующее вспомогательное обозначение:
vk=jmIndfrjk.
Тогда написанное выше рекуррентное уравнение можно переписать следующим образом:
fdi) = maxk{vk}
fn(i) = maxk{vik + jmInd fj}, n = 1, 2, ..., N-1.
661
Богатиков В.Н. и др. Разработка технологии оценки состояния...
Этот алгоритм, использующий вычисления величин fn(i), лежит в основе решения задачи принятия решений с конечным числом этапов. Подробнее этот вопрос рассмотрен в (Таха, 2001).
7. Заключение
В ходе исследований разработаны алгоритм поиска центра технологической безопасности и технология оценки состояний многоагентных информационных систем технологических процессов. Технология оценки состояний основана на использовании нечёткой Марковской модели, узлами которой являются интегральные показатели безопасности, которые определяются степенью нечёткого равенства некоторого текущего состояния и области центра безопасности. Узлы графа могут быть образованы и на основе риск-показателей. В этом состоит основное отличие рассматриваемой в работе цепи от общепринятой цепи Маркова.
Разработанная технология обеспечивает более гибкую адаптацию к конкретной задаче и позволяет выполнять диагностирование объекта уже на этапе расчёта интегрального показателя надёжности. Г ибкость достигается за счёт того, что состояние надёжности может оцениваться сразу по нескольким технологическим и надёжностным показателям. Диагностика на этапе вычисления интегрального показателя состояний достигается за счёт того, что вычисления можно разделить на разные этапы. Каждый этап оценивает какой-либо из отдельных показателей, что, в конечном итоге, позволяет сделать вывод о состоянии соответствующего элемента.
Литература
Алексеев В.В., Богатиков В.Н., Палюх Б.В. Приложения метода разделения состояний к управлению технологической безопасностью на основе индекса безопасности. Тверь, ТГТУ, 368 с., 2009. Богатиков В.Н., Палюх Б.В. Построение дискретных моделей химико-технологических систем. Теория и практика. Апатиты, КНЦРАН, 164 с., 1995.
Виноградов Г.П. Индивидуальное принятие решений: поведение целеустремлённого агента. Тверь, ТГТУ, 164 с., 2011.
Мелихов А.Н., Бернштейн Л.С., Коровин С.Я. Ситуационные советующие системы с нечёткой логикой. М., Наука, 272 с., 1990.
Мироненко А.С., Палюх Б.В. Надёжность и эффективность экономических информационных систем.
Тверь, ТГТУ, 157 с., 2003.
Поспелов Д.А. Ситуационное управление: Теория и практика. М., Наука, 288 с., 1986.
Таха Х. Введение в исследование операций. М., Издательский дом "Вильямс", 916 c., 2001.
662