Научная статья на тему 'Приближённые методики решения задачи определения рациональной стратегии поиска и устранения неисправности в АСУ ТП на основе моделей теории игр и марковских цепей'

Приближённые методики решения задачи определения рациональной стратегии поиска и устранения неисправности в АСУ ТП на основе моделей теории игр и марковских цепей Текст научной статьи по специальности «Математика»

CC BY
523
55
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
МАРКОВСКИЕ ЦЕПИ / ТЕОРЕТИКО-ИГРОВАЯ ОПТИМИЗАЦИЯ / МАТРИЧНЫЕ ИГРЫ

Аннотация научной статьи по математике, автор научной работы — Шестаков Геннадий Анатольевич

Предложены две приближённые методики выбора оптимальной стратегии поиска и устранения неисправности на основе модели цепи Маркова с теоретико-игровым определением неизвестных вероятностей перехода. Проведён их сравнительный анализ.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Шестаков Геннадий Анатольевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Приближённые методики решения задачи определения рациональной стратегии поиска и устранения неисправности в АСУ ТП на основе моделей теории игр и марковских цепей»

Приближённые методики решения задачи определения рациональной стратегии поиска и устранения неисправности в АСУ ТП на основе моделей теории игр и марковских цепей

Г. А. Шестаков

ФГБОУ ВПО Ростовский государственный университет путей сообщения, г. Ростов-на-Дону

Техническое диагностирование (ТД) АСУ технологическими процессами (АСУ ТП) проводится на различных этапах их жизненного цикла. Согласно ГОСТ 20911-89 под ТД понимается определение технического состояния объекта. При этом задачами ТД являются: контроль технического состояния, поиск места и определение причин отказа неисправности, прогнозирование технического состояния. Содержание и порядок решения этих задач должны зависеть от рассматриваемого этапа жизненного цикла АСУ ТП.

Одним из подходов к оптимизации стратегии поиска и устранения неисправности является использование аппарата теории марковских процессов. Его применение для определения показателей надёжности и диагностики регламентировано (например, в стандартах РФ [1]) и реализовано для широкого круга задач, например, рассмотренных в работах [2] - [5]. С другой стороны, широкое применение цифровой техники в АСУ ТП приводит к необходимости перехода от моделей дискретных марковских процессов с непрерывным временем к моделям дискретным по времени, т.е. к цепям Маркова. Такие модели применяются для описания поведения различных систем, в частности, в [6] на основе марковских моделей проведён анализ надежности вычислительного управляющего комплекса, а в [7] рассмотрена модель системы синхронизации, описываемая состояниями, в которых может находиться система, и вероятностями перехода между ними.

Однако для новых видов АСУ ТП, особенно на начальных этапах жизненного цикла, статистических данных натурных испытаний исследуемой системы может оказаться недостаточно для получения параметров марковской модели. Для получения достаточной статистики требуются длительные по времени испытания или эксплуатация АСУ ТП, что не всегда возможно. В этих условиях адекватным является применение теоретико-игровых подходов [8], [9]. При этом сложность получаемых моделей обуславливает в ряде случаев получение решения только на основе приближённых методов, имеющих различные качественные характеристики. Следовательно, построение и сравнение приближённых методов решения задачи определения рациональной стратегии поиска и устранения неисправности на основе моделей теории игр и марковких цепей является актуальным.

Для построения решаемой задачи рассмотрим ситуацию, когда при функционировании АСУ ТП известны (оценены): 1) состояния рассматриваемого процесса (50 - состояние, при котором АСУ ТП находится в исправном состоянии; £у— состояние, в котором АСУ ТП находится в неисправном состоянии вследствие возникновения у-ой причины и устранение этой

неисправности осуществляется на основе /-го алгоритма, I = 1, п, у = 1, т ); 2) вероятность перехода системы из исправного состояния в неисправные Р0; 3) граф состояний (рис. 1) с

Рис. 1 Граф процесса поиска и устранения неисправности АСУ ТП

Из анализа графа состояний, заданного множествами 5 и и, и представленного на рис. 1, следует, что

Чу = Ро£ Л у, * = 1, П у = 1, т (1)

где £ — вероятность выбора /-го алгоритма поиска и устранения неисправности, Л у — вероятность возникновения у-ой причины неисправности.

Возможные значения этих вероятностей образуют множества смешанных стратегий первого и второго игроков:

М^={ X = (£&... 4 )Т : £ > О, I = 1п, £ £ = 1]

/=1

m

(2)

(3)

М^=|7 = {щт -Лтп) ^0, у = 1,да, = 1|.

Поскольку рассматриваемая цепь является эргодической, то для неё могут быть определены асимптотические значения вероятностей нахождения системы в соответствующих

состояниях тт = {ж0 яия12■■■п\т ■■■Ппп$, т е. значения, не зависящие от времени и начального состояния системы. При этом вектор вероятностей п является решением системы уравнений вида

(iv- Р( X ,Y )T )-ж = 0У,

JÜV-\et, -n = 1,

(4)

где /v - единичная матрица, v = n • m + 1,dim /v = vxv, Ev ,0 , - векторы с единичными и нулевыми элементами, dim Ev = dim 0 = v, T - знак операции транспонирования, P - матрица вероятностей перехода,

^1 - Po Роб Г/1 Ро^2 ... Роб Пі ••• PoLVm^

Р( X, Y) =

P11 1 - P11

P12 0

0

1 - p12

V Jr nm

0

0

1 - p.

(5)

nm J

Обозначим элемент ж0 в решении (4), (5) через п0(X,У). Тогда ситуация равновесия в

смешанных стратегиях для антагонистическом игры определяется равенством:

maxmin п0 (X, Y)=min max п0 (X, Y),

mv

причём оптимальные смешанные стратегии игроков имеют вид:

0

0

0

( л

X = argmax шіпж0 (X,У) , (7)

м4

Vм У

(

У = argmiп шахж0 (X ,У)

V М

м,

Выражения (2) - (7) определяют математическую модель задачи нахождения оптимальной смешанной стратегии X = (Е 1 Е2... Е ) поиска и устранения неисправностей на ос-

нове цепи Маркова с теоретико-игровым определением неизвестных значений вероятностей переходов из исправного 50 в каждое из неисправных состояний 5'у, I = 1, п, у = 1, т .

Сложность решения задачи (2) - (7) связана с неявным представлением функции выигрыша первого игрока, что влечёт за собой необходимость применения итеративных методов её приближённого решения.

Достаточность такого решения может быть обоснована следующим образом: поскольку применение игровой модели связано с отсутствием (или недостаточностью) статистических

данных о вероятностях щ, у = 1, т, то по мере получения и обобщения результатов наблюдений в виде оценок У = (Щ Щ ... Щ )Г этих вероятностей, рациональное представление вектора смешанной стратегии первого игрока X* = (Е* Е*... Е*)Г возможно на основе линейной формы:

X* = (1 -Л) X* +ЯХ ,Ле[0,1], (8)

где

X = аг§ тах (я (X, У )). (9)

мЕ

При этом с ростом достоверности оценок У = (Щ Щ ... Щ )Г осуществляется увеличение параметра линейной формы Л от 0 до 1.

* * * * Г

Для поиска приближённого решения X = (Е1 Е2 . Е ) рассмотрим две методики. Первая из них основана на линейном представлении функции выигрыша.

Для её построения положим

Чу = Р0Ещ], * = 1 п°, у = 1, т , где Е ,Щ у - компоненты векторов оптимальных смешанных стратегий X ,У соответствую-

щих игроков для модели игры, определяемой матрицей А с элементами ау = я-Ц

і = 1, п, у = 1, т, Я, - стационарная вероятность нахождения системы в состоянии 50, определяемая как результат решения (4), (5) при

X = еп, і = 1п,У = ет, у = 1,т, (10)

еп ( ет ) - вектор размерности п (да), 1-й (/-й) элемент которого равен единице, а остальные -

нулю.

Ясно, что выражения для определения X*,У* зависят от выбранной конкретной модели

игры, антагонистические модели которых в наиболее полной мере представлены в монографии [1].

В частности, для модели игры вида ГА =<М|, МЩ, Н >, где

~ пт

Н = Е ЕауЕЩу ,

г=1:=1

компоненты векторов оптимальных смешанных стратегий определяются на основе решения следующих задач линейного программирования: найти

тп 1 = тт{/п X} (11)

X X

при ограничениях

> 1, у = 1т X > 0, (12)

найти

тах1 = тах{/тГ} (13)

I" У

при ограничениях

ЛУ < 1,1 = \П,У > 0, (14)

где а. > 0, I = 1, п, у = 1, т, 1п и 1т - векторы, соответствующей размерности, каждая компонента которых равна единице, , Л* -/-й столбец и /-я строка матрицы А. При этом нахо-

И« И«

ждение оптимальных смешанных стратегий X ,У и значения игры а осуществляется по выражениям:

X* =±Х‘,У = = 4* (15)

1 1 1 1

где X2, Г, 1*, 1 * - решения задач (11), (12) и (13), (14).

Относительное значение невязки, связанной с приближённым представлением функции выигрыша можно оценить по выражению

в = я*-а/я*2-100%, (16)

* / * * \ где я0 =я0(X ,У ).

Таким образом, в соответствие с первой методикой приближённое решение задачи (2) -(7) включает следующие этапы:

1. Формирование матрицы игры, определяющей функцию выигрыша первого игрока, на основе многократного решения системы линейных алгебраических уравнений (4), (5) для различных сочетаний чистых стратегий игроков (10).

2. Решение прямой и двойственной задач линейного программирования (11) - (15) с оценкой погрешности по выражению (16).

Построение второй методики основано на использовании Ц^.Ц в качестве матрицы игры для определения смешанных стратегий игроков (X, У 2), выражения для поиска которых будут совпадать с (11) - (15) с точностью до замены а. на р .

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Тогда приближённое решение задачи (2) - (7) для второй методики включает следующие этапы:

1. Решение прямой и двойственной задач линейного программирования (11) - (15) с использованием ||рг.|| в качестве матрицы игры, т.е. определение смешанных стратегий игроков (X2, У 2). Найденная смешанная стратегия первого игрока является основой для выбора стратегии поиска и устранения неисправности.

2. При необходимости оценки решения требуется: а) формирование матрицы игры, определяющей функцию выигрыша первого игрока, на основе многократного решения системы линейных алгебраических уравнений (4), (5) для различных сочетаний чистых стратегий игроков (10); б) определение математического ожидания вероятностей нахождения системы в

исправном состоянии для (X 2 ,У*); в) оценка погрешности по выражению (16).

Объём вычислений для второй методики без учёта оценки решения значительно меньше - не требуется многократного решения системы линейных алгебраических уравнений (4), (5) для различных сочетаний чистых стратегий игроков (10).

Отметим, что стационарная вероятность нахождения системы в исправном состоянии я0 зависит от известных вероятностей перехода за заданный интервал времени из неисправ-

я

я0

ных ^, г = 1, п, у = 1, т состояний в исправное (50). На основе этой зависимости могут быть поставлены оптимизационные задачи модернизации системы технического диагностирования, решение которых обеспечит максимизацию я0 по элементам р, г = 1, п, у = 1, т при ограничениях на ресурсы их изменения. При этом в полной мере может быть использован научно-методический аппарат управляемых цепей Маркова и управляемых полумарковских процессов [5].

Рассмотрим пример.

Пусть Р0 = 0,25 и

(0,95 0,70 0,85^

||р|| = 0,65 0,75 0,95 . (17)

V0,85 0,90 0,75у

Тогда на основе решения (4), (5) для всех сочетаний X = ег, г = 1, п е У = г], у = 1, т получим матрицу игры:

(0,8917 0,7368 0,7727Л 0,7222 0,7500 0,7917

0,7727 0,7826 0,75001,

V ’ ’ ’ У

при этом в результате решения задач (11) - (15) определим оптимальные смешанные стратегии игроков при применении первой методики: X* =(0,2184 0,2376 0,5440)Г,

У* = (0,1933 0,3211 0,4856)Г.

Для второй методики, решая прямую и двойственную задачи линейного программирования (11) - (15) с матрицей игры (17) получим: X* =(0,2083 0,2500 0,5417^,

У* =(0,2083 0,3333 0,4533)Г.

Оценим полученные результаты. Для этого решим (4), (5) при

X; =(0,2184 0,2376 0,5440)Г, У* =(0,1933 0,3211 0,4856^ е X* =(0,2083 0,2500 0,5417)Г,

У* =(0,2083 0,3333 0,4533)Г получим:

- стационарные значения вероятностей нахождения системы в исправном состоянии

для первого и второго приближенных подходов соответственно: я* = 0,764344 и

*

я02 = 0,764310;

- математические ожидания вероятностей нахождения системы в исправном состоянии для первого и второго приближенных подходов соответственно:

пт пт

а = ^^JяlC2Л2] = 0,764864; а2 ; = 0,764845

г=1 у=1 г=1 у=1

Тогда значения невязки (16) при применении двух методик для рассматриваемого примера составляют малые величины в ~ 0,068% и е2к 0,070%, что свидетельствует о результативности предложенных подходов.

Сравнение полученных методик позволяет сделать вывод о приблизительно равной их точности, при этом вторая методика существенно проще при реализации по объёму вычислений, особенно при больших значениях п и т.

* •

Реализация смешанной стратегии X для первой и второй методик при обнаружении факта неисправности, вызванной одной из трёх рассматриваемых причин, осуществляется путём моделирования случайных событий с соответствующими вероятностями их наступления (т.е. осуществляется выбор одного из трёх алгоритмов поиска и устранения неисправности).

Далее при достаточном объёме наблюдений могут быть получены с некоторой доверительной вероятностью оценки У = (Х Х ••• Х )Г. Пусть У = (0,5 0,2 0,3)Г. Тогда на основе

решения задачи (9) для л\ определим X = (1 0 0)Г и значение

п т

а =

Х = 0,775020. Таким образом, сравнивая значения а1 = 0,764864,

г=1 у=1

а2 = 0,764845 е а = 0,775020, можно сделать вывод: учёт дополнительной информации о вероятностях возникновения причин неисправности позволяет на основе корректировки выбора стратегий поиска и устранения неисправности (на основе выражения (8)) увеличить вероятность нахождения АСУ ТП в исправном состоянии.

Следует отметить, что применение рассмотренных методик для решения задач поиска и устранения неисправностей особенно актуально в системах дистанционного контроля с заданной периодичностью выполнения диагностических операций. Такие системы, как правило, имеют пространственную топологию и (или) большое число источников информации с малым числом каналов передачи (приёма) информации.

Поскольку полученные решения для начальных этапов эксплуатации АСУ ТП (ввод в эксплуатацию, приведение в готовность к использованию по назначению, начальный период использования АСУ ТП по назначению) основаны на применении теоретико-игровой модели они будут обладать свойством равновесия - при отклонении распределения вероятностей переходов в неисправные состояния от оптимального вероятность нахождения системы в исправном состоянии не будет уменьшаться. Таким образом, оценка этой вероятности является максимально-гарантированной.

Для основного этапа эксплуатации - использования АСУ ТП по назначению, определение стратегий поиска и устранения неисправностей осуществляется в соответствие со статистическим подходом (на основе решения задачи (9)).

Литература

1. ГОСТ Р 51901.15-2005 Менеджмент риска. Применение марковских методов. - М.: Стандартинформ, 2005.

2. Гуменюк В.М. Надёжность и диагностика электротехнических систем. 1ББК 5-75960051-6. Владивосток: Изд-во Дальневост. гос. техн. ун-та, 2010.

3. Держо Г.Г. Количественная оценка вклада систем связи в безопасность технологических процессов на железнодорожном транспорте: Монография. 1ББК 978-5-89035-407-5. М.: ГОУ Учебно-методический центр по образованию на железнодорожном транспорте, 2007.

4. Любченко А. А. Определение рациональной периодичности технического обслуживания систем связи с подвижными объектами / А. А. Любченко, Е. Ю. Копытов // Приборы и Системы. Управление, контроль, диагностика. - 2012. - № 1. - С. 20 - 24.

5. Любченко А. А. Повышение безопасности изделий технологической радиосвязи на основе оптимизации сроков их технического обслуживания // Инженерный Вестник Дона. -2012. - № 2. (www.ivdon.ru)

6. Викторова В.С., Волик Б.Г., Степанянц А.С. Анализ надежности вычислительного управляющего комплекса методом комбинации расчетных моделей // Надёжность. 2006. № 2. С. 53 - 59.

7. Минасьянц В.Р., Стадницкий А.И. Алгоритм поиска оптимальных параметров системы синхронизации блоковых кодов // Общие вопросы радиоэлектроники. 2011. вып. 2. С. 80 -85.

8. Макаров Ю.Н., Строцев А.А. Методология исследования сложных организационнотехнических систем, функционирующих в конкурентной среде при ограниченных ресурсах. Ростов-на-Дону, 2010.

9. Строцев, А. А. Применение матричных игр к задачам оптимизации программ контроля функционирования сложных систем на стадиях испытаний и начального периода экс-

плуатации / А. А. Строцев, С. В. Синицын, М. А. Кушнир // Контроль. Диагностика. - 2009. -N 1. - С. 51-57.

10. Королюк В.С. Полумарковские процессы и их применение / В.С. Королюк, С.М. Броди, А.Ф. Турбин // Итоги науки и техники. Серия: Теория вероятностей. Математическая статистика. Теоретическая кибернетика. 1974. т.11. С. 47 - 97.

i Надоели баннеры? Вы всегда можете отключить рекламу.