Научная статья на тему 'Об оптимальном управлении периодически нестационарным обобщенным автоматом в нечетких условиях'

Об оптимальном управлении периодически нестационарным обобщенным автоматом в нечетких условиях Текст научной статьи по специальности «Математика»

CC BY
86
26
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Мосягина Е. Н.

Решена задача последовательного принятия оптимальных решений по управлению периодически нестационарным обобщенным детерминированным автоматом при задании в общем виде нечетко определенной цели и нечетких ограничений на выбор управляющих воздействий. Приведен пример решения задачи.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

On the optimal control of a periodically nonstationary generalized automaton under fuzzy conditions

The problem of sequential optimal decision making on the control of a periodically nonstationary generalized

Текст научной работы на тему «Об оптимальном управлении периодически нестационарным обобщенным автоматом в нечетких условиях»

УДК 519.71

Вестник СПбГУ. Сер. 1, 2007, вып. 4

Е. Н. Мосягина

ОБ ОПТИМАЛЬНОМ УПРАВЛЕНИИ ПЕРИОДИЧЕСКИ НЕСТАЦИОНАРНЫМ ОБОБЩЕННЫМ АВТОМАТОМ В НЕЧЕТКИХ УСЛОВИЯХ

1. Введение. В работах Р. Беллмана, Л. Заде [1] и С. А. Орловского [2] рассмотрена задача принятия оптимальных решений по воздействию на стационарный детерминированный абстрактный конечный автомат при нечетко определенной цели и простых нечетких ограничениях на входные символы. В настоящей работе подобная общая задача исследуется применительно к принципиально новой автоматной модели — периодически нестационарному обобщенному детерминированному конечному автомату [3], функционирующему в более сложных нечетких условиях.

2. Исследуемая автоматная модель. Периодически нестационарным обобщенным детерминированным конечным автоматом A„d будем называть систему

Apd = {X(t), A(t ),Y(t), aio ,f(T ),f(T ),tQ, T), (1)

где tQ —длина предпериода, T — период повторения параметров структуры автомата, т = т (t) — структурный номер такта, который определяется через текущий номер такта t = 0,1, 2 ... следующим образом:

Т = т (t) = It при t < Л (2)

Т Т() 1(t - tQ - 1)(modT) + tQ + 1 при t>tQ,

X(t), Y(t) —алфавиты входных (управляющих) и выходных символов, допустимых в г-ом такте, r = l,to + T, AtyrA—множество состояний автомата в т-ом такте, т = 0,to + T, A(to + T) = A(to\AA = {aio}; f(T\ Лт)-функции переходов и выходов автомата в т-ом структурном такте, f(T(t)) = f(T(t)) (ait-1 ,Xst) = ait, l(T(t)) = f(T(t))(ait_1 ,xst) = y it, где ait_1 G A(T(t—i)), au G A(T(t)), xst G X(tm), yit G Y<tW).

В начальный момент времени t = 0 параметры структуры автомата (1) задаются алфавитом A(Q). Далее, согласно (2), с момента времени t = 1 до t = tQ структура автомата (1) определяется алфавитами X(T), Y(T), A(T) и функциями f(T), f(T) при т = t, а с момента времени t = tQ + 1 — меняется периодически с периодом T и определяется этими алфавитами и функциями при т = (t — tQ — 1)(modT) + tQ + 1.

3. Нечеткие ограничения и нечеткая цель. В каждом текущем такте t на входной управляющий символ автомата (1) накладывается нечеткое ограничение Ct = CT(t), являющееся нечетким множеством в (A(T—1) x Y(T 1>) X Х(Т) с функцией принадлежности /jj((ai, y i),xs), ai G A(T—1), yi G Y(T—1), Xs G X(T), принимающей значения из интервала [0,1]. Кроме того для фиксированного структурного такта т = N > tQ автомата (1) задается нечеткая цель — нечеткое множество GN, определяемое функциями принадлежности Pgn (ai) и lj ,gn (yi), ai G A(N), yi G Y(N), и коэффициентами An G [0,1] относительной важности ai перед yi.

© E. H. Мосягина, 2007

4. Постановка задачи. Задан периодически нестационарный автомат Apd, структурный такт т = N и нечеткая цель, определяемая функциями принадлежности PGN(aiN), lj, gn ( y in) и коэффициентами An, Au G [0,1]. Кроме того на входные управляющие символы автомата наложены нечеткие ограничения САт\(а1, yi), Xs), т = l,to + Т. Задача заключается в нахождении множества максимизирующих решений для текущих тактов tN = N + nT, n = 0,1,..., под которым понимается множество входных управляющих последовательностей (слов в алфавите X = Ut X(T) ), каждая из которых строится при условии достижения максимально возможной степени принадлежности заданной цели с учетом полученных решений на предыдущих этапах.

5. Метод решения задачи. Прежде всего преобразуем заданную нечеткую цель GN в нечеткое множество в A(N) x Y(nK В этом случае функция принадлежности Pgn (aiN, yin) нечеткой цели GN определяется как выпуклая комбинация функций принадлежности Pgn (aiN) и Pgn (yin) следующим образом:

Pgn (aiN ,yiN ) = Aii Pgn (aiN ) + (1- Aii )Pgn (yin), Au G [0,1 ]. (3)

Решение поставленной задачи начнем с нахождения максимизирующего решения для автомата Apd с начальным состоянием aio и фиксированным временем окончания процесса tN = N + nT при n = 0. Искомое решение, аналогично представленному в [1], определим как нечеткое множество D — пересечение нечетких ограничений с заданной целью:

D = CQ П C1 П ... П CN — 1 n GN. Пусть wQ = Xsi,..., XsN — управляющее воздействие, тогда Pd(wQ) = min(Pl(aio,xs 1), . .., Pn((ain-1 ,yin-1 ),xsn),PGn(aiN,yiN)).

Необходимо найти последовательности wQ, максимизирующие Pd . Представим решение в виде XSt+1 = Kt+i(a}xt}yxt)} t = 0,N — 1, где 7rt+i —принятое правило выбора Xst+i в зависимости от (ait ,yit). Для получения как nt+1, так и максимизирующего решения, которое обозначим wM, можно применить метод обратных итераций [1]:

Pd (wQf) =

= max m axmin(Pl(aio x ),..., Pn((ain-1 ,yin-1 ),xsn ),Pgn (f(N) ,<f(N))), (4)

x S 1 ,---, xSN — 1 xSN

где (f(N\A(N>) = (ain,yin) = (f<n)(aiN— 1 ,xsn),V(N)(ain— 1 ,xsn)). Обозначим

Pgn — 1 (ai N — 1 , yiN — 1 ) = m axmn(PN ((ai N — 1 , yiN — 1 ), xs N ), Pgn (f N ), ¥>m)).

XsN

Тогда равенство (4) приводится к виду

Pd (wM) = i:nax m1n(Pl (a,io x),.. .,Pn— 1((ain—2 ,yin—2 ),xsn —1 ),Pgn— 1 (ain— 1 ,yin— 1)).

Xs1 '---XsN— 1

Повторяя процесс обратных итераций, получаем систему рекуррентных уравнений, которая дает решение задачи:

Pgn — v (ai N — v ,yiN — v ) =

= max min(PN — v+1((aiN — V , yi N— v ),xsN — v +1 ),PGn — v +1 (aiN — v +1 "N— v +1 )), (5) x.n — v +1

где ^ 1А+1>) = (а1м +1 ,у 1м +1), У = 1, N. Максимизирующее решение т// получается последовательной максимизацией величин (тм-ю, у1м-ю). Обозначим

множество таких решений через ZoN, а соответствующее им значение функции ро(ш//) через

Теперь будем рассматривать периодическую часть автомата (1) как новый автомат Л'рё. Зафиксируем время окончания процесса tN = N + Т, п = 1. В качестве начальных состояний выберем состояния, достигаемые автоматом (1) в момент времени tN = N при шм О ИоМ. Максимизирующие решения для нового автомата находятся аналогичным образом. Обозначим их через .£N(N+1'), а значение функции \0 ("№м), соответственно, через 31 Затем ищутся максимизирующие решения Z(N+т)^+2Т) для автомата Л'рй с фиксированным временем окончания процесса tN = N + 2Т, п = 2 и начальными состояниями, которые были достигнуты автоматом Лрй при tN = N + Т, и т. д. Алгоритм повторяется до тех пор, пока не найдутся такие значения к — 1, к, при которых конечные состояния а^+(к-1)Ти а^+кТсовпадут.

В общем случае для t = N + пТ, п = 0,1, 2,..., множество управляющих слов, обеспечивающих достижение максимизирующих решений в заданных условиях, будет определяться регулярным выражением

6. Пример. Задан автомат Лр^ у которого 1о = 2, Т = 3, а алфавиты входных и выходных символов Х(т), Ут), множество состояний А(т) и функции переходов

. = zoN и Z0NZN(N+Т) и . . . и ^ . . . z*N+(k-1)T)(N +кТ). Для каждого шм О \ шм \ = tN = N + пТ, значение функции принадлежности результата заданной цели определяется выражением

ггмп [/¡с; о. р-сп .-■■-, Рс;п \ при п < к, ттр^-о. ¿1,С1..... при п > к.

и выходов у

(т) ,

1, 5, задаются следующими таблицами:

Хз (а1>У1)

XI (а(,у()

Х2 (а2,у1)

XI (а 1, у2) (а3,у

1)

Х2 (а>2,у2 <'3,У3)

)

Хз (а 1 ,у 1 (а 1, У

) з)

(а 1,У з )

(7)

3

(/(2)Л(2)) а1 «2 (/(4) ,У(4)) а1

(а2,у1) (а>2,у1) Х2 (а2,У1)

Х4 (а2,уэ) (а1-У 4> Х4 (а2,У3)

(/(5)Л5)) а1 а>2

Х2 (а2,У1) (аи Уз ) (а2.у1> (а2. у 3)

Хв Хб (а1,У3) (а1,У3)

а>2

' У4)

Для структурного такта т = N = 3 > 1 о = 2 задана нечеткая цель, определяемая функциями принадлежности | О3 (тз), 1О3 (у 1з) и коэффициентами \ц:

\1 ■т У2 Уз

а \ 1 0

4 1

а2 аз 2 5 2 1

6

агз а1 а>2 аз VI з г/1 У2 Уз

Ы03(л1з) 0,6 0,3 Мс3(Л3) 0,8 0,4 0,9

аз

2

2

)

где «—» соответствует недостижимым комбинациям (а,1,у1) в (6). Также заданы нечеткие ограничения Сг на входные символы в структурных тактах г = 1, 5:

М1 Х-1 Ж2

«0 0,7 0,4 0,5

) Х2 Х-4

т) 0.9 0,8

("'2, ¿л) 0,3 0,4

.г-, х-1 .!

0,9 0.5 0,6

(«•^УО 0,4 0,7 0,9

(Я2,?/з) 0,7 0,8 о!з

1 у: 2 х.\

о/> 0,3

(«1- У>) 0.7 0,6

(«■1 ; У?,) 0.8 0,5

т) ОД 0,9

0.6 0,7

("■я: т) 0,5 0,3

МБ Х'2 а-5 Мб Х1 Х2

(«1: У А) 0,7 0,6 0,6 («•1 -.уз) 0,9 0,5 0,6

0,5 0,9 0,7 (т, у[) 0,1 0,7 0,9

(«2: УЗ) 0,4 0,7 0,5 {<'■2; уз) 0.7 0,8 0,3

(8)

где /лт = /лт((а1т-1, у1т-г), хэт). Требуется найти множество максимизирующих решений при Ь = N + п ■

Т = 3 + п ■ 3, п = 0,1,...

Сначала по формуле (3), используя (7), определим значения функции принадлежности нечеткой цели:

/лаз (аз ,у1з).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

/1Г;Я Оь?л) - 0,7, ¡¿уз [а-\, у2) 0,4,

11о% (а I - Уз) ~~ ¡.¡.^г (а-2-у-}) 0,5,

/'•г;3 ("'.ч, У1) — 0, 6,

Затем определим максимизирующее решение для случая п = 0, Ь = 1, 2, 3. Подставляя полученные значения (9) в формулу (5), находим PGt и т+1. Результаты расчетов представлены в табл. 1.

Максимизирующим решением будет единственное слово Z03 = х1х2х3, порождающее последовательность состояний аоа1а2а1 и приводящее к значению функции принадлежности заданной цели АО° = 0, 7.

Далее, в качестве нового автомата А'рй рассматривается периодическая часть автомата Арй с фиксированным временем окончания процесса tN = 6, п = 1. Функция принадлежности заданной цели РОА = РО3 определяется выражением (9). В качестве начального состояния берется состояние а1, достигнутое автоматом Арй в момент времени tN = 3. Как и в предыдущем случае задача решается последовательным применением формулы (5). Результаты расчетов представлены в табл. 2.

t т л-f 1

6 3 1'пЛ" i>?/i) = 0,7

¿<СУ?-(«Ъ!/2) -0.4

¿icv ?.(«1 .у я) -0.9 (ai-Уз) ¿■a

l-l-G'iUl-i.y-i) - 0.5

-0,6

- 0,8

5 5 l-1-ij-i 1>1. У*) - 0,(3 (ai уз) - •t'3

¡>с;2(<>J.Wl) = 0,9 я-ь [а-2 Vl) = .та («2, УД)

= 0,8 {(12 УЗ) = x2

4 4 («ъи; -0,7 (ai yi)-

[1С1 («у,?д) = 0.9 {an Vl) = Хг, X2

= 0.7 Щ {(12 УЗ) =

:i fi-( ;Д«ъ?/з) - 0,8 УЗ) - J'2 («1. :</з)

Максимизирующим решением для автомата является = х2х5х3, которое порождает последовательность

состояний а1а2а2а1. Значение функции принадлежности заданной цели определяется как Ля 1 = 0, 8.

На этом анализ заканчивается, поскольку совпали конечные состояния при к — 1 = П = 0 и к = П = 1.

Таким образом, максимизирующим решением для автомата А<г (1) является множество управляющих воздействий

Z = ZoaU Z03Z3,, = Z03(e и 13, о = 1в31\б = х1х2х3[х2х5х37 *, ^оМ = m1n[JGo ,Зе1 ] = шш[0, 7; 0, 8] = 0, 7.

Summary

E. N. Mosyagina. On the optimal control of a periodically nonstationary generalized automaton under fuzzy conditions.

The problem of sequential optimal decision making on the control of a periodically nonstationary generalized automaton with fuzzy defined goal in a general view and fuzzy restrictions on the choice of controlling is solved. The example of solving is given.

Литература

1. Беллман Р., Заде Л. Принятие решений в расплывчатых условиях // Вопросы анализа и процедуры принятия решений. М.: Мир, 1976. С. 172-215.

2. Орловский С. А. Проблемы принятия решений при нечеткой исходной информации. М.: Наука, 1981. 206 с.

3. Пономарева А. Ю., Чирков М. К. Оптимизация обобщенных автоматов с периодически меняющейся структурой. СПб., 2000. 91 с.

Статья поступила в редакцию 17 мая 2007 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.