Раздел IV. Методы искусственного интеллекта
УДК 519.7
А .А. Айбазова ФОРМАЛИЗАЦИЯ МЕТОДА НЕЧЕТКОГО ПОИСКА В АДАПТИВНЫХ СИСТЕМАХ АВТОМАТИЧЕСКОЙ ОПТИМИЗАЦИИ
Приведена модель и структура адаптивного обучаемого нечеткого регулятора, включающая следующие элементы: блок выбора управляющих решений, блок анализа состояний, база знаний, блок коррекции знаний, блок оценки результатов управления. Рассмотрены особенности синтеза каждого из функциональных блоков системы.
Разработан алгоритм поиска последовательности оптимальных управляющих воз.
адаптивных системах автоматической оптимизации.
Автоматическая оптимизация; алгоритм поиска экстремума.
A.A. Ayibazova FORMALIZATION FUZZY SEARCH METHOD IN ADAPTIVE SYSTEMS AUTOMATIC OPTIMIZATION
A model and structure of the adaptive _ fuzzy controller trainee, which includes the _ following elements: the block selection control decisions, the unit of analysis states that the knowledge base correction block knowledge unit management evaluation. The features of the synthesis of each of the functional blocks of the system.
Developed an algorithm for finding the optimal sequence of control actions. Developed stages of the method in the algorithmic search of fuzzy adaptive systems of automatic optimization.
Automatic optimization; algorithm of searching for of the extremum.
Область применения адаптивного обучаемого нечеткого регулятора определяется задачами автоматического, либо автоматизированного контроля выходного параметра ОУ в соответствии с некоторыми уставными значениями. Характеристики ОУ априори неизвестны и меняются во времени. Контроль выходного параметра осуществляется в соответствии с заданными экспертами правилами эксплуатации ОУ и результатов анализа текущих показателей функционирования.
На рис. 1 приведена структура адаптивного обучаемого нечеткого регулятора.
yt
оценки результатов управления позволяют получить сигнал оценки предыдущего управления ut-1 и выработать результат сравнения в виде переменной zt, который подается в блок коррекции базы знаний. Блок анализа состояний распознает со-
xt , ,
, xt, -
ut.
Модель адаптивного обучаемого нечеткого регулятора задается в виде четверки множеств
(Z, L, U, Р), (1)
где Ъ - множество, на котором определено пространство входных переменных, Ц/={и7,и2,...,ип} - множество решений об управлении, Ь={Ь],Ь2,...,Ьп} - разбиение Ъ на нечеткие эталонные классы, Р - матрица-строка начальных значений степеней предпочтительного выбора управляющих решений.
Рис. 1. Адаптивный обучаемый нечеткий регулятор
Основу базы знаний составляет таблица соответствия «ситуация - решение», в которой экспертами определены правила принятия решений. Блок анализа состояний накапливает информацию о состояниях ОУ в такты времени x0, x1, x2, ..., xt, что позволяет получать статистические данные и использовать эту информацию в блоке оценки результатов управления для получения сигнала zt. Блок коррекции знаний осуществляет изменение степеней предпочтительного выбора управляю-
zt
управления. Если в такте t выбора управляющего решения ut существовал вектор P(t) значений степеней предпочтительного выбора, то для каждого (t+1)-ro такта времени принятия решения ut+1 вектор P(t+1) определится как результат воздействия оператора J на вектор P(t), т.е.
P(t+1)=J[P(t)]. (2)
Для реализации оператора J должен быть разработан соответствующий алгоритм. Этих алгоритмов может быть сколь угодно много, но к ним предъявляются следующие требования: изменение степеней предпочтения pi должно согласовываться со смыслом сигнала zt оценки результата управления; после выполненной коррекции должно выполняться условие нормирования степеней предпочтения
n
Z Pi= 1.
i=1
Например, если определить, что P0pt - некоторый неподвижный вектор сте-
, -
, (t)
t (n-1)-
m
P(t) = {<PM P2 (t), Pn(t)>, X Pi(t)=1, P(t)>0 , (3)
i=1
то форма преобразований будет иметь вид
P(t+1)=J[P(t)]=rt> (t)+(1- a)Popt, (4)
где «принимает значения из интервала [0,1]. Показано [1], что
Г[Р(г)]=сСР(г)+(1-сС)Рори (5)
т.е. компоненты вектора Р сходятся к компонентам вектора Р0рр Примером реализации оператора / является стохастическая модель обучаемости Буша-Мостеллера [2], которая задается в следующем виде:
и=(Х,У,Р), Р={рьР2,..,Рг}, ^р., р, > 0. (6)
1=1
Множество Ъ содержит два элемента г1 и г2 из следующих соображений. Модель ОУ априори неизвестна и представлена в виде множества
С=(а1,а2,...,аг), (7)
где а, 1=1,г - неизвестные коэффициенты модели.
Выходная переменная у{ и переменная состояния ОУ изменяют случайное значение критерия качества /ь принимающая значения из множества ^ которое разобьем на два подмножества ^ и ¥2.
Элементам из множества ¥1 соответствует сигнал положительной реакции 1=+1 на управления щ, вырабатываемый блоком оценки результатов управления, а элементам из множества ¥2 соответствует сигнал отрицательной реакции 1=-1 на управления щ.
Если адаптивный обучаемый нечеткий регулятор выработал управляющее решение действия ыр) (]=1,2,...,п) в такте времени г, то с вероятностью ф- он получит сигнал поощрения г1 либо с вероятностью р- сигнал наказания г2 в так те времени (г+1). Вероятности определяются по формулам:
1 + а- 1-а- (8)
Ч;=------р=------------- , (8)
1 2 1 2
. . - -
ы-.
Элементы вектора Р изменяются в зависимости от сигналов реакции по следующим правилам, представляющим собой реализацию оператора /. При сигнале поощрения 11 вероятности р, пересчитываются по формулам:
р.(г + 1)=-----^Р^----------------, р.(1 + 1)=-Р-(-)------------,] Ф [. (9)
1-(1-Р)р() ' 1-(1-Р)р() 7
При сигнале наказания г2 вероятности р, пересчитываются по формулам:
р (1 + 1)=-----СрМ--------, р (I + 1)=--------.I-------------------, - ф ., (10)
^ 1-(1-а)р1(1Г] 1-(1-а)р(1)
где свыбирается мень ше единицы, а ^больше ед иницы.
При разработке алгоритмов поиска последовательности оптимальных управляющих воздействий в системах автоматической оптимизации (САО) необходимо с требуемой точностью и быстродействием найти состояния или выходные пара, .
Для разработки алгоритмов поиска последовательности оптимальных управ-
ляющих воздействий будем считать, что модель ОУ является многопараметрической и в общем случае аналитический вид её неизвестен. Управляющие воздействия определены на множестве и=и1хи2х ... хит вектором ы1 = Ы,ы,2,...,и™},
. = 1,1, I = |и7| X\и2 |х... X |ит| , где ы,еи, ы- е и., - = 1,т. Состояния ОУ принимают значения из множества Х=Х1хХ2х ... хХп и определены в общем случае вектором хг = {х\,х1,...,хт }, / = 1,Ь, Ь = |Х^х|Х2|х...х|Хт|, где лчеХ,
хф е Х , ф = 1,п. Выходной параметр ОУ является вектором ук = { у1,у1 ,...,уГ }, который принимает значения из множества У=У1хУ2х ... хУг, причем уке У, уI е Х g = 1,г. Эффективность функционирования ОУ определяется критерием Р(Х,У), который в общем случае рассматривается, как гиперповерхность с некоторыми экстремальными областями. В силу воздействия на ОУ возмущений экстремальные области следует рассматривать, как блуждающие. В результате необходимо разработать алгоритмы поиска последовательности оптимальных управляющих воздействий, позволяющие находить и отслеживать блуждающий экстремум в многопараметрическом пространстве состояний.
Предлагается следующая последовательность этапов применения метода алгоритмизации поиска в нечетких адаптивных системах автоматической оптимизации.
1.
ОУ формально определяются базовые множества:
♦ и1,и2,.,ит для задания управляющих воздействий ы1,ы2,...,ыт, . = 1,1
I = \и\ х \и2\х... х рт\; _
♦ Х1,Х2,.,Хп для описания и измерения компонент х\,х2{ ,...,хт, I = 1,Ь
Ь = |Х;|х|Х2|х...х\Хт\ вектора состояний х ОУ;
♦ У1,У2,.,Уг для описания и измерения компонент у{,у1 ,...,ук, у I е Х g = 1,г вектора выходного параметра ук ОУ.
Исходя из сформулированных целей и структуры целеобразования осуществляется выбор частных и интегрального критерия Р(Х,У) для оценки эффективности . -ства от экстремального значения. Задается показатель I эффективности процесса слежения за блуждающим экстремумом критерия Р(Х,У), как цель эффективности .
,
для выбора правила принятия управляющих воздействий, а также правила оценки состояний и выходных параметров ОУ, полученных в результате поданных управ.
,
адаптивных САО определены базовые множества параметров ОУ, правила формирования базы данных предыстории объекта управления, оценки результатов управления и блока коррекции знаний, определено множество критериев оценки эффективности управления и требования поиска блуждающего экстремума. Всё это составляет исходные данные для алгоритмизации и последующего синтеза
( . . 1).
2.
х0 . , , -
татов предшествующих измерений, заданного начального значения критерия каче-, -ветствующих элементов и узлов ОУ в заданные состояния. В более сложном случае при качественном описании параметров состоянии ОУ начальное состояние идентифицируется с применением продукционных моделей нечеткого логического
вывода и операций дефазицикации. Результат второго этапа метода алгоритмизации поиска в нечетких адаптивных САО состоит в определении компонент
х11(10),х2(10),...,хт(10), I = ТЬ Ь = \Х}\х\Х2\х ...х\Хт\ вектора состояний
х(0)=хо О У.
Этап 3. Выполняется поиск в пространстве параметров управления и такого и0 ( ),
значения параметров управления, соответствующие экстремуму характеристики ОУ. Определяется множество допустимых последовательных алгоритмов и параметров алгоритмов поиска экстремума, отношение для выбора алгоритмов в виде соответствия
Бх£——£, (11)
где у/ф - график соответствия Уф; Б - множество состояний; £ - множество алгоритмов с последовательной процедурой принятия решений; Бх£ - область отправ-
ления соответствия Уф; £ - область прибытия соответствия Уф, а также параметров алгоритмов в виде соответствия
¥1: Б х0 — 0, (12)
где 0 - множество нечетких параметров последовательного алгоритма. Определяется множество эталонных ситуаций состояний ОУ и задается модель выбора
и0.
устойчивого поиска экстремума.
Результаты третьего этапа метода алгоритмизации поиска в нечетких адаптивных САО формально определяют множество последовательных алгоритмов поиска, множество параметров алгоритмов, область параметров управления, базу экспертных знаний для решения задачи поиска в условиях неполноты данных.
4. -
ний ф0 и задаются начальные значения параметров последовательного алгоритма .
, -
четких адаптивных САО выполнены все подготовительные работы для поиска и отслеживания экстремального значения критериальной функции Р(Х,У), как характеристики эффективности функционирования ОУ.
Этап 5. С применением выбранного начального последовательного алгоритма ф0
функции Р(Х,У) и отслеживание блуждающего экстремума до тех пор, пока отклонение значения показателя качества от экстремального значения будет находиться в пределах заданной точности.
6. -, -, -ритма ф0 принятия решений. Если коррекция параметров алгоритма возможна, то происходит изменение параметров с применением вида заданного на этапе 4 соответствия (12). После этого выполняется переход к этапу 5 метода алгоритмизации поиска в нечетких адаптивных САО. Если коррекция параметров алгоритма невозможна, то выполняется переход к следующему, седьмому этапу метода.
Этап 7. Согласно заданному на этапе 4 виду соответствия (11) осуществляет-
ф1 ,
его начальных значений параметров и выполняется переход к этапу 5 метода алгоритмизации поиска в нечетких адаптивных САО.
На данном этапе решается экстремальная задача минимизации заданного показателя I эффективности процесса слежения за блуждающим экстремумом. В случае невыполнения поставленной цели эффективности управления осуществляется переход к этапу 2 метода алгоритмизации поиска в нечетких адаптивных САО, что позволяет выполнить коррекцию начального состояния х0, определить область начального приближения и0, задать множества допустимых последовательных алгоритмов и параметров алгоритмов поиска экстремума, задать вид соответствия (11) и соответствия (12), а также задать модель выбора управляющих решений.
,
этапов метода алгоритмизации поиска в нечетких адаптивных САО полностью зависит от степени неопределенности относительно модели ОУ, цели функционирования и количественного или качественного задания параметров ОУ. Эффективность поиска блуждающего экстремума будет определена базой знаний, применяемыми последовательными алгоритмами поиска, моделями нечеткого логиче-.
задачи минимизации показателя I эффективности слежен ия за блуждающим экс, -ние экспериментов с этой моделью.
На рис. 2 приведена структура предлагаемой имитационной модели метода алгоритмизации поиска в нечетких адаптивных САО.
Начало
1
х
Подпрограммы задания базовых множеств для описания
,
выходных параметров ОУ
2
Подпрограмма задания частных и интегрального критерия оценки эффективности функционирования ОУ, требований к отклонению показателя качества от экстремального значения
3
Подпрограм ма задания цели управления в виде показателя эффективности процесса слежения за блуждающим экстремумом интегрального критерия
4
Подпрограм ма задания лингвистических и нечетких переменных для описания параметров ОУ
5
Подпрограммы моделей нечеткого логического вывода
Подпрограмма идентификации начального состояния ОУ
Подпрограмма выбора области начального приближения
Подпрограмма выбора алгоритма поиска экстремума, задания параметров алгоритма и условий устойчивого поиска экстремума
Подпрограмма поиска экстремума критериальной функции
10 .
Подпрограмма отслеживания блуждающего экстремума
Отклонение показателя качества находится в пределах заданной точности?
12
Подпрограмма коррекции параметров последовательного алгоритма принятия решений — і
Возможна коррекция параметров алгоритма?
14
Подпрограмма выбора алгоритма поиска экстремума, задания параметров алгоритма
Выполняются условия минимизации показателя эффективности процесса слежения за блуждающим экстрему мом?
Контроль времени функционирования ОУ?
Конец
9
0
0
6
7
_ 8
Рис. 2. Структура имитационной модели поиска блуждающего экстремума
Первому этапу метода алгоритмизации поиска в нечетких адаптивных САО :
♦ подпрограмма задания базовых множеств для описания управляющих воздействий, состояний и выходных параметров ОУ (см. блок 1 на рис. 2);
♦ подпрограмма задания частных и и нтегрального критерия оценки эффективности функционирования ОУ, требований к отклонению показателя качества от экстремального значения (см. блок 2 на рис. 2);
♦
процесса слежения за блуждающим экстремумом интегрального критерия (см. блок 3 на рис. 2);
♦ подпрограмма задания лингвистических и нечетких переменных для описания параметров ОУ (см. блок 4 на рис. 2);
♦ подпрограмма моделей нечеткого логического вывода (см. блок 5 на рис. 2).
Второму этапу метода алгоритмизации поиска соответствует подпрограмма идентификации начального состояния ОУ (см. блок 6 на рис. 2).
Третьему и четвертому этапам метода алгоритмизации поиска соответствует
( . 7 . 2)
подпрограмма выбора алгоритма поиска экстремума, задания параметров алгоритма и условий устойчивого поиска экстремума (см. блок 8 на рис. 2).
Пятому этапу метода алгоритмизации поиска соответствует подпрограмма
( . 9 . 2)
( . 10 . 3.7).
В подпрограмме блока 11 на рис. 2 проверяется выполнение условия возможности определения управляющих воздействий, обеспечивающих нахождение значения показателя качества в заданных границах. При выполнении данного условия продолжается процесс отслеживания блуждающего экстремума, а при невы-
12.
12 13 -
иска в нечетких адаптивных САО. Подпрограмма коррекции параметров последовательного алгоритма принятия решений решает задачи коррекции параметров согласно принятым правилам. В подпрограмме блока 13 проверяется возможность дальнейшей коррекции параметров последовательного алгоритма. Если коррекция возможна, то после коррекции выполняется переход к блоку 9 имитационной модели и выполняется поиск экстремума критериальной функции. Если коррекция невозможна, то выполняется переход к блоку 14 имитационной модели.
14 15 . 2 -
зации поиска в нечетких адаптивных САО. Подпрограмма выбора алгоритма поиска экстремума и задания параметров алгоритма предназначена для выбора последующего последовательного алгоритма принятия решений и его начальных
.
процесса слежения за блуждающим экстремумом выполняется переход к блоку 9 имитационной модели для последующего поиска экстремума критериальной функции и отслеживания его блуждания. Если же цель эффективности управления не обеспечена в данной области выбора начального приближения выбранными , ( ) 6 . ,
, ,
,
.
Таким образом, эффективность поиска определяется многими трудноформа-лизуемыми факторами, эвристическими методами и методами последовательного поиска экстремума в условиях неполноты данных относительно модели ОУ, которые должны удовлетворять следующим условиям [3]:
♦ в алгоритме поиска блуждающего экстремума, с целью оптимизации вре-
, -ритма при заданных начальных условиях;
♦ алгоритм должен устойчиво функционировать в режиме поиска блуждающего экстремума критериальной функции.
В связи с этими сформулированными требованиями выполним анализ и оценку эффективности алгоритмов принятия управляющих решений в САО, которые могут быть применены для реализации подпрограмм поиска экстремума критериальной функции и отслеживания блуждающего экстремума пятого этапа метода алгоритми. , -горитмы на основе последовательной статистической проверки гипотез [4,5].
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Срагович ВТ. Теория адаптивных систем. - М.: Наука, 1976. - 320 с.
2. Буш Р., Молтеллер Ф. Стохастические модели обучаемости. - М.: ИЛ, 1962.
3. Молчанов AM., Финаев В.И. Модели систем автоматической оптимизации с нечеткими параметрами. - Таганрог: Изд-во Технологического института ЮФУ, 2007. - 218 с.
4. Саридис Д. Самоорганизующиеся стохастические системы управления / Пер. с англ. под ред. ЯЗ. Цыпкина. - М.: Наука, 1980.
5. Красовский А.А., Буков В.Н., Шендрик B.C. Универсальные алгоритмы оптимального управления непрерывными процессами. - М.: Наука, 1977. - 272 с.
Статью рекомендовал к опубликованию д.т.н., профессор Я.Е. Ромм.
Айбазова Аминат Абдуллаховна
Карачаево-Черкесская государственная технологическая академия.
E-mail: [email protected].
357100, г. Черкесск, ул. Ставропольская, 36.
Тел.: 8782202387.
Кафедра математики; соискатель.
Ayibazova Aminat Abdullakhovna
Karachai-Cherkess State Thechnological Academy.
E-mail: [email protected].
36, Stavropolskaya Street, Cherkessk, 357100, Russia.
Phone: +7782202387.
The Department of Mathematics; Competitor.
УДК 519.7
А.А. Айбазова, ЮЛ. Заргарян
ПРИНЯТИЕ РЕШЕНИЙ ПРИ МНОГИХ КРИТЕРИЯХ В УСЛОВИЯХ НЕПОЛНОТЫ ДАННЫХ
Рассмотрена задача оптимизации, которая состоит в отыскании максимума или минимума действительной функции при действительных переменных и определении соответствующих значений аргументов на некотором множестве п-мерного пространства.
Поставлена задача оптимизации, как задача поиска максимума (минимума) многомерной целевой функции в условиях неполноты данных относительно модели объекта .
; .