СИСТЕМЫ УПРАВЛЕНИЯ
УДК 681.513
В. А. Серов
ГЕНЕТИЧЕСКИЕ АЛГОРИТМЫ ОПТИМИЗАЦИИ УПРАВЛЕНИЯ МНОГОКРИТЕРИАЛЬНЫМИ СИСТЕМАМИ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ НА ОСНОВЕ КОНФЛИКТНЫХ РАВНОВЕСИЙ
Приведен комплекс генетических алгоритмов многокритериальной конфликтной оптимизации, являющийся объединяющей идейной основой алгоритмизации и вычислительной технологии оптимизации управления многокритериальными системами в условиях неопределенности.
В статье рассмотрен развивающий идеологию [1-4] комплекс генетических алгоритмов (ГА) многокритериальной конфликтной оптимизации в условиях неопределенности на основе конфликтных равновесий, в частности стабильно-равновесных игровых компромиссов.
Предположим, что модель функционирования структурно-сложной системы (ССС) задана в виде коалиционной игры в условиях неопределенности
г = (м, р, {и*}к&р , Z, {Зк (и, г)}К€р , {Пк}кер) . 0)
Здесь Р — коалиционная структура множества участников конфликта М вида
Р = { К1,..., К Кг р| К = 0; У К = м| . (2)
I г=3 3=1 )
Члены коалиции объединены общими интересами: ик = П иг —
гек
множество допустимых стратегий коалиции К; вектор пк = иг г €
€ к € ик объединяет компоненты векторов допустимых стратегий подсистем (участников конфликта), образующих коалицию к; £ — неопределенный фактор, о котором лишь известно, что он принимает значения из множества Z; 3к (и, г) = (и, г) |г € к] € Етк — векторный показатель эффективности коалиции к, где 7г (и, г) — показатель эффективности г-й управляющей подсистемы, г € м;
С Етк — выпуклый конус доминирования, порождающий коалиционное отношение предпочтения для коалиции к на множестве достижимых векторных оценок 3к (и, Z).
Постановка задачи (1) является достаточно общей, так как позволяет учесть такие важные в системном аспекте признаки ССС, как многокритериально сть целей управления участников конфликта, несогласованный (конфликтный) характер взаимодействия подсистем, неопределенность среды. Сравнительный анализ различных игровых подходов к решению задачи (1) выявил необходимость дальнейшего развития концепции конфликтных равновесий.
Вместе с тем, для сложных прикладных игровых моделей характерны высокая резмерность критериального пространства и пространства управляющих параметров, а для компонентов векторных показателей эффективности коалиций (подсистем) ССС, как правило, характерны невыпуклость, нелинейность и наличие разрывов.
Перечисленные особенности задачи (1) затрудняют или делают невозможным применение известных оптимизационных методов и алгоритмов, что обусловливает актуальность формирования подходов к алгоритмизации и организации вычислительной технологии оптимизации управления многокритериальными системами в условиях неопределенности на новой объединяющей идейной основе.
Ситуацию и = [ик \К € Р] € и в игре (1) будем оценивать векторным показателем Vп (и) € Ет, который определим следующим образом:
3 (и, £) с Vп (и) + П, (3)
где П = П Пк С Ет, 3 (и, г) = [71 (и, г) , ...,Зт (и, г)]т, а для кеР
любого другого вектора V, удовлетворяющего включению
3 (и, £) с V + П, (4)
имеет место
Vп (и) - V € П\0т. (5)
При этом Vп (и) = ["(и) \ К € Р ], а Vкп (и) = [^кп (и) \ г € € К] — векторный показатель эффективности коалиции К в условиях неопределенности; Vп (и) определяет в критериальном пространстве соответствующую ситуации и в условиях неопределенности £ "наихудшую" для всех коалиций относительно конуса доминирования П точку предельной неэффективности, а компонент Vк" (и) в соответствующем подпространстве определяет векторную оценку, "наихудшую" для коалиции К относительно конуса доминирования Пк.
Эффективность применения коалицией К € Р стратегии ик € ик в игре (1) будем оценивать векторным показателем VKo (ик) =
УКпК (ик) \г € К , который определим следующим образом:
3К (ик, им\к, £) с Vк°К (ик) + Пк, (6)
а для любого другого вектора Vк, удовлетворяющего включению
3к (ик, им\к, Z) С Vк + Ок, (7)
имеет место
Ук"к(ик) - Vк € О*\0тк. (8)
Определение 1. Стратегия ик9 называется гарантирующей стратегией коалиции к относительно конуса доминирования Ок, а векторная оценка п (ик9) — векторным минимаксом относительно конуса доминирования Ок в игре (1), если для любого ик = ик9
ук"к (ик) - Ук°к (ик9) € Ок\0тк. (9)
Определение 2. Множество ик9, содержащее все ик9, обладающие свойством (9), называется множеством гарантирующих стратегий коалиции к относительно конуса доминирования Ок в игре (1).
Определение 3. Ситуация и* € и называется активным Ок-равновесием игры (1), если для любой стратегии ик € ик существует такая стратегия пм\к € им\к контркоалиции (М\к), что
гкп Л,к им/ , *ч , ок\
(ик,им€ Vк" (и*) + Ок\0тк. (10)
Определение 4. Ситуация ис € и называется обобщенным равновесием игры (1), если для любой коалиции к € Р она является активным Ок-равновесием.
Определение 5. Пусть задан вектор е = |ек |к € Р] € (—О), где ек € (-Ок). Ситуация иаек € и называется активным (екОк) -равновесием игры (1) для коалиции к € Р, если для любой стратегии ик € ик существует такая стратегия пм\к € им\к контркоалиции (м\к), что
Укп (ик, им\к) - (и-к) - ек) € Ок\0тк. (11)
Определение 6. Ситуация исе € и называется обобщенным е-равновесием игры (1), если для любой коалиции к € Р ситуация и^ является активным (екОк)-равновесием.
Определение 7. Пусть иае — множество обобщенных е-равновесий коалиционной игры в условиях неопределенности (1). Ситуация и8£ € иае называется стабильным обобщенным е-равновесием игры (1), если для любого и € иае, и = иве имеет место
Vп (и) - Vп (и5е) € О\0т. (12)
Сделаем следующее предположение, характерное для широкого класса прикладных задач.
Предположение 1. Пусть в игре (1) множества U, Z — метрические компакты; компоненты векторных функций J (u, z) G Em, Vo (u), VKO (uK), K G P — полунепрерывные снизу и ограниченные снизу функции соответственно на множествах U х Z, U, UK.
Для разработки вычислительной технологии поиска множества стабильных равновесий коалиционной игры в условиях неопределенности (1) ключевое значение имеют следующие утверждения [3, 4].
Теорема 1. Пусть выполняется предположение 1. Тогда существует обобщенное ^-равновесие игры (1).
Теорема 2. Пусть выполняется предположение 1. Для того чтобы ситуация u* G U была активным (£KQK)-равновесием игры (1) необходимо и достаточно, чтобы для любой гарантирующей стратегии uKg G UKg коалиции K G P выполнялось условие
vkoK (uKg) g (vKO (u*) - £K) + nK. (13)
Следствие 1. Для того чтобы ситуация u* являлась обобщенным £-равновесием игры (1) необходимо и достаточно, чтобы для любой коалиции K G P выполнялось условие (13).
Теорема 3. Пусть в игре (1) ситуация u* является обобщенным £-равновесием; для ситуации u G U выполняется условие
Vn (u) - Vn (u*) G П. (14)
Тогда ситуация u также является обобщенным ^-равновесием игры (1).
Теорема 4. Пусть выполняется предположение 1. Тогда множество ^^стабильных обобщенных £-равновесий игры (1) не пусто.
Теорема 5. Для того чтобы ситуация u* была стабильным обобщенным £-равновесием игры (1) необходимо и достаточно одновременного выполнения следующих условий:
VK°K (uK) G (VKO (u*) - £K) + nK, K G P; (15)
Vn (u*) G Opto (Vn (U)) , (16)
где Opto (Vo (U)) — множество оптимальных относительно конуса Q точек, построенное на множестве достижимых векторных оценок Vo (U).
В основе вычислительной технология поиска множества стабильных равновесий коалиционной игры в условиях неопределенности (1) лежит комбинированная вычислительная процедура [4], включающая в себя следующие основные этапы.
1. Построение для каждой коалиции K G P множества UKg гарантирующих стратегий, а также множества VKO (UKg) векторных минимаксов относительно конуса доминирования QK.
2. Построение множества Uc£ С U обобщенных £-равновесий игры (1), удовлетворяющего следующей системе условий:
vk°k (ukg) р| (vko (Uc£) - £K) + nK = 0, к g p. (17)
3. Построение на множестве достижимых векторных оценок Vo (U) множества Opto (Vo (U)) оптимальных по конусу Q точек.
4. Построение множества Us£ стабильных обобщенных £-равновесий вида ( )
Vo (Us£) = Opto (Vo (U)) p| Vo (Uc£). (18)
5. Уменьшение неопределенности множества стабильных обобщенных £-равновесий. Данный этап, в частности, может быть реализован, если в игре (1) существует £-равновесие относительно системы конусов доминирования, на основе которого осуществляется построение множества U С Us£, для которого
Vo(Us£) = Opto(Vo(U)) p|(Vo(U£) + П). (19)
Для эффективной реализации этапов 1-5 разработан комплекс генетических алгоритмов многокритериальной оптимизации в условиях конфликта и неопределенности.
Далее предположим, что u G U С Er — вектор управляющих параметров ССС размерности r; uK G UK С ErK — вектор управляющих параметров коалиции K размерности rK; r = ^^ rK; z G Z С Erz
KeP
— вектор неопределенных факторов размерности rz; множества U, Z заданы системами интервальных ограничений
U = {u G Er |uL ^ u ^ uH } , (20a)
Z = {z G Erz |zL ^ z ^ zh } . (20б)
Генетический алгоритм поиска множества гарантирующих стратегий коалиции в условиях неопределенности. Данный ГА применяется для реализации этапа 1 комбинированной вычислительной процедуры.
Фиксируем коалицию K G P.
Шаг 1. Определяем параметр T — максимальное число поколений тестовых точек-особей (ТТО) — "потомков". Полагаем t = 0 — номер поколения ТТО.
Шаг 2. Генерация популяции ТТО U (t) = {uKi (t), i = 1, pi}.
Шаг 3. Генерация популяции ТТО U"MXK (t) = {u(M\K)j (t),
j = 1, P2 }- _ _
Шаг 4. Генерация популяции ТТО Z (t) = {zk (t), k = 1, pz}.
Шаг 5. Полагаем г = 1.
Шаг 6. Сформируем таблицу значений векторного показателя эффективности коалиции:
тк (£) = {3к (икг (£), и(м\к)3 (£), (£)) = к = } .
(21)
По таблице (21) вычисляем точку предельной неэффективности Ук°к (икг (¿)) вида (6)-(8).
Шаг 7. Полагаем г = г + 1. Если г ^ рь то переходим к шагу 6. Иначе переходим к шагу 8.
Шаг 8. Осуществляем оценку всех (икг (¿)), г = 1,рь отно-
сительно конуса доминирования Ок. (Для это)го строим конус доминирования с вершиной в точке (икг (¿)) и при фиксированном г проверяем выполнение условия
Ук°к (икз (¿)) - Ук°к (икг (¿)) € Ок (22)
для всех ] = 1,р1, ] = г.
Обозначим Ьг (¿) число точек икз (¿) € и (¿), в которых выполняется условие (22).
Шаг 9. Вычисляем функцию пригодности вида
Ф К' (¿)) = , 1 ч., (23)
Р1 -1
где д — параметр, влияющий на скорость сходимости алгоритма. Функция пригодности (23) имеет следующие свойства. Максимальное значение функции пригодности Ф (икг (¿)) = 1 достигается при Ьг (¿) =0. Это означает, что стратегия икг (¿) имеет наилучшие гарантирующие свойства в пределах популяций ТТО и (¿),
им\к (£), ¿(¿).
Минимальное значение функции пригодности Ф (икг (¿)) = (1/2). достигается при Ьг (¿) = р1 - 1. В этом случае стратегия икг (¿) имеет наихудшие гарантирующие свойства в пределах популяций ТТО
ик (¿), им\к (¿),
Шаг 10. Если £ < Т, то переходим к шагу 11. Иначе переходим к шагу 14.
Шаг 11. С учетом значений функции пригодности (20) по известным правилам формируем из популяции и (¿) массив Л (¿) ТТО-"родителей".
Шаг 12. Применяем к массиву Л (¿) ТТО-"родителей" последовательно генетические операторы кроссовера, мутации, инверсии
(основанные на кодировании популяций ТТО с помощью бинарного кода Грея). В результате получаем новое поколение и (£ + 1) ТТО-"потомков".
Шаг 13. Полагаем t = t +1. Переходим к шагу 3.
Шаг 14. Построение множества
V™" (с/К* ф) = Ор^К {(с/К (t))} . (24)
С этой целью строим подмножество О" (t) С 17 для которого Ф (иКг = 1 при любых иКг (t) € С/ *
Полагаем, что аппроксимация множества гарантирующих страте-
Г-Г Кд гтК*
гий коалиции С- = С
Генетический алгоритм поиска множества обобщенных ¿-равновесий в условиях неопределенности. Данный ГА применяется для реализации второго этапа комбинированной вычислительной процедуры.
В результате выполнения этапа 1 для каждой коалиции К € Р имеем аппроксимацию множества гарантирующих стратегий СКд = = |иКд?, ] = 1, рК} и соответствующего ему множества векторных минимаксов
Шаг 1. Определяем параметр Т — максимальное число поколений тестовых точек-особей (ТТО)-"потомков". Полагаем t = 0 — номер поколения ТТО.
Шаг 2. Генерация популяции ТТО С/ (^ = [и1 (^ , г = 1, ри}.
Шаг 3. Генерация популяции ТТО Ё (t) = (t), к = 1, рг}.
Шаг 4. Полагаем 8 = 1 (номер коалиции).
Шаг 5. Полагаем г = 1 (номер ТТО в популяции).
Шаг 6. Сформируем таблицу значений векторного показателя эффективности ССС в виде
Тг ф = {7 (и ф , гк (t)) |к = Т7"рт} . (25)
По таблице (25) вычисляем вектор Vп (и (t)) вида (3)-(5), характеризующий точку предельной неэффективности.
Шаг 7. Выделяем в векторе Vп (иг (t)) компоненту VKs0 (иг
Шаг 8. Осуществляем сравнение множества vKsOKs (СК"д) с точкой (иг (t)) — еКа) относительно конуса доминирования 3. Для этого строим конус доминирования ПКз с вершиной в точке (и — £Ки проверяем выполнение условия
s (uKsg^ G u - ^ + пкs (26)
для всех ] = 1, Р^к^.
Обозначим Ьг, (¿) число точек икаа? € ик"д, в которых выполняется условие (26).
Шаг 9. Вычисляем функцию пригодности вида
Ф (<)) = / Ь-,«) у ■ (27) 0+^)
где д — параметр, влияющий на свойства сходимости алгоритма.
Из утверждения теоремы 2 вытекают следующие свойства функции пригодности (27).
1. Для того чтобы стратегия иг (¿) являлась активным (£к )-равновесием игры (1) в пределах популяций ТТО ¿7 (¿), ик"д, & (¿) необходимо и достаточно, чтобы максимальное значение функции пригодности Ф, (иг (¿)) = 1 при Ьг, (£) =0.
2. При Ф, (иг (¿)) < 1 стратегия иг (¿) не является активным (ек )-равновесием игры (1).
Шаг 10. Полагаем 8 = 8 + 1.
Шаг 11. Если 8 ^ /, то переходим к шагу 7. Иначе переходим к шагу 12.
Шаг 12. Сформируем из компонент вида (27) векторную функцию пригодности:
Ф (иг (¿)) = [Ф1 (иг (¿)) , ..., Фг (иг (¿))]т , (28)
имеющую следующие свойства.
1. Для того чтобы стратегия иг (¿) являлась обобщенным £-равновесием игры (1) в пределах популяций ТТО и (¿), ик"д, & (¿) необходимо и достаточно, чтобы значения компонент векторной функции пригодности одновременно принимали максимальные значения: Ф (иг (¿)) = [1, ..., 1]т = 11 при Ьг,(£) = 0 для любого 8 = 1,/.
2. При Ф (иг (¿)) < 11 стратегия иг (¿) не является обобщенным £-равновесием игры (1).
Шаг 13. Полагаем г = г + 1. Если г ^ ри, то переходим к шагу 6. Иначе переходим к шагу 14.
Шаг 14. Для каждой точки иг (¿) € и (¿) проверяем выполнение условия ( ) ( )
Ф (и (¿)) - Ф (иг (¿)) € £> (29)
для всех и (¿) € и (¿), = г.
Обозначим (¿) число точек и (¿) € и/ (£), для которых выполняется условие (29). Поставим в соответствие векторной функции
Ф (иг скалярную функцию пригодности
Ф (Ф (и(<))) = ттфау • (30)
Функция (30) имеет следующие свойства.
1. Для того чтобы стратегия иг (^ являлась обобщенным ^-равновесием игры (1) в пределах популяций ТТО С/ СК"д, . (^ необходимо и достаточно, чтобы максимальное значение функции пригодности Ф (Ф (иг (^)) = 1 при ^ (^ = 0.
2. Если Ф (Ф (иг (t))) < 1, стратегия иг (t) не является обобщенным ^-равновесием игры (1). Минимальное значение функции пригодности
Ф (Ф (иг (t))) = — при ^ (t) = ри — 1, что соответствует максимальной степени "неравновесности" стратегии иг (^ в смысле утверждения теоремы 1.
Шаг 15. Если t < Т, то переходим к шагу 16. Иначе переходим к шагу 19.
Шаг 16. С учетом значений функции пригодности (30) по известным правилам формируем из популяции и (^ массив Л (^ ТТО-"родителей".
Шаг 17. Применяем к массиву Л^) ТТО-"родителей" последовательно генетические операторы кроссовера, мутации, инверсии. В результате получаем новое поколение и ^ + 1) ТТО-"потомков".
Шаг 18. Полагаем t = t + 1. Переходим к шагу 3.
Шаг 19. Строим подмножество и * С и для элементов которого и € и * выполняется условие Ф(Ф (и (^)) = 1. Полагаем, что аппроксимация множества обобщенных е-равновесий игры (1) С-02 = С*.
Генетический алгоритм многокритериальной оптимизации в условиях неопределенности. Данный ГА применяется для реализации третьего этапа комбинированной вычислительной процедуры. Структура и особенности указанного ГА рассмотрены в работах [5, 6].
Алгоритм построения множества стабильных обобщенных ¿-равновесий в условиях неопределенности. Данный алгоритм применяется для реализации четвертого этапа комбинированной вычислительной процедуры. При этом в качестве входных данных используются результаты этапов 2 и 3:
аппроксимация С-02 множества обобщенных е-равновесий игры (1) и соответствующего ему множества Vп (С-0*); аппроксимация С-п множества оптимальных относительно конуса О решений игры (1) на множестве достижимых векторных оценок Vп (С).
Фиксируем и" е и и для каждого и02 € и проверяем выполнение условия ( )
V" (и" - V" (и"2) € О. (31)
Если условие (31) выполняется хотя бы для одного и"2 € и, то считаем, что и" — стабильное обобщенное е-равновесие игры (1).
Осуществив аналогичную проверку всех и" € и", получим аппроксимацию и,е множества стабильных обобщенных равновесий игры (1).
Генетический алгоритм построения множества е-равновесий относительно системы конусов доминирования. Данный ГА применяется для реализации пятого этапа комбинированной вычислительной процедуры как дополнительный инструмент уменьшеньшения неопределенности множества стабильных обобщенных е-равновесий игры (1). Структура и особенности указанного ГА рассмотрены в работах [6-8].
Представленный комплекс ГА был использован для решения ряда прикладных задач:
— многокритериального синтеза параметров алгоритмов нейро-управления приводом поворота промышленного робота в условиях неопределенности [5];
— исследования эффективности и безопасности эксплуатации биоресурсов природной экосистемы на основе иерархических игровых моделей [9];
— многокритериального управления потоками данных в распределенной системе мониторинга промышленных объектов в условиях конфликта и неопределенности [10];
— многокритериальной стабилизации режимов биотехнологического процесса в условиях неопределенности на основе искусственных нейронных сетей [11].
Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (грант № 07-08-00509-а).
СПИСОК ЛИТЕРАТУРЫ
1. Воронов Е. М. Методы оптимизации управления многообъектными многокритериальными системами на основе стабильно-эффективных игровых решений / Под ред. Н.Д. Егупова. - М.: Изд-во МГТУ им. Н.Э. Баумана, 2001. -576 с.
2. Смольяков Э. Р. Теория конфликтных равновесий. - Едиториал УРСС, 2005.-304 с.
3. С е р о в В. А. Стабильно-равновесное управление в иерархической игровой модели структурно-сложной системы в условиях неопределенности // Тр. Института системного анализа РАН. Динамика неоднородных систем / Под ред. Ю.С. Попкова. - М.: КомКнига, 2006. - Вып. 10 (1). - С. 64-76.
4. Серов В.А. Особенности вычислительной технологии поиска множества стабильных равновесий в коалиционной игровой модели функционирования структурно-сложной системы в условиях неопределенности // Тр. Института системного анализа РАН. Динамика неоднородных систем / Под ред. Ю.С. Попкова. - М.: КомКнига, 2006. - Вып. 10 (2).
5. С е р о в В. А., С у х а н о в Н., Холба Ю. Я. Комбинированная вычислительная процедура многокритериального синтеза параметров нейроконтроллера в адаптивной системе управления промышленным роботом // Вестник РУДН. Сер. "Инженерные исследования". - 2001. - № 1. - С. 147-158.
6. С е р о в В. А., Горячев Ю. В. Генетический алгоритм многокритериальной оптимизации // Актуальные проблемы теории и практики инженерных исследований: Сб. научн. тр. - М.: Машиностроение, 1999. - С. 23-29.
7. С е р о в В. А., Горячев Ю. В. Генетический алгоритм поиска векторного равновесия в задаче многокритериальной оптимизации в условиях конфликта // Вестник РУДН. Спец. выпуск "Инженерные исследования". - 2000. - № 1. -С. 5-10.
8. С е р о в В. А. Алгоритмическое обеспечение стабилизации обобщенного равновесия в задаче многокритериальной оптимизации в условиях конфликта // Вестник РУДН. Сер. "Кибернетика". - 1998. - № 1. - С. 43-48.
9. С е р о в В. А., И в а н о в а Г. И., С у х а н о в а Н. И. Исследование теоретико-игровой модели эксплуатации экосистемы с векторными целевыми функционалами участников // Вестник РУДН. Сер. "Инженерные исследования". - 2002. - № 2. - С. 91-95.
10. С е р о в В. А. Многокритериальное управление потоками данных в распределенной системе мониторинга в условиях конфликта // Вестник РУДН. Сер. "Инженерные исследования". - 2002. - № 2. - С. 96-101.
11. С е р о в В. А., М а л ю к Ю. А., Х о л б а Ю. Я. Применение искусственных нейронных сетей для стабилизации режимов биотехнологических процессов // Необратимые процессы в природе и технике: Тез. докл. Всеросс. конф. (Россия, Москва, 23-25 января 2001г.). - М.: Изд-во МГТУ им. Н.Э. Баумана, 2001. -С. 162.
Статья поступила в редакцию 31.05.2007
Владимир Александрович Серов родился в 1953 г., окончил МВТУ им. Н.Э. Баумана. Канд. техн. наук, доцент, докторант кафедры "Управление и моделирование систем" Московского государственного университета приборостроения и информатики. Автор более 80 научных публикаций в области теории многокритериальной оптимизации и принятия решений в условиях конфликта и неопределенности.
V.A. Serov (b. 1953) graduated from the Bauman Moscow Higher Technical School. Ph. D. (Eng.), assoc. professor, doctorate of "Control and Simulation of Systems" department of the Moscow State University for Instrument Engineering and Information Technology. Author of more than 80 publications in the field of theory of multi-objective optimization and decision making under conditions of conflict and uncertainty