Наука к Образование
МГТУ им. Н.Э. Баумана
Сетевое научное издание
Наука и Образование. МГТУ им. Н.Э. Баумана. Электрон. журн. 2015. № 04. С. 105-129.
ISSN 1994-0408
Б01: 10.7463/0415.0763768
Представлена в редакцию: Исправлена:
© МГТУ им. Н.Э. Баумана
УДК 531.36, 517.977
Об одном подходе к определению весовых коэффициентов метода пространства состояний
1 *
Романова И. К. '
18.03.2015 05.04.2015
marti2 003 iSvandex. ju
1МГТУ им. Н.Э. Баумана, Москва, Россия
Решается актуальная задача определения весовых коэффициентов метода пространства состояний, известного также как метод аналитического конструирования оптимальных регуляторов (АКОР). Отмечается общность в постановке задач многокритериальной оптимизации и метода АКОР. Сформулирована обратная задача принятому в кооперативных дифференциальных играх подходу с формированием двух квадратичных критериев качества и последующего решения совместной системы двух матричных уравнений Риккати. Предложена методика, опирающаяся на разделение и последующий совместный анализ отдельных интегральных квадратичных критериев в терминах Парето - оптимума, в частности равновесного решения по Кэли- Смородински. Для диагональных матриц весовых коэффициентов получены аналитические зависимости. Показано, что применение разработанного метода позволяет улучшить качество регулирования по сравнению с классическим подходом равновесных вкладов.
Ключевые слова: метод пространства состояний, весовые коэффициенты, многокритериальная оптимизация, Парето - оптимальные решения, синтез систем управления, летательные аппараты
1. Введение
Понятие качества управления процессами в технических и экономических сферах напрямую связано с целью управления. Оценка качества — совокупность тех показателей качества управления, которые отражают наиболее важные требования, предъявляемые к системе. Отдельные показатели, которые также называются частными критериями качества, представляют собой скалярные величины. Они могут быть собраны в единый векторный критерий. Задача обеспечения требуемого качества системы в случае нескольких критериев составляет суть задачи многокритериальной оптимизации. Как правило, эти критерии носят взаимно противоречивый характер. Предполагается, что выбранные критерии независимы и задано направление улучшения значений критериев. Задачи многокритериальной оптимизации успешно решаются в рамках теории
многокритериальной оптимизации (МКО) — математической дисциплины, базирующейся на аксиомах выбора решения и изучающей следствия этих аксиом.
Одним из часто используемых подходов к решению задач МКО является применение обобщенных критериев качества, получаемых, например, путем свертки критериев. Известны следующие методы свертки критериев: аддитивный критерий, мультипликативный критерий, максиминный критерий, определяющий критерий. Для скалярных критериев как целевых функций широко известны методы оптимизации (задача математического программирования).
Особую роль в решении задачи многокритериальной оптимизации играет метод пространства состояний или, как принято в русскоязычной литературе, метод аналитического конструирования оптимальных регуляторов (АКОР) или метод Летова -Калмана. Целевая функция, аналитический минимум которой был получен, представляла собой квадратичный функционал качества. Калман расширил класс систем, для которых возможно получение оптимального управления, включив в рассмотрение стохастические динамические системы.
На сегодняшний день существует несколько вариантов задачи АКОР.
В любом случае рассматривается векторное дифференциальное уравнение
х (г) = Л(г) х(г) + Б(г )и (г ), х(г0) = х0, ^
где Л(г) - матрица динамических параметров объекта, зависящих от времени размера пхп; Б(г) - матрица коэффициентов усиления управляющих воздействий размера пхт; и - т-мерный вектор управляющих воздействий; х(г) - п - мерный вектор фазовых координат.
Вектор наблюдений системы у(г) размерностир описывается уравнением
у(г) = С(г) х(г), (2)
где С(г) - матрица коэффициентов выхода динамической системы, которые также зависят от времени.
Варианты конкретной задачи АКОР отличаются особенностями формирования квадратичного критерия качества.
Во-первых, рассматривается задача обеспечения изменения выходных параметров у(г) (см. формулу 2) по заданной программе у*(г) (задача слежения), т.е. минимизируется интегральная оценка ошибки
е(г) = у*(г) - у(г). (3)
Соответствующий интеграл для ошибки (3) имеет вид
гк
3 (и) = 1 ет (гк )дке(гк) +1} [еТ (г №(г) + ит (г) Яи(г)
¿п
±. (4)
Здесь и далее Qk, Q - неотрицательно определенные матрицы весовых коэффициентов, Я - положительно определенная матрица весовых коэффициентов. Во-вторых, решается задача регулирования выхода системы у(г), т.е.
J (u) = 1 .у7 (tk )Qky(tk) +1 ] [yT (t )Qy(t) + uT (t) Ru(t)
t0
Наилучший результат считается достигнутым, если выполняется
У1
dt
(5)
y (t ) =
У 2
У,
^ 0
(6)
В-третьих, ставится задача удержания около нуля компонентов вектора состояния
x(t )
XCi
x
2
x
^ о
(7)
Эта задача также имеет название задачи о регуляторе состояний. Функционал представляется в виде
1 t 1 k Г t t
J(u) = -x (tk)Qkx(tk) + -J|x (t)Qx(t) + u (t)Ru(t)
2
dt
(8)
В-четвертых, ставится задача обеспечения асимптотической устойчивости системы при бесконечном времени наблюдения т.е.
J (u) = 1 ][xT (t )Qx(t ) + u (t ) Ru(t )
dt
(9)
и
lim x(t) = 0.
t
(10)
Оптимальный закон управления и0 (1), обеспечивающий минимум квадратичному критерию (9), рассчитывается по формуле
и(0 = Я1ВТ(!)К(!)х(?) = -Д0х(0;Щ) = Я-1 В(ОКО, (11)
где К(1) - решение матричного дифференциального уравнения типа Риккати
K(t) = -K(t) A(t) - AT (t)K(t) + K(t)B(t)ЛBT (t)K(t) - g, (12)
с граничным условием K (t ) = Qk . В настоящее время разработаны надежные методы решения уравнений (12) и определения оптимального управления (11).
1 Tï T
t
о
о
Квадратичный интегральный критерий качества является, по существу, одним из видов свертки частных критериев. Действительно, требования к системе могут быть представлены в виде предельно допустимых значений по отдельным фазовым координатам
Xj max и максимально допустимых сигналов управления Uj max. Очевидно, что отдельные частные требования (критерии) могут вступать в противоречие друг с другом и сверка осуществляется с помощью матриц весовых коэффициентов Qk, Q, R. Одним из распространенных способов свертки является метод равных вкладов максимальных отклонений координат и затрат на управление.
Брайсоном и Хо Ю-ши предложен подход, в соответствии с которым элементы матрицы Q рассчитываются по формуле
— = & " к) x2
\ k 0/ j max
q* ■
Элементы матрицы R определяются по формуле
= (tk ~ ^0 )U j max .
ТУ
Следует отметить, что задача выбора весовых коэффициентов в (4), (5), (8), (9), при которых бы выполнялись требования (6), (7), (10), является основной проблемой метода АКОР.
Замена векторного критерия скалярным не всегда оправданна, поскольку не в полной мере учитывает значения отдельных взаимно противоречивых критериев. Поэтому интерес представляет наряду с классическим подходом использование специальных методов многокритериальной оптимизации.
Среди многочисленных методов многокритериальной оптимизации можно выделить получение Парето - оптимальных вариантов. Предполагается при этом, что выполняются аксиомы Парето и аксиомы исключения. Напомним эти положения [1].
Аксиома Парето состоит в том, что если оценка одного из двух вариантов не хуже оценки второго варианта по всем компонентам, причем, по крайней мере, по одной из них - строго лучше, то первый вариант предпочтительнее второго, т.е.
х', х" е X, кг (х') < кг (х "), I = 1,.. т
Зк е {1,2,...,т} : Нк(х') < Нк(х") = х' ^ х"' (13)
где ^ х - бинарное отношение предпочтения определённое на , лица, принимающего
решение (ЛИР); причем, если х ^ х х , то из пары вариантов х , х ЛИР выберет первый вариант и не выберет второй.
Пусть С (X) - множество выбираемых вариантов. Аксиома исключения предполагает, что вариант, не выбираемый в какой-либо паре, не должен оказаться среди выбранных и из исходного множества возможных вариантов, т.е.
х,х" е X, х у х х" = х" £ С(X)
Принцип Эджворта - Парето, являющийся фундаментальным принципом многокритериального выбора состоит в следующем. При выполнения аксиомы Парето и аксиомы исключения для любого множества выбираемых вариантов С(Х) имеет место
включение С (X) с Р^ (X). Здесь РФ(Х) - множество Парето - оптимальных вариантов,
состоящих из точек X , таких что
X X) ={x
PV(X) = ix е X
не существуетх е X такого,что
h (х) < h (х*), i = 1,... m h(x) Ф h(x*)}.
Для представления Парето - оптимальных вариантов вводится в рассмотрение понятие границы Парето P(X), включающей в себя точки X, удовлетворяющие условиям
P(X) = {х е X : {х'е X : х'< х,х'ф х} = 0}. (15)
Актуальный обзор существующих методов решения МКО приведен в [2].
2. Обзор современных исследований на основе метода пространства
состояний
Метод пространства состояний, впервые сформулированный несколько десятилетий назад, до сих пор привлекает исследователей. Приложения метода в настоящее время весьма разнообразны. Так в [21] рассматривается проблема линейно-квадратичного оптимального управления для решения дифференциально-алгебраического уравнения. При минимальных допущениях доказывается достаточность и необходимость оптимального решения, решаются соответствующая проблема граничных значений и показывается, что такие условия для решения явного обыкновенного дифференциального уравнения эквивалентны классический проблемы линейно - квадратичного оптимального управления.
В [22] рассматривается управление минимаксной моделью с обратной связью на основе квадратичной целевой функции. Главным вкладом является разработанный алгоритм для решения минимаксной квадратичной проблемы с заданной точностью аппроксимации. Вводится понятие горизонта рекурсии, что позволяет сделать выбор между вычислительной сложностью и качеством закона управления. Статья [23] посвящена обсуждению максимально правдоподобной оценки моделей пространства состояний используя алгоритм EM (Expectation-Maximization). В [24] рассматривается прямой аналитический алгоритм для решения транспортных проблем с коэффициентами
квадратичного функционала стоимости. Алгоритм использует концепцию абсолютных точек. Полезность алгоритма обусловлена тем, что квадратичные функционалы часто используются для аппроксимации других функций.
В работе [25] унифицируется и расширяется линейный квадратичный регулятор к динамическим уравнениям во временных шкалах, связанных с линейными инвариантными во времени системами. Ищется оптимальное управление, которое минимизирует стоимостную функцию. Показывается, что если финальное состояние фиксируется, то оптимальный открытый вход определяется в терминах конечного рассогласования состояния. С другой стороны, если финальное состояние свободно, мы имеем оптимальное замкнутое управление.
Задаче изучения скорости сходимости двух стратегий оптимизации в контексте мультиагентских систем посвящена статья [26]. Анализы сходимости проводятся по минимизации квадратичных локальных стоимостных функций.
Теоретические и практические результаты применения метода пространства состояний нашли свое отражение в монографии [27].
Анализ современных публикаций, в которых так или иначе применяется поиск оптимума квадратичного стоимостного критерия показывает, что в подавляющем большинстве случаев выбор весовых матриц остается за пределами внимания исследователей.
В качестве примера публикаций, где такой вопрос все же в определенной мере поднимается, служит работа [28]. Рассматривается проблема выполнения действий на одной машине. Решается задача минимизации взвешенной общей стоимости, причем используются структурные свойства оптимальных решений, таких как ограничения порядков, т.е. достаточные условия для пары операций, которые появляются в определенном порядке и оценивается влияние различных ограничений порядка на выполнение точных алгоритмов.
Наиболее интересной с точки зрения задачи определения весовых коэффициентов является работа [29] решается обратная задача теории оптимального управления. Прямая задача формулируется как по заданным матрицам А,В и матрице коэффициентов усиления К найти необходимые и достаточные условия для К , чтобы получить оптимальное решение LQ на бесконечном времени. Обратная задача - это определение всех весовых матриц Q,R и S, таких, что обеспечивали бы заданный коэффициент усиления К. Это задача, впервые предложенная Калманом. В данной статье ставится более трудная задача, а именно, задаваясь траекториями LTI систем, определить матрицы Q,R и S , так, чтобы они генерировали такие траектории. Рассматриваются проблемы бесконечного и конечного времени. Свое развитие указанные методы получили в [30].
Тем не менее, обзор современной литературы позволяет признать, что задача определения весовых коэффициентов является по-прежнему актуальной.
3. Современная постановка задачи и обзор методов расчета весовых
коэффициентов.
В рамках данной статьи на первый план выдвигается проблема сужения множества Парето при выполнении принципа Эджворта-Парето, решению которой посвящены работы В.Д. Ногина [3-7]. Одним из методов является выбор на основе обобщённого критерия. Для некоторых комбинаций критериев можно описать все множество Парето. Наиболее простой и понятной является линейная свертка критериев [7]:
т
(*)
1=1
с возможным условием нормировки
т
IЛ = 1
г =1
Важно отметить, что всякая точка максимума на множестве X линейной свёртки критериев при > 0, г — 1,2,... т, является Парето-оптимальной. Т.е. для выбора вариантов необходимо просто выбрать коэффициенты линейной свёртки.
Часто трактуют эти коэффициенты как как веса (или «коэффициенты важности») соответствующих критериев, т.е. они задают степень влияния отдельных критериев на окончательный выбор (окончательную, или сводную оценку): чем больше коэффициент, тем больший вклад вносит соответствующий ему критерий.
Среди методов свертки критериев помимо линейной свёртки используют максиминную свертку, мультипликативную свертку, метод идеальной точки, рандомизированные стратегии, обобщенный логический критерий максимизации.
Иногда выделяют всего две группы методов получения весов. Во первых, это экспертные оценки, среди которых метод ранжирования и метод приписывания баллов. Если рассматривать результаты оценок каждого из экспертов как реализации некоторой случайной величины, то к ним можно применять методы математической статистики. Во-вторых, формальные методы определения весовых коэффициентов.
Подробная классификация методов задания и расчета весовых коэффициентов приведена в [1], где определено место указанных задач как неотъемлемой части современных информационных систем поддержки принятия решений различного назначения. Выделяются следующие методы определения относительной важности критериев:
• метод полезности (с использованием функции полезности, или ценности);
• метод взвешенного степенного среднего;
• метод взвешенной медианы;
• метод согласования кластеризованных ранжировок;
• метод попарного сравнения важности и т.д.
Сравнительный анализ указанных методов приводится в работе [8].
В современной периодике достаточно подробно описаны практические подходы к решению задачи определения весовых коэффициентов. В [9] приводится методика вычисления весовых коэффициентов важности на основе обобщенного логического критерия максимизации и соответствующий анализ свойств области эффективных решений. В [10] показано применение шкалы Фишберна, использование принципа нечеткого большинства, метода множественной регрессии. В [11] дается описание метода потенциального распределения вероятностей и дана формула оценок весовых коэффициентов. Расчет коэффициентов относительной важности приведен в [3]. В [12] дано описание применения алгоритмов АВ и АВС для расчета весовых коэффициентов групп показателей.
Очевидны проблемы, связанные с привлечением экспертных оценок, т.е. наличия определенной субъективности предпочтений. В [13] описан подход к выбору весовых коэффициентов ранговых оценок экспертов, позволяющий ЛПР увеличить степень согласованности мнений экспертов рабочей группы. В [14] разработана процедура выявления коэффициентов важности показателей, основанная на сравнении по предпочтительности векторных оценок парето -оптимальных вариантов решений с использованием нормированного коэффициента относительной важности шкал показателей. В [15] описан подход учета неопределенностей критериев и субъективности предпочтений.
В [16] предложена процедура, позволяющая оценить изменение оптимального решения при элементарном изменении экспертных суждений.
Задача МКО часто решается в рамках многокритериальной теории полезности MAUT (Multi-Attribute Utility Theory) в которой существенно используется понятие весов (коэффициентов важности) критериев. Считается, что ЛПР может найти коэффициенты -числа, которые определяют важность критериев. Важную роль в теории полезности играет метод анализа иерархий (МАИ). В общем виде постановка задачи, решаемой МАИ [17], включает цель, альтернативы и критерии оценки альтернатив; требуется выбрать наилучшую альтернативу. После построения иерархической структуры (цели - критерии -альтернативы) система парных сравнений элементов каждого уровня приводит к результату, который может быть представлен в виде обратно -симметричной матрицы A, элемент которой а есть интенсивность проявления альтернативы (элемента иерархии) i относительно альтернативы j в смысле выбранного фиксированного критерия.
Следует отметить, что подавляющее большинство работ, связанных с разработкой методов получения Парето -оптимальных решений и подчиненной задачи расчета весов, выполнено в рамках решения экономических проблем. Исключение составляют такие работы, как [18], где показано получение Парето-оптимума для управления группой мобильных роботов и [19], где решается многокритериальная динамическая задача с экспертными оценками.
Несмотря на наличие большого количества методов определения весовых коэффициентов задача по-прежнему остается актуальной. Причины не только в проблемах субъективности оценок, но и в чисто математических аспектах. В [1], [7] отмечается, что метод линейной свёртки относится к разряду не имеющих строгого обоснования
эвристических подходов, которые могут приводить к далеко не лучшим окончательным вариантам выбора. Пределы применения метода отражает лемма Карлина.
Метод парных сравнений теории полезности дает возможность применить подходы в формированию множества Эджворта -Парето при двух критериях на данном уровне иерархии.
4. Постановка задачи
В [2] автором впервые была высказана мысль о том, что в работах не прослеживается очевидная связь между интерактивными методами и классическим методом аналитического конструирования оптимальных регуляторов (АКОР), в котором ЛПР по существу задает такие же условия: назначает весовые коэффициенты частных критериев оптимальности; накладывает ограничения на значения частных критериев оптимальности; выполняет оценку предлагаемых МКО - системой альтернатив. Важным свойством интерактивных методов является то, что предпочтения ЛПР могут изменяться в процессе оптимизации.
Данная статья ставит задачей связать оба подхода к решению задачи МКО. Ожидаемым преимуществом будет совмещение аналитического решения, базирующегося на формулах метода АКОР и преодоление недостатков свертки критериев, связанных с трудностью выбора весовых коэффициентов. Новизной статьи является то, что очевидная идея отыскания отношений между весами критериев путем построения кривой безразличия (фронта Парето) применяется уже не линейной свертке критериев, имеющей свои недостатки, а к специальным видам квадратичных интегральных критериев.
5. Описание метода
Модифицируем квадратичный критерий качества, разбив его на несколько составляющих. В теории дифференциальных игр [31],[32] часто применяется разбиение на два критерия, что позволяет получить графическую интерпретацию на плоскости в координатах критерия Jl и критерия J2. В нашем случае рассмотрим интеграл от фазовых координат
*к\
йг
1 г
Зх(и) = 1 \[хт (г )Ох(г )
2 г
(16)
и интеграл от затрат на управление.
Л = 2 2
1} [ит (г) Яы(г)
йг. (17)
Поскольку часто метод применяется для стабилизации относительно опорной траектории, наглядным является представление х и и как отклонений фазовых координат и затрат на управление.
г0
Приняв матрицы весовых коэффициентов в (16) и (17) диагональными, получим под интегралом следующие соотношения
Хт
хт )<2х(£) = [х1 х2 ... хп ]
Ч1 0 0 0
0 Ч2 0 0
0 0 0
0 0 0 Чп
Хг-.
х„
=[
х„
Ч2 Х2 а х
П ^
Аналогично, для затрат на управление имеем
2 2 2 а1 Х1 + а2 Х2 + ... + апХп
и ^)Яы(1) = [м1 ы2
гж + ги +... + тит
11 2 2 т т
и
г1 0 0 0
0 г2 0 0
0 0 0
0 0 0 г т
и
и
и
(18)
(19)
Предположим, что внутри первого и второго интегралов сохраняются пропорциональные соотношения, т.е.
Чи
Г Л2
Х1тах Х
V г тах
с
а»; гп
л
и1тах
и.
V У тах у
11
или
Ч,, = К,Чп = РгЧх; Г,, = ^у Г11 =
к
Г Л2
Х1тах Х
V г тах У
; и,
и
1 тах
и
V у тах у
(20)
Выполнение соотношения (20) обеспечит сохранение равного взвешенного вклада отдельных отклонений.
Однако мы откажемся от принимаемого обычно положения о том, что суммарный вклад максимально допустимых отклонений фазовых координат должен приблизительно равняться суммарному вкладу максимально допустимых отклонений сигналов управления. Оптимальное компромиссное решение будем искать в соответствии с (13) -(15).
Теперь весовое соотношение между затратами на управление и штрафами за отклонения фазовых координат будем определять через построение линий фронта Парето.
]
2
2
Для этого используем дополнительное масштабирование о между двумя группами весовых коэффициентов, а именно
41 = °Т1. (21)
Величина а связана с компромиссом между затратами на управление и допустимыми отклонениями фазовых координат.
Тогда с учетом (18) и (19) имеем следующие выражения для интегралов (16) и (17)
1 'к Г
Л(«) = ^ Д<
2 2 2 Х1 + 42 Х2 + •••+ ЯпХп
Ж' =
= 11 [?1 х12 + ^ Х2 + ••• + 41
Ж' =
(22)
1 к Г
= 41 2
х + х2 + •••+ ^пХп
Ж'
В (22) выражение под интегралом целиком определяется заданными техническими требованиями к системе. Аналогично имеем
3
.(и) =1 \\тк
2 2
К + + ••• + ттит
1 2 2 т т
Ж' =
= 11 [и12 + Т1и2и22 + ••• + Фти2т
Ж' =
=т1 11[К
2 + и и2 + ••• + и и2
2 2 т т
Ж' •
(23)
Приняв коэффициент Гц = 1, получим по (21)
411 •
Тогда необходимо исследовать поведение оптимальной системы в соответствии с преобразованными уравнениями (22) и (23)
1 'к Г
31(и) = ^1 + ¥2+ ••• + ¥пХ1 .
Ж'
(24)
и
3
1 'и -(и) = 21К
и2 + иК2 + и и2
1 2 2 т т
Ж •
(25)
Здесь под интегралом стоят только известные из технического задания величины.
0
'
0
0
2
0
'
0
0
0
0
Очевидно, что снижения отклонений можно достичь, увеличивая затраты на управление. Для окончательного выбора компромиссного решения строятся зависимости между интегралами и 32. При этом решается обычная задача синтеза по объединённому критерию качества, на решение которой не влияет разделение общего критерия на два. Поскольку коэффициент а играет роль относительной связи между затратами на управление и отклонениями, для выбора следует рассмотреть модифицированные интегралы (24) и (25):
1 ^ Г
~ (и) = — Г Х + + •••+
2 *п
Жг
1 к г
(и)=— Ди2
32 (и) = ^ I 1и12 + и2и22 + ... + итит
(26)
(27)
которые отражают реальную картину переходных процессов в системе.
При этом внутренние коэффициенты и и2,...ит играют роль
масштабирующих факторов внутри каждого из критериев.
Полученная по (26) и (27) зависимость между и 32 имеет характер, показанный на рис. 1.
Рис. 1. Взаимозависимость квадратичных критериев 3 — и 32 при изменении величины а (стрелкой
показано направление возрастания а )
Последующий выбор оптимального решения опирается на методы анализа фронта Парето. В данной работе оптимальное решение было определено по одному из методов теории кооперативных игр [31], а именно, методу Кэли- Смородински. Исходные данные для применения этого подхода к оптимизации задавались в виде предельно допустимых значений по каждому из критериев, а также значений идеальной точки.
Качественная картина представлена на рис. 2
Рис.2. Определение оптимального решения по Кэли- Смородински:
I - идеальная точка, d - предельно допустимая точка, P - фронт Парето, S - область допустимых решений,
^ оптимальное решение.
6. Результаты расчетов
В качестве примера была выбрана модель управляемого движения летательного аппарата [20], в которой используются динамические коэффициенты а^.
х' = Ах + Ви ,
А =
("0 ( а 40 )
ал
и = [А5е ],
("а02)
("а42) а
("а04) ("а44)
0 1
а
("а10 + а1?2* а40) ("а12 + а12 * а42) (а12* а44) ("а11 " ^
В =
("а03) ("а43)
а.
(а12 * а43 а13) ,
х
= [АУ АаАвАюД и = [Аёе\
х =
<ЖАУ ЖАа <ЖА0 йЛю,
Ж
Ж
Ж
Ж
0
где матрицы А и В соответствуют общей задаче (1). Вектор фазовых переменных состоит из отклонений скорости ДF , угла атаки Да, угла наклона траектории А© и угловой скорости , одномерный вектор управления и - отклонение рулей высоты.
На рис.3 построена зависимость квадратичных критериев J 1 и J 2 для рассмотренной гипотетической модели и выполнено определение оптимального решения по Кэли- Смородински (точка К)
Л „х10"4
а
\ ......1С - а ■ .........
.....
I _________
3.6 3.8 4 4.2 4.4 4.6 4.8 х 10
Л
Рис. 3. Зависимость квадратичных критериев J\ и J2 для задачи (28) (стрелкой показано направление
увеличения коэффициента с)
Для найденной точки К оптимального решения пары критериев J\ и J2 далее по
графику зависимости любого из критериев J\ или J2 от параметра с определяется требуемое значение этой величины, в рассматриваемом примере это с=0.6.
Результат моделирования замкнутой системы с оптимальным управлением (11), полученным с использованием весовых матриц (20), (21), для одной из фазовых координат, а именно угла атаки а, показан на рис. 4. Там же приведен график изменения угла атаки при использовании управления, рассчитанного по соотношению весовых коэффициентов сШах. Соответствующие зависимости для изменения управляющих воздействий показаны на рис. 5.
0.05
а, рад
0.04
0.03
0.02
0.01
-0.01
1 1 -с
5 6 7 8 9 10
1. с
Рис. 4. Результат моделирования замкнутой системы с оптимальным управлением: сро - коэффициент, рассчитанный по оптимуму Парето; стах - максимально допустимое значение по рис.3
и о.ое
0.05
0.04
0.03
0.02
0.01
-0.01
— и так -
\ \
\
5 В 7 8 9 10
1. с
Рис. 5. Зависимость управляющего сигнала от времени для замкнутой системы с оптимальным управлением: сро - коэффициент, рассчитанный по оптимуму Парето; стах - максимально допустимое
значение по рис. 3
Можно отметить серьезное сокращение затрат на управление при использовании оптимального равновесного решения по Кэли- Смородински, полученного на основании анализа фронта Парето.
Для сравнения на рис. 6 и рис. 7 также приведены базовые решения, традиционно получаемые при использовании предложения о равных вкладах затрат на дополнительное управление и отклонений фазовых координат, т.е. при о=1.
а, рад
0.05
0.04
0.03
0.02
0.01
-0.01
V о—1
& 6 7 8 9 10
1. с
Рис. 6. Результат моделирования замкнутой системы с оптимальным управлением: сро - коэффициент, рассчитанный по оптимуму Парето; с =1-равновесный подход
0.025
0.02
0.015
0.01
0.005
-0.005
I ст-1
01234&Б789 10
1. с
Рис. 7. Зависимость управляющего сигнала от времени для замкнутой системы с оптимальным управлением: сро - коэффициент, рассчитанный по оптимуму Парето; с=1 - равновесный подход
Из рис.6 следует, что ухудшения по переходному процессу практически не произошло, но получен в соответствии с рис. 7 выигрыш по затратам на управление.
Аналогичный подход может быть применен и к разделению на пары частных критериев внутри векторного критерия, связанного с ограничениями на фазовые координаты, а также, в случае применения многомерного управления при разделении отдельных управлений. Таким образом, будет выполнен отказ от принципа равного взвешенного вклада отдельных отклонений (20) и инструмент поиска компромиссных решений станет более гибким.
7. Выводы
Получена методика определения весовых коэффициентов в методе аналитического конструирования оптимальных регуляторов, использующая построение фронта Парето и равновесного решения по одному из подходов, в частности, по Кэли- Смородински. Возможно также применение и других типов равновесных решений. Полученное решение показывает предпочтение по сравнению с традиционными подходами. Показано направление дальнейших исследований, связанное с отказом от принципа равного взвешенного вклада отдельных отклонений.
Список литературы
1. Ногин В.Д. Принятие решений при многих критериях. СПб.: Изд-во Ютас, 2007. 104 с.
2. Романова И.К. Применение аналитических методов к исследованию парето -оптимальных систем управления // Наука и образование. МГТУ им. Н.Э. Баумана. Электрон. журн. 2014. № 4. С. 238-266. DOI: 10.7463/0414.0704897
3. Ногин В.Д. Сужение множества Парето на основе информации о предпочтениях ЛПР множественно-точечного типа // Искусственный интеллект и принятие решений. 2010. № 2. С. 54-63.
4. Ногин В.Д. Аксиоматический подход к сужению множества Парето: вычислительные аспекты // International Journal "Information Theories & Applications". 2013. Vol. 20, no. 4. P. 352-359.
5. Ногин В.Д., Прасолов А.В. Многокритериальная оценка оптимальной величины импортной пошлины // Труды Института Системного Анализа РАН. 2013. Т. 63, вып.
2. С. 34-44.
6. Ногин В.Д. Границы применимости аксиоматического подхода к сужению множества Парето // International Journal "Information, Theories and Applications". 2014. Vol. 21, no.
3. P. 275-282.
7. Ногин В.Д. Линейная свертка в многокритериальной оптимизации // Искусственный интеллект и принятие решений. 2014. № 4. С. 73-82.
8. Салтыков С.А. Экспериментальное сопоставление методов взвешенной суммы, теории полезности и теории важности критериев для решения многокритериальных задач с балльными критериями // Управление большими системами: сб. тр. 2010. Вып. 29. С.16-41.
9. Шапошников Д.Е., Костина И.В. Применение обобщенного логического критерия для аппроксимации области эффективности в многокритериальных задачах оптимизации // Инженерный вестник Дона: электронный научный журнал. 2014. № 4. Режим доступа: http://ivdon.ru/ru/magazine/archive/n4y2014/2552 (дата обращения 01.03.2015).
10. Потапов Д.К., Евстафьева В.В. О методиках определения весовых коэффициентах надежности коммерческих банков // Социально-экономическое положение России в новых геополитических и финансово-экономических условиях: реалии и перспективы развития: сб. науч. ст. Вып.5 / под общ. ред. проф. В.В. Тумалева. СПб.: НОУ ВПО Институт бизнеса и права, 2008. С. 191-195. Режим доступа:
http://www.ibl.ru/konf/041208/60.pdf (дата обращения 01.03.2015).
11. Лукашевич Н. С., Гаранин Д. А. Оценка инвестиционной привлекательности проектов на основе обобщенного показателя и снижения уровня // Научно-технические ведомости Санкт-Петербургского государственного политехнического университета. Экономические науки. 2013. Т. 2, № 163. С. 103-108.
12. Некрестьянова Ю.Н. Определение весовых коэффициентов критериев эффективности инвестиций // Publishing house Education and Science s.r.o.: сайт. Режим доступа: http://www.rusnauka.com/15_NPN_2013/Economics/8_139451.doc.htm (дата обращения 01.03.2015).
13. Постников В.М., Спиридонов С.Б. Подход к расчету весовых коэффициентов ранговых оценок экспертов при выборе варианта развития информационной системы // Наука и образование. МГТУ им. Н.Э. Баумана. Электрон. журн. 2013. № 8. С. 395412. DOI: 10.7463/0813.0580272
14. Семенов А.О., Лабутин А.Н., Тараканов Д.В. Методика определения показателей предпочтительности вариантов действий по ликвидации чрезвычайных ситуаций на потенциально опасных объектах // Вестник Ивановского государственного энергетического университета. 2012. № 3. С. 51-54.
15. Яцало Б.И., Грицюк С.В., Мирзеабасов О.А., Василевская М.В. Учет неопределенностей в рамках многокритериального анализа решений с использованием концепции приемлемости // Управление большими системами: сб. тр. 2011. Вып. 32. С. 5-30.
16. Дмитриев М.Г., Ломазов В.А. Оценка чувствительности линейной свертки частных критериев при экспертном определении весовых коэффициентов // Искусственный интеллект и принятие решений. 2014. № 1. С. 52-56.
17. Колесникова С.И. Свойства корректной модификации метода парных сравнений // Интеллектуальные системы. 2010. Т. 14, № 1-4. С. 183-202.
18. Проталинский И.О. Алгоритмизация процесса нахождения парето-оптимального управления для группы мобильных роботов // «Наука вчера, сегодня, завтра»: сб. ст. по матер. V Международной научно-практической конференции (Россия, г. Новосибирск, 16 октября 2013 г.). Новосибирск: Изд-во «СибАК», 2013. С. 35-40. Режим доступа: http://sibac.info/10671 (дата обращения 01.03.2015).
19. Лобарёв Д.С. Многокритериальная динамическая задача с экспертными оценками // Молодой ученый. 2010. Т. 1, № 11. С. 32-37.
20. Романова И.К. Управление в технических системах. Ч.1. М.: Изд-во МГТУ им. Н.Э. Баумана, 2014. 120 с.
21. Backes A. A necessary optimality condition for the linear-quadratic DAE control problem. Preprint no. 03-16. Humboldt University, Institute of Mathematics, Berlin, 2003. Available at: http://www2.mathematik.hu-berlin.de/publ/pre/2003/p-list-03.html , accessed 01.03.2015. .
22. de la Pena D.M., Alamo T., Bemporad A., Camacho E.F. Feedback Min-Max Model Predictive Control Based on a Quadratic Cost Function // Proceedings of the 2006 American Control Conference, Minneapolis, Minnesota, USA, June 14-16, 2006. IEEE Publ., 2006. DOI: 10.1109/ACC.2006.1656443
23. Ho М., Shumway R., Ombao H. The State Space Approach to Modelling Dynamic Processes: Applications in Neuroscience and Social Sciences // In: Models for Intensive Longitudinal Data / ed. by T.A. Walls, J.L. Schafer. Oxford University Press, 2006. P. 148-171.
24. Adlakha V., Kowalski K. On the Quadratic Transportation Problem // Open Journal of Optimization. 2013. Vol. 2. P. 89-94. DOI: 10.4236/ojop.2013.23012
25. Bohner M., Wintz N. The Linear Quadratic Regulator on Time Scales // International Journal of Difference Equations. 2010. Vol. 5, no. 2. P. 149-174.
26. Zanella F., Varagnolo D., Cenedese A., Pillonetto G., Schenato L. The convergence rate of Newton-Raphson consensus optimization for quadratic cost functions // 2012 IEEE 51st Annual Conference on Design and Control (CDC), 2012. P. 5098-5103. DOI: 10.1109/CDC.2012.6426750
27. Tervo Kalevi. Human adaptive mechatronics methods for mobile working machines. Report 168. Helsinki University of Technology Control Engineering, 2010. 232 p.
28. Wiebke H., Tobias J. An experimental and analytical study of order constraints for single machine scheduling with quadratic cost // Proc. of the 14th Workshop on Algorithm Engineering and Experiments (ALENEX). SIAM, 2012. P. 103-117. DOI: 10.1137/1.9781611972924.11
29. Nori F., Frezza R. Linear Optimal Control Problems and Quadratic Cost Functions Estimation // Proceedings of the 12th IEEE Mediterranean Conference on Control and Automation (MED '04), June 6-9, 2004, Kusadasi, Turkey. 2004. Art. no. 1099. Available at: http://med-control.org/index_Conferences.php , accessed 01.03.2015.
30. Pauwels E., Henrion D., Lasserre J.-B. Inverse optimal control with polynomial optimization. 20 Mar 2014 // Cornell University Library: website. Available at: http://de.arxiv.org/abs/1403.5180v1 , accessed 01.03.2015.
31. Engwerda J. LQ Dynamic Optimization and Differential Games. John Wiley & Sons Ltd, 2005. 511 p.
32. Reddy P.V., Engwerda J.C. Necessary and Sufficient Conditions for Pareto Optimal Solutions of Cooperative Differential Games // IEEE Transactions on Automatic Control. 2014. Vol. 59, no. 9. P. 2536-2543. DOI: 10.1109/TAC.2014.2305933
Science and Education of the Bauman MSTU, 2015, no. 04, pp. 105-129.
Science^Education
of the Bauman MSTU
ISS N 1994-0408 © Bauman Moscow State Technical Unversity
About One Approach to Determine the Weights of the State Space Method
DOI: 10.7463/0415.0763768
Received: Revised:
18.03.2015 05.04.2015
I.K. Romanova
1,*
marti20Qj@yaridexju :Bauman Moscow State Technical University, Moscow, Russia
Keywords: the method of state space, weights, multi-objective optimization, Pareto - optimal
solutions, synthesis of control systems, aircraft, missile
The article studies methods of determining weight coefficients, also called coefficients of criteria importance in multiobjective optimization (MOO). It is assumed that these coefficients indicate a degree of individual criteria influence on the final selection (final or summary assessment): the more is coefficient, the greater is contribution of its corresponding criterion.
Today in the framework of modern information systems to support decision making for various purposes a number of methods for determining relative importance of criteria has been developed. Among those methods we can distinguish a utility method, method of weighted power average; weighted median; method of matching clustered rankings, method of paired comparison of importance, etc.
However, it should be noted that different techniques available for calculating weights does not eliminate the main problem of multicriteria optimization namely, the inconsistency of individual criteria. The basis for solving multicriteria problems is a fundamental principle of multi-criteria selection i.e. Edgeworth - Pareto principle.
Despite a large number of methods to determine the weights, the task remains relevant not only for reasons of evaluations subjectivity, but also because of the mathematical aspects. Today, recognized is the fact that, for example, such a popular method as linear convolution of private criteria, essentially, represents one of the heuristic approaches and, applying it, you can have got not the best final choice. Carlin lemma reflects the limits of the method application.
The aim of this work is to offer one of the methods to calculate the weights applied to the problem of dynamic system optimization, the quality of which is determined by the criterion of a special type, namely integral quadratic quality criterion. The main challenge relates to the method of state space, which in the literature also is called the method of analytical design of optimal controllers.
Despite the features of the problem, allowing us to obtain an analytical solution, it should be recognized that this criterion is, essentially, another form of a convolution of individual criteria. The problem to determine the weighting criteria in this quadratic convolution is still relevant and one of the main problems of the method.
The author traces the obvious connection between the interactive methods for finding Pare-to-optimal solutions of the MOO problem and the classical method for analytical design of optimal controllers (ADOC), in which decision-maker, essentially, specifies the same conditions: assigns the weights of private optimality criteria; imposes restrictions on the values of private optimality criteria; evaluates proposed MOO, using the system of alternatives. An important feature of interactive methods is that during optimization process the decision-makers' preferences may change.
The article aims to link both approaches to the MOO problem. The expected advantage is the combination of analytical solutions based on the formulas of ADOC method and overcoming the criteria convolution shortcomings because of the difficult choice of weights. The novelty of the article is that the obvious idea of finding relationships between the weights of criteria by creating an indifference curve (Pareto frontier) has been already used for the special type of quadratic integral criteria rather than for non-linear convolution of criteria that have their drawbacks.
A modification of the quadratic criterion by breaking it into several components is made. Splitting into two criteria, which allowed us to obtain a graphical interpretation on a plane in the coordinates of the criterion describing the management costs and the criterion of the phase coordinates of the control object turned to be convenient. Since the method is often used for stabilization relative to the reference trajectory, representation of x and u as deviations of the phase coordinates and management costs was visual.
The article abandoned a traditionally taken provision that the total contribution of the maximum tolerated deviations of phase coordinates should be approximately equal to the total contribution of the maximum tolerated deviations of the control signals. The optimal solution was treated as a compromise and was in accordance with the Edgeworth - Pareto principle.
A weight ratio between the management costs and penalties for deviations of the phase coordinates was determined through constructing the Pareto front lines and analysis of the Pareto front. The optimal solution was determined according to theory of cooperative games. The source data to apply this approach to the optimization were specified as maximum tolerated values for each of the criteria as well as for the values of an ideal point.
The obtained formulas and technique were applied to the synthesis of the aircraft movement control. An optimal solution was determined according to Cayley - Smorodinskii approach. Significantly reduced management costs were found through the specified optimal equilibrium solution.
It is noted that a similar approach can be also applied to the separation of private criteria into pairs within vector criterion related to restrictions on phase coordinates, as well as in the case of multidimensional control with individual control divisions. Thus, there is a possibility for renunciation of the principle of the equal weighted contribution of individual deviations, which will make the search tool for compromise solutions more flexible.
References
1. Nogin V.D. Prinyatie reshenii pri mnogikh kriteriyakh [Decision-making in many criteria]. St. Petersburg, Yutas Publ., 2007. 104 p. (in Russian).
2. Romanova I.K. The application of analytical methods to the study of Pareto - optimal control systems. Nauka i obrazovanie MGTU im. N.E. Baumana = Science and Education of the BaumanMSTU, 2014, no. 4, pp. 238-266. DOI: 10.7463/0414.0704897 (in Russian).
3. Nogin V.D. Reducing the Pareto set based on set-point information. Iskusstvennyi intellekt i prinyatie reshenii, 2010, no. 2, pp. 54-63. (English version of journal: Scientific and Technical Information Processing, 2011, vol. 38, iss. 6, pp. 435-439. DOI: 10.3103/S0147688211050078 ).
4. Nogin V.D. The axiomatic approach to narrowing the set of Pareto: computational aspects. International Journal "Information Theories & Applications", 2013, vol. 20, no. 4, pp. 352359. (in Russian).
5. Nogin V.D., Prasolov A.V. Multicriteria Evaluation of the Optimal Amount of the Import Duty. Trudy Instituta Sistemnogo Analiza RAN = Proc. of Institute of Systems Analysis of Russian Academy of Sciences, 2013, vol. 63, no. 2, pp. 34-44. (in Russian).
6. Nogin V.D. The limits of applicability of the axiomatic approach to narrowing the set of Pare-to. International Journal "Information, Theories and Applications", 2014, vol. 21, no. 3, pp. 275-282. (in Russian).
7. Nogin V.D. Weighted sum scalarization in multicriteria optimization. Iskusstvennyi intellekt i prinyatie reshenii, 2014, no. 4, pp. 73-82. (in Russian).
8. Saltykov S.A. Experimental comparison of methods of weighted sum, utility theory and criteria importance theory for the solution of multicriterial problems with score criteria. Upravlenie bol'shimi sistemami: sb. tr. = Large-scale Systems Control, 2010, iss. 29, pp. 1641. (in Russian).
9. Shaposhnikov D.E., Kostina I.V. The use of the generalized logical criterion for approximation of the efficiency area in multiobjective optimization problems. Inzhenernyi vestnik Dona = Engineering Journal of Don, 2014, no. 4. Available at:
http://ivdon.ru/ru/magazine/archive/n4y2014/2552 , accessed 01.03.2015. (in Russian).
10. Potapov D.K., Evstafeva V.V. On the methods of determining the weighting coefficient of reliability of commercial banks. Sotsial'no-ekonomicheskoe polozhenie Rossii v novykh geopoliticheskikh i finansovo-ekonomicheskikh usloviyakh: realii i perspektivy razvitiya: sb. nauch. st. Vyp.5 [Socio-economic situation of Russia in the new geopolitical, financial and economic conditions: Realities and Prospects for Development: collected scientific articles. Iss. 5]. St. Petersburg, Institute of Business and Law Publ., 2008, pp. 191-195. Available at: http://www.ibl.ru/konf/041208/60.pdf , accessed 01.03.2015. (in Russian).
11. Lukashevich N. S., Garanin D. A. The evaluation of investment attractiveness of the project using the generalized indicator and reducing the degree of subjectivity. Nauchno-
tekhnicheskie vedomosti Sankt-Peterburgskogo gosudarstvennogo politekhnicheskogo universiteta. Ekonomicheskie nauki = St. Petersburg State Polytechnical University Journal. Economics, 2013, vol. 2, no. 163, pp. 103-108. (in Russian).
12. Nekrest'yanova Yu.N. Opredelenie vesovykh koeffitsientov kriteriev effektivnosti investitsii [Weighting of the criteria of efficiency investments]. Publishing house Education and Science s.r.o.: website. Available at:
http://www.rusnauka.com/15 NPN 2013/Economics/8 139451.doc.htm , accessed 01.03.2015. (in Russian).
13. Postnikov V.M., Spiridonov S.B. Approach to calculation of weighting coefficients of experts' rank assessments when selecting a development option for an information system. Nauka i obrazovanie MGTU im. N.E. Baumana = Science and Education of the Bauman MSTU, 2013, no. 8, pp. 395-412. DOI: 10.7463/0813.0580272 (in Russian).
14. Semenov A.O., Labutin A.N., Tarakanov D.V. Calculation Method of Preference Parameters of Action Versions for Disaster Response on potentially dangerous objects. Vestnik Ivanovskogo gosudarstvennogo energeticheskogo universiteta = Vestnik IGEU, 2012, no. 3, pp. 51-54. (in Russian).
15. Yatsalo B.I., Gritsyuk S.V., Mirzeabasov O.A., Vasilevskaya M.V. Uncertainty treatment within multicriteria decision analysis with the use of acceptability concept. Upravlenie bol'shimi sistemami: sb. tr. = Large-scale Systems Control, 2011, iss. 32, pp. 5-30. (in Russian).
16. Dmitriev M.G., Lomazov V.A. Estimation of the linear convolution sensitivity of particular criteria during the expert determination of weight factors. Iskusstvennyi intellekt i prinyatie reshenii, 2014, no. 1, pp. 52-56. (English version of journal: Scientific and Technical Information Processing, 2014, vol. 41, iss. 6, pp. 400-403. DOI: 10.3103/S0147688214060033 ).
17. Kolesnikova S.I. Properties correct modification of method of paired comparisons. Intellektual'nye sistemy = Intelligent systems, 2010, vol. 14, no. 1-4, pp. 183-202. (in Russian).
18. Protalinskii I.O. Algorithmization of process of finding Pareto-optimal control for group of mobile robots. "Nauka vchera, segodnya, zavtra": sb. st. po mater. 5 Mezhdunarodnoi nauchno-prakticheskoi konferentsii ["Science: yesterday, today, tomorrow": collected articles on proc. of the 5th International scientific and practical conference], Russia, Novosibirsk, October 16, 2013. Novosibirsk, "SibAK" Publ., 2013, pp. 35-40. Available at: http://sibac.info/10671 , accessed 01.03.2015. (in Russian).
19. Lobarev D.S. Multi-criteria dynamic problem with peer review. Molodoi uchenyi = The young scientist, 2010, vol. 1, no. 11, pp. 32-37. (in Russian).
20. Romanova I.K. Upravlenie v tekhnicheskikh sistemakh. Ch.1 [Management of Engineering Systems. Pt. 1]. Moscow, Bauman MSTU Publ., 2014. 120 p. (in Russian).
21. Backes A. A necessary optimality condition for the linear-quadratic DAE control problem. Preprint no. 03-16. Humboldt University, Institute of Mathematics, Berlin, 2003. Available at:
http://www2.mathematik.hu-berlin.de/publ/pre/2003/p-list-03.html , accessed 01.03.2015. (in Russian).
22. de la Pena D.M., Alamo T., Bemporad A., Camacho E.F. Feedback Min-Max Model Predictive Control Based on a Quadratic Cost Function. Proceedings of the 2006 American Control Conference, Minneapolis, Minnesota, USA, June 14-16, 2006. IEEE Publ., 2006. DOI: 10.1109/ACC.2006.1656443
23. Ho M., Shumway R., Ombao H. The State Space Approach to Modelling Dynamic Processes: Applications in Neuroscience and Social Sciences. In: Walls T.A., Schafer J.L., eds. Models for Intensive Longitudinal Data. Oxford University Press, 2006, pp. 148-171.
24. Adlakha V., Kowalski K. On the Quadratic Transportation Problem. Open Journal of Optimization, 2013, vol. 2, pp. 89-94. DOI: 10.4236/ojop.2013.23012
25. Bohner M., Wintz N. The Linear Quadratic Regulator on Time Scales. International Journal of Difference Equations, 2010, vol. 5, no. 2, pp. 149-174.
26. Zanella F., Varagnolo D., Cenedese A., Pillonetto G., Schenato L. The convergence rate of Newton-Raphson consensus optimization for quadratic cost functions. 2012 IEEE 51st Annual Conference on Design and Control (CDC), 2012, pp. 5098-5103. DOI: 10.1109/CDC.2012.6426750
27. Tervo Kalevi. Human adaptive mechatronics methods for mobile working machines. Report 168. Helsinki University of Technology Control Engineering, 2010. 232 p.
28. Wiebke H., Tobias J. An experimental and analytical study of order constraints for single machine scheduling with quadratic cost. Proc. of the 14th Workshop on Algorithm Engineering and Experiments (ALENEX). SIAM, 2012, pp. 103-117. DOI: 10.1137/1.9781611972924.11
29. Nori F., Frezza R. Linear Optimal Control Problems and Quadratic Cost Functions Estimation. Proceedings of the 12th IEEE Mediterranean Conference on Control and Automation (MED '04), June 6-9, 2004, Kusadasi, Turkey. 2004, art. no. 1099. Available at: http://med-control.org/index Conferences.php , accessed 01.03.2015.
30. Pauwels E., Henrion D., Lasserre J.-B. Inverse optimal control with polynomial optimization. 20 Mar 2014. Cornell University Library: website. Available at: http://de.arxiv.org/abs/1403.5180v1 , accessed 01.03.2015.
31. Engwerda J. LQ Dynamic Optimization and Differential Games. John Wiley & Sons Ltd, 2005. 511 p.
32. Reddy P.V., Engwerda J.C. Necessary and Sufficient Conditions for Pareto Optimal Solutions of Cooperative Differential Games. IEEE Transactions on Automatic Control, 2014, vol. 59, no. 9, pp. 2536-2543. DOI: 10.1109/TAC.2014.2305933