ВЕСТНИК БУРЯТСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА 2/2012
УДК 517.977.5 © И.-Х.Д. Хишектуева, Д. Халтар
МЕТОД ОПТИМИЗАЦИИ ЛИНЕЙНЫХ ПАРАМЕТРОВ ДИНАМИЧЕСКИХ СИСТЕМ
Работа выполнена при финансовой поддержке РФФИ в рамках научных проектов №№ 12-01-00914-а, 12-01-98011-р_сибирь_а
Предлагается подход к оптимизации параметров систем, являющийся дальнейшим развитием методов нелокального улучшения.
Ключевые слова: управляемые системы, необходимое условие оптимальности, нелокальное улучшение.
I.-Kh.D. Khishektueva, D. Haltar
METHOD OF OPTIMIZATION OF LINEAR PARAMETERS OF DYNAMICAL SYSTEMS
An approach for optimization of system parameters is proposed. It is a further development of the methods of nonlocal improvement
Keywords: control systems, necessary condition for optimality, nonlocal improvement.
1. Постановка задачи
Рассматривается задача оптимизации динамической системы по управляющим параметрам
ф(м) = p(x(t1)) +f ((a( x(t), t), u) + d (x(t), t))dt ^ min, (1)
JT ^ ' ueU
X(t) = A(x(t), t)u + b( x(t), t), x(t0) = x0, u eU, t eT = [t0, t1], (2) в которой o(t) = (x1(t),...,xn(t)) - вектор состояния, u = (u1,...,um) - вектор управляющих параметров (управление) со значениями в компактном множестве U e Rm. Матричная функция A(x, t), векторные функции a(x, t), b(x, t), функции p(x), d(x, t) непрерывны вместе с своими производными по x по совокупности аргументов на множестве Rn х T . Начальное состояние x0 и интервал T фиксированы.
Функция Понтрягина имеет вид
H(y, x,u, t) = H0(y, x, t) + (H1(y, x, t),u),
H0(y,x, t) = (y,b(x, t)) - d(x, t), H1(y, x, t) = AT (x, t)y - a(x, t).
И.-Х.Д. Хишектуева, Д. Халтар. Метод оптимизации линейных параметров динамических систем
Введем следующие обозначения. Для допустимого управления V &и v), t еТ - решение системы (2), у^, v), t еТ - решение стандартной сопряженной системы
у (О = -Я (у^), x(t), u, t), t е T, у(^) = -рх (x(t1)) (3)
при ы = v, x(t) = x(t, v).
Частное приращение произвольной вектор-функции g(у^...,у,) по переменным у3 , у3 будем обозначать
°2 д
У5, +ДУ5,, у^2 +ду*2 g (Уl,..., у) =
(5)
= gуя1 Уз2 +ДУs2,...,у,) -g(Уl,...,У1)
Аналогично [2; 3] рассмотрим дифференциально-алгебраическую сопряженную систему
р(t) = -Я (р^), x(t), t) - г(t), (4)
(Их (р^), x(t), t), у (t) - x(t)) + (г(0, у^) - x(t)) =
= Д у (() И (р^), x(t), t)
с краевыми условиями
р(0 = -фх(x(tl)) - ч , (6)
( (x(tl)), у (tl) - x(tl)) + {ч, у (О - x(t1)) = Д у (^ р( x(t1)) . (7)
Алгебраические соотношения (5) и (7) всегда можно однозначно разрешить относительно г^), ч . Одно простое правило указано в [2]. Другое правило можно применить для квадратичной по состоянию задачи (функции А(x,^ , а(x, t), Ь(x, t), р(x), d(x, t) квадратичны по x), которое состоит в следующем представлении
г(0 = И^ (р^), x(t), w, t)(у^) - x(t)), ч = р^ (x(tl))(y(tl) - x(tl)) .
Очевидно, что при этом алгебраические соотношения удовлетворяются тождественно. Такой подход к представлению г^), ч легко обобщается на полиномиальную по состоянию задачу (1), (2). При этом дифференциально-алгебраическая сопряженная система превращается в известную модифицированную сопряженную систему [1]. Следовательно, сопряженную систему (4)-(7) можно рассматривать как обобщение известной модифицированной сопряженной системы в общей нелинейной по состоянию задаче (1), (2).
Рассматривая различные однозначные представления г^), ч , будем получать различные дифференциальные варианты сопряженной системы, решения которых для допустимых управлений ы, V будем обозначать р(^ы,V), t еТ при w = ы , x(t) = x(t,ы), y(t) = x(t,V).
Очевидно, что p(t,ы,ы) = у(^ы), t еТ .
ВЕСТНИК БУРЯТСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА 2/2012
Поставим задачу об улучшении управления и0 е и : найти управление V еи с условием АуФ(и0) < 0.
2. Метод улучшения
Управляющий вектор параметров в задаче (1), (2) рассмотрим как постоянную векторную функцию времени на интервале Т . Тогда из формулы приращения целевого функционала в задаче оптимального управления, полученной в работе [2], в качестве очевидного следствия следует формула приращения целевой функции для рассматриваемого случая
Д^(и0) = -[ Д„Н(рЦ,и0,V),х^,V),и0,t)dt. (8)
В линейной по управлению задаче (1), (2) формула приращения целевой функции принимает вид
Д^(и0) = Н1( p(t, и0, V), x(t, V), t )dt, V - и V еи . (9)
По аналогии с [1] для заданного а > 0 введем отображение
Wa(u, V) = Ри (и + а [ H1(p(t, и, V), x(t, V), t)dt), и еи, V еи. (10)
» Т
Согласно свойству проекции имеет место неравенство
Н1 (p(t,и,V),Х^,V),(и,V) - ^ > -|Уа(и,V) -и\\2. (11)
Дифференциальный принцип максимума для управления и еи с помощью отображения (10) представляется в виде
и = Уа(и,и), а > 0. (12)
Формула (9) позволяет сконструировать метод нелокального улучшения допустимого управления и0 е и в задаче (1), (2).
Проекционный метод улучшения: для заданных а > 0 и и0 е и определим оператор У1а с помощью соотношения У^^) = Уа(и0,V), Vеи и найдем решение V = v(u0) уравнения
V = Ща^). (13)
Покажем, что решение vа еи системы (13) обеспечивает улучшение. В силу свойства проекции (11) имеем
НДр^, и0, vа), х^, Vа), t)dt, vа - и ^ >-| |vа - и0||2.
Отсюда, и из формулы приращения (9), следует уменьшение целевой функции (1) с оценкой
К 112
Ф^а) -Ф(и0) <--- и0 . (14)
а11 11
Таким образом, метод нелокального улучшения заключается в поиске неподвижных точек оператора У1а .
И.-Х.Д. Хишектуева, Д. Халтар. Метод оптимизации линейных параметров динамических систем
Рассматривая различные однозначные представления r(t), q в сопряженной системе (4)-(7) будем получать модификации метода с различными однозначными операторами W". В частности, в случае квадратичной задачи (1), (2) с указанным выше представлением, предлагаемый метод совпадает с известным проекционным методом нелокального улучшения [1].
Отметим, что управление u0 е U , удовлетворяющее необходимому условию (12), является очевидным решением уравнения (13) для всех а > 0 . Обратно, если u0 является неподвижной точкой оператора W1a хотя бы
для одного а > 0, то u0 удовлетворяет необходимому условию оптимальности (12). Следовательно, справедливо следующее утверждение.
Лемма. Управление u0 е U удовлетворяет необходимому условию оптимальности (12) тогда и только тогда, когда u0 является неподвижной точкой оператора W1a хотя бы для одного а > 0 .
Таким образом, дифференциальный принцип максимума в рассматриваемой задаче можно сформулировать следующим образом: для оптимальности управления u0 е U необходимо, чтобы вектор u0 был неподвижной точкой оператора W1a хотя бы для одного а > 0 .
Метод позволяет на основе оценки (14) обосновать новое усиленное необходимое условие оптимальности: для оптимальности управления u0 е U в линейной по управлению задаче необходимо, чтобы вектор u был единственной неподвижной точкой оператора W1a для всех а > 0 .
Отсутствие неподвижных точек в процедуре нелокального улучшения свидетельствует о неоптимальности управления u0 е U в задаче (1), (2).
Метод дает возможность строго улучшать управления, удовлетворяющие дифференциальному принципу максимума. Необходимым условием строгого улучшения является неединственность неподвижных точек.
Трудоемкость построения улучшающего вектора управляющих параметров определяется трудоемкостью решения задачи о неподвижной точке определяемого оператора проектирования.
3. Примеры
Рассмотрим простые примеры, иллюстрирующие работу метода.
Пример 1 (улучшение особого управления).
1f 2
O(u) = —I ux (t)dt ^ min ,
2 0 "еи X(t) = u , x(0) = 0, u еи = [-1,1], t е T = [0,1].
Поставим задачу улучшения управления u = 0 с соответствующей фазовой траекторией x(t,u0) = 0, t е T и значением функционала O(u0) = 0 .
ВЕСТНИК БУРЯТСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА 2/2012
Применим проекционный метод улучшения. Функция Понтрягина имеет вид:
1 2
х, x(t,v) =vt, teT, veU.
H = yu-—ux . Далее
Дифференциально-алгебраическая сопряженная система принимает
вид
p (t ) = -r (t ), p(1) = -q,
г (t)vt = 0, qv = 0. Если V = 0, то получаем г^) = 0, д = 0 в соответствии с правилами [2]. Если V Ф 0, то г(0 = 0, д = 0, следовательно р ^) = 0, р(1) = 0. Отсюда р(^и0,V) = 0, t еТ .
Оператор W1'x принимает вид
W» = W a(u0, v) = i|-U]
'i(-2
a | (-^v2t2)dt
= P-u
1 2
—av 6
Таким образом, задача о неподвижной точке принимает вид
v = P
i,i]
—av 6
1 2
-1, — av2 <-1, 6
1 2
—av , 6
12
-1 <— av2 < 0.
6
Решение v = -1 реализуется при а > 6 .
Очевидное решение v = 0 имеет место при любом а > 0 . В силу леммы это означает, что исходное управление u0 = 0 удовлетворяет дифференциальному принципу максимума.
Другое ненулевое решение v = - — получаем при а > 6 .
а
Таким образом, задача о неподвижной точке допускает ненулевое решение вида v = - — при а > 6 . При этом имеет место строгое улучшение а
исходного управления u0 = 0, удовлетворяющего ДПМ, с оценкой (14). Пример 2.
1f 2
ф(н) = — I x (t)dt ^ min , 2 0
X(t) = u, x(0) = 1, u eU = [-1,1], t eT = [0,2].
1
И.-Х.Д. Хишектуева, Д. Халтар. Метод оптимизации линейных параметров динамических систем
Рассмотрим управление и0 = -1. Соответствующая фазовая траектория х(:,и0) = 1 - :, t е Т, значение целевой функции Ф(и0) = 1.
1 2
Функция Понтрягина Н = уи -—х ; х(:, V) = vt +1, t е Т, V еи,
Нх = -х, Ни = ¥ .
Для рассматриваемого примера: Нх(p(t), x(t,и0),и0, t) = -х(:,и0) = t -1, x(t, V) - х(:, и0) = t (V + 1),
Д х(^) Н (p(t), x(t, и0), и0, t) = 2(1 + v)(t 2(1 - V) - 2t).
x(t1, V) - х(^, и0) = 2(v +1).
Отсюда, дифференциально-алгебраическая система принимает вид: р(:) = 1 -1 - г (t),
1 2
t(: - 1)(v +1) + ^(:)(v +1) = - (V + 1)(t2 (1 - V) - 2t),
Р(2) = -Я, q(2v + 2) = 0.
Если V = -1, то по правилам [2] получаем г (:) = 0, я = 0 . Если V ^ -1, то я = 0.
Разрешим алгебраическое уравнение для функции г(:) г (:) = - 2 :(1 + V).
Таким образом, получаем дифференциальное уравнение р(:) = 1 - 2: + 2V:, р(2) = 0
: 2 : 2
с решением р(:,и0, V) =: - — + —— (1 + V),: еТ.
Оператор У1а принимает вид: 4 2
—V —
3 3
У» = р_и][-1 + а(-- V —)].
Отсюда получаем задачу о неподвижной точке:
ВЕСТНИК БУРЯТСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА 2/2012
4 2
V = р_и][-1 + а(- - V - -)] =
42
-1, - 1 + а(--V--) <-1,
3 3
42
1, - 1 + а(--V--) > 1,
33
4 2 4 2
-1 + а(--V--), - 1 <-1 + а(--V--) < 1.
3 3 3 3
Рассмотрим 3 случая.
42
1. Пусть V = -1. Тогда -1 + а (-—V- —) <-1. Решив неравенство, полу-2
чим —а < 0 , что противоречит условию а > 0 . Следовательно, V Ф -1. В
силу леммы это значит, что исходное управление и0 = -1 не удовлетворяет ДПМ.
42
2. Пусть V = 1. Тогда -1 + а(-~V- —) > 1. Отсюда а<-1, что также невозможно, т.к. а > 0 . Следовательно, V Ф1.
3. Пусть V = -1 + а(-—V - 2). Отсюда V =--3— = -3—а . При этом
3 3 , , 4 3 + 4а
1 + — а 3
-1 < V < 1
Таким образом, задача о неподвижной точке допускает единственное -3 - 2а
решение V =-, которое строго улучшает исходное управление
3 + 4а
и0 = -1 с оценкой (14).
Данный пример демонстрирует эффективность предлагаемого подхода по сравнению с подходом [1]. В [1] для строгого улучшения потребовалась дополнительная фазовая регуляризация целевой функции, что значительно увеличивает трудоемкость решения задачи улучшения.
Заключение
В линейной по управлению задаче оптимизации управляющих параметров построен метод нелокального улучшения на основе операции проектирования, обобщающий известный подход [1] на общие нелинейные по состоянию систему и целевую функцию (А(х,:), а(х,:), Ь(х,:), (р(х), d (х,:) нелинейны по х). Нелокальность улучшения достигается ценой решения задачи о неподвижной точке определяемого оператора проектирования. Разработанный метод позволяет улучшать экстремальные управления и получить усиленное по сравнению с дифференциальным принци-
И.-Х.Д. Хишектуева, Д. Халтар. Метод оптимизации линейных параметров динамических систем
пом максимума необходимое условие оптимальности в рассматриваемом классе задач.
Выделим основные свойства метода.
1. Нелокальность улучшения управляющих параметров без процедуры варьирования по малому параметру.
2. Возможность строгого улучшения управляющих параметров, удовлетворяющих дифференциальному принципу максимума. Такая возможность появляется в случае неединственности решения задачи о неподвижной точке.
2. Получение нового необходимого условия оптимальности, усиливающего дифференциальный принцип максимума в рассматриваемом классе задач.
Литература
1. Булдаев А.С. Методы возмущений в задачах улучшения и оптимизации управляемых систем. Улан-Удэ: Изд-во Бурят. гос. ун-та, 2008. 260 с.
2. Булдаев А.С., Моржин О.В. Улучшение управлений в нелинейных системах на основе краевых задач // Известия Иркут. гос. ун-та. Математика. 2009. Т. 2, № 1. С. 94-107.
3. Булдаев А.С., Хишектуева И.-Х.Д. Об одном методе улучшения управляющих параметров нелинейных систем // Инфокоммуникационные и вычислительные технологии и системы: материалы III Междунар. конф. (Россия, Бурятия, Улан-Удэ - оз. Байкал, 6-11 сентября 2010 г.). Улан-Удэ: Изд-во БГУ, 2010. С. 79-82.
Хишектуева Ишин-Хорло Дамбадоржиевна, аспирант кафедры прикладной математики Бурятского государственного университета, e-mail: [email protected] Халтар Дамба, старший научный сотрудник, Институт математики, Школа математики и информатики Монгольского государственного университета
Khishektueva Ishin-Khorlo Dambadorzhievna, postgraduate student, applied mathematics department, Buryat State University.
Haltar Damba, senior researcher, Institute of Mathematics, School of Mathematics and Computer Science of Mongolian State University.