ISSN 2079-3316 ПРОГРАММНЫЕ СИСТЕМЫ: ТЕОРИЯ И ПРИЛОЖЕНИЯ №1(28), 2016, с. 171-186 УДК 517.977
В. И. Гурман, И. В. Расина
Метод глобального улучшения управления для неоднородных дискретных систем
Аннотация. Рассматривается класс неоднородных дискретных систем (НДС), как широко распространенных на практике, так и получающихся при дискретизации непрерывных систем при решении задач оптимизации итерационными методами. Для указанного класса формулируются достаточные условия оптимальности в двух формах и строится аналог метода глобального улучшения Кротова. Приводится иллюстративный пример.
Ключевые слова и фразы: неоднородные дискретные системы, метод глобального улучшения, оптимальное управление.
Введение
К настоящему моменту времени в теории оптимального управления получено огромное количество теоретических результатов, включающих как необходимые, так и достаточные условия оптимальности, для самых разнообразных классов управляемых систем. Однако непосредственное использование любого из таких результатов, начиная с классики — принцип максимума Понтрягина, метод динамического программирования Беллмана, наталкивается на непреодолимые трудности разрешимости в аналитическом виде тех или иных соотношений, следующих из теории, для любой практической задачи. Поэтому теоретические результаты сопровождались построением и развитием разнообразных итерационных методов. Отследить все работы не представляется возможным, некоторое представление дает обзор [1], отталкивающийся от разработок на основе достаточных
Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований: проекты 15-01-01915_а «Приближенная оптимизация управления на основе магистральных решений», 15-01-01923_а «Конструктивные методы оптимизации управления системами неоднородной структуры», 15-07-09091_а «Приближенная оптимизация ситуационного управления». © В. И. Гурман!, И. В. Расина( , 2016
© Институт программных систем имени А. К. Айламазяна РАН!1, , 2016 © Институт проблем управления имени В. А. Трапезникова РАН( , 2016 © Программные системы: теория и приложения, 2016
условий оптимальности Кротова [2], поскольку эти условия, их аналоги и обобщения будут существенно использоваться далее. В работе рассматривается класс неоднородных дискретных управляемых систем, как продолжение исследований для непрерывных систем той же структуры.
Один из возможных подходов состоит в обобщении для них достаточных условий оптимальности Кротова [2]. За основу взята абстрактная динамическая система как многошаговая, операторы которой на разных шагах допускают различную интерпретацию [3]. В [4-7] предложена и развита математическая модель дискретно-непрерывной системы (ДНС) в виде конкретизации указанной абстрактной модели [2], применимая для широкого класса задач управления неоднородными процессами, и для нее получен аналог достаточных условий Кротова для непрерывных и дискретных систем. При таком подходе строится иерархическая модель, в которой нижний уровень представляет собой описания однородных процессов на отдельных этапах, а верхний уровень связывает эти описания в единый процесс и управляет функционированием всей системы в целом. В различных задачах управления, в частности в задачах оптимизации, оба уровня рассматриваются во взаимодействии. Заметим, что на нижнем уровне на каждом из этапов фигурировали непрерывные управляемые системы.
В данной работе рассматривается модель, в которой и на нижнем уровне, действуют дискретные управляемые системы (ДДС) [7]. Такие системы могут рассматриваться как самостоятельные «дискретно-дискретные», так и в качестве вспомогательных для ДНС с учетом естественной дискретизации непрерывных подсистем в реальных вычислениях.
Для НДС строится аналог метода глобального улучшения управления Кротова [8,9]. Рассматривается иллюстративный пример.
1. Неоднородные дискретные процессы и основные конструкции
Рассмотрим подробнее важное приложение иерархического принципа как прямой аналог динамической ДНС — двухуровневую модель, в которой нижний уровень составляют дискретные динамические
системы однородной структуры. На верхнем уровне фигурирует дискретная модель общего вида
х(к + 1) = ] (к,х(к),и(к)),
(1) к £ К = {кI, к[ + 1,...,кР },
и е и (к, х),
где к — номер шага (этапа), х и и — соответственно переменные состояния и управления произвольной природы (возможно различной) для различных к, И(&, х) — заданное при каждом к и х множество.
На некотором подмножестве К' С К, кр £ К' управление и(к) интерпретируется как пара (иу (к), та(к)). В этой паре процесс тй(к) образован парой функций (хл (к, Ь), ил(к, £)), заданных при Ь £ Т(к, г (к)), и принадлежит множеству допустимых процессов, удовлетворяющих системе
ха(к,г +1) = ¡а(к,г,г,ха(к,г),иа(к,г)), г = (к, х,и°),
(2) t £ Т = {^(г),^(г) + 1,...,1р(г)}, ха £ X(к,г,г),
иа е И (к,г,г,ха).
Здесь Хл(к, г,Ь), И^ (к,г,Ь,хл) — заданные при каждом Ь, г и хл множества. Оператор правой части (1) сводится к следующему:
/ (к,х,и) = в(г,1л(г)),
^а(г) £ Та(к,г) = {^г,ха1,гР,х%): ^ = т(к,г), хат = £(к,г),
гр = ё(к,г),хлр £ Тлр(к, г)}.
На множестве О процессов
т = (х(к), и(к), ха(к, г), иа(к, г)) ,
удовлетворяющих (1) и (2), рассматривается задача оптимального управления о минимизации концевого функционала I = Р (х (кр)) при фиксированных к[ = 0, кр, х (к[) и дополнительных ограничениях
х(к) £ Х(к).
Для решения этой задачи вводится множество Е процессов то, где исключены дискретные цепочки, и обобщенный лагранжиан по
аналогии с лагранжианом для ДНС [3,7]:
Ь = С (х (кР)) — ^ К(к,х(к),и(к))
К\К'\ кР
+ Е(°*(г) - Е К*(г,г,х*(к,г),и*(к,г))^, К' Т(г)\^
С (х) = Д (х) + р (кр, х) — (кх, х (кх)),
К (к, х,и) = (к + 1, / (к, х, и)) — (к, х),
С* (к, г, = —V (к + 1,в (к, г, ^)) + ^ (к, х (к))
+ у* (к,г,гр,хр) — (к,г,гт,х*) ,
К* (к, г, г, ха, и*) = сра (к, + 1, ¡а (к, г, г, ха, и*)) — ра(к, г, г, ха),
р* (к, г, г) = зир{Ка (к, г, г, ха, и*) : х* € Х*(к, г, г),
и* € и * (к,г,г,х*)},
I* (к, г) = М[С*(к, г, 1*): € Г*(к, г),
х* € Х*(к,г,гр)},
8ир|Д (к, х,и) : х € Х(к), и € И (к, х)}, £ € К \ К', — Ш {I * (г): х € X (к) ,иу € И (к, х)}, к € К',
I = М{С (х): х € Г П X (кр)}.
Здесь <р (к, х) — произвольный функционал, {к, г, Ь, х*) — произвольное параметрическое семейство функционалов с параметрами к и
Легко убедиться, что Ь(т) = I(т) при т € О, т. е. при выполнении отброшенных связей Ь(т) совпадает с I(т). Действительно, при т € О
Д = у (к + 1,х(к + 1)) — у (к,х), К* = ^*(к,г,Ь +1,х*(г +1)) — <р*(к,г,г,х*),
Ь = Д(х(кр)+ ^ (ср (к,х) — р (к,х)) К\К'
+ Е( Е &*(к, *, х*) — ^(к, г, х*))) .
К' Т( к,г)
Отсюда непосредственно следуют теоремы аналогичные теоремам для ДНС [3, 7].
Теорема 1. Для любого элемента то £ О и любых <р, имеет место оценка
I(то) - МI < А = I(то) - I.
Пусть имеются два процесса то1 £ О и то11 £ Е и функции <р и ^, такие, что Ь (го11) < Ь (то1) = I (то1) , и то11 £ О.
Тогда I(то11) < I(то1).
Теорема 2. Пусть имеются такие последовательность процессов {тоа} С О и функционалы <р, ^, что:
(1) К (к, ха (к) ,иа (к)) ^ ^ (к), к £ К;
(2) К1(гв,г,хЛ3 (г) ,иЛа (г)) - ц* (г3,г) ^ 0, к £ К', * £ Т (гв);
(3) СЛ (га,<у2) - 1Л (га) ^ 0, к £ К';
(4) С (Ха (гР)) ^ I.
Тогда последовательность {тоа} — минимизирующая для I на
Б.
2. Достаточные условия в форме Беллмана
Один из возможных способов задания пары (<р, ¡р^) — это потребовать выполнения условия М Ь = 0 тождественно при всех
{ти}
тох. Здесь тои = (и(к),и"(к),иЛ(к,1)), т.е. совокупность управляющих функций, принимающих значения из И, И, И^ соответственно, тох = (х(к), хЛ(к,Ь)) — совокупность траекторий верхнего и нижнего уровня. Такое требование непосредственно ведет к конкретным условиям оптимальности типа Беллмана, которые также могут быть использованы для построения эффективных итераций улучшения процесса. Пусть Тр (г) = Мп(й), в (х, = в (х, Хр) . Других ограничений на переменные состояния нет.
Получается следующая рекуррентная цепочка относительно функционалов Кротова-Беллмана двух уровней р и pjd (z):
<р (к,х) = sup <р (к + 1,f (к,х (к) ,u)), к € K \ K' \ kp,
ueu(k,x)
p (kp, x) = —F (x),
(3)
<pd(k,t) = sup <pd (k,t + 1,fd (k,t,xd (k,t) ,ud)) ,
ieud( z,t,xd)
<pd (z,tp,xp) = <p (k + 1,9 (z,xp)) ,
p (k,x)= sup pd (z,t (z) (z)), к € K', u eu (t, x)
которая разрешается в порядке следования от kp к kj.
Предположим, что решение этой цепочки (jp (к, х (к)), pd (z, t, xd)) существует и, кроме того, существуют соответствующие этому решению функции и (к, х), и" (к, х), iid (z, t, xd~), получающиеся в результате операций максимума в (3). Подставляя эти функции в правые части заданных дискретных соотношений, будем иметь:
ж (к + 1) = f (к,х (t) ,й(к,х (t))), х (к/) = х^, к € K \ K' \ кР,
х (к + 1) = 9 (к,х (к), и" (к, х (к)), jd (z)) ,
xd(k, t + 1) = fd (k,x (k), u" (k, x (k)), t, xd, iid (z(k),t, xd)) ,
tj = т (z(k)), xd (tj) = С (~z(k)),
z(k) = (k,x (k) ,uv (k,x (k)))
при к € K'. Тогда решение этой дискретно-дискретной цепочки
(х (к) ,и (к))*, к € K \ K',
(х (к) ,й(к), xd (k,t) ,ud (k,t))* , к € K', t € T (z*(k)),
если оно существует, задает в целом оптимальный «дискретно-дискретный» процесс то*. Заметим, что функцию pd(z,t,xd) в данном случае можно считать фактически не зависящей от х, поскольку она, как синтезирующая, «обслуживает» семейство задач для различных начальных условий.
3. Метод глобального улучшения
В работах [8, 9] был предложен метод глобального улучшения управления, его аналог для ДНС получен в работе [10], а модификации
u
для линейных ДНС и билинейного случая — в [11,12]. Построим теперь аналогичную процедуру для ДДС.
Предположим, что Х(к) = Мт( к), X а(г,г) = М"( к), ^ = т (г), Ьр = 3(2), х'} = £ (г), к1, XI и кр — заданы, Хр £ М"( к).
Задан элемент то1 £ О. Функции <р (к,х (к)), найдем
из условий:
(4) К(к,х(к),и1 (к)) ^ ш1п,
х
(5) С (х) ^ шах,
(6) Ка (г, г, ха (к, г), иа1 (к, г)) ^ шт,
хd
(7) ай (г,хй(гР,г)) - ^ Ка(г(к),г,ха(г,г),иа1(к,г)) ^ шах,
Т(г( к))\^ Х
где хл(Ь, г) — результат операции в (6). Минимизация и максимизация производится по областям, где ожидается прохождение улучшенной траектории. Такие области, как правило, известны в практических приложениях.
Эти условия могут быть выполнены неоднозначно и оставляют значительную свободу выбора функций ^ и Если потребовать, чтобы левые части в этих условиях не зависели от х, , то получится дискретно-дискретная цепочка относительно , описываемая уравнениями типа (3) для схемы Беллмана, не содержащими операции поиска максимума по и, ил и, следовательно, линейными относительно
у (к, х) = у (к + 1(к, х (к), и1(к))) , к £ К \ К' \ кр, (кр, х) = -Р (х),
ч>л(к,г) = у* (М + 1, (к, х (к),иа1(к)), ха (к,г)), Ч>* (г,1р ,х%) = ^ (к + 1,0 (г, Хр)) ,
V (к,х) = <р* (г,т (г) (г)), к £ К',
которая разрешается в порядке следования от кр к к1.
Пусть
й (k,x) = arg max R (к,х (к) ,u (к)),
uEU(k,x)
ud (z,t,xc) = arg max Rd {z,t,xd,ud) ,
udeud(z,t,xc)
üv (k,x) = arg min fcd(z,jd(z)) - V Rd (z,tA, weU"(к) V
У T(z(k))\tF 7
где Rd (z,t) = Rd (z,t,xd(z,t),ud (z,t,xd(z,t))).
Тогда из заданной дискретно-непрерывной системы и начальных условий при полученных управлениях находятся функции х11(к), xdII(k,t) и программы управлений:
.II ал _ „~. „II/,..vii ал _ ~v „II/
d
ии (к) = и (к, xII(k)) , uvU (к) = üv {к, xII(k))
иа11 (к, г) = йа (к, г, хи(к), ха11(к,г)),
т.е. элемент то11 , такой что I (топ) < I {то1). Повторяя итерационно эти операции, получим улучшающую последовательность {то8}. В этом случае справедливо следующее утверждение.
Теорема 3. Если элемент то1 не является решением задачи, то справедливо неравенство Ь {то1) > Ь {то11).
Доказательство. Воспользуемся фактом, что на множестве О функционалы I и Ь совпадают. Имеем
Цто11,^,^1) - Цто1,^,^1)
= С(х11) - С(х1)
- ^ к,х11(к),и11 (к),?1) - Щк, х1(к),и1(к), р1)) К\К'\ кР
+ <РЛ) - Оа(г\к), <р\ О)
К'
- ^ (в?(г11(к),г,х'а1(г),и<а1(г),<р1,<р<а)
Т(г( к))\tF
- Rd(z1 (к),г,ха1(г),иа1 (г),^1,^1)) = Дх - А2 + Д3 - Д4,
где Дх = С(х}1) - С(х}) < 0 в силу условия (5).
Д2 = (^(к,х11(к),и11(к),р1) - Е(к,х1(к),и1(к),р1))
К\К'\ кр
= ^ (К(к,х11(к),и11(к),р1) - К(к,х11(к),и1(к),р1)) К\К'\ кр
+ ^ (К(к,х11(к),и1(к),р1) - Щк,х\к),и\к),1р1))
К\К'\ кр
> 0
согласно (4). Далее имеем
Дз = ^(Сй(г11(к), рй1) - Са(г1(к), р1 ,ра1)) < 0,
К'
и
Д4 = ^ (Ка(г11(к),г,ха11(г),иа11(г),р1,ра1)
Т(г( к))\гР
- Ей(х1(к), г, Ха1(г), иа1(г), р1, рй1)) =
= ^ (Ка(г11(к),г,ха11(г),иа11(г),р1,ра1)
Т(г( к))\гр
- Ей(х11(к), г, Ха11(г), иа1(г), р1, ра1))+
+ ^ (Ка(г11(к),г,ха11(г),ис1(г),р1,ра1)
Т(г( к))\гр
- Ей(х1(к), г, Ха1(г), иа1(г), р1, рй1))
>0
в силу условий (6), (7). Тогда
Ь(то11) - Ь(т1) = Д1 - Д2 + Д3 - Д4 < 0.
□
Будем далее выполнять указанные операции приближенно в достаточно малой окрестности траектории дискретно-дискретного процесса то1. Возможны различные схемы аппроксимации.
Зададим конструкции <р и рА в виде:
<р(к, х) = ф(к)х, р(к, г, х, хй) = фа(к, г)ха + х(к, г)х,
где ф, фл, X —векторы соответствующих размеров, и рассмотрим наиболее простой вариант аппроксимаций — линейный. Тогда для выполнения условий (1) -(4) достаточно положить:
Сх = 0, Ех = 0, Д^ =0, Еах = 0, С^ = 0, Сах = 0, я
— (ф + 1, в(г, )) - ф), хар)) = 0, Где = ) = (т (г),<&Ш(г),х%).
Значения переменных здесь и ниже берутся на элементе т1 для соответствующих к и
Расшифровка указанных условий приводит к задаче Коши для НДС относительно ф, фл, X с начальными условиями на правом конце:
ф(кр ) = -Рх(х(кр)), ф(к) = Нх(ф(к + 1)),
Н(к, ф, х, и) = фТ/(к, х,и), к £ К \ К' \ кр, Ф(к) = х(^) + ) - тТнл(±1),
Ф\к,г) = н*л (ф\к,г + 1)), фа(к,гр) = Нх* (г,ф(к + 1),хр),
\(к,г) =
Х(к,1р) = Нх(ф(к + 1)) + + Ни Тх - £Нх(ф(к + 1)).
Н (г,ф,хр) = фтв(г,хр), Нл(г, г, фл, ил) = фЛТ!Л(г, г, ил), к £ К'.
Здесь для краткости в правых частях указаны лишь необходимые для понимания соотношений аргументы ф(к + 1), ф<1(к,1 + 1). Отметим, что эта система линейна, т.е. заведомо разрешается.
4. Итерационная процедура
На основе полученных соотношений можно сформулировать следующую итерационную процедуру.
(1) «Слева направо» просчитывается НДС (1), (2) при и = и,(к), и" = и" (к), ил = ид(к,Ь) и заданных начальных условиях, получается соответствующая траектория (х,(к), Хд(к,Ь)).
(2) «Справа налево» разрешается НДС относительно ф(к), фл(к,1) и
\(к,г).
(3) Находятся и, и", йл.
(4) Просчитывается «слева направо» исходная НДС (1), (2) при й, и", йл и начальном условии х(к[) = Х[.
Процесс итераций заканчивается, когда 11в+1 - 1е1 ~ 0 с заданной точностью.
Имеет место следующее утверждение о сходимости.
Теорема 4. Пусть для НДС (1), (2) построена указанная итерационная процедура, и функционал I ограничен снизу. Тогда она генерирует улучшающую последовательность элементов {то,} € О, сходящуюся по функционалу, т.е. существует число I*, такое что I* < I(то,), I(то,) ^ I*.
Доказательство. Доказательство следует непосредственно из свойства монотонности (по функционалу) рассмотренного оператора улучшения. Таким образом, получается монотонная числовая последовательность
{I,)} = {I(то,)}, 1, + 1 < I„
ограниченная снизу, которая по известной теореме анализа сходится к некоторому пределу: I, ^ I*. □
Пример 1. Проиллюстрируем один шаг метода на примере. Пусть задана неоднородная дискретная управляемая система:
х^г +1) = (х^))2 + иЛ(г), х\(г +1) = х^г),
х((0) = х%(0) = 1, 1иЛ(г)1 < 1, г = 0,1, 2;
х((г + 1) = -х((г)+ и((г), 1и((г)1 < 2, г = 3,4;
I = х±(5) ^ шт .
Нетрудно видеть, что К = 0,1, 2. Поскольку роль связующей переменной на двух рассматриваемых этапах играет хс[, то в терминах этой переменной легко записать процесс верхнего уровня: ж(0) = хс[(0,0),
х(1) = х1(0, 3), х(2) = х((1, 5), х(1) = х((0, 3) = в, х((1, 4) = х(1) = £ . Тогда I = х(2). Основные конструкции принимают вид:
на(0,г,ф( (0,г + 1),ф$(0,г + 1),ха1 ,х4,иа)
= ф((0,г + 1)((х4(г))2 + ч\г)) + ф!(0, г + 1)х4(г), нл (1,г,ф((1,г + 1),х{,и{) = ф*(1,ь + 1)(-х{(г)+ и&)) Н(к,ф(к + 1),х) = ф(к + 1)х4(к^Р), ф(1)=0, фйг(0,1) = ф1(0,1 + 1), ф*(0,3) = 1,
Ф(2) = -1, Ф1(0,г + 1) = 2фа1(0,г + 1)х%(0,г), ф$(0,3)=0, Ф1(1,г) = -Ф1(1,± + 1), Ф1(1,5) = -1.
Управляющие воздействия определяются по формулам: ил(0,Ь) = sign(^f(0,t + 1)), и^(1,1) = 2sign(фf(1,t + 1)). Поскольку уравнения нижнего уровня не зависят от переменной х верхнего уровня, то
\(к,г) = 0.
В качестве начального приближения были выбраны значения ий(0,1) = и^(1,Ь) = -1, при этом 11 = -1. После выполнения одного шага иа(0,Ь) = 1, и^(1,Ь) = 2. Тогда I2 = -3, что подтверждает работоспособность предложенного алгоритма.
5. Заключение
Таким образом, в работе приведена иерархическая модель неоднородной дискретной системы (НДС), для которой поставлена задача оптимального управления. Даны достаточные условия оптимальности типа Кротова в двух формах. На их основе получен аналог метода глобального улучшения Кротова. Доказана теоремы об улучшаемо-сти начального приближения и сходимости метода по функционалу. Рассмотрен иллюстративный пример.
Список литературы
[1] В. И. Гурман, И. В. Расина, А. О. Блинов. «Эволюция и перспективы приближенных методов оптимального управления», Программные системы: теория и приложения, 2:2(6) (2011), с. 11-29, http://psta.psiras.ru/read/psta2011_2_11-29.pdf t171
[2] В. Ф. Кротов, В. И. Гурман. Методы и задачи оптимального управления, Наука, М., 1973, 448 с. t172
[3] В. Ф. Кротов. «Достаточные условия оптимальности для дискретных управляемых систем», ДАН СССР, 172 (1967), с. 18-21. t 172,174
[4] В. И. Гурман. «К теории оптимальных дискретных процессов», Автоматика и телемеханика, 1973, №6, с. 53-58. Г 172
[5] В. И. Гурман, И. В. Расина. «Дискретно-непрерывные представления импульсных процессов в управляемых системах», Автоматика и телемеханика, 2012, №8, с. 16-29. Г 172
[6] И. В. Расина. «Дискретно-непрерывные модели и оптимизация управляемых процессов», Программные системы: теория и приложения, 2:5(9) (2011), с. 49-72, 11К1_: http://psta.psiras.ru/ read/psta2011_5_49-72.pdf Г 172
[7] И. В. Расина. Иерархические модели управления системами неоднородной структуры, Физматлит, М., 2014. Г 172,174
[8] В. Ф. Кротов, И. Н. Фельдман. «Итерационные методы решения экстремальных задач», Моделирование технико-экономических процессов, Изд-во Московского экономико-статистического института, М., 1978, с. 22-35. t172Д76
[9] В. Ф. Кротов, И. Н. Фельдман. «Итерационный метод решения задач оптимального управления», Изв. АН СССР. Техн. киберн., 1983, №2, с. 160-168. Г 172,176
[10] И. В. Расина. «Итерационные алгоритмы оптимизации дискретно-непрерывных процессов», Автоматика и телемеханика, 2012, №10, с. 3-17. Г 176
[11] И. В. Расина, О. В. Батурина. «Оптимизация линейных по состоянию дискретно-непрерывных систем», Автоматика и телемеханика, 2013, №4, с. 80-90. Г 177
[12] И. В. Расина, О. В. Батурина. «Оптимизация управления в билинейных системах», Автоматика и телемеханика, 2013, №5, с. 102-113. Г 177
Об авторах:
Владимир Иосифович Гурман
д.т.н., профессор, зав. кафедрой системного анализа УГП им. А. К. Айламазяна, известный специалист в области теории управления, системного анализа и их приложений, автор и соавтор более 200 статей и 20 монографий e-mail: [email protected]
Ирина Викторовна Расина
д.ф.-м.н., г.н.с. Исследовательского центра системного анализа Института программных систем им. А. К. Айламазяна РАН, специалист в области моделирования и управления гибридными системами, автор и соавтор более 100 статей и 5 монографий
e-mail: [email protected]
Пример ссылки на эту публикацию:
В. И. Гурман, И. В. Расина. «Метод глобального улучшения управления для неоднородных дискретных систем», Программные системы: теория и приложения, 2016, 7:1(28), с. 171-186.
URL: http://psta.psiras.ru/read/psta2016_1_171-186.pdf
Vladimir Gurman, Irina Rasina. Global Control Improvement Method for
Non-homogeneous Discrete Systems.
Abstract. The class of non-homogeneous discrete systems is considered. These systems are prevalent in practice and can be obtained from discretization of continuous systems when optimization problems are solving using iterative methods. For this class of systems Krotov type sufficient optimality conditions are formulated in two different forms. The prototype of Krotov global improvement method is constructed. An illustrative example is presented. (In Russian).
Key words and phrases: non-homogeneous discrete systems, global improvement method, optimal
control.
References
[1] V. I. Gurman, I. V. Rasina, A. O. Blinov. "Evolution and prospects of approximate methods of optimal control", Programmnye Sistemy: Teoriya i Prilozheniya, 2:2(6) (2011), pp. 11-29 (in Russian), URL: http://psta.psiras.ru/read/psta2011_2_11-29.pdf
[2] V. F. Krotov, V.I. Gurman. Methods and optimal control, Nauka, M., 1973 (in Russian), 448 p.
[3] V. F. Krotov. "Dostatochnyye usloviya optimal'nosti dlya diskretnykh upravlyayemykh sistem", DAN SSSR, 172 (1967), pp. 18-21 (in Russian).
[4] V.I. Gurman. "Theory of optimum discrete processes", Autom. Remote Control, 34:7 (1973), pp. 1082-1087.
[5] V. I. Gurman, I. V. Rasina. "Discrete-continuous representations of impulsive processes in the controllable systems", Autom. Remote Control, 73:8 (2012), pp. 1290-1300.
[6] I. V. Rasina. "Discrete-continuous models and optimization of control processes", Programmnyye sistemy: teoriya i prilozheniya, 2:5(9) (2011), pp. 49-72 (in Russian), URL: http://psta.psiras.ru/read/psta2011_5_49-72.pdf
[7] I. V. Rasina. Iyerarkhicheskiye modeli upravleniya sistemami neodnorodnoy struktury, Fizmatlit, M., 2014.
[8] V. F. Krotov, I. N. Fel'dman. "Iteratsionnye metody resheniya ekstremal'nykh zadach", Modelirovanie tekhniko-ekonomicheskikh protsessov, Izd-vo Moskovskogo ekonomiko-statisticheskogo instituta, M., 1978, pp. 22-35.
[9] V. F. Krotov, I. N. Fel'dman. "An iterative method for solving optimal control", Izv. AN SSSR. Tekhn. kibern., 1983, no.2, pp. 160-168 (in Russian).
[10] I. V. Rasina. "Iterative optimization algorithms for discrete-continuous processes", Autom. Remote Control, 73:10 (2012), pp. 1591-1603.
[11] I. V. Rasina, O. V. Baturina. "Optimization of state-linear discrete-continuous systems", Autom. Remote Control, 74:4 (2013), pp. 604-612.
[12] I. V. Rasina, O. V. Baturina. "Control optimization in bilinear systems", Autom. Remote Control, 74:5 (2013), pp. 802-810.
© V. I. Gurman(1, I. V. Rasina!2, 2016
© Ailamazyan Program System Institute of RAS(1>2, 2016
© ICS V. A. Trapeznikov of RAS!1, 2016
© Program systems: Theory and Applications, 2016
Sample citation of this publication:
Vladimir Gurman, Irina Rasina. "Global Control Improvement Method for Non-homogeneous Discrete Systems", Program systems: theory and applications, 2016, 7:1(28), pp. 171-186. (In Russian).
URL: http://psta.psiras.ru/read/psta2016_1_171- 186.pdf