УДК 519.97
Центральные поля траекторий в задачах оптимального управления и вариационного исчисления
ОРЁЛ ЕВГЕНИЙ НИКОЛАЕВИЧ,
доктор физико-математических наук, профессор, профессор кафедры «Математика-1» Финансового университета при Правительстве Российской Федерации, г. Москва, Россия E-mail: [email protected]
ОРЁЛ ОЛЬГА ЕВГЕНЬЕВНА,
кандидат физико-математических наук, доцент, доцент кафедры «Математика-1» Финансового университета при Правительстве Российской Федерации, г. Москва, Россия E-mail: [email protected]
АННОТАЦИЯ
Динамика многих экономических систем может быть описана в рамках теории оптимального управления. Одним из центральных результатов здесь является принцип максимума Понтрягина, представляющий собой необходимое условие локального экстремума. Но для полного решения задачи оптимального управления требуется переход от локального к глобальному экстремуму, поскольку экономист-практик должен быть уверен, что получено наилучшее или близкое к нему по функционалу решение. Например, это может быть глобальный минимум издержек или глобальный максимум прибыли.
В задачах вариационного исчисления, которым уже более 300 лет, анализ на глобальный экстремум проводится с помощью полей экстремалей, для которых проверяется условие Вейерштрасса. Если такие поля строить трудно, то можно использовать метод ломаных Эйлера. Тогда возникает задача поиска кратчайших путей на графе, которые строятся с помощью алгоритма Дейкстры. Эти кратчайшие пути имеют структуру дерева, сильно напоминающего упомянутое выше поле экстремалей. Такое сходство показывает принципиальную близость и адекватность обоих подходов, несмотря на существенное их различие.
В статье рассматриваются поля экстремалей и деревья кратчайших путей в задачах оптимального управления. Получены критерии оптимальности для центрального поля траекторий в неавтономных задачах оптимального управления. Показано, что из этих критериев в задачах вариационного исчисления легко выводятся известные соотношения и условия экстремума. Построены оптимальное центральное поле и дерево кратчайших путей для экономической модели выполнения заказа на производство продукции с минимальными издержками. Ключевые слова: оптимальное управление; глобальный экстремум; задача с экономическим содержанием; центральное поле траекторий; дерево траекторий.
Central Fields of Trajectories in Problems of Optimal Control and Calculus of Variations
EVGENY N. OREL,
Doctor of Physical and Mathematical Sciences, professor, professor of the Department «Mathematics-1», Financial University under the Government of the Russian Federation, Moscow, Russia E-mail: [email protected]
OLGA E. OREL,
Candidate of Physical and Mathematical Sciences, associate professor, associate professor of the Department «Mathematics-1», Financial University under the Government of the Russian Federation, Moscow, Russia E-mail: [email protected]
ABSTRACT
Dynamics of many economic systems can be described in terms of optimal control theory. One of the main results here is the Pontryagin maximum principle, which is a necessary condition for a local extremum. However, for a complete solution of the optimal control problem, a transition from local to global extremum is required, because in practice it is very important to obtain the best solution (or close to the best one with respect to the functional), such as, for example, a global minimum of costs or a global maximum of profit.
In calculus of variations originated more than three hundred years ago the analysis of the global extremum is performed using the fields of extremals for which the Weierstrass condition is verified. If these fields are difficult to construct, it is possible to use the method of Euler lines. This results in a problem of finding the shortest routes in a graph. The Dijkstra's algorithm can be used to find these routes. They have a tree structure which is similar to the abovementioned field of extremals. Such a similarity shows a principal proximity and adequacy of both approaches, although they differ significantly.
The paper deals with the field of extremals and the shortest path tree in optimal control problems. Optimality criteria for the central field of trajectories in non-autonomous problems of optimal control are obtained. It is shown that from these criteria we can deduce the relations and conditions of optimality well-known in calculus of variations problems. The optimal central field and the shortest path tree for the economic model of carrying out the production order with minimal costs are built.
Keywords: optimal control; the global extremum; problem with economic content; central field of trajectories; tree of trajectories.
1. Введение. Решение задач оптимального управления не заканчивается нахождением экстремали Понтрягина и исследованием ее на локальный экстремум. Необходимо еще провести идентификацию, т.е. убедиться, что найденное управление действительно является лучшим. Без такой идентификации термин «оптимальное управление» теряет смысл. Это особенно важно для задач с экономическим содержанием, поскольку решение должно обеспечивать не локальный, а глобальный минимум издержек или максимум прибыли. Опыт вариационного исчисления подсказывает, что единственный достаточно общий подход к проблеме идентификации состоит в том, чтобы погрузить испытуемую экстремаль в поле экстремалей [1]. Это значит, что с самого начала вместо одной экстремали приходится строить целое их семейство, выстилающее исследуемую область, а это вызывает серьезные дополнительные трудности. При решении задач на глобальный экстремум в вариационном исчислении для поля экстремалей проверяется условие Вейер-штрасса.
Поскольку задачи оптимального управления значительно сложнее задач вариационного исчисления, то, видимо, другого общего способа идентификации оптимального управления, кроме
построения полей, не существует. Вместе с тем проблема построения и анализа полей траекторий в теории оптимального управления, ввиду ее сложности, почти не изучалась. Едва ли не единственным исключением являются центральные поля экстремалей, построенные в [2], в разделе «Задачи синтеза» для некоторых автономных линейных задач оптимального быстродействия. В работе [3] выведено несколько критериев оптимальности центральных полей траекторий для автономных задач оптимального управления. В настоящей статье эти результаты переносятся на случай неавтономных систем.
2. Постановка задачи. Пусть t0 Е Я и х0 Е Я" —
соответственно момент старта и точка старта системы. Будем рассматривать поведение системы при t > t0. Пусть G С Я"+1 — область расширенного фазового пространства с центром в начальной точке А = (0,х0), т.е. такая, что 1) если (7,х) е G, то t > 70, и 2) если (0, х )е О, то х = х0. Пусть и С Ят — область управлений. Кусочно непрерывную вектор-функцию и(.): [71,72 и, 70 £ 71 £ 72, будем называть допустимым управлением. Если и(.) — допустимое управление, то кусочно гладкую вектор-функцию х(.): [[1,72 Я", удовлетворяющую системе дифференциальных уравнений
dx (t) dt
= f (t, x (t ),u (t)
(1)
и такую, что (,X()) 6 G для всех t £ , будем называть траекторией. Пусть Р — множество траекторий. Вместе допустимое управление и соответствующая траектория (х(.),и(.)) определяют процесс управления. Предполагается, что вектор-функция 1 + п + т переменных f ((,х,и) такова, что выполнены условия существования и единственности решения уравнения (1) при заданном и(.). Иногда, если не возникнет недоразумений, траектории будем обозначать крайними точками ВС = х(.), где В = (1,х1) и С = (t2,х2) — соответственно начальная и конечная точки траектории
х (.).
Минимизируемый критерий качества для процесса управления ВС = (х(.),и(.)) с концами В = х^ и С = (2,х2) запишем в виде
I (ВС) = J (х (.),и (.)) = £t2 £ (t, х (), и()),
где £ ((, х, и) — непрерывно дифференцируемая функция Лагранжа.
Процесс (ВС )* называется оптимальным, если
l ((BC )* )< l (BC)
и 2) любой начальный участок траектории семейства также является траекторией семейства.
Центральное поле, состоящее из оптимальных траекторий, будем называть оптимальным.
Пусть центральное поле траекторий Q , не обязательно оптимальное, задано. Тогда определена функция действия по Гамильтону S : G ® R в соответствии с формулой S (B) = l (AB), AB б Q.
Функция S аналогична как функции Беллма-на в оптимальном управлении, так и функции, которую формирует алгоритм Дейкстры в задачах поиска кратчайшего пути на графе. В работе рассматриваются центральное поле траекторий и свойства функции S, позволяющие проверить это поле на оптимальность. Показывается также, что поле вместе с функцией S могут быть построены численно.
3. Неравенство треугольника. Множество траекторий P обладает несколькими простыми алгебраическими свойствами [4], одно из которых здесь будет активно использоваться: если траектории BC и CD принадлежат P , то «ломаная» BCD также принадлежит P . При этом B и D являются соответственно начальной и конечной точками траектории BCD и
l (BCD) = l (BC) +1 (CD)
для любой траектории ВС с теми же граничными точками В и С.
В вариационном исчислении рассматриваются поля экстремалей, обладающие некоторыми свойствами [1]. При переходе к задачам оптимального управления эти свойства приходится значительно ослаблять по ряду причин. В частности, траектории поля не обязаны быть экстремалями — они могут быть особыми кривыми, скользящими режимами, огибающими и т.д. Поэтому на начальном этапе исследований, чтобы не потерять общность, лучше отказаться от большинства свойств, оставив только те из них, без которых обойтись невозможно. В то же время представляется целесообразным рассматривать именно центральные поля, т.е. семейства траекторий, имеющих одну общую (обычно начальную или конечную) точку. Для определенности фиксируется стартовое состояние А = (0, х0).
Определение. Семейство допустимых траекторий ¡2 С -Р, стартующих из точки А = (?0,х0), назовем центральным полем, если 1) в каждой точке В е G оканчивается ровно одна кривая семейства
Т е о р е м а (первый критерий оптимальности центрального поля). Центральное поле Q оптимально тогда и только тогда, когда для каждой траектории ВС е Р выполнено неравенство треугольника
S (B) +1 (BC )> S (C).
(2)
Д о к а з а т е л ь с т в о. 1. Необходимость. Пусть на какой-либо траектории BC неравенство треугольника нарушено, S(B) +1(BC) < S(C). Пусть AB, AC € Q. Тогда последнее неравенство принимает вид l (ABC) < l (AC). Это значит, что траектория поля AC неоптимальна, поскольку нашлась траектория (ABC) с меньшим значением функционала. 2. Достаточность. Пусть AC — произвольная траектория,
(AC )* — траектория поля. Очевидно, что S(A) = 0. Полагая в (2) B = A, получаем l (AC )> l ((AC )*) ,т.е. траектория поля (AC )* оптимальна. Теорема доказана.
Заметим, что если BC является участком траектории поля, то неравенство треугольника превращается в равенство отрезка
5 (В) +1 (ВС ) = S (С) (3)
(«отрезок» АС состоит из двух участков, АВ и ВС).
4. Монотонность. Пусть дана траектория ВС = у(.) с концами В = (1,х^, С = (2,х2) и допустимым управлением V(.). Введем функцию времени
(В ) + £ X (т, у (т), V (т))т-5 (, у ()),
Обозначая промежуточную точку траектории через М = (7, у (7)), получим другое выражение для введенной функции:
р( )=5 (В) +1 (ВМ)-5 (М)
Поэтому неравенство треугольника для траектории ВС равносильно условию р(7)> 0.
Т е о р е м а (второй критерий оптимальности центрального поля). Центральное поле Q оптимально тогда и только тогда, когда для каждой траектории ВС € Р функция р( не убывает.
Д о к а з а т е л ь с т в о. Для неубывающей функции из А7> 0 следует Ар> 0. Выразим Ар. Пусть С = (7,у(7)), Б = (7 + Д7,у(7 + Д7)). Тогда
р(7 )= 5 (В) +1 (ВС)-5 (С), р( + А7 )= 5 (В) +1 (ВСБ)-5 (Б).
После вычитания, с учетом
I (ВСБ) = I (ВС) +1 (СБ,
имеем
Др= 5 (С) +1 (СБ)-5 (Б).
Так как траектория СБ € Р произвольна, то неравенство Ар > 0 равносильно первому критерию оптимальности. Теорема доказана.
5. Основное неравенство. Для получения аналитических выражений, вытекающих из второго критерия оптимальности, нужно перейти к производной функции р( . При этом недостаточно опираться на теорему Лебега-Рисса о том, что всякая монотонная функция почти всюду имеет производную, ибо производная может не существовать, например, на всюду плотном подмножестве
области определения. Выходом из положения является то, что, во-первых, любая функция имеет нижнюю производную, если условиться, что она может принимать значения , во-вторых, функция не убывает тогда и только тогда, когда ее нижняя производная неотрицательна [3]:
^ (7 )> 0.
Кроме того, полезным свойством является то, что при вычитании нижняя производная превращается в верхнюю:
(-/) (х) = -К(х),
где Я — символ нижней производной;
Л — символ верхней производной.
Найдем явное выражение для нижней производной функции р( . Так как в формуле (3) величина 5 (В) постоянна, а производная второго слагаемого существует и равна ¿(7, у (7), V (7 )),то
^ (7) = X(7,у(7),V(7))-(7,у(7)).
Тем самым получен еще один критерий оптимальности.
Т е о р е м а (третий критерий оптимальности центрального поля). Центральное поле Q оптимально тогда и только тогда, когда для каждой траектории ВС € Р в любой момент времени 7 выполнено неравенство
X(7,у(7),V(7))-(7,у())> 0. (4)
Будем называть неравенство (4) основным. Оно весьма информативно, хотя внешне выглядит не очень содержательным. Покажем (см. также [1]), что из основного неравенства (4) можно получить важные соотношения вариационного исчисления.
6. Использование основного неравенства в вариационном исчислении. Задачи вариационного исчисления — частный случай задач оптимального управления, когда / (7, х, и) = и и и = Я". Значит, х' = и.
Предположим сначала, что пробная кривая является кривой поля. Тогда нижняя производная становится обычной производной, а неравенство (4) становится равенством
¿(7, х, х')-—5 (7, х ) = 0.
Здесь х' = х' (х) — наклон поля в точке (,х). Считая функцию £ (t, х) дифференцируемой, перейдем к частным производным:
£(, х, х (t, х)-^ х), х ') = 0, (5)
где Ух — градиент по х ;
(,} — скалярное произведение.
Учитывая (4), для произвольного наклона у' имеем
£(, х, у х)-фхЯ (t, х), у '}> 0. (6)
Из (5) и (6) следует, что выражение слева принимает наименьшее значение при у' = х' х). Поэтому в точке у' = х' градиент этого выражения по х' равен нулю:
Ух, £ (, х, х') -Ух'(Ух5 (t, х), х ') = 0. (7)
В этом месте в задачах вариационного исчисления появляется возможность замены Ух8 на Ух' £ (в задачах оптимального управления такая возможность отсутствует). Действительно, поскольку (х),х'} линейно зависит от х', то ( х), х ') = Ух5 ( х). Поэтому в равенстве (7) имеем
VxS (t, x) = Vx' L(t, x, x').
(8)
Подставим теперь (8) в (5) и (6):
д
£(, х, х')-—^ (t, х )-(Ух, £ (t, х, х'), х ') = 0. (9)
£(t, х, у х )-(Чх, £(t, х, х'), у '}> 0. (10)
В разделе «Вариационный алгоритм Гюйгенса» монографии [1] Л. Янг вслед за К. Каратеодори считает соотношения (8) и (9) фундаментальными уравнениями вариационного исчисления. В частности, из них выводится инвариантный интеграл Гильберта [1]. К этому следует добавить, что после вычитания (9) из (10) получается классическое условие Вейерштрасса
L (t, x, y') — L(t, x, x ') — -<Vx' L (t, x, x'), y' — x ')> 0.
(11)
Из (4) можно легко получить и другие известные соотношения вариационного исчисления, что неудивительно, поскольку каждый из трех рассмотренных критериев равносилен исходной задаче.
7. Построение центрального поля в вариационном исчислении. Роль центральных полей экстремалей в вариационном исчислении не ограничивается теоретическим анализом. Это важно потому, что далеко не всегда удается аналитически построить центральное поле кривых. Практическое построение центральных полей оптимальных кривых или их аппроксимация гораздо проще и доступнее. Для каждой конкретной задачи вариационного исчисления можно написать вычислительную программу, которая строит кривые методом ломаных Эйлера. При этом фактически ищется кратчайший путь на конечном графе, вершинами которого являются узлы регулярной решетки расширенного фазового пространства. В памяти компьютера формируется дерево кратчайших путей, представляющее собой аппроксимацию центрального поля оптимальных кривых. Такие программы написаны авторами настоящей статьи для ряда классических задач вариационного исчисления: кратчайшие кривые на плоскостях Евклида и Лобачевского, брахистохроны, минимальные поверхности вращения. На рис. 1 приводится результат работы программы, которая строит профили минимальных поверхностей вращения. При этом приведены кривые, оканчивающиеся на прямой t = const. Видно, что они образуют центральное поле. На рис. 2 изображены кривые, полученные аналитически. Визуально между рисунками нет принципиальных отличий, если не считать того, что кривые, проходящие внутри криволинейной трапеции SOAB (см. рис. 1), не выведены на печать. Видно, что для терминальных точек, расположенных над точкой B, оптимальными кривыми являются цепные линии, а для точек, расположенных под этой точкой, — ломаные «вниз — вправо — вверх». Эти ломаные не являются экстремалями поставленной задачи. При построении центрального поля (или, иначе,—дерева) программа, разумеется, не решала уравнения Эйлера—Лагранжа, не искала огибающей семейства цепных линий и не проверяла условие Вейерштрасса (11), а действовала слепо в соответствии с принципом Гюйгенса.
8. Центральное поле в задаче с экономическим содержанием. Рассмотрим известную модель оптимального управления, имеющую экономическую интерпретацию [5]. Фирма получила заказ, который надо выполнить к моменту времени T, на
Рис. 1. Профили минимальных поверхностей вращения, построенные численно
производство Y единиц продукции. Изготовленная заранее продукция передается на склад и хранится там до времени Т, когда вся продукция будет передана заказчику. Пусть У — объем продукции, изготовленной к моменту 7. Как изготовление, так и хранение продукции сопряжено с затратами. Надо выбрать такой режим производства продукции, чтобы суммарные затраты были минимальными. Таким образом, управление заключается в выборе режимов (скорости) производства продукции у' 0 как функции времени. Считается, что затраты на выпуск единицы продукции пропорциональны интенсивности производства у'0 с коэффициентом пропорциональности а. Пусть Ь — стоимость хранения единицы продукции в единицу времени. Тогда суммарные затраты на промежутке [0,Г равны
Ср + С = а £Гу '2 (7 )— + ь£Гу (7 ) —,
Рис. 2. Профили минимальных поверхностей вращения, построенные аналитически
где Ср — затраты на выпуск продукции; С5 — затраты на ее хранение. В начальный момент имеется нулевой запас, поэтому у (0) = 0. Ограничение на управление состоит в том, что скорость производства неотрицательна и не может превосходить некоторой константы: 0 < у'(7)< Ж. ь
После замены переменной у (7 ) = — х (7) получа-
а
ем задачу оптимального управления без параметров а и Ь : найти абсолютный экстремум
J = £Г (и2 (7) + х (7))
тт
при ограничениях
^ = и (7), 0<и()< V,
7 > 0, х()> 0, х(0) = 0, х(Г) = X.
Константы Г, XV неотрицательны. Управление и 0 ищется в классе кусочно непрерывных функций. Величина V может быть, как в [5], равна бесконечности; в этом случае скорость производства не ограничена сверху, и задача упрощается. Заметим, что задача нелинейна, так как под интегралом стоит квадрат скорости и2 (7).
При решении задачи мы фиксируем левый конец траекторий (0,0) и освобождаем правый. Таким образом, мы будем строить семейство траекторий, оканчивающееся во всех точках (Г, X) множества достижимости. Легко видеть, что из точки (0,0) можно попасть в точку (7, х), двигаясь по допустимой траектории, тогда и только тогда, когда х <У7 . Это неравенство и определяет множество достижимости Б.
С помощью принципа максимума Понтрягина находим следующее поле экстремалей:
4 (7, а
0,
0 < 7 < а,
(7 -
-, а < 7 < 2V + а, а > 0,
4(7,а) =
V(t-V - а), 2V + а < 7,
(7 - а)2 а2
±-— —, 0 < 7 < 2V + а,
4 4 --
а e[-2V,0].
V (7-V - а)-—, 2V + а < 7.
Геометрически это — изображенное на рис. 3 од-нопараметрическое семейство кривых, выходящих из точки (0,0). Здесь 7 — время, а б[-IV,+го) — параметр, определяющий конкретную кривую. Пунктиром обозначена линия перехода на производство продукции с постоянной скоростью.
Данное семейство гладко зависит от параметра а. Расчеты показывают, что для него справедливо основное неравенство (4) во всех точках множества достижимости. Отсюда следует, что каждая траектория семейства (т.е. центрального поля) доставляет глобальный экстремум функционала издержек. Мы видим, что даже в этой не очень сложной задаче с экономическим содержанием анализ на глобальный экстремум требует больших усилий. В более сложных задачах построение такого поля
Рис. 3. Оптимальное поле экстремалей для экономической модели, построенное аналитически
может быть весьма затруднено или даже невозможно. Поэтому особое внимание следует уделить численному построению поля. Такое поле для данной задачи приведено на рис. 4.
Заключение. В задачах оптимального управ -ления большую роль должны играть центральные поля траекторий. Чтобы проверить такое поле на оптимальность, можно воспользоваться любым из трех критериев, приведенных в работе. В задачах вариационного исчисления, а также в автономных задачах оптимального управления [3] из этих критериев вытекают, в частности, известные условия и соотношения. Для неавтономных задач оптимального управления такие условия будут выведены в последующих публикациях. В конкретных случаях построение центрального поля траекторий, претендующего на оптимальность, — не такая уж простая задача. В вариационном исчислении оптимальные центральные поля можно легко построить методом ломаных Эйлера, двигаясь по узлам регулярной решетки. Во многих задачах оптимального управления движение по узлам решетки невозможно из-за ограничений на управляющие воздействия. В работах [6, 7] предложен общий численный метод, позволяющий строить оптимальные центральные поля траекторий в задачах оптимального управления. В основе метода лежит разбиение
4
Рис. 4. Оптимальное поле экстремалей для экономической модели, построенное численно
пространства состояний на классы. Метод может использовать разные логики поиска в пространстве состояний, в том числе и обобщение алгоритма Дейкстры для построения кратчайшего пути на графе. При этом узлами формируемого дерева являются не состояния, а классы состояний — множества, на которые заранее разбивается пространство состояний.
Литература
1. Янг Л. Лекции по вариационному исчислению и теории оптимального управления. М.: Мир, 1974. 488 с.
2. Понтрягин Л. С., Болтянский В.Г., Гамкрелид-зе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М.: Наука, 1969. 384 с.
3. Орёл Е.Н., Орёл О.Е. Абсолютный экстремум в автономных задачах оптимального управления // Известия РАН. Теория и системы управления.2013. № 3.С.60-73.
4. Орёл Е.Н. Об аппроксимации функции Бел-лмана // Журнал вычислительной математики и математической физики.1973. Т. 13. № 5. С. 1161-1174.
5. Kamien N., Schwartz N. Dynamic Optimization: The calculus of variations and optimal control
in economics and management // New-York: Elsevier Science Publishing Co, 1991. 377 p.
6. Орёл Е.Н. Метод решения задач оптимального управления // ДАН СССР. 1989. Т. 306. № 6. С.1301-1304.
7. Орёл Е.Н. Алгоритмы поиска квазиоптимального управления, использующие разбиение пространства состояний // Журнал вычислительной математики и математической фи-зики.1990. Т. 30. № 9. С. 1283-1293.
References
1. YangL. Lektsii po variatsionnomu ischisleniiu i teorii optimal'nogo upravleniia [Lectures on the Calculus of Variations and Optimal Control Theory]. Moscow, Mir - Mir, 1974,488 p. (in Russ.).
2. Pontriagin L.S., Boltianskii V.G., GamkrelidzeR. V., Mishchenko E. F. Matematicheskaia teoriia optimal'nykh protsessov [The Mathematical Theory of Optimal Processes]. Moscow, Nauka — Science, 1969, 384 p. (in Russ.).
3. OrelE.N., Orel O.E. Absoliutnyi ekstremum v av-tonomnykh zadachakh optimal'nogo upravleniia [Global Extremum in Autonomous Problems of Optimal Control]. Izvestiia RAN. Teoriia i sis-temy upravleniia — Russian Academy of Science Newsletter, Theory and Systems of Control, 2013, no. 3, pp. 60-73 (in Russ.).
4. Orel E.N. Ob approksimatsii funktsii Bellmana [Approximation of the Bellman function]. Zhur-nal vychislitel'noi matematiki i matematicheskoi fiziki — Journal of computational mathematics and mathematical physics, 1973, no.13 (5), pp. 1161-1174 (in Russ.).
5. Kamien N., Schwartz N. Dynamic Optimization: The calculus of variations and optimal control in economics and management. New-York, Elsevier Science Publishing Co, 1991, 377 p.
6. Orel E.N. Metod resheniia zadach optimal'nogo upravleniia [A method for solution of optimal control problems]. DAN SSSR — DAN USSR, 1989, no. 306 (6), pp. 1301-1304 (in Russ.).
7. Orel E.N. Algoritmy poiska kvazioptimal'nogo upravleniia, ispol'zuiushchie razbienie pros-transtva sostoianii [Ouasioptimal control search algorithms using state-space partitioning]. Zhur-nal vychislitel'noi matematiki i matematicheskoi fiziki — Journal of Computational mathematics and mathematical physics, 1990, no. 30 (9), pp. 1283-1293 (in Russ.).