Научная статья на тему 'Метод редукции пространства состояний для решения задачи оптимального управления'

Метод редукции пространства состояний для решения задачи оптимального управления Текст научной статьи по специальности «Математика»

CC BY
235
25
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ / ТЕОРИЯ ГРАФОВ / ЗАДАЧА О КРАТЧАЙШЕМ ПУТИ / УПРАВЛЕНИЕ МОБИЛЬНЫМ РОБОТОМ / OPTIMAL CONTROL PROBLEM / GRAPH THEORY / SHORTEST PATH PROBLEM / CONTROL FOR MOBILE ROBOT

Аннотация научной статьи по математике, автор научной работы — Березнев Валентин Александрович, Дивеев Асхат Ибрагимович

Рассматривается задача оптимального управления с фазовыми ограничениями. Для решения задачи используется метод редукции пространства состояний. Метод состоит в том, чтобы уменьшить размерность пространства состояний объекта управления. Для этой цели часть компонент вектора состояний заменяется функциями времени из предположения об оптимальном поведении этих компонент и их физических свойствах. В результате получаем модель объекта управления в виде системы обыкновенных дифференциальных уравнений меньшего порядка и кусочно-функциональные уравнения с неизвестными параметрами для остальных компонент вектора состояний. Далее формулируем новую задачу оптимального управления в пространстве состояний меньшей размерности. При решении новой задачи оптимального управления некоторые компоненты вектора управления находим из формы функций исключенной части компонент вектора пространства состояний. В качестве примера рассмотрена задача оптимального управления мобильным роботом, движущимся на плоскости с круговыми фазовыми ограничениями. В результате применения метода редукции пространства состояний было сделано предположение, что угол поворота робота на оптимальной траектории принимает либо постоянные значения, либо является линейной функцией времени. Данное предположение позволило трансформировать задачу оптимального управления роботом к задаче оптимального движения точки на плоскости. Известные формы функции изменения угла поворота робота позволили определить класс управлений для одной из компонент вектора управления. В новой задаче оптимального управления отсутствует угол поворота робота, поэтому оптимальная траектория движения точки должна иметь наименьшую длину. Оптимальная траектория движения состоит из кусков прямых отрезков, касательных к круговым ограничениям, и круговых дуг, расположенных на границах ограничений. Для построения оптимальной траектории в новой задаче необходимо определить порядок ограничений, по границам которых должна пройти оптимальная траектория. Для решения этой подзадачи фазовые ограничения рассматриваются как вершины графа и при этом используется алгоритм Дейкстры поиска кратчайшего пути на графе. В результате используемых методов было получено значение функционала в два раза меньше, чем для решения, полученного эволюционным алгоритмом.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Березнев Валентин Александрович, Дивеев Асхат Ибрагимович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

STATE SPACE REDUCTION METHOD FOR OPTIMAL CONTROL PROBLEM

The problem of optimum control with phase restrictions is considered. For the solution of a task originally the dimension of the state space decreases at the expense of a hypothesis of behavior of a part of coordinates of a vector of states. As a result we receive a set of equations of a smaller order and the piece -functional the functions equations with unknown parameters for other components of a vector of states. Further we formulate a new problem of optimum control in the state space of a smaller order for which solution we use a hypothesis of behavior of a part of coordinates of the state space. For an example the problem of optimum control of the mobile robot moving on the plane with circular obstacles is considered. As a result of a aplication of the method the task is transformed to a problem of a movement of a point on the plane which solution is performed by graph theory and geometrical ratios. The computing experiment showed effectiveness of the offered method on value of the used functional. The optimal control problem with phase restrictions is considered. For the solution of the task a state space reduction method is used. The method consists in reducing dimension of states' space for control object. For this purpose a part the component of a vector of states is replaced function of time from the assumption of optimum behavior of these a component and their physical properties. As a result we receive model of an object of management in the form of the system of the ordinary differential equations of a smaller order and the piecewise and functional equations with unknown parameters for the others a component of astates' vector. Further a new problem of optimum control in space of states smaller dimension is formulated. At the solution of the new optimal control problem some components of a control vector are found from a form of functions for the excluded part of the states' space vector. As an example the optimal control problem of the mobile robot moving on the plane with circular phase restrictions is considered. As a result of application of the state space reduction method the assumption was made that the angle of rotation of the robot on an optimum trajectory accepts or constant values, or is linear function of time. This assumption allowed to transform the optimal control problem of the robot to a problem of the optimal movement of a point on the plane. Known forms of function for change of a rotation angle of the robot allowed to define a class of control for a component of a control vector. In a new optimal control problem there is no angle of rotation of the robot therefore the optimal trajectory of the movement of a point has to have the smallest length. The optimal trajectory of the movement consists of pieces of direct pieces, tangents to circular restrictions, and the circular arches located on borders of restrictions. For creation of an optimum trajectory in the new task it is necessary to define an order of restrictions on which borders there has to pass the optimal trajectory. For the solution of this subtask a set of phase restrictions are considered as top of the count and Dijkstra's algorithm of search of the shortest way on the column is used. As a result of the used methods the value of functional twice smaller, than for the solution that was received by an evolutionary algorithm.

Текст научной работы на тему «Метод редукции пространства состояний для решения задачи оптимального управления»

УДК 519.71

DOI 10.21685/2307-4205-2019-3-2

В. А. Березнев, А. И. Дивеев

МЕТОД РЕДУКЦИИ ПРОСТРАНСТВА СОСТОЯНИЙ ДЛЯ РЕШЕНИЯ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ1

V. A. Bereznev, A. I. Diveev

STATE SPACE REDUCTION METHOD FOR OPTIMAL CONTROL PROBLEM

Аннотация. Рассматривается задача оптимального управления с фазовыми ограничениями. Для решения задачи используется метод редукции пространства состояний. Метод состоит в том, чтобы уменьшить размерность пространства состояний объекта управления. Для этой цели часть компонент вектора состояний заменяется функциями времени из предположения об оптимальном поведении этих компонент и их физических свойствах. В результате получаем модель объекта управления в виде системы обыкновенных дифференциальных уравнений меньшего порядка и кусочно-функциональные уравнения с неизвестными параметрами для остальных компонент вектора состояний. Далее формулируем новую задачу оптимального управления в пространстве состояний меньшей размерности. При решении новой задачи оптимального управления некоторые компоненты вектора управления находим из формы функций исключенной части компонент вектора пространства состояний. В качестве примера рассмотрена задача оптимального управления мобильным роботом, движущимся на плоскости с круговыми фазовыми ограничениями. В результате применения метода редукции пространства состояний было сделано предположение, что угол поворота робота на оптимальной траектории принимает либо постоянные значения, либо является линейной функцией времени. Данное предположение позволило трансформировать задачу оптимального управления роботом к задаче оптимального движения точки на плоскости. Известные формы функции изменения угла поворота робота позволили определить класс управлений для одной из компонент вектора управления. В новой задаче оптимального управления отсутствует угол поворота робота, поэтому оптимальная траектория движения точки должна иметь наименьшую длину. Оптимальная траектория движения состоит из кусков прямых отрезков, касательных к круговым ограничениям, и круговых дуг, расположенных на границах ограничений. Для построения оптимальной траектории в новой задаче необходимо определить порядок ограни-

Abstract. The problem of optimum control with phase restrictions is considered. For the solution of a task originally the dimension of the state space decreases at the expense of a hypothesis of behavior of a part of coordinates of a vector of states. As a result we receive a set of equations of a smaller order and the piece -functional the functions equations with unknown parameters for other components of a vector of states. Further we formulate a new problem of optimum control in the state space of a smaller order for which solution we use a hypothesis of behavior of a part of coordinates of the state space. For an example the problem of optimum control of the mobile robot moving on the plane with circular obstacles is considered. As a result of a aplication of the method the task is transformed to a problem of a movement of a point on the plane which solution is performed by graph theory and geometrical ratios. The computing experiment showed effectiveness of the offered method on value of the used functional. The optimal control problem with phase restrictions is considered. For the solution of the task a state space reduction method is used. The method consists in reducing dimension of states' space for control object. For this purpose a part the component of a vector of states is replaced function of time from the assumption of optimum behavior of these a component and their physical properties. As a result we receive model of an object of management in the form of the system of the ordinary differential equations of a smaller order and the piecewise and functional equations with unknown parameters for the others a component of astates' vector. Further a new problem of optimum control in space of states smaller dimension is formulated. At the solution of the new optimal control problem some components of a control vector are found from a form of functions for the excluded part of the states' space vector. As an example the optimal control problem of the mobile robot moving on the plane with circular phase restrictions is considered. As a result of application of the state space reduction method the assumption was made that the angle of rotation of the robot on an optimum trajectory accepts or constant values, or is linear function of time. This assumption

1 Работа выполнена при частичной финансовой поддержке РФФИ (проект 18-29-03061мк).

© Березнев В. А., Дивеев А. И., 2019

чении, по границам которых должна проити оптимальная траектория. Для решения этоИ подзадачи фазовые ограничения рассматриваются как вершины графа и при этом используется алгоритм Дейкстры поиска кратчайшего пути на графе. В результате используемых методов было получено значение функционала в два раза меньше, чем для решения, полученного эволюционным алгоритмом.

Ключевые слова: задача оптимального управления, теория графов, задача о кратчайшем пути, управление мобильным роботом.

allowed to transform the optimal control problem of the robot to a problem of the optimal movement of a point on the plane. Known forms of function for change of a rotation angle of the robot allowed to define a class of control for a component of a control vector. In a new optimal control problem there is no angle of rotation of the robot therefore the optimal trajectory of the movement of a point has to have the smallest length. The optimal trajectory of the movement consists of pieces of direct pieces, tangents to circular restrictions, and the circular arches located on borders of restrictions. For creation of an optimum trajectory in the new task it is necessary to define an order of restrictions on which borders there has to pass the optimal trajectory. For the solution of this subtask a set of phase restrictions are considered as top of the count and Dijkstra's algorithm of search of the shortest way on the column is used. As a result of the used methods the value of functional twice smaller, than for the solution that was received by an evolutionary algorithm.

Keywords: optimal control problem, graph theory, shortest path problem, control for mobile robot.

Задача оптимального управления [1], несмотря на долгую историю, является одной из сложнейших математических задач, для которой не создано универсального вычислительного метода. Попытки создать вычислительный метод на основе методов нелинейного программирования [2, 3] не увенчались успехом как для прямого подхода, основанного на непосредственном поиске функции оптимальнгого управления, так и для решения краевой задачи или непрямого подхода, использующего принцип максимума Понтрягина [1]. На отсутствие универсального вычислительного метода для задачи оптимального управления указывает хотя бы тот факт, что такого метода нет в известных математических пакетах MatLab [4], Mathematica [5], Maple [6].

В подавляющем большинстве случаев сегодня превалирует тенденция редукции задачи оптимального управления к задаче нелинейного программирования [7] и попытка ее решения каким-либо эффективным численным методом оптимизации. По-видимому, основная причина неудач построения универсального численного метода для решения задачи оптимального управления заключается в том, что функционал задачи не всегда отвечает требованиям унимодальности и выпуклости на пространстве искомых параметров, а большинство классических численных методов нелинейного программирования требует именно таких свойств целевой функции. Строгих методов исследования унимодальности интегрального функционала в задаче оптимального управления пока не создано, но, например, в работе [8] показано, что в задаче оптимального управления с фазовыми ограничениями целевой функционал имеет более одного локального минимума. Следовательно, скорее всего универсальный численный метод решения задачи оптимального управления должен быть построен на основе методов глобальной оптимизации. Здесь следует отметить, что точное решение задачи глобольной оптимизации [9] возможно только для задач небольшой размерности из-за необходимой процедуры перебора областей поиска решения. В задаче оптимального управления, например при прямом подходе, размерность пространства искомых параметров пропорциональна количеству интервалов разбиения оси времени. Чем больше интервалов, тем точнее аппроксимация функции оптимального управления. Следовательно, точные методы решения задач глобальной оптимизации для задачи оптимального управления в большинстве случаев не применимы. Необходимо использовать методы случайного поиска [10] или эволюционные алгоритмы [11]. В работе [12] приведены результаты вычислительного эксперимента по сравнению градиентных численных методов и эволюционных алгоритмов для решения задачи оптимального управления мобильным роботом с фазовыми ограничениями. Результаты работы показывают очевидное преимущество эволюционных алгоритмов при решении этой задачи.

Поскольку решения, найденные эволюционными алгоритмами, не являются в строгом смысле решением задачи оптимального управления и применение их целесообразности определяется лишь значением найденного функционала, то очевидно, что в данном случае возможно использование и

других подходов, направленных на трансформацию исходной задачи к некоторой другой задаче, решение которой также не является строго оптимальным, но может давать приемлимые значения функционала. В настоящей работе представлен один из таких методов, основанный на уменьшении размерности пространства состояний.

Рассмотрим традиционную постановку задачи управления с фазовыми ограничениями. Процесс управления в такой постановке описывается дифференциальным уравнением

х (;) = / (х, и), (1)

где х(;) е Мп - вектор состояния; и(;) е Мт - вектор управления, причем на управление и (;) заданы естественные ограничения

и-< и (;) < и+, (2)

где и-, и + е М т , а для вектора состояния заданы начальное и конечное (терминальное) состояния

х (0) = х0, х (?) = X. (3)

Задан функционал качества

Заданы фазовые ограничения

J = | f0 (х, u)dt ^ min . (4)

ф; (х) < 0, I =), 5 . (5)

Необходимо найти оптимальное управление в виде функции времени

и = и (;), (6)

которое удовлетворяет ограничениям (2) и позволяет решению системы ()) достичь из начального состояния терминальное (3) с оптимальным значением критерия качества (4).

Пусть известно или возможно из особенностей задачи преположить, что часть компонент вектора состояний представляет собой известные до значений параметров функции времени, тогда можно уменьшить размерность вектора состояний и получить новую задачу оптимального управления меньшей размерности

х\;) = / (х1, х 2(;, д), и), (7)

где х = [х1: х2]Т , х1 е Яп , х2 е Яп , д - вектор постоянных параметров

д = [д1...др]Т . (8)

Теперь необходимо найти оптимальное управление (6) и вектор постоянных параметров (8), но уже для задачи меньшей размерности п) < п .

Рассмотрим пример решения задачи оптимального управления мобильным роботом на плоскости [13]. Математическая модель объекта управления имеет следующий вид:

(9)

Для модели заданы начальные и терминальные условия (3). Заданы круговые фазовые ограничения

тг2 -(х*. -Х1)2 -(х2,г -х2)2 < 0, i = 1,s , (10)

* *

где r - радиус ограничения i; х1., х2. - координаты центра ограничения i. Задан функционал качества управления

J = tf ^min. (11)

Предположим, что компонента х3, угол направления робота на оптимальной траектории либо не меняется, либо меняется линейно во времени:

[аА. л, если д4(. п < t < д4. 2 —

) = Г47- (71 ,1 = 1,1, (12)

( -1? если ¡А7-2 <t < ¡А

где д0 =0 .

Тогда получаем следующую систему уравненения движения точки на плоскости

X = ^соэ Х3(0, X = и^т ). (13)

Вместе с управлением и1 необходимо еще найти компоненты вектора параметров

д = [(¡1...ь]т , (14)

которые определяют интервалы времени и чередующиеся по интервалам времени скорости изменения компоненты х3 и ее постоянные значения.

Рассмотрим теперь плоскую задачу, когда х^) е Я2. В этом случае круговые препятствия задаются координатами в Я2 центров кругов С и их радиусами т], у = 1,5. Таким образом, фазовые ограничения принимают вид

РхЦ) - а], у = 1,5. (15)

Задача заключается в таком выборе и ^), при котором í принимает минимальное значение и выполнено условие

Рх^) - ХР <8, (16)

где 8 > 0 - некоторое заданное малое число.

При практическом решении задачи помимо задания конкретных значений / (х, и) и параметров условий (13)-(16) требуется выбрать класс функций, из которого выбирается управление и(t). Решая конкретно задачу управления мобильным роботом, в качестве управления естественно рассматривать линейную скорость движения робота и выбирать ее из класса непрерывных кусочно-линейных функций. Вторым параметром управления обычно принято считать положение руля или колес робота. Мы вернемся к обсуждению этого вопроса позже. Исходя из объективных технических характеристик любого робота, естественно считать производную кусочно-линейной функции управления ограниченной. т.е. | и'^) |< 8 для любого t. Это понятно, так как и ускорение при наборе

устройством скорости до некоторой максимально возможной и + и отрицательное ускорение (торможение) в естественных условиях ограничены. Мы будем считать их постоянными и обозначать

+ -

ускорение через ш , а торможение - через ш .

Представив задачу в традиционной постановке (13) - (16), попытаемся сформулировать ее в некоторой альтернативной форме. Действительно, задача об оптимальном быстродействии при наличии фазовых ограничений имеет много общего с задачей поиска кратчайшего пути на графе. В связи с этим напомним основные определения теории графов.

Формальное определение графа таково: задано конечное множество X, состоящее из п элементов X = х1,., хп, называемых вершинами графа, и подмножество V с X х X, называемое множеством дуг или ребер. Тогда графом G называется совокупность (X, V). Дугу между вершинами 7 и у (7, у е X) будем обозначать через \3, т.е. V = }. Нагруженным графом G(X V) называется граф, каждому ребру которого поставлено в соответствие некоторое число, называемое весом. Нагруженный граф может быть задан матрицей смежности Т , для которой элемент tij равен весу

ребра V . Если ребро V отсутствует, то полагаем tj = ^.

Кратчайшим путем L(х7, х]) на нагруженном графе называется последовательность вершин с наименьшим суммарным весом соединяющих их ребер. Наша задача заключается в нахождении L (х1, хп).

Проиллюстрируем все эти понятия на простом примере, предложенном в [13], сделав предварительное преобразование координат. Расположим ось абсцисс вдоль прямой, соединяющей х0 и х, и поместим начало координат в точку х0 (рис. )). В качестве вершин графа везьмем х1 = х0, хп = х , а также точки круговых препятствий с минимальной и максимальной ординатами, как показано на рис ).

сч

X ос

Я -

г о

3 ®

7 6 5 4 3 2 1 О -1 -2 -3 -4 -5

-7

i

x7 Г ---------1-

f........1 ---------T'

t 1

I ---------T -

; vQ t

t 1

---------T~

■ x2 ...xS-.. xlO

Г --------1 ......... / \ r......... -------~ " T " t i

1---------n ---------у -

i"--------1 ---------j

t

f" * *-----i Г ---------I-

О 2 4 6 8 10 12 14

Переменная х1

Рис. ). Вершины графа G (X, V)

При построении матрицы смежности будем исходить из следующих ограничений:

- дуга между вершинами х и х] отсутствует, т.е. ^ если вершины принадлежат одному

и тому же круговому препятствию;

- для любой дуги V7 выполняется условие 7 < у , т.е. граф считается ориентированным;

- любая дуга Vй представляет собой гладкую кривую, соединяющую вершины х7 и х:>;

- дуга V считается отсутствующей, если она содержит точки круга, которому не принадлежат вершины х1 и х].

В качестве веса ;у Ф^ дуги V принимается минимальное время перемещения робота из х1 в

х] с учетом того, что по криволинейному участку дуги робот может двигаться с минимальной скоростью и", а изменение скорости происходит с ускорениями и ш", представляя собой непрерывную кусочно-линейную функцию. Вычисление ;у при этих условиях не представляет труда.

Действительно, пусть требуется вычислить время ; у перехода от вершины х к вершине х], причем 7 =) у Ф п . Вычислим координаты точки 2 на окружности с центром с5 и радиусом г5, которой принадлежит вершина х]. Из условия гладкости перехода от движения по прямолинейному участку [х , 2] к движению по дуге окружности [2, х] ] точка 2 является решением системы уравнений

(z - xJ, z - с" >;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

< P z - с" P2 = Г"2; (17)

zi = ci — zi ^ z2 Г" — 1 X2 — X 21

Движение по прямолинейному участку [ X, z ] состоит из двух или трех составляющих в зависимости от длины этого участка /1 = PX - zP . Сначала робот разгоняется до максимальной скорости u+ с ускорением ш+, затем движется с постоянной скоростью u+ и, наконец, с тормозит с ускорением ш-, начиная с такого момента, чтобы в точке z скорость была равна u- . Вычислим время, за которое робот разгонится до некоторой скорости u в предположении, что ограничение сверху на допустимую скорость u+ отсутствует. Обозначим его через т1, а через т2 - время торможения со скорости u до u-. Легко проверить, что т1 и т2 являются решением системы уравнений

т1ш+ -т2 ш- =u-; т\ ш -т2ш = 2Iv

Если при этом u = т1ш+ < u+, то время прохождения роботом прямолинейного участка равно t1 =т1 + т2. В противном случае t1 =т1 + т2 + т3, где

т1 = u+ / ш+, т 2 = (u + - u-) / ш", т3 = (2/1 - т2 ш+ - т 2ш-) / 2u+ .

Движение по дуге [z, xJ ], длина которой равна /s = rs (z2 / z1), по условию осуществляется с постоянной скоростью u- . Следовательно, время, затраченное на перемещение по этому участку, равно t2 = /2 / u- . Таким образом, ty = t1 +12.

Вычисление , когда i Ф 1 и J = n, происходит по аналогичным формулам за исключением незначительных нюансов. Если i Ф 1 и J Ф n, то система, подобная (17), зависит от двух переменных z1 и z2, являющихся точками общей касательной к окружностям, содержащим вершины графа x и xj. Однако решение этой системы также не составляет труда.

Для построения минимального пути L(x1,xn) на графе G(X,V) существует ряд алгоритмов. Приведем один из них, обозначив через I множество индексов всех вершин графа, через I+ - множество индексов помеченных вершин, а через I ~ = I \ I+ - множество индексов непомеченных вершин.

Алгоритм. (Е. Дейкстра [14] )

Шаг 1. Положить k = 0 , s = 1, X0(x") = 0, I+ = {1}, X0(x") = ^ для iе I- .

Шаг 2. Положить k = k +1 . Если I- = %, то перейти к шагу 4. В противном случае положить Xk(xp) = min{Xk-1(xp),Xk-1(x") + tsp}, tsp <~, pе Г , Xk (xJ) = Xk-1(xJ), J е I-, J ф p .

Шаг 3. Если Xk (xj) = ^ для всех J е I-, то перейти к шагу 4. В противном случае выбрать s из условия Xk(x") = min _ Xk(xJ). Положить I+ = I+ u {s} и перейти к шагу 2.

Шаг 4. Построить последовательность индексов вершин, отвечающих минимальному пути, при этом вершина xq, предшествующая вершине xn, определяется из соотношения

X k (xq ) + tqn =X k ( xn ).

Затем определяется вершина, предшествующая вершине хд, и т.д. до вершины х1. Корректность алгоритма доказывается индукцией по номеру итерации, а вычислительная сложность алгоритма оказывается квадратичной (см. [14, 15]).

На рис. 2 показан минимальный путь, полученный алгоритмом Дейкстры для примера из работы [13] при и- = 1,4, и + = 10,0, ш+ = 80,0, ш- =-150,0.

Траектория метода

(} 2 4 6 Ё 10 12 14

Переменная х1

Рис. 2. Траектория метода

Время прохождения роботом пути I(х1, хп) составило I = 1,8287, что более чем в два раза превосходит результаты, приведенные в работе [13].

На рис. 3 приведен график линейной скорости робота на протяжении минимального пути. Очевидно, что положение руля или колес технического устройства должно меняться при переходе от прямолинейного движения к движению по окружности, и наоборот. Важно также отметить, что увеличение скорости прохождения криволинейных участков трассы до значения и- = 2,0 приводит к изменению траектории движения и, что естественно, к уменьшению значения 1 .

График скорости на трассе 14 .....................................

12:-------------------------------------п--------

о 1

Рис. 3. График скорости на трассе

Библиографический список

1. Понтрягин, Л. С. Математическая теория оптимальных процессов / Л. С. Понтрягин, В. Г. Болтянский, Р. В. Гамкрелидзе, Е. Ф. Мищенко. - Москва : Наука, Главная редакция физико-математической литературы, 1983. - 322 с.

2. Федоренко, Р. П. Приближенное решение задач оптимального управления / Р. П. Федоренко. - Москва : Наука, Главная редакция физико-математической литературы, 1978. - 488 с.

3. Грачев, Н. И. Библиотека программ для решения задач оптимального управления / Н. И. Грачев, Ю. Г. Евтушенко // Журнал вычислительной математики и математической физики. - 1979. - Т. 19, № 2. -С. 367-387.

4. Дьяконов, В. П. MATLAB 6/6.1/6.5 + Simulink 4/5. Основы применения. Полное руководство пользователя /

B. П. Дьяконов. - Москва : СОЛОН-Пресс, 2002. - 768 с.

5. Дьяконов, В. П. Mathematica 5/6/7. Полное руководство / В. П. Дьяконов. - Москва : ДМК Пресс, 2009. -624 с.

6. Дьяконов, В. П. Maple 7 : учеб. курс / В. П. Дьяконов. - Санкт-Петербург : Питер, 2002. - 672 с.

7. Евтушенко, Ю. Г. Оптимизация и быстрое автоматическое дифференцирование / Ю. Г. Евтушенко. -Москва : ВЦ РАН, 2013. - 144 с.

8. Дивеев, А. И. Условия отсутствия свойств унимодальности функционала в задаче оптимального управления с фазовыми ограничениями / А. И. Дивеев // Cloud of Science. - 2018. - Т. 5б, № 2. - С. 268-285.

9. Евтушенко, Ю. Г. Метод неравномерных покрытий / Ю. Г. Евтушенко, М. А. Посыпкин // Журнал вычислительной математики и математической физики. - 2013. - Т. 63, № 2. - С. 144-157.

10. Стронгин, Р. Г. Численные методы в многоэкстремальных задачах (информационно-статистические алгоритмы) / Р. Г. Стронгин. - Москва : Наука, 1978. - 240 с.

11. Карпенко, А. П. Современные алгоритмы поисковой оптимизации. Алгоритмы, вдохновленные природой / А. П. Карпенко. - Москва : Изд-во МГТУ им. Н. Э. Баумана, 2014. - 446 с.

12. Дивеев, А. И. Исследование практической сходимости эволюционных алгоритмов оптимального программного управления колесным роботом / А. И. Дивеев, С. В. Константинов // Известия РАН. Теория и системы управления. - 2018. - № 4. - С. 80-106.

13. Дивеев, А. И. Эволюционные алгоритмы для решения задачи оптимального управления / А. И. Дивеев,

C. В. Константинов // Вестник Российского университета дружбы народов. Инженерные исследования. -2017. - Т. 18, № 2. - С. 254-265.

14. Dijkstra, E. W. A note on two problems in connection with graphs / E. W. Dijkstra // Numer. Math. Springer Science + Business media. - 1959. - Vol. 1, № 1. - P. 269-271.

15. Кормен, Т. Алгоритмы. Построение и анализ / Т. Кормен, Ч. Лейзерсон, Р. Ривест, К. Штайн. - Москва : Вильямс, 2013. - 1328 с.

References

1. Pontryagin L. S., Boltyanskiy V. G., Gamkrelidze R. V., Mishchenko E. F. Matematicheskaya teoriya opti-mal'nykh protsessov [Mathematical theory of optimal processes]. Moscow: Nauka, Glavnaya redaktsiya fiziko-matematicheskoy literatury, 1983, 322 p. [In Russian]

2. Fedorenko R. P. Priblizhennoe reshenie zadach optimal'nogo upravleniya [Approximate solution of optimal control problems]. Moscow: Nauka, Glavnaya redaktsiya fiziko-matematicheskoy literatury, 1978, 488 p. [In Russian]

3. Grachev N. I., Evtushenko Yu. G. Zhurnal vychislitel'noy matematiki i matematicheskoy fiziki [Journal of computational mathematics and mathematical physics]. 1979, vol. 19, no. 2, pp. 367-387. [In Russian]

4. D'yakonov V. P. MATLAB 6/6.1/6.5 + Simulink 4/5. Osnovy primeneniya. Polnoe rukovodstvo pol'zovatelya [MATLAB 6/6.1/6.5 + 4/5 Simulink. Basics of application. Complete user manual]. Moscow: SOLON-Press, 2002, 768 p. [In Russian]

5. D'yakonov V. P. Mathematica 5/6/7. Polnoe rukovodstvo [Mathematica 5/6/7. Complete guide]. Moscow: DMK Press, 2009, 624 p. [In Russian]

6. D'yakonov V. P. Maple 7. Uchebnyy kurs [Maple 7. Training course]. Saint-Petersburg: Piter, 2002, 672 p. [In Russian]

7. Evtushenko Yu. G. Optimizatsiya i bystroe avtomaticheskoe differentsirovanie [Optimization and fast automatic differentiation]. Moscow: VTs RAN, 2013, 144 p. [In Russian]

8. Diveev A. I. Cloud of Science. 2018, vol. 5b, no. 2, pp. 268-285. [In Russian]

9. Evtushenko Yu. G., Posypkin M. A. Zhurnal vychislitel'noy matematiki i matematicheskoy fiziki [Journal of computational mathematics and mathematical physics]. 2013, vol. 63, no. 2, pp. 144-157. [In Russian]

10. Strongin R. G. Chislennye metody v mnogoekstremal'nykh zadachakh (informatsionno-statisticheskie algoritmy) [Numerical methods in multiextremal problems (information and statistical algorithms)]. Moscow: Nauka, 1978, 240 p. [In Russian]

11. Karpenko A. P. Sovremennye algoritmy poiskovoy optimizatsii. Algoritmy, vdokhnovlennye prirodoy [Modern search engine optimization algorithms. Nature-inspired algorithms]. Moscow: Izd-vo MGTU im. N. E. Baumana, 2014, 446 p. [In Russian]

12. Diveev A. I., Konstantinov S. V. Izvestiya RAN. Teoriya i sistemy upravleniya [Proceedings of the RAS. Theory and control systems]. 2018, no. 4, pp. 80-106. [In Russian]

13. Diveev A. I., Konstantinov S. V. Vestnik Rossiyskogo universiteta druzhby narodov, Inzhenernye issledovaniya [Bulletin of the peoples ' friendship University of Russia. Engineering study]. 2017, vol. 18, no. 2, pp. 254-265. [In Russian]

14. Dijkstra E. W. Numer. Math. Springer Science + Business media. 1959, vol. 1, no. 1, pp. 269-271.

15. Kormen T., Leyzerson Ch., Rivest R., Shtayn K. Algoritmy. Postroenie i analiz [Algorithms. Construction and analysis]. Moscow: Vil'yams, 2013, 1328 p. [In Russian]

Березнев Валентин Александрович

доктор физико-математических наук, профессор, старший научный сотрудник,

Управление робототехническими устройствами, Федеральный исследовательский центр «Информатика и управление» Российской академии наук (Вычислительный центр им. А. А. Дородницына РАН) (119333, Россия, г. Москва, ул. Вавилова, 40) E-mail: [email protected]

Дивеев Асхат Ибрагимович

доктор технических наук, директор роботоцентра

Управления робототехническими устройствами, Федеральный исследовательский центр «Информатика и управление» Российской академии наук (Вычислительный центр им. А. А. Дородницына РАН) (119333, Россия, г. Москва, ул. Вавилова, 40); профессор департамента механики и мехатроники Инженерной академии Российского университета дружбы народов (115419, Россия, г. Москва, ул. Орджоникидзе, 3) E-mail: [email protected]

Bereznev Valentyn Аleksandrovych

doctor of physical and mathematical sciences, professor,

senior researcher of the robot control center,

Federal research center

«Computer science and control»

of the Russian Academy of Sciences

(Dorodniсyn Computer Center of RAS)

(119333, 40 Vavilov street, Moscow, Russia)

Diveev Askhat Ibragimovich

doctor of technical sciences,

director of the robot control center,

Federal research center

«Computer science and control»

of the Russian Academy of Sciences

(Dorodn^yn Computer Center of RAS)

(119333, 40 Vavilov street, Moscow, Russia);

professor of the department of mechanics

and mechatronics Engineering Academy

Peoples' friendship University of Russia

(115419, 3 Ordzhonikidze street, Moscow, Russia)

Образец цитирования:

Березнев, В. А. Метод редукции пространства состояний для решения задачи оптимального управления / В. А. Березнев, А. И. Дивеев // Надежность и качество сложных систем. — 2019. — № 3 (27). - С. 17-25. - БО! 10.21685/2307-4205-2019-3-2.

i Надоели баннеры? Вы всегда можете отключить рекламу.