Научная статья на тему 'Игровые и вариационные задачи механики полета с ограниченным прогнозом ситуации'

Игровые и вариационные задачи механики полета с ограниченным прогнозом ситуации Текст научной статьи по специальности «Математика»

CC BY
157
52
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Ученые записки ЦАГИ
ВАК
Область наук

Аннотация научной статьи по математике, автор научной работы — Бобцов В. А., Кузмак Г. Е.

Рассматриваются игровые и вариационные задачи механики полета, которые можно условно назвать задачами с ограниченным прогнозом ситуации. В таких задачах оптимальный выбор управления производится на сдвинутых один относительно другого малых интервалах времени. Использование малости интервала времени позволяет построить эффективный метод решения таких задач, основанный на использовании принципа максимума Л. С. Понтрягина. С помощью этого метода может быть проведен анализ всех возможных типов оптимального управления и разработаны алгоритмы, обеспечивающие большую скорость численного решения. Дана оценка точности метода и приведены результаты расчетов, иллюстрирующие характер сходимости итераций для ряда характерных случаев.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Игровые и вариационные задачи механики полета с ограниченным прогнозом ситуации»

То м IV

УЧЕНЫЕ ЗАПИСКИ ЦА Г И

197 3

№ 6

УДК 629.7.015.531.55

ИГРОВЫЕ И ВАРИАЦИОННЫЕ ЗАДАЧИ МЕХАНИКИ ПОЛЕТА С ОГРАНИЧЕННЫМ ПРОГНОЗОМ СИТУАЦИИ

В. А. Бобцов, Г. Е. Кузмак

Рассматриваются игровые и вариационные задачи механики полета, которые можно условно назвать задачами с ограниченным прогнозом ситуации. В таких задачах оптимальный выбор управления производится на сдвинутых один относительно другого малых интервалах времени. Использование малости интервала времени позволяет построить эффективный метод решения таких задач, основанный на использовании принципа максимума Л. С. Понтрягина. С помощью этого метода может быть проведен анализ всех возможных типов оптимального управления и разработаны алгоритмы, обеспечивающие большую скорость численного решения. Дана оценка точности метода и приведены результаты расчетов, иллюстрирующие характер сходимости итераций для ряда характерных случаев.

Игровые задачи механики полета описываются нелинейными дифференциальными уравнениями со сложными ограничениями, накладываемыми как на фазовые координаты, так и на управления. Важным усложняющим обстоятельством является также и то, что в процессе движения могут изменяться цель и условия игры. Это значит, что при решении реальных задач механики полета необходимо уметь находить и склеивать решения различных игровых задач. При современном состоянии теории игр точное решение таких задач наталкивается на большие трудности. Успехи, достигнутые в этой области математики в течение последних лет [1—3], применимы к решению задач механики полета в том случае, если их рассматривать в упрощенной модельной постановке. Чаще всего такие задачи рассматриваются в кинематической постановке, в которой управляющим вектором является вектор скорости. Решения модельных задач позволяют в общих чертах представить себе стратегии каждого из игроков. При известных тенденциях в поведении каждого из игроков возникает задача о реализации их на базе точных уравнений движения с учетом действительных управляющих возможностей. При решении такой задачи вместо изучения поведения игроков на всем последующем интервале времени можно ограничиться малым интервалом в будущем, непо-

средственно примыкающем к рассматриваемому моменту времени [4—6]. Игровые, а также вариационные задачи, решаемые в такой приближенной постановке, можно условно назвать „задачами с ограниченным прогнозом ситуации". В рамках такой постановки можно учесть все реальные ограничения и изменение условий игры в процессе движения.

Целью настоящей работы является изложение методики решения таких задач. Предложенная методика основана на использовании аппарата принципа максимума Л. С. Понтрягина. На интервале времени, равном интервалу прогноза, она позволяет численно с помощью ЭЦВМ получить точные решения игровых задач. Следует отметить, что хотя игры с ограниченным прогнозом ситуации не рассматривались в классической теории дифференциальных игр [1—3], в рамках указанной выше постановки можно решить многие практические игровые задачи, в частности задачи механики полета. Если при увеличении времени прогноза удается обеспечить сходимость соответствующих итерационных процессов, возможен переход к классической постановке задачи, когда оптимизируются функционалы в момент окончания игры.

Постановка задачи. Рассмотрим игру двух лиц. Пусть игрок А

управляет движением системы А с вектором фазовых координат х и управляющим вектором и, а игрок Б управляет движением системы Б с вектором фазовых координат у и вектором управляющих функций v.

Уравнения движения системы А —

dx "*• -*

и), UÇGА. (1)

Уравнения движения системы Б —

-%-МУ, v)t vïGs. (2)

Через /а и /б здесь обозначены векторы правых частей уравнений движения соответственно систем А и Б, а через Ga и ■Ge—области допустимых значений управлений. В настоящей работе будем предполагать, что уравнения движения предварительно могут быть преобразованы таким образом, что области GA и GB не зависят от фазовых координат. Такие преобразования указаны в монографии [7] и применимы ко всем основным ограничениям, встречающимся в механике полета, кроме ограничений, налагаемых на высоту полета и скоростной напор. Учет последних ограничений требует специального рассмотрения.

В соответствии со сказанным выше предположим, что в результате предварительного рассмотрения задачи определены скалярные

функции F\ (л, у) и FB (х, у), которые характеризуют качество позиций игроков при всех значениях хну, реализующихся в процессе игры [4—6]. Будем считать, что качество позиций игроков А и Б тем лучше, чем соответственно больше значения функций Fa. и Гъ-

Управления u(t) и v{t) определяем последовательно, переходя от момента времени tk к моменту ík+\ = tk-\- h, где h — малая величина.

Причем при определении управлений для интервала \tk, tk-\-hJ ситуация прогнозируется на больший чем h интервал времени M

вперед и максимизируется качество позиций обоих игроков при

—>

t = tk + bt. Таким образом игрок А выбирает свое управление и (t), исходя из условия максимизации величины F\(tk-\- ht), а игрок Б

выбирает свое управление v(t) так, чтобы максимизировать

+АО-

Задача сводится к игре с ненулевой суммой [8] при t(t\tk, tk-\-bt\. В зависимости от предположений, которые делаются относительно

стратегии противника, получающиеся таким образом функции u(t)

и v(t) соответствуют либо точке равновесия по Нэшу, либо определяются с помощью максминного подхода [8]. Более подробно

этот вопрос будет рассмотрен ниже. Величина интервала M далее

—► —>

считается заданной и малой. При определении u(t) и v{t) с помощью указанной процедуры осуществляется приближенный синтез оптимального управления для каждого из игроков.

Игра рассматривается на интервале времени 0 <11 < Т. Момент окончания игры Т либо задан заранее, либо определяется как момент попадания игрока А или Б на специально заданное для каждого из них множество.

Победа или поражение присуждается игрокам по-разному, в зависимости от того, как определяется момент Т. Если Т задано, то для решения этого вопроса необходимо ввести в рассмотрение функции Qa и Qb, характеризующие величину выигрыша соответственно для игроков А и Б. Если важно только положение игроков при t = T, то Qa и Qb являются известными функциями от х(Т) и у(Т), если же необходимо оценить положение игроков в течение всей игры, то соответствующие критерии имеют интегральный характер и для определения функций Qa (0 и Qb(î) необходимо задать специальные дифференциальные уравнения:

dQA - - dQB ~ -»

-¿Г = та (■*• У' Qa» qb); -¿р = <Рб Qa, Qb).

При фиксированном Т игрок А считается победившим игрока Б, если Qa (T) > Qb (Т) и, наоборот, победа присуждается игроку Б, если это неравенство выполняется с обратным знаком. В случае равенства этих функций будем считать игру окончившейся ничейным исходом. Значения функций Qa(T) и Qb^) можно использовать для оценки качества победы. При указанном способе оценки итогов игры ясно, что выбор управлений каждым из игроков из условия максимизации прогнозируемых значений величин функций Fa. и Fb, характеризующих качество позиции, должен, по крайней мере, приближенно соответствовать максимизации величин Q\(T) и Qs(T). При определении момента окончания игры из условия попадания

игрока на заданное для него множество, которое может зависеть —>■ —►

от х(Т),у(Т), Qa (Т) и QbOO, победившим следует считать либо того игрока, у которого так же как и ранее выигрыш больше, либо присуждать победу тому, которому это удалось сделать раньше. При последнем способе присуждения победы значения функций Qa(T) и Qb(T) можно так же как и ранее использовать для оценки качества победы или поражения. В этом случае выбор

функций Fa (х, у) и Fb (х, у) должен быть подчинен условию наибыстрейшего достижения множеств, определяющих момент окончания игры.

Определение управляющих функций. Рассмотрим сформулированную выше задачу об определении управляющих векторов

u(t) и v(t) при ik С t <! tk-\- At соответственно из условий минимизации функционалов Л. и Л:

А = — Fa Çc(tk-\- At), y(tk 4- ДО); Л = -Fh Çc(tk + At), y(tk+ At)).(3)

Будем предполагать, что при 0 -<ct^ltk аналогичные задачи

решены, так чтол:(^) и y(tk) известны. Задачи об определении

векторов u(t) и v(t) при ¿¿<¿<^4- Дt представляют собой вариационные задачи соответственно для уравнений (1) и (2) с функционалами (3). Эти задачи зависят одна от другой из-за зависимости функций Fa и Fb от фазовых координат обоих игроков. Будем

сначала при определении вектора u(t) считать, что известно значение вектора у (tk + ДО, и аналогично при определении вектора v(f)

предположим, что дано значение x(tk-\-At). Тогда указанные задачи становятся независимыми, каждая из них представляет собой задачу Майера со свободным правым концом траектории и фиксированным временем. Воспользуемся для их решения принципом максимума Л. С, Понтрягина. Приведем основные соотношения, необходимые

для определения u(t). Задача об определении v(t) решается аналогично.

Управление u(t) определяется из условия максимума по «6<За гамильтониана НА = (фд, fh(x, и)), где Фа —вектор сопряженных переменных. Вектор фд удовлетворяет следующим условиям [6]:

=--<М** + Д0 = -—--■ (4)

аг дх дх (tk -f At)

Первый из рассмотренных алгоритмов основан на использовании линеаризованных представлений для функционалов (3). Обозначим

через хй

(4-МО и y0(tk + At) некоторые известные приближенные

значения функций x(tk + At) и y(tk-\- At) и выполним линеаризацию функционала Л. в их окрестности

Ja^-Fa [х0 (tk + At),y0(tk + Д/)) - . - , Ду) • (5) Здесь

Ах = x(tk + Д t) - х0 (tk + Д t); Дy-y(h + ДО - у0 (tk + ДО-

Величины x0(tk -f ДО, Уо(*к + M) могут быть, в частности, приближенно определены по результатам решения задачи для£б|^-ъ + дг]. При использовании (5) величина (tk + At) оказывается

равной и не зависящей от y(tk-\~ At). Этот факт означает

V дх /0

полное разделение задач об определении u(t) и v(t). При таком подходе к решению движения игроков А и Б связаны одно с

другим посредством величин х0ук + Ы) и y0(tk-{-At), которые при каждом k являются опорными величинами при линеаризации функционалов (3).

Алгоритм решения получающейся здесь краевой задачи будет приведен после изложения второго из алгоритмов определения

u(t) и v(t), который более точно учитывает нелинейный характер

зависимостей Уд и /б от х и у. Для построения второго алгоритма

введем в рассмотрение функцию FA--FA{x(t), y0(tkA-M)) и соста-

dFs ( dFA

вим для нее дифференциальное уравнение -¡f = I——, /а], Присоединим это уравление к уравнениям (1) и рассмотрим задачу о минимизации функционала JA = — FA\t+u- Эта задача эквивалентна исходной. Запишем для нее гамильтониан На и систему для определения вектора сопряженных переменных фА и сопряженной переменной ф0, соответствующей FA\

На = (Фа, /а (х, и)) + ф0 , /А (х, и) ) ;

дх

Так как Ф0=1> то На и сопряженная система могут быть переписаны в виде

На = ( ФА 4* , /а(х, И));

V дх /

—*

= - 4 (?А + -^Ч /а) ; Îa (/, 4- АО = 0. (б)

al дх \ дх 1

Достоинством данного подхода к задаче является то, что ?а + определяется точно.

Перейдем далее к решению краевой задачи для уравнений (1) с граничными условиями, данными при t = tk, и уравнений (6) с условиями, заданными при t = tk-\-àt. В качестве основы для решения этой задачи выбран метод прогонки [6]. Выбор этого метода связан с тем, что для линейных систем он дает точное решение задачи за одну итерацию. Рассматриваемые же нами задачи из-за малости Дt близки к линейным. Кроме того, при малых M этот метод может быть еще более упрощен путем замены интеграции сопряженной системы вычислением значений сопряженных переменных с помощью конечных соотношений.

Как это принято в методе прогонки, будем определять Фа (0 [или Фа(0], переходя от t — tk + àt, где их значения даны, к меньшим значениям t, предполагая, что значения x(t) известны в результате расчета предыдущей итерации. Предположим, что отрезок [tk, tk + M] может быть разбит на меньшие отрезки таким

образом, что внутри каждого из них вектор непрерывен. Это всегда можно сделать, если на каждой итерации отслеживать моменты разрывов, которые совпадают с нулями функций переключения. Рассмотрим вопрос о построении зависимости Фа(0 для какого-либо одного из таких отрезков с началом при ¿ = и

концом при t = b^.tk + М в предположении, что значения Фа (Ь)

ФЬ,

уже определены. Определяя при Ь = Ь из сопряженной системы, можем написать

(0 = Фа (Ь) + (*-*) + О (7)

В формулах для фА указываются только погрешности, связанные

с неточностью аппроксимации. Равенство (7) позволяет найти Фа (а) с погрешностью 0(Д£2). Соответственно сопряженная система позво-

¿Фд —

ляет найти —при Ь = а с такой же точностью. Зная фл (Ь)> ( ¿фА \ / ¿фА \ .

1-^-1 и 1—, можно использовать более точное выражение для фА

Фа(0 = ФА (Ь) + {^г]ьа-Ь) +

V Л 1ь ~ V Л /,

Ь \ М 1 а

Ь — а

(-Ц^- + 0(дг3).(8)

При использовании формул (7) и (8) важным является правильное определение производных при t — b после прохождения точки

разрыва и{£).

Было оценено изменение величины погрешности в х {£) при переходе от предыдущей итерации к последующей. Установлено,

что если при tk + Щ нет точек разрыва то после вы-

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

полнения каждой следующей итерации величина этой погрешности

уменьшается в (Д*)2 раз, если же есть точки разрыва то для систем, близких к линейным, —только в Д^ раз. Это следует из того, что величина погрешности, входящей в правые части систем

уравнений для х и ф, интегрируется. Отметим, что так как погрешность аппроксимации фд(0 есть величина 0(Д*)3, то погрешность в определении х({), вообще говоря, не может быть меньше чем

0(Д*4) в случае отсутствия разрывов и (¿) и меньше чем О (Д*3) при наличии разрывов. Это является следствием того, что величина

погрешности в «(¿), определяемой в соответствии с принципом максимума, в общем случае не может быть меньше величины

погрешности в фА(/)- Отмеченный результат позволяет утверждать, что предельная точность при использовании формулы (8) при а =

и 6 = достигается в случае отсутствия разрыва и(£) после

выполнения двух, а при наличии разрыва — после трех итераций. Максимально допустимое значение Д*, обеспечивающее заданную

точность, должно выбираться с учетом указанных оценок точности метода.

—» —>•

Изложенные алгоритмы определения u(t) и v{t) при приближенном задании координат противника в момент t =tk + M позволяют перейти; к решению сформулированной выше игровой задачи. Суть вопроса, очевидно, состоит в указании способа уточнения

величин x0(tk + и + Если считать, что каждому из игроков известны обе функции ГА (х, у) и Еъ(х, у), которые максимизируются, т. е. известна стратегия противника, то итерации для определения u(i) следует чередовать с итерациями для определения v(t). Ясно, что в этом случае при наличии сходимости процесса одновременно с уточнением управлений будут уточняться прогнозируемые положения игроков. Получающиеся

предельные вектор-функции и (t) и v (t) соответствуют точке равновесия [8] для задачи минимизации функционалов (3). Используя принцип сжатых отображений, можно доказать, что если функции

/*д (х, у) и Fh(x, у) близки к линейным, то указанный процесс сходится к решению поставленной задачи.

Рассмотрим далее противоположный случай, когда игрокам ничего не известно о стратегиях противника [8]. В такой ситуации для определенности игрок А может предположить, что противник действует наихудшим для него образом, т. е. максимизирует JA

при известном и. Такое предположение для игровых задач механики полета с ограниченным прогнозом ситуации недостаточно обосновано при выборе u{t) на одном шаге, так как заведомо неверно прогнозируется движение противника. Однако если рассмотреть положения игроков после нескольких шагов выбора управнений,

то использование такого „гарантирующего" управления и = и* может дать известный выигрыш. Из сказанного следует, что управление и = и* определяется в результате решения следующей задачи:

УАг(и*, V) = min шах JA.

и v

Аналогично „гарантирующее" управление v = v* для игрока Б определяется из условия

и') = min тах/Б-

Решения этих задач могут быть получены с помощью поочередного использования описанных выше алгоритмов игроками А и Б.

Максимизация гамильтониана. Одним из основных факторов, определяющих быстродействие изложенного метода решения игровых задач, является возможность для уравнений механики

полета определить значения и, сообщающие максимум Н, в явном виде. Для рассмотрения этого вопроса запишем уравнения движения летательного аппарата в полускоростной системе координат

4— Ученые записки ЦАГИ № 6

49

"(ось Ох направлена по вектору скорости, ось Оу расположена в

вертикальной плоскости):

dV , , оч dd g . .. dk S \

-¿f — ё (nx sin 0); cos 0); _ _

(9)

1/cos 6cos X; 1/cosQsinX; ^=Vslne. )

Через X здесь обозначен угол курса, все остальные обозначения общепринятые.

Проекции перегрузки пх, пу, пг на оси полускоростной системы координат связаны с проекциями перегрузки пхс, пус, nzC на оси скоростной системы координат с помощью формул:

пх= пхс; пу = «у ccos7c — «zcsin тс; nz = nzCcos fc + пу с sln Тс- (Ю) Таким образом, скоростная система координат получается из полускоростной путем поворота ее на угол крена ус относительно вектора скорости. Для компонент пхс, пус, пгс можно записать следующие выражения:

пхс = -g- [Pcos (a -f fT) cos p — Q cos p + г sin ¡3];

Лу« = -д-[1'+Я81п(а+<рт)];

nzc = -^- [z cos p + Q sin p — P cos (a + sin p|.

Здесь G— вес; P—тяга; Q — сопротивление; Z — боковая сила; Y — подъемная сила; <рт — угол между вектором тяги и плоскостью, от которой отсчитывается угол атаки а; Р'—угол скольжения. Управляющими функциями в этой системе уравнений являются а> Р. Р> Тс. а также величины, определяющие положение механизации летательного аппарата. Эти функции представляют собой компоненты вектора и. Обозначим через g Ни часть гамильтониана для уравнений (9), зависящую от уравнений

+ — (11)

Здесь tyv, <И — сопряженные переменные, соответствующие фазовым координатам V, 6, X.

Введем в рассмотрение вектор 5 с проекциями Sx, Sy, Sz на оси полускоростной системы координат:

= Sy=JíL; Sz = — . (12)

С использованием этого вектора выражение для Н„ может быть переписано в виде

Н„ = (3, л). (13)

В соответствии с принципом максимума вектор « б G/v, где

Gn — область допустимых значений п, должен быть определен так,

чтобы при фиксированном 5 скалярное произведение (13) было максимальным. Для того чтобы определить область Gм, зададим в

вертикальной плоскости, проходящей через вектор скорости V,

область N возможных значений пхс и гех =

с + til с при и б Ga-

Характерный вид этой области изображен на фиг. 1. Правая граница 50

области получается при максимальной тяге, левая — при выключенной тяге и полностью открытых тормозных щитках, линия АБ соответствует максимальным значениям подъемной силы и т. д. В самом общем случае, каждой точке границы этой области соответствуют вполне определенные одно или несколько значений

вектора и. При известной области N нетрудно построить область

—►

<3л?- В силу независимости величины вектора п от угла крена эта

область получается путем вращения области N относительно оси Опх с, которая совмещена с вектором V.

Условие максимума (5, п) допускает простую геометрическую интерпретацию. Вследствие того что область Gn ограничена поверхностью вращения, вектор п = nopt должен быть расположен в плоскости, проходящей через векторы S и V, и направлен в точку касания границы области Gлг с плоскостью К, которая перпендикулярна к вектору S*. Для случая, когда вектор 5 расположен в вертикальной плоскости, взаимное расположение векторов S, nopt и плоскости К указано на фиг. 1. Если точка касания плоскости К с областью Gn определяется однозначно, то nopt может быть определено из условия максимума Н, и в таких случаях управление имеет граничный характер. Так как граничные режимы являются основными, то из сказанного вытекает целесообразность любых мероприятий, направленных на увеличение области N. Важным здесь является то, что из рассматриваемой вариационной задачи выделяется задача максимизации этой области, не зависящая от задачи определения сопряженных переменных [10].

После того как вектор /zopt определен, можно найти исходный

вектор Mopt, компонентами которого являются положения органов управления летательного аппарата. Из сказанного выше следует,

что при оптимальном управлении между компонентами вектора и существуют вполне определенные связи, не зависящие от сопряженных переменных. _

Анализ возможных расположений вектора S показывает, что наряду с граничными режимами существуют также режимы осо-

* Аналогичный результат указан в работе [9] для случая, когда иг = 0 и вектор тяги может быть ориентирован произвольно по отношению к летательному аппарату.

бого управления, когда лор1 не может быть определен из принципа максимума.

Первый тип особого управления появляется тогда, когда

5 = 0. В этом случае вектор raopt полностью не определен.

Второй тип особого управления характеризуется тем, что вектор 5 параллелен или антипараллелен вектору V. В этом случае

невозможно определить угол крена. Модуль же вектора reopt определяется однозначно.

Третий тип особого управления появляется в случае, когда

вектор S перпендикулярен к прямой, соединяющей точки А и Б на фиг. 1. В этом случае можно определить угол крена, но невозможно определить управление тягой и тормозными щитками.

Из сказанного следует, что характер особого управления весьма существенно связан с формой области N. Определение особых управлений требует привлечения специальных методов [7].

Дополним проведенное геометрическое рассмотрение задачи максимизации Н одним аналитическим результатом. Перепишем выражение (11) с учетом равенств (10) и (12):

На = Sx пх с -f Sy (пу с eos fe — пг с sin fe) + Sz (nz c COS Tfc + ny с sin Tfc) = = Sx nx с + (Sy ny c + Sz nz c) cos Tc + (Sz пу с — Sy «г с) sin fc.

Выполняя максимизацию по получим

Sy пу с-\-Sznzс Sznyc Synzc

cosYcopt — —-ó—г-; sinfc,opt==-о—-- ; (14)

°± "i "j.

H„ = шах Ни = Sx nx c + S± n± = (S1( nj.

Tc

Здесь

Sx=Vs2y + g> 0; n±=Vn2yc + n¡c> 0; =

Проведенное преобразование сводит исходную трехмерную задачу о выборе n£GN к двумерной задаче определения n^^N, максимизирующего Нв, Можно указать практически приемлемую аппроксимацию границ области N, при которой задача максимизации Н„ может быть решена аналитически. Существенные упрощения получаются, если решать задачу с учетом лишь первых степеней пг, когда можно принять п±^хпуС. После того как такое решение получено, формулы (14) позволяют найти тс, opt.

Результаты расчетов. Целью проведенных расчетов являлось исследование характера сходимости описанных выше алгоритмов. При расчетах использовался алгоритм, основанный на линеаризации функционала с уточнением значении —-, -зг-

dx{tk + M) dy(tk + ДО

Фиг. 2

сл ы

на каждой итерации. С тем чтобы получить решение задачи синтеза оптимального управления в вариационных и игровых задачах, о которых будет сказано далее, этот алгоритм включался в действие с шагом А = 1 с. Прежде всего были проведены расчеты для случая, когда летательный аппарат А двигается по программе, а летательный аппарат Б стремится с ним сблизиться. На фиг. 2 для — 3 и 6 с рассмотрен случай, когда аппарат А совершает прямолинейное движение. Для построения управления аппаратом Б

в этом случае было принято /гб = — \га— гб|, где гА и гб —радиус-векторы центров масс аппаратов А и Б. На этой и всех последующих фигурах пунктиром обозначено нулевое приближение, штрих-пунктиром — первая итерация и сплошной линией —последняя итерация. На фиг. 3 для М = 3с построены графики последовательных итераций для случая, когда аппарат А движется в горизонтальной плоскости с минимально возможным радиусом разворота,

а аппарат Б по-прежнему стремится с ним сблизиться. На фиг. 4 представлены результаты аналогичных расчетов для случая, когда в начальный момент скорости аппаратов направлены в противоположные стороны, и, кроме того, аппарат Б находится на меньшей высоте, чем аппарат А, который двигается прямолинейно. В этом случае аппарат Б совершает существенно пространственный маневр. На фиг. 2—4 видно, что в случае, когда аппарат А совершает программное движение, для всех рассмотренных маневров требуется не более двух-трех итераций цри неудачно выбранном нулевом приближении и не более одной-двух итераций в случае хорошего нулевого приближения для обеспечения сходимости метода.

На фиг. 5 представлены результаты расчетов для игровой ситуации. Графики последовательных итераций построены только для аппарата Б, так как для аппарата А картина аналогична.

7, М

СЯг 1000 п

г*5 — * м - I

ЯГс Л ¿ Юс —

9с - Мс

1

\ ___ у

-3000 -2000 \ 15с \ \ 'Л 0 1000х,м

\\

N ,20с\ \

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

№ \зос

Е&р ^""/ЛЛЛ

Фиг. 5

Видно, что для представленного этапа движения, характеризующегося приблизительно эквивалентным расположением аппаратов, характер сходимости итераций не меняется: при интервале прогноза Д^ = 3 с по-прежнему необходимо сделать не более двух-трех итераций для получения оптимального управления.

Все представленные расчеты были проведены для достаточно характерных случаев. Быстрая сходимость метода, как уже указывалось, связана с тем, что при малых Ы рассматриваемые системы оказались близкими к линейным. Предложенный метод при использовании ЭЦВМ БЭСМ-6 обеспечивает приближенное решение задачи синтеза оптимального управления со скоростью примерно в пять раз большей, чем скорость развития реального процесса.

Авторы выражают благодарность В. А. Ильину за ряд полезных замечаний, высказанных в процессе обсуждения данной работы.

ЛИТЕРАТУРА

1. Айзеке Р. Дифференциальные игры. М., „Мир", 1967.

2. Красовский Н. Н. Экстремальные стратегии в дифференциальных играх. Доклад на Международном конгрессе математиков в Ницце — 1970 г. М., .Наука", 1972.

3. Понтрягин Л. С. Линейные дифференциальные игры. Доклад на Международном конгрессе математиков в Ницце — 1970 г. М., .Наука", 1972.

4. Lee V. А., Мог an W. Т., W е n h а ш R. Т. Air comlat simulation. AIAA Paper, No. 68—190.

5. Бобцов В. А., Брауде A. 3., Кузмак Г. E. Приближенный синтез оптимального управления в вариационных и игровых задачах механики полета со свободным концом траектории. .Ученые записки ЦАГИ", т. III, № 3, 1972.

6. М о и с е е в Н. Н. Численные методы в теории оптимальных систем. М., „Наука", 1971.

7. Л е т о в A.M. Динамика полета и управление. М., .Наука", 1969.

8. S t а г г A. W. and Но Y. С. Nonzero-sum differential games. Journal of Optimization Theory and Applications, v. 3, No 3, 1969.

9. V i n h N. X. General theory of optimal trajektory for rocket flight in a resisting medium. Journal of Optimization Theory and Applications, v. II, No 2, 1973.

10. Болтянский В. Г. Математические методы оптимального управления. М., .Наука*, 1969.

Рукопись поступила 13jlV 1973 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.