УДК 629.7.0
РЕАЛИЗАЦИЯ АЛГОРИТМА ТЕРМИНАЛЬНОГО УПРАВЛЕНИЯ НЕЛИНЕЙНЫМ ДИНАМИЧЕСКИМ ОБЪЕКТОМ
П.М. Оневский, М.П. Оневский, А.А. Ишин
Кафедра «Информационные процессы и управление»,
ГОУ ВПО «ТГТУ»; [email protected]
Представлена членом редколлегии профессором В.Г. Матвейкиным
Ключевые слова и фразы: вектор настраиваемых параметров; итеративный алгоритм управления; прогнозирующая модель; уравнения чувствительности; цикл коррекции траектории.
Аннотация: Предложен итеративный алгоритм управления конечным состоянием нелинейного динамического объекта и его реализация на примере наведения истребителя на воздушную цель с заданным ракурсом. Благодаря использованию прогнозирующей модели, включающей, наряду с моделью объекта, уравнения чувствительности для определения поправок к вектору настраиваемых параметров, задача терминального управления решается без использования процедур численного дифференцирования при определении функций чувствительности координат объекта к управляющим параметрам, что повышает точность и устойчивость алгоритма управления.
Большинство существующих методов решения задач управления нелинейным динамическим объектом при приведении его в конечное состояние с заданными значениями координат вызывают значительные вычислительные трудности, особенно при определении управлений в процессе реального функционирования объекта [1]. Предлагается алгоритм, предусматривающий настройку параметров управляющих функций и реализующий терминальное управление с требуемой точностью. Разработанный алгоритм использует прогнозирующую модель для описания поведения объекта в будущем и уравнения чувствительности для определения поправок к вектору настраиваемых параметров. Применение данного алгоритма исключает трудности, связанные с численным дифференцированием, при определении функций чувствительности [2].
1. Алгоритм управления. Пусть управляемый объект описывается уравнением:
X = f (X, и, 0; Х(/0) = Х0, (1)
T т
где Х(/) = [х^/),х2(/), ... ,хп(/)] - вектор состояния; и(/) = [и^/), и2(/), ... , ит(/)] -
т
вектор управляющих функций; Хо = [х^/о), х2(/о), ... , хп(/о)] - вектор началь-
ных условий; f = [/ь /2, ... , /п]т - дифференцируемая по всем аргументам нелинейная вектор-функция. Требуется перевести объект (1) из начального состояния
Х(/0) в конечное состояние Xт (^), причем требования на конечное состояние могут накладываться не на все компоненты, а на г < п компонент вектора X. Предполагается также, что система (1) управляема по этим г фазовым координатам. Каких-либо дополнительных требований к траектории Х^) в процессе дви-
Функции (2) могут выбираться в достаточной мере произвольно, однако, они должны быть дифференцируемы по своим аргументам. Например, возможно их задание в виде [3]
где uоnj (/) - опорные управления, получаемые с использованием известных методов оптимального управления, в частности, принципа максимума, для номинального режима функционирования объекта [4]. Таким образом, функции uоTj (/) определяют качество процесса управления и удовлетворение эксплуатационным ограничениям в определенных пределах в процессе движения объекта к конечной точке. Настраиваемые параметры в (3) играют роль модулирующих
функций, деформируя опорные управления по частоте s1, фазе S2, амплитуде sз и углу наклона к оси времени S4. Таким образом, с помощью соответствующего выбора настраиваемых параметров можно найти такой вектор управляющих функций и(/), который бы переводил систему (1) из начального состояния Хо в конечное Хт. При этом в ограниченной области изменения начальных и конечных условий получаемые траектории близки к оптимальным в том смысле, в каком были получены опорные управления иопу (/).
Управление объектом (1) представляет собой итеративный процесс. На каждом цикле коррекции траектории путем прогнозирования оцениваются отклонения реализуемых конечных значений вектора Х(^) от заданных Хт , на основе чего определяются поправки к вектору настраиваемых параметров 8 .
Рассмотрим решение системы (1) с управлениями (2). Так как при реализации траектории Х(/,/о,и(8,t),Хо) начальные условия в точке t = /о уже выбраны и не варьируются, полагаем, что Х(/, /о, и(8, /), Хо) = Х(/, и(8, /)).
Потребуем, чтобы в некоторый момент времени / выполнялось равенство Х(/, и(8, /)) = Хт. Линеаризуем левую часть данного равенства в окрестности
точки (8р,^), где ^ - фиксированный момент времени ^ > /о; 8р - значение вектора параметров, полученное на р-й итерации, имеем
жения объекта (1) в конечное состояние Х т (д) не предъявляется. Управляющие функции системы (1) задаем в виде
и]- (/) = и]- (8, /), ] = 1, т,
т
где 8 = S2, ...., sk] - ^-мерный вектор настраиваемых параметров.
(2)
uj (t) _ (i + ^З + s4t ^оп (sit + s2 ),
(З)
Выражение (4) может быть использовано для определения поправок Д8 к
вектору 8р и поправок Дt к длине интервала прогнозирования для случая, когда время управления жестко не фиксировано или неизвестно.
Подставляя t = ^ в выражение (4), получим уравнение для вычисления поправок Д8 для случая фиксированного конечного момента времени
5X dU dU dS
t=ti ДS -(Xт - X(ti ))= 0, (5)
S=Sp
где Х(^) = Х(/ь и(8 Р, ^)), или в скалярной форме
к ______________________
XарДу -ЬР = о, І = 1,г, (6)
]=1
где Ьр = х-т - xi (^) - невязка по i-й управляемой переменной на р-й итерации;
т дх- дик
a
P -ij
= 1
k=1 duk ds
{=1 - чувствительность переменной Хї к параметру у у ; Ду у -
8=8 р
поправка к у-му настраиваемому параметру.
В уравнения (6) вошли г компонент вектора состояния X, на которые наложены требования в конечной точке { = {і.
При г = к система (6) представляет собой систему из к линейных алгебраических уравнений относительно неизвестных поправок Ду, у=1,к . Решая систему (6) относительно Ду, производим уточнение вектора параметров 8 по формуле
8 Р+1 = 8 Р + ГД8 Р, (7)
где Г - симметричная (к х к) матрица, характеризующая величину шага; р - номер итерации на каждом цикле коррекции траектории.
Выбирая соответствующим образом элементы матрицы Г, можно реализовать тот или иной алгоритм спуска к искомому 8.
Итерации заканчиваются при выполнении условия
bP
= x^ - x.
(ti)| <єг, i = 1, r , (8)
где е- - заданные достаточно малые положительные числа.
Уравнения (5) или (6) могут также использоваться для вычисления поправок Ду и для случая, когда время управления жестко не фиксировано. Это возможно,
если контроль за остановом процесса интегрирования при прогнозировании осуществлять по достижению какой-либо монотонно изменяющейся координаты х-вектора Х своего заданного значения х-т . Это более эффективный способ, чем
находить искомые поправки из уравнения (4).
^ дик
Выражения для частных производных —— в (6) известны и определяются
дх-
видом управляющих функций (2). Производные —— являются функциями чувст-
дик
вительности параметров траектории х- по управлениям ик и определяются из решения соответствующих уравнений чувствительности [5]
где Z =---- - (п х т)-матрица чувствительности; —,---------матрицы Якоби раз-
ди дХ ди
мерности соответственно (п х п) и (п х т).
Использование уравнений чувствительности сокращает число прогнозов по сравнению со случаем, если бы частные производные системы (6) определялись численным дифференцированием, а также повышает точность определения поправок Д5у .
Таким образом, для организации управления объектом (1) на каждом цикле коррекции траектории необходимо совместно интегрировать уравнения модели (1) и уравнения чувствительности (9), затем, используя выражения (6) и (7), определять уточненные значения вектора параметров 8. Количество прогнозов (итераций) зависит от требуемой точности, выбранного начального приближения 8о и уровня возмущений, действующих на объект (1).
2. Реализация алгоритма. Рассмотрим реализацию алгоритма на примере управления наведением истребителя на воздушную цель. На кинематической схеме (рис. 1) показаны возможные траектории в горизонтальной плоскости, реализуемые методами наведения «параллельное сближение» и «погоня» (кривые 1 и 2 соответственно) и разработанным алгоритмом (кривая 3). На схеме обозначено: ии - скорость истребителя; vц - скорость цели; Б - дальность; Фи - курсовой угол истребителя относительно цели; Фц - курсовой угол цели относительно истребителя; юц - угловая скорость маневра цели в горизонтальной плоскости.
Оба метода наведения не позволяют обеспечить заданный ракурс цели (угол подлета) азад в точке перехвата П, что немаловажно при использовании невсера-курсного вооружения. Эта проблема может быть решена использованием для наведения разработанного алгоритма, который обеспечивает подлет к цели практически под любым углом а, однако, целесообразно азад выбирать в диапазоне аШш < азад < атах, где ат^, атах углы подлета для «погони» и «параллельного сближения» соответственно.
(9)
dX
df df
Ц
Рис. 1. Кинематическая схема наведения истребителя на воздушную цель
Модель относительного движения истребителя и цели имеет вид D = —оц cos Фи - ои cos Фц;
Фи = -1(оц sinФи + Ои sinфц)— ®ц;
Фц = -1 (оц sin Фи + Ои sin фц ) - /у (Фц - Фц зад );
Ои = /v (ои зад — Ои ),
где /у, /у - коэффициенты маневренности истребителя по курсу и скорости. Последнее уравнение системы (1о) характеризует собственно инерционные свойства истребителя по скорости.
В качестве управлений выбираем и! = уи зад, и2 = Фц зад, что соответствует управлениям типа (3) при ^ = s2 = s4 = о и иоп1 = уио, иоп2 = Фцо.
Цель управления в конечной точке 11:
Частные производные в (12), (13) определяются из уравнений чувствитель-
ности (9), где Х = [d,Фи,Фц, ]T ; U = [иь^f; f = [/1,/2,/3,/4]T; /1,/2,
Коэффициенты к! и к2 подбираются в процессе исследования так, чтобы обеспечивалась приемлемая сходимость и устойчивость алгоритма.
3. Результаты моделирования. Исходные данные для моделирования (вариант):
а) параметры модели (1о): ¥ц = 1ооо м/с; юц = о; / = о,о2,; /^ = о,о3;
б) начальные условия для системы (1о): Бо = 219,5 км; Фио = 329,9°;
Фцо = о°; уио = 15оо м/с;
в) цель управления: Б(/1) = 2 км; а(^) = 1о°;
г) критерий окончания итераций на каждом цикле коррекции управлений: () - Бзад| < о,о5 км) л (а^) - азад| < о,1о )}= истина;
д) частота коррекции управлений: /к = о,1 с4.
На рис. 2 показан фрагмент формы компьютерной программы, реализующей данный алгоритм, с отображением траекторий истребителя и цели и параметров траекторий в конце наведения.
D(t1) Бзад; a(t1) u2(t1) — фи(^1) 180° азад.
Уравнения для поправок (6):
(11)
(12)
t=t]
= 0. (13)
/3, /4 - правые части уравнений модели (1о).
Уточнение управлений производится по формулам
ир+1 = ир + к1Ди1; ир+1 = ир + к2&и2.
[кт]
Цель /
Истре бите ль
Текущие параметры траектории Цели:
Хц = |14Э | кт; 2л = 5 | кт;
VII = |1000 т/с; Фи = |170 | град
Путевой угол : '1'ц = |р | град
Истребителя:
Хи = |147 | кт; 2м = |5 | кт;
Уи = |1521 т/с; Фц = |35Б | град
Путевой угол : и = 1354 | град
Дальность : I) = |2 | кт;
Ракурс цели И-р= 1 о | град
Время ; 1 =
Ма
РВ
Міг
V
210 X |іт1
Рис. 2. Фрагмент формы компьютерной программы
Щ, м/с г
1521,31 1521,3 ■ 1521,29 1521,28 1521,27 1521,26 —‘ 1521,25 1521,24
Т
Г
I
и2-.
-6,5
-7
-7,5
I—
1 -
0 50 100 І, с 0 50 100 t, с
а)
б)
Рис. 3. Вид функций управляющих воздействий:
а - скорость; б - курс
Как видно, алгоритм практически без ошибок отрабатывает заданные параметры траектории в конце наведения.
На рис. 3 представлен вид функций управляющих воздействий. Наиболее интенсивно управление осуществляется по курсу (см. рис. 3, б), по скорости (см. рис. 3, а) необходимое управление рассчитывается уже на первом цикле коррекции траектории и в дальнейшем практически остается неизменным.
Таким образом, реализованный алгоритм обеспечивает приемлемую точность управления при количестве прогнозов на каждом цикле коррекции траектории, не превышающем 5-6.
Список литературы
1. Буков, В.Н. Адаптивные прогнозирующие системы управления полетом / В.Н. Буков. - М. : Наука, 1987. - 232 с.
о -
2. Охоцимский, Д.Е. Алгоритмы управления космическим аппаратом при входе в атмосферу / Д.Е. Охоцимский, Ю.Ф. Голубев, Ю.Г. Сихарулидзе. - М. : Наука, 1975. - 400 с.
3. Оневский, П.М. Итеративные прогнозирующие алгоритмы терминального управления нелинейными объектами / П.М. Оневский // Вестн. Тамб. высш. воен. авац. училища радиоэлектроники. - 2008. - № 1. - С. 23-29.
4. Математическая теория оптимальных процессов / Л.С. Понтрягин [и др.]. -4-е изд., стереотипное. - М. : Наука, 1983. - 393 с.
5. Розенвассер, Е.Н. Чувствительность систем управления / Е.Н. Розенвас-сер, Р.М. Юсупов. - М. : Наука, 1981. - 464 с.
Realization of Algorithm of Termination Control of Nonlinear Dynamic Object
P.M. Onevsky, M.P. Onevsky, A.A. Ishin
Department “Information Processes and Control”,
TSTU; [email protected]
Key words and phrases: adjustable parameters vector; iteration algorithm of control; forecasting model; sensitivity equation; cycle of trajectory correction.
Abstract: The paper offers iterative algorithm of control over finite condition of the nonlinear dynamic object and its realization on the example of the fighter direction to the air target with the specified aspect angle. Due to the forecasting model application which involves both the object model and the sensitivity equations to determine the corrections to the adjustable parameters vector, the task of terminal control is solved without the procedures of numerical differentiation in the course of determining the sensitivity of object coordinated to the control parameters, thus improving the accuracy and stability of the control algorithm.
Realisierung des Algorithmus der terminalen Steuerung vom nichtlinearen dynamischen Objekt
Zusammenfassung: Es ist den interaktiven Algorithmus der Steuerung vom Endzustand des nichtlinearen dynamischen Objektes und seine Realisierung am Beispiel der Nichtfuhrung des Jagdflugzeuges auf die Luftziel mit dem vorgegebenen Zielkurs vorgeschlagen. Dank der Benutzung des prognostizierenden Modells, das die Gleichungen der Empfindlichkeit fur die Bestimmung der Verbesserungen zum Vektor der abstimmenden Parameter enthalt, wird die Aufgabe der terminalen Steuerung ohne Benutzung der Prozeduren der zahlenmaBigen Differenzierung bei der Bestimmung der Funktionen der Empfindlichkeit der Objektkoordinaten zu den steuernden Parameter gelost.
Realisation de l’algorithme de la commande terminale d’un objet dynamique non-lineaire
Resume: Est propose un algorithme de la commande terminale d’un objet dynamique non-lineaire et sa realisation a l’exemple du pointage de l’avion de chasse sur un but aerien avec un raccourci donne. Grace a l’emploi du modele faisant des pronostics comprenant outre le modele de l’objet les equations de la sensibilite pour la definition des corrections envers le vecteur des parametres ajustes, le probleme de la commande terminale est resolu sans utiliser les procedures de la differantiation numerique lors de la definition des fonctions de la sensibilite des coordonnees envers les parametres commandants ce qui augmente la precision et la stabilite de l’algorithme de la commande.
Авторы: Оневский Павел Михайлович - кандидат технических наук, доцент кафедры «Информационные процессы и управление»; Оневский Максим Павлович - студент; Ишин Андрей Анатольевич - студент, ГОУ ВПО «ТГТУ».
Рецензент: Погонин Василий Александрович - доктор технических наук, профессор кафедры «Информационные процессы и управление», ГОУ ВПО «ТГТУ».