УДК 629.7.01
МОДЕЛИРОВАНИЕ ПРОДОЛЬНОГО УГЛОВОГО ДВИЖЕНИЯ
САМОЛЕТА: СОПОСТАВЛЕНИЕ ТЕОРЕТИЧЕСКОГО, ЭМПИРИЧЕСКОГО И ПОЛУЭМПИРИЧЕСКОГО ПОДХОДОВ*
М.В. ЕГОРЧЕВ, Д.С. КОЗЛОВ, Ю.В. ТЮМЕНЦЕВ
Статья представлена доктором технических наук, профессором Брусовым В.С.
На примере продольного углового движения самолета рассматривается проблема математического и компьютерного моделирования нелинейных динамических систем при недостаточности знаний об объекте моделирования и условиях его функционирования. Предлагаемый подход основан на объединении возможностей теоретического и нейросетевого моделирования.
Ключевые слова: нелинейная динамическая система, самолет, продольное угловое движение, эмпирическая модель, полуэмпирическая модель, нейросетевое моделирование, обучающий набор.
Введение
Свойства объектов авиационной техники в процессе их функционирования могут изменяться заранее непредсказуемым образом, например, вследствие отказов их систем, а также из-за повреждения конструкций. Модели таких объектов, не учитывающие указанных изменений, могут приводить к возникновению критических ситуаций, если они используются, например, в составе их систем управления. Один из возможных путей решения данной проблемы состоит в формировании адаптивных моделей, т.е. обладающих способностью видоизменяться для сохранения адекватности изменившимся свойствам моделируемого объекта. Такие модели могут быть получены на основе полуэмпирического подхода, предложенного в [1-3], позволяющего сочетать теоретические знания об объекте моделирования с улучшением модели на основе экспериментальных данных, используя методы обучения искусственных нейронных сетей (НС).
Исходная теоретическая модель объекта содержит, как правило, элементы, которые не представляется возможным определить с требуемой точностью без привлечения экспериментальных данных о поведении моделируемого объекта в силу недостаточности знаний о нем. Для летательного аппарата (ЛА) это, чаще всего, нелинейные зависимости аэродинамических сил и моментов от величин, характеризующих движение ЛА. Восстановление вида таких зависимостей по имеющимся экспериментальным данным (по результатам летных испытаний для ЛА) -это традиционная задача идентификации систем [4]. Предложенный в [1-3] подход обеспечивает требуемое уточнение полуэмпирической НС-модели путем восстановления вида неизвестных (или недостаточно точно известных) зависимостей, входящих в нее.
В предлагаемой работе на примере задачи моделирования продольного углового движения самолета показано, каким образом может быть получена полуэмпирическая НС-модель из исходной теоретической, а также как восстановить по экспериментальным данным зависимости для коэффициента подъемной силы и коэффициента момента тангажа, которые считаются изначально неизвестными в рамках данной модели. При традиционном подходе к решению такой задачи [5-7] используется модель возмущенного продольного движения ЛА, полученная путем линеаризации исходной нелинейной модели. Восстанавливаемые зависимости при таком подходе представляются их разложениями в ряд Тейлора с оставлением только линейных (иногда еще и квадратичных) членов данного разложения. Предметом задачи идентификации в таком случае является нахождение значений коэффициентов этого разложения, основной составной частью которых являются безразмерные производные коэффициентов аэродинамических сил и
* Работа выполнена при финансовой поддержке Минобрнауки РФ по проекту № 865.
моментов по соответствующим величинам, описывающим движение ЛА (угол атаки, угол тангажа, угловая скорость тангажа и т.д.). В отличие от этого, развиваемый подход позволяет восстанавливать требуемые зависимости как целостные объекты - нелинейные функции от соответствующих аргументов, представленные в виде нейросетевых модулей, входящих в состав полуэмпирической модели. В то же время для ряда применений, например, для анализа характеристик устойчивости и управляемости, необходимо знать не только зависимости для сил и моментов, но и упомянутые производные для них. В данной работе показано, каким образом можно получить эти производные, используя имеющееся НС-представление зависимостей для этих коэффициентов.
Традиционный подход к НС-моделированию динамических систем является чисто эмпирическим, т.е. получаемая модель основана исключительно на экспериментальных данных и совсем не использует теоретические знания, доступные для рассматриваемого объекта моделирования. Наиболее часто используемый вариант таких моделей - это нелинейная авторегрессия с внешними входами (NARX - Nonlinear AutoRegressive network with eXogeneous inputs), реализуемая в виде рекуррентной нейронной сети специального вида [8]. Чтобы оценить, что дает усложнение НС-модели при переходе от чисто эмпирического к полуэмпирическому ее варианту, проводится сопоставление этих моделей по их точности, полученное путем компьютерных экспериментов. Показано, что имеет место многократный рост точности полуэмпирических НС-моделей в сравнении с эмпирическими НС-моделями.
Эмпирические и полуэмпирические нейросетевые модели динамических систем
Как уже отмечалось, традиционный подход к НС-моделированию динамических систем является чисто эмпирическим, причем в практических применениях наиболее часто используется сеть типа NARX. Она представляет собой рекуррентную динамическую слоистую НС-модель с элементами задержки (TDL - Time Delay Line) на входах сети [8].
NARX-модель реализует динамическое отображение, описываемое разностным уравнением следующего вида
m=fm-^t-2i...M-Ny)Mt-\)Mt-2\...Mt-Nu)\ (1)
где значение выходного сигнала y(t) для данного момента времени t вычисляется на основе значений y (t -1), y (t - 2), ..., y (t - N ) этого сигнала для последовательности предшествующих моментов времени, а также значений входного (управляющего) сигнала u(t — 1), u(t — 2) , ..., u(t — N ), внешнего по отношению к NARX-модели.
Удобным способом реализации NARX-модели является использование многослойной сети прямого распространения мультиперсептронного типа для приближенного представления отображения /(••■) в соотношении (1), а также линий задержки (TDL-элементов) для получения
значений величин y(t — 1), y(t — 2), ..., y(t — N) и u(t — 1), u(t — 2) , ..., u(t — N) . Применительно к задаче моделирования продольного углового движения самолета нейросетевая реализация NARX-модели была предложена в [9]. Здесь NARX-модель представляет собой двухслойную сеть, в которой активационные функции скрытого слоя являются нелинейными (сигмоиды), а выходного слоя - линейными.
Точность эмпирических НС-моделей далеко не всегда удовлетворяет предъявляемым требованиям. Один из очевидных путей ее повышения - привлечение теоретических знаний об объекте моделирования, в частности, в форме модели его движения, имеющей вид системы обыкновенных дифференциальных уравнений, что очень часто имеет место при решении разнообразных прикладных задач. Для такой модели можно сформировать ее НС-представление на основе подхода, предложенного в [10]. В реальных задачах, однако, типична ситуация, когда теоретическая модель определена с точностью до одного или нескольких факторов неопределенности. Примеры таких факторов - зависимости аэродинамических сил и моментов, дей-
ствующих на ЛА, которые, в лучшем случае, известны с недостаточной точностью. В силу этого, непосредственно воспользоваться НС-моделью, полученной на основе теоретической модели объекта, не удастся, вначале требуется каким-либо образом устранить указанные факторы неопределенности. Для реализации этого требования и был предложен в [1-3] полуэмпирический подход к формированию НС-моделей, приводящий к получению динамической нейронной сети с модульной архитектурой.
Формирование полуэмпирических НС-моделей состоит из следующих этапов:
1. Формирование теоретической модели для исследуемой динамической системы, сбор доступных экспериментальных данных о поведении этой системы.
2. Оценка точности теоретической модели на доступных данных, в случае недостаточной ее точности выдвижение гипотез о причинах и возможных путях их устранения.
3. Преобразование исходной системы с непрерывным временем в систему с дискретным временем.
4. Формирование нейросетевого представления для полученной системы с дискретным временем.
5. Обучение нейросетевой модели.
6. Оценка точности обученной нейросетевой модели.
7. Структурная корректировка нейросетевой модели в случае ее недостаточной точности.
Перечисленные этапы на примере модельной задачи подробно рассмотрены в [2].
При решении проблем рассматриваемого вида одним из важнейших этапов является формирование репрезентативного набора данных, характеризующего поведение моделируемой ДС на всей области изменения значений величин, описывающих ДС и производных (скоростей изменения) этих величин. Данная задача критически важна для получения достоверной модели ДС, однако простого решения она не имеет. Требуемые обучающие данные для формируемой НС-модели могут быть получены за счет специальным образом организованных тестовых возбуждающих воздействий на моделируемую ДС.
В работе [3] было показано, что применительно к рассматриваемому классу задач наиболее эффективным является использование полигармонического возбуждающего сигнала. При таком подходе входное воздействие для каждого из m органов управления ЛА формируется как сумма гармонических сигналов, каждый из которых обладает своим собственным сдвигом по фазе (рк. Входной сигнал и., отвечающий j -му органу управления, имеет вид:
u (t) = Х A cos f2^ + ( j = 1,..., m,; Ij с K; K = {l,2,...,M };
\ T J (2)
u*(t) = ii.(t)+u.(tx
где M - общее число гармонически связанных частот; T - промежуток времени, в течение которого на ДС действует тестовый возбуждающий сигнал; A - амплитуда k -й синусоидальной
компоненты; u*(t) - полное управляющее воздействие для j -го органа управления; й;(1) -
управляющее воздействие для j -го органа управления, реализующее тестовый маневр.
Эмпирическая и полуэмпирическая нейросетевая модели продольного короткоперио-дического движения самолета
Для оценки работоспособности предлагаемого подхода рассмотрим формирование полуэмпирической НС-модели продольного углового движения ЛА, которое описывается с помощью математической модели, традиционной для динамики полета самолетов [11]
^ п / \, £
а = со--С (а.со ,а>)Л—
"" тУ у' " V
■ ( \
со_ =-т\а,со_,ц)) •
(3)
где а - угол атаки, град; со2 - угловая скорость тангажа, град/с; р - угол отклонения управляемого стабилизатора, град; С - коэффициент подъемной силы; тг - коэффициент момента тангажа; т - масса самолета, кг; V - воздушная скорость, м/с; q = р¥2¡2 - скоростной напор;
3 2 2
р - плотность воздуха, кг/м ; g - ускорение силы тяжести, м/с ; S - площадь крыла, м ; ЬА -средняя аэродинамическая хорда крыла, м; - момент инерции самолета относительно боковой оси, кг-м2; безразмерные коэффициенты С и т являются нелинейными функциями своих аргументов; Т, £ - постоянная времени и коэффициент относительного демпфирования привода, <рас( - командный сигнал на привод. В модели (3) величины а, со,, ф и ф - это состояния объекта управления, величина ра(Л - управление.
Формируемая полуэмпирическая модель включает два настраиваемых НС-модуля, описывающих нелинейные зависимости коэффициентов подъемной силы С и момента тангажа тг
от угла атаки а, угловой скорости тангажа сог и угла отклонения управляемого стабилизатора р . Эти зависимости подлежат восстановлению на основе имеющихся экспериментальных данных для наблюдаемых переменных состояния динамической системы.
Рис. 1. Полуэмпирическая НС-модель продольного углового движения самолета (на основе схемы дискретизации Эйлера); затененные элементы схемы с соответствующими связями входят в НС-модули, реализующие восстанавливаемые зависимости для С и т , незатененные элементы и связи между ними реализуют остальные зависимости из (3)
Применительно к (3) процедура формирования полуэмпирической НС-модели приводит к получению структуры, показанной на рис. 1 (она основана на использовании схемы дискретизации Эйлера, аналогично можно получить структуру для схемы Адамса).
Сравнительный анализ эмпирической и полуэмпирической моделей
В качестве примера конкретного объекта моделирования рассматривался маневренный самолет, исходные данные для которого были взяты из [12]. Вычислительный эксперимент с моделью (3) проводился для временного интервала t е[0,20] с, с шагом дискретизации At = 0.02 с
для частично наблюдаемого вектора состояния y(t) = [a(t);^z (t)]T, с аддитивным белым шумом со среднеквадратическим отклонением (СКО) са = 0.057 град, ст = 0.0057 град/c, воздействующим на выход системы y(t) .
Как отмечалось выше, наилучшим с точки зрения репрезентативности является обучающий набор, полученный с использованием полигармонического возмущающего воздействия. Вычислительный эксперимент с использованием такого воздействия выполнялся для двух тестовых маневров: прямолинейный горизонтальный полет с постоянной скоростью («точечный режим», для которого угол атаки равняется его балансировочному значению для этого испытательного режима) и полет с монотонно увеличивающимся углом атаки («монотонный режим», от стартового балансировочного значения угла атаки до некоторого его завершающего значения). С учетом этих соображений было получено значение управляющего воздействия (pact (t) -командного сигнала привода цельноповоротного горизонтального оперения и, используя исходную модель (3) в качестве имитатора летного эксперимента, реакции самолета y(t) = [a(t );юг (t)]T на это воздействие. С привлечением этих данных для принятого временного интервала и шага дискретизации по времени At была получена обучающая выборка {y}, i = \,...,N, которая использовалась при формировании как эмпирической, так и полуэмпирической модели. Обучение на этой выборке проводилось в системе Matlab для сетей в форме LDDN (Layered Digital Dynamic Networks) с использованием алгоритма Левенберга-Марквардта по критерию среднеквадратической ошибки модели. Матрица Якоби вычисляется по алгоритму RTRL (Real-Time Recurrent Learning) [8].
Таблица 1
Ошибка моделирования на тестовом множестве для эмпирической (NARX) _и полуэмпирической НС-модели_
Точечный режим Монотонный режим
СКОа скоЮг СКОа скоЮг
Полуэмпирич. 0,0029 0,0076 0,0491 0,1169
NARX 1,3293 2,7445 1,5566 2,8882
Формируемая полуэмпирическая модель включает два НС-модуля, реализующих две искомые («восстанавливаемые») зависимости: коэффициент подъемной силы С и коэффициент момента тангажа тг ,р) . Эти зависимости реализуются с использованием слоистой сети прямого распространения с одним скрытым слоем и сигмоидальными активационны-ми функциями. Число нейронов в скрытом слое, подобранное экспериментально, равняется 1 для С и 5 для т .
уа *
Определяющими для сформированной модели являются ее обобщающие свойства, под которыми традиционно для НС-модели понимается ее способность обеспечивать требуемый уровень точности не только для данных, на которых модель обучалась, но и для любых значений и сочетаний значений состояний и управлений в пределах области их определения. Такого рода проверка осуществляется на тестовых данных, покрывающих упомянутую область определения и не совпадающих с обучающими данными.
а,а
по результа-
Рис. 2. Оценка точности восстановления зависимостей С {а, а ,р) и т
там тестирования полуэмпирической модели, включающей НС-модули для этих зависимостей (монотонный режим). Здесь раа - командный сигнал привода цельноповоротного горизонтального оперения; а - угол атаки; - угловая скорость тангажа; Еа, Еа - ошибки по углу атаки
и угловой скорости тангажа
Успешно решенная задача идентификации и моделирования должна обеспечить получение требуемой точности моделирования на всей области определения модели путем восстановления с заданной точностью аэродинамических характеристик ЛА как соответствующих нелинейных функциональных зависимостей. Насколько хорошо решается эта задача можно судить по результатам, представленным на рис. 2, а также в табл. 1. Из приводимых данных видно, во-первых, что ошибки по всем наблюдаемым переменным состояния незначительны и, во-вторых, что максимальные значения этих ошибок с течением времени практически не растут, что свидетельствует о хороших обобщающих свойствах полученной НС-модели. При этом следует подчеркнуть, что тестирование модели осуществлялось в весьма жестком режиме. Из рис. 1 видно, что реализуется очень активная работа управляемым стабилизатором, выражающаяся в частом изменении значения командного сигнала рас/ привода данного органа управления при существенных перепадах между соседними значениями (эти командные сигналы формировались случайным образом). Цель применения такого способа формирования тестового набора состоит в том, чтобы обеспечить возможно большее разнообразие состояний моделируемой системы (чтобы покрыть по возможности равномерно и плотно все пространство состояний системы), а также возможно большее разнообразие перепадов соседних по времени состояний (чтобы мак-
симально достоверно отразить в НС-модели динамику моделируемой системы). Дополнительный осложняющий фактор состоит в том, что очередное возмущающее воздействие на ЛА выдается на фоне еще не завершившихся переходных процессов от одного или нескольких предыдущих воздействий.
Что касается эмпирической НС-модели ^АКХ), то, как это видно из табл. 1, она многократно проигрывает по точности полуэмпирической модели; тестирование обеих моделей осуществлялось на одних и тех же данных.
Как отмечалось выше, в ряде случаев, помимо восстановления неизвестных функций (в рассматриваемом случае это С (а,®г ,() и т (а,&2 ,() ), представляют интерес также и значения
производных этих функций, например, С" и т" . После завершения обучения полуэмпирической модели можно извлечь из нее НС-модули для функций С и тг. Производные выходов
этих НС-модулей по их входам можно вычислить по алгоритму, аналогичному обратному распространению, предназначенному для вычисления производных целевой функции по весам и смещениям сети. Пользуясь цепным правилом дифференцирования, можно выразить производную выхода а^ к -го нейрона т -го (выходного) слоя по входу р через чувствительности
а
т,1 _ дак Ак, - = ~ I
да™ ^ т,дп-
я = X —-, (4)
дРг -^С, дРг
где п1 - взвешенный вход - -го нейрона I -го слоя; 1С - множество пар индексов , определяющих номер - нейрона в I -м слое, имеющего связь с , -м входом (р ). При этом чувствительности вычисляются в ходе выполнения алгоритма обратного распространения, а произ-
дП п
водные —- равняются весам соответствующих входных связей iwi, (поскольку в данном слу-
Фг
чае вход нейрона определяется взвешенной суммой п1. = -ш]'1 н— ). Использование данного алгоритма дает, например, следующие значения производных С" и т", вычисленные для точечного режима ( = 0 ), для балансировочных значений угла отклонения стабилизатора р и угла атаки а: С" = 3.8745, т" = —0.4785. Аналогичным образом можно найти производные и для любых других сочетаний значений аргументов функций С и т .
Заключение
Полученные результаты позволяют сделать вывод о том, что методы полуэмпирического нейросетевого моделирования, сочетающие знания и опыт из соответствующей предметной области с методами обучения нейронных сетей, являются мощным и перспективным инструментом, потенциально пригодным для решения сложных задач моделирования и идентификации для летательных аппаратов, а также для других видов нелинейных управляемых динамических систем. Эти методы позволяют получить многократное повышение точности моделирования по сравнению с чисто эмпирическими моделями.
ЛИТЕРАТУРА
1. Егорчев М.В., Тюменцев Ю.В. Нейросетевые полуэмпирические модели управляемых динамических систем // Сб. науч. тр. XV Всероссийской науч.-техн. конф. «Нейроинформатика-2013». - М.: МИФИ, 2013. - С . 22-31. - Ч. 2.
2. Егорчев М.В., Козлов Д.С., Тюменцев Ю.В., Чернышев А.В. Нейросетевые полуэмпирические модели управляемых динамических систем // Вестник информационных и компьютерных технологий. - 2013. - № 9. - С. 3-10.
3. Егорчев М.В., Тюменцев Ю.В. Обучение полуэмпирической нейросетевой модели управляемого движения самолета // Сб. науч. тр. XVI Всероссийской науч.-техн. конф. «Нейроинформатика-2014». - М.: МИФИ, 2014. - С. 263-272. - Ч. 2.
4. Льюнг Л. Идентификация систем: Теория для пользователя / пер. с англ. / под ред. Я.З. Цыпкина. - М.: Наука, 1991.
5. Берестов Л.М., Поплавский Б.К., Мирошниченко Л.Я. Частотные методы идентификации летательных аппаратов. - М.: Машиностроение, 1985.
6. Klein V., Morelli E.A. Aircraft system identification: Theory and practice. - Reston, VA: AIAA, 2006.
7. Tischler M.B., Remple R.K. Aircraft and rotorcraft system identification: Engineering methods with flight-test examples. - Reston, VA: AIAA, Inc., 2006.
8. Хайкин С. Нейронные сети: олный курс / пер. с англ. - М.: Вильямс, 2006.
9. Кондратьев А.И., Тюменцев Ю.В. Нейросетевое моделирование управляемого движения летательных аппаратов // Вестник МАИ. - 2010. - Т. 17. - № 4. - С. 5-11.
10. Dreyfus G. Neural networks: Methodology and applications. - Berlin ao.: Springer, 2005.
11. Аэромеханика самолета: Динамика полета - 2-е изд., перераб. и доп. / А.Ф. Бочкарев и др. - М.: Машиностроение, 1985.
12. Nguyen L.T., Ogburn M.E., Gilbert W.P., Kibler K.S., Brown P.W., Deal P.L. Simulator study of stall/poststall characteristics of a fighter airplane with relaxed longitudinal static stability. - NASA TP-1538, Dec. 1979.
AIRCRAFT SHORT-PERIOD LONGITUDINAL MOTION MODELLING: A COMPARISON OF THEORETICAL, EMPIRICAL AND SEMI-EMPIRICAL APPROACHES
Egorchev M.V., Kozlov D.S., Tiumentsev Yu.V.
A simulation approach is discussed for maneuverable aircraft longitudinal motion as nonlinear controlled dynamical system under multiple and diverse uncertainties including knowledge imperfection concerning simulated plant and its environment exposure. The suggested approach is based on a merging of theoretical knowledge for the plant with training tools of artificial neural network field.
Keywords: nonlinear dynamical system, aircraft, short-period longitudinal motion, empirical model, semi-empirical model, neural network based modeling, training dataset.
Сведения об авторах
Егорчев Михаил Вячеславович, 1990 г.р., окончил МАИ (2013), аспирант МАИ, автор 6 научных работ, область научных интересов - динамические системы, математическое и вычислительное моделирование, нейросетевое моделирование.
Козлов Дмитрий Сергеевич, 1985 г.р., окончил МАИ (2009), аспирант МАИ, автор 9 научных работ, область научных интересов - динамические системы, математическое и вычислительное моделирование, нейросетевое моделирование.
Тюменцев Юрий Владимирович, 1947 г.р., окончил МАИ (1971), кандидат технических наук, ведущий научный сотрудник кафедры динамики и управления летательных аппаратов МАИ, автор 105 научных работ, область научных интересов - динамика полета, адаптивное и интеллектуальное управление, нейросетевое моделирование.