УДК 629.7.01
Егорчев М.В., Тюменцев Ю.В.
Московский авиационный институт (национальный исследовательский университет), г. Москва,
Россия
АДАПТИВНОЕ НЕЙРОСЕТЕВОЕ МОДЕЛИРОВАНИЕ ДИНАМИЧЕСКИХ СИСТЕМ АННОТАЦИЯ
В статье обсуждается проблема математического и компьютерного моделирования нелинейных динамических систем при недостаточности знаний об объекте моделирования и условиях его функционирования. Предлагаемый подход к решению этой проблемы основан на объединении возможностей теоретического и нейросетевого моделирования. Его работоспособность демонстрируется на примере моделирования продольного углового движения маневренного самолета.
КЛЮЧЕВЫЕ СЛОВА
Нелинейная динамическая система; эмпирическая модель; полуэмпирическая модель; нейросетевое моделирование; обучающий набор; самолет; продольное угловое движение.
Egorchev M.V., Tiumentsev Yu.V.
Moscow Aviation Institute (National Research University), Moscow, Russia
ADAPTIVE NEURAL NETWORK BASED SIMULATION OF DYNAMICAL SYSTEMS
ABSTRACT
A simulation approach is discussed for maneuverable aircraft longitudinal motion as nonlinear controlled dynamical system under multiple and diverse uncertainties including knowledge imperfection concerning simulated plant and its environment exposure. The suggested approach is based on a merging of theoretical knowledge for the plant with training tools of artificial neural network field.
KEYWORDS
Nonlinear dynamical system; empirical model; semi-empirical model; neural network based modeling; training dataset; aircraft; short-period longitudinal motion.
Введение
Традиционными классами математических моделеи для технических систем являются обыкновенные дифференциальные уравнения (для систем с сосредоточенными параметрами) и дифференциальные уравнения в частных производных (для систем с распределенными параметрами). Применительно к управляемым динамическим системам (ДС) в качестве аппарата моделирования наибольшее распространение получили обыкновенные дифференциальные уравнения. Эти модели, в сочетании с соответствующими численными методами, широко используются, например, при решении задач синтеза и анализа управляемого движения летательных аппаратов (ЛА) различных классов. Аналогичные средства используются также и для моделирования движения динамических систем других видов, включая надводные и подводные аппараты, наземные движущиеся средства и т.п.
Методы формирования и использования моделеи традиционного типа к настоящему времени достаточно детально разработаны и с успехом используются для решения широкого круга задач. Однако применительно к современным и перспективным сложным техническим системам возникает ряд проблем, решение которых не может быть обеспечено традиционными методами. Эти проблемы вызываются наличием разнообразных и многочисленных неопределенностеи в своиствах соответствующеи системы и в условиях ее функционирования, которые можно парировать, только если рассматриваемая система обладает своиством адаптивности, то есть имеются средства оперативнои подстроики алгоритма управления системы и ее модели к меняющеися текущеи ситуации. Кроме того, требования к точности моделеи, предъявляемые исходя из специфики решаемои прикладнои задачи, в ряде случаев превышают возможности традиционных методов.
Как показывает имеющийся опыт, аппаратом моделирования, наиболее адекватным указанной ситуации, являются методы и средства, основанные на концепции искусственнои неироннои сети (НС). Такои подход можно рассматривать как альтернативу традиционным методам моделирования ДС (дифференциальные уравнения), обеспечивающую, в том числе, возможность получения адаптивных моделеи. При этом неиросетевые модели ДС в их традиционном исполнении, в частности модели классов NARX и NARMAX, наиболее часто используемые для моделирования управляемых динамических систем, являются чисто эмпирическими (модели типа «черньш ящик»), т.е. основываются исключительно на экспериментальных данных о поведении объекта. Однако в задачах того уровня сложности, которыи типичен для авиационнои и ракетно-космическои техники, очень часто для такого рода эмпирических моделеи не удается добиться требуемого уровня точности, обеспечивающего, например, решение задач управления движением ЛА. Кроме того, в силу особенностеи структурнои организации таких моделеи, они не позволяют решать задачу идентификации характеристик ДС (например, аэродинамических характеристик ЛА), что является серьезным недостатком данного класса моделеи.
Однои из важнеиших причин невысокои эффективности НС-моделеи традиционного типа в задачах, связанных со сложными техническими системами, является то, что формируется чисто эмпирическая модель («черныи ящик»), которая должна охватывать все нюансы поведения ДС. Для этого приходится строить НС-модель достаточно высокои размерности (т.е. с большим числом настраиваемых параметров в неи). В то же время из опыта НС-моделирования известно, что чем больше размерность НС-модели, тем большии объем обучающих данных требуется для ее настроики. В итоге, при тех объемах экспериментальных данных, которые реально можно получить для сложных технических систем, не удается осуществить обучение таких моделеи, обеспечивающее заданныи уровень их точности.
Чтобы преодолеть такого рода затруднения, характерные для традиционных моделеи обоих видов, т.е. как в виде дифференциальных уравнении, так и в виде НС-моделеи, предлагается использовать комбинированным подход. Основу его составляет НС-моделирование, в силу того, что только в этом варианте удается получить адаптивные модели. Теоретическое знание об объекте моделирования, существующее в виде обыкновенных дифференциальных уравнении (это, например, традиционные модели движения ЛА), вносится специальным образом в НС-модель комбинированного типа (полуэмпирическую НС-модель, модель типа «серыи ящик»). При этом часть НС-модели формируется на основе имеющегося теоретического знания и не требует дальнеишеи настроики (обучения). Настроике и/или структурнои корректировке в процессе обучения формируемои НС-модели подлежат только те элементы, которые содержат неопределенности, например, аэродинамические характеристики ЛА.
Результатом такого подхода являются полуэмпирические НС-модели, позволяющие решать задачи, недоступные традиционным НС-методам: резко уменьшить размерность НС-модели, что позволяет добиться от нее требуемои точности, используя обучающие наборы, недостаточные по объему для традиционных НС-моделеи; обеспечить возможность идентификации характеристик ДС, описываемых нелинеиными функциями многих переменных (например, коэффициентов аэродинамических сил и моментов).
Чтобы оценить, что дает усложнение НС-модели при переходе от чисто эмпирического к полуэмпирическому ее варианту, в последующих разделах проводится сопоставление этих моделеи по их точности, полученное путем компьютерных экспериментов применительно к однои из задач динамики полета, связаннои с моделированием продольного углового движения маневренного самолета. Показано, что имеет место многократныи рост точности полуэмпирических НС-моделеи в сравнении с эмпирическими НС-моделями, кроме того, появляется возможность решения с высокои точностью задачи идентификации аэродинамических характеристик летательного аппарата.
Эмпирические и полуэмпирические нейросетевые модели динамических систем
Традиционныи подход к НС-моделированию динамических систем является чисто эмпирическим, т.е. получаемая модель основана исключительно на экспериментальных данных и совсем не использует теоретические знания, доступные для рассматриваемого объекта моделирования. Наиболее часто используемыи вариант таких моделеи - это нелинеиная авторегрессия с внешними входами (NARX - Nonlinear AutoRegressive network with eXogeneous inputs), реализуемая в виде рекуррентнои слоистои неироннои сети с элементами задержки (TDL -Time Delay Line) на входах сети [1].
NARX-модель реализует динамическое отображение, описываемое разностным уравнением следующего вида:
y(t) = f (y(t -1), y(t - 2),..., y(t - Ny ), u(t -1), u(t - 2),..., u(t - N„)), (1)
где значение выходного сигнала y(t) для данного момента времени t вычисляется на основе
значении y(t -1), y(t - 2), ..., y(t - Ny ) этого сигнала для последовательности предшествующих
моментов времени, а также значении входного (управляющего) сигнала u (t -1), u (t - 2) , ...,
u (t - Nu) , внешнего по отношению к NARX-модели.
Удобным способом реализации NARX-модели является использование многослоинои сети прямого распространения персептронного типа для приближенного представления отображения f (•••) в соотношении (1), а также линии задержки (TDL-элементов) для получения значении
величин y(t -1), y(t - 2), ..., y(t - Ny ) и u(t -1), u(t - 2) , ..., u(t - Nu) . Применительно к задаче
моделирования продольного углового движения самолета неиросетевая реализация NARX-модели была предложена в [2]. Здесь NARX-модель представляет собои двухслоиную сеть, в которои активационные функции скрытого слоя являются нелинеиными (сигмоиды), а выходного слоя -линеиными.
Точность эмпирических НС-моделеи далеко не всегда удовлетворяет предъявляемым требованиям. Один из очевидных путеи ее повышения - привлечение теоретических знании об объекте моделирования, в частности, в форме модели его движения, имеющеи вид системы обыкновенных дифференциальных уравнении, что очень часто имеет место при решении разнообразных прикладных задач. Для такои модели можно сформировать ее НС-представление на основе подхода, предложенного в [3]. В реальных задачах, однако, типична ситуация, когда теоретическая модель определена с точностью до одного или нескольких факторов неопределенности. Примеры таких факторов - зависимости аэродинамических сил и моментов, деиствующих на ЛА, которые, в лучшем случае, известны с недостаточнои точностью. В силу этого, непосредственно воспользоваться НС-моделью, полученнои на основе теоретическои модели объекта, не удастся, вначале требуется каким-либо образом устранить указанные факторы неопределенности. Для реализации этого требования и был предложен в [4-6] полуэмпирическии подход к формированию НС-моделеи, приводящии к получению динамическои неироннои сети с модульнои архитектурой
Формирование полуэмпирических НС-моделеи состоит из следующих этапов [4]:
1. Формирование теоретической модели для исследуемой динамической системы, сбор доступных экспериментальных данных о поведении этой системы;
2. Оценка точности теоретической модели на доступных данных, в случае недостаточной ее точности выдвижение гипотез о причинах и возможных путях их устранения;
3. Преобразование исходной системы с непрерывным временем в систему с дискретным временем;
4. Формирование нейросетевого представления для полученной системы с дискретным временем;
5. Обучение нейросетевой модели;
6. Оценка точности обученной нейросетевой модели;
7. Структурная корректировка нейросетевой модели в случае ее недостаточной точности. Перечисленные этапы на примере модельнои задачи подробно рассмотрены в [4].
При решении проблем рассматриваемого вида одним из важнеиших этапов является формирование репрезентативного (информативного) набора данных, характеризующего поведение моделируемои ДС на всеи области изменения значении величин, описывающих ДС и производных (скоростеи изменения) этих величин. Данная задача критически важна для получения достовернои модели ДС, однако простого решения она не имеет. Требуемые обучающие данные для формируемои НС-модели могут быть получены за счет специальным образом организованных тестовых возбуждающих воздеиствии на моделируемую ДС.
В работе [7] было показано, что применительно к рассматриваемому классу задач наиболее эффективным является использование полигармонического возбуждающего сигнала. При таком подходе входное воздеиствие для каждого из m органов управления ЛА формируется как сумма
гармонических сигналов, каждьш из которых обладает своим собственным сдвигом по фазе рк. Входнои сигнал u ■, отвечающии j -му органу управления, имеет вид:
Uj (t) = X Ak cos I + Pk I, j = 1, —, m, I J с K, K = {i,2,..., M},
' keIJ \ T ) j (2)
u (t) = uj (t) + uj (t),
где M - общее число гармонически связанных частот; T - промежуток времени, в течение которого на ДС действует тестовый возбуждающий сигнал; Ak - амплитуда k -и синусоидальной
компоненты; u * (t) - полное управляющее воздеиствие для j -го органа управления; Uj (t) -управляющее воздеиствие для j -го органа управления, реализующее тестовьш маневр.
Эмпирическая и полуэмпирическая нейросетевая модели продольного коротко периодического движения самолета
Для оценки работоспособности предлагаемого подхода рассмотрим формирование полуэмпирическои НС-модели продольного углового движения ЛА. Традиционная для динамики полета самолетов математическая модель даннои системы имеет следующии вид [8]:
а = а -C (а,а ,р) + g
z ТГ Уа z Т7
mV a V
qSbA , ч coz =-A mz (a,az ,р)
^ zz
T2p = -2TCp -P + Pc,
(3)
где а - угол атаки, град; az - угловая скорость тангажа, град/с; р- угол отклонения управляемого стабилизатора, град; Cy - коэффициент подъемнои силы; mz - коэффициент момента тангажа; m - масса самолета, кг; V - воздушная скорость, м/с; q = pV2 /2 - скоростнои напор; р -плотность воздуха, кг/м3; g - ускорение силы тяжести, м/с2; S - площадь крыла, м2; bA - средняя аэродинамическая хорда крыла, м; Jzz - момент инерции самолета относительно боковои оси, кг-м2; безразмерные коэффициенты Cy и mz являются нелинеиными функциями своих аргументов; T, с - постоянная времени и коэффициент относительного демпфирования привода, Pact - командный сигнал на привод. В модели (3) величины а , Cz, р и р - это состояния объекта управления, величина pact - управление.
Рис. 1. Полуэмпирическая НС-модель продольного углового движения самолета (на основе схемы дискретизации Эйлера); затененные элементы схемы с соответствующими связями входят в НС-модули,
реализующие восстанавливаемые зависимости для Су и тг, незатененные элементы и связи между ними
реализуют остальные зависимости из (3)
Формируемая полуэмпирическая модель включает два настраиваемых НС-модуля, описывающих нелинеиные зависимости коэффициентов подъемнои силы Cy и момента тангажа
ya
mz от угла атаки а , угловои скорости тангажа 0)z и угла отклонения управляемого стабилизатора р. Эти зависимости подлежат восстановлению на основе имеющихся экспериментальных данных для наблюдаемых переменных состояния динамическои системы. Фрагменты НС-модели, соответствующие данным зависимостям, выделены цветом на рис. 1. Настраиваемыми параметрами модели будут только веса связеи этих фрагментов, для остальных ее элементов соответствующие веса переходят в НС-модель из исходнои теоретическои модели и фиксируются.
Применительно к (3) процедура формирования полуэмпирическои НС-модели приводит к получению структуры, показаннои на рис. 1 (она основана на использовании схемы дискретизации Эилера, аналогично можно получить структуру для схемы Адамса).
Сравнительный анализ эмпирической и полуэмпирической моделей
В качестве примера конкретного объекта моделирования рассмотрим маневренныи самолет, исходные данные для которого были взяты из [9]. Вычислительный эксперимент с моделью (3) проводился для временного интервала t е [0,20] с, с шагом дискретизации At = 0.02
с для частично наблюдаемого вектора состояния y(t) = [a(t);coz(t)]г , с аддитивным белым шумом
со среднеквадратическим отклонением (СКО) са = 0.057 град, от = 0.0057 град/c,
воздеиствующим на выход системы y(t) .
Как отмечалось выше, наилучшим с точки зрения репрезентативности является обучающии набор, полученныи с использованием полигармонического возмущающего воздеиствия. Вычислительныи эксперимент с использованием такого воздеиствия выполнялся для двух тестовых маневров: прямолинеиныи горизонтальный полет с постояннои скоростью («точечныи режим», для которого угол атаки равняется его балансировочному значению для этого испытательного режима) и полет с монотонно увеличивающимся углом атаки («монотонныи режим», от стартового балансировочного значения угла атаки до некоторого его завершающего значения). С учетом этих соображении было получено значение управляющего воздеиствия pact (t)
- командного сигнала привода цельноповоротного горизонтального оперения и, используя исходную модель (3) в качестве имитатора летного эксперимента, реакции самолета
y(t) = [a(t); coz (t )]г на это воздеиствие. С привлечением этих данных для принятого временного
интервала и шага дискретизации по времени At была получена обучающая выборка |yi j,
i = 1,., N, которая использовалась при формировании как эмпирическои, так и полуэмпирическои модели. Обучение на этои выборке проводилось в системе Matlab для сетеи в форме LDDN (Layered Digital Dynamic Networks) с использованием алгоритма Левенберга-Марквардта по критерию среднеквадратическои ошибки модели. Матрица Якоби вычисляется по алгоритму RTRL (Real-Time Recurrent Learning) [8].
Таблица 1. Ошибка моделирования на тестовом множестве для _эмпирической ^АКХ)и полуэмпирической НС-модели
Точечныи режим Монотонныи режим
СКО а СКОаг СКО а СКОаг
Полуэмпирическая 0.0029 0.0076 0.0491 0.1169
NARX 1.3293 2.7445 1.5566 2.8882
Формируемая полуэмпирическая модель включает два НС-модуля, реализующих две искомые («восстанавливаемые») зависимости: коэффициент подъемной силы Су и
коэффициент момента тангажа тг . Эти зависимости реализуются с использованием
слоистои сети прямого распространения с одним скрытым слоем и сигмоидальными активационными функциями. Число неиронов в скрытом слое, подобранное экспериментально, равняется 1 для Су и 5 для тг.
Определяющими для сформированнои модели являются ее обобщающие своиства, под которыми традиционно для НС-модели понимается ее способность обеспечивать требуемьш
уровень точности не только для данных, на которых модель обучалась, но и для любых значении и сочетании значении состоянии и управлении в пределах области их определения. Такого рода проверка осуществляется на тестовых данных, покрывающих упомянутую область определения и не совпадающих с обучающими данными.
Рис. 2. Оценка точности восстановления зависимостей Су (а, (, р( и тг (а,(г, р} по результатам
тестирования полуэмпирической модели, включающей НС-модули для этих зависимостей (монотонный режим). Здесь: р>ас1 - командный сигнал привода цельноповоротного горизонтального оперения; а - угол
атаки; (0г - угловая скорость тангажа; Еа, Е( - ошибки по углу атаки и угловой скорости тангажа
Успешно решенная задача идентификации и моделирования должна обеспечить получение требуемои точности моделирования на всеи области определения модели путем восстановления с заданнои точностью аэродинамических характеристик ЛА как соответствующих нелинеиных функциональных зависимостей Насколько хорошо решается эта задача, можно судить по результатам, представленным на рис. 2, а также в табл. 1. Из приводимых данных видно, во-первых, что ошибки по всем наблюдаемым переменным состояния незначительны и, во-вторых, что максимальные значения этих ошибок с течением времени практически не растут, что свидетельствует о хороших обобщающих своиствах полученнои НС-модели. При этом следует подчеркнуть, что тестирование модели осуществлялось в весьма жестком режиме. Из рис. 1 видно, что реализуется очень активная работа управляемым стабилизатором, выражающаяся в частом
изменении значения командного сигнала (ас( привода данного органа управления при
существенных перепадах между соседними значениями (эти командные сигналы формировались случаиным образом). Цель применения такого способа формирования тестового набора состоит в том, чтобы обеспечить возможно большее разнообразие состоянии моделируемои системы (чтобы покрыть по возможности равномерно и плотно все пространство состоянии системы), а также возможно большее разнообразие перепадов соседних по времени состоянии (чтобы максимально достоверно отразить в НС-модели динамику моделируемои системы). Дополнительный
осложняющии фактор состоит в том, что очередное возмущающее воздеиствие на ЛА выдается на фоне еще не завершившихся переходных процессов от одного или нескольких предыдущих воздеиствии.
Что касается эмпирическои НС-модели (NARX), то, как это видно из табл. 1, она многократно проигрывает по точности полуэмпирическои модели; тестирование обеих моделеи осуществлялось на одних и тех же данных.
Заключение
Полученные результаты позволяют сделать вывод о том, что методы полуэмпирического неиросетевого моделирования, сочетающие знания и опыт из соответствующеи предметнои области с методами обучения неиронных сетеи, являются мощным и перспективным инструментом, потенциально пригодным для решения сложных задач моделирования и идентификации для летательных аппаратов, а также для других видов нелинеиных управляемых динамических систем. Эти методы позволяют получить многократное повышение точности моделирования по сравнению с чисто эмпирическими моделями.
Работа выполнена при финансовой поддержке Минобрнауки РФ по проекту № 865.
Литература
1. Хайкин С. Нейронные сети: Полный курс: Пер. с англ. - М.: Вильямс, 2006. - 1104 с.
2. Кондратьев А.И., Тюменцев Ю.В. Нейросетевое моделирование управляемого движения летательных аппаратов / / Вестник Московского авиационного института. - 2010, том 17, № 4. - С. 5-11.
3. Dreyfus G. Neural networks: Methodology and applications. - Berlin ao.: Springer, 2005. - 515 pp.
4. Егорчев М.В., Козлов Д.С., Тюменцев Ю.В., Чернышев А.В. Нейросетевые полуэмпирические модели управляемых динамических систем / / Вестник информационных и компьютерных технологий. - 2013, № 9. - С. 3-10.
5. Егорчев М.В., Козлов Д.С., Тюменцев Ю.В. Моделирование продольного углового движения самолета: сопоставление теоретического, эмпирического и полуэмпирического подходов // Научный вестник МГТУ ГА. -2015, № 1 (2011). - С.116-123.
6. Егорчев М.В., Тюменцев Ю.В. Обучение полуэмпирической нейросетевой модели управляемого движения самолета // Сб. науч. трудов XVI Всероссийской науч.-техн. конф. «Нейроинформатика-2014», ч. 2. - М.: Изд-во МИФИ, 2014. -С.263-272.
7. Klein V., Morelli E.A. Aircraft system identification: Theory and practice. - Reston, VA: AIAA, 2006. - 498 pp.
8. Аэромеханика самолета: Динамика полета - 2-е изд., перераб. и доп. / А.Ф. Бочкарев и др. - М.: Машиностроение, 1985. - 360 с.
9. Nguyen L.T., Ogburn M.E., Gilbert W.P., Kibler K.S., Brown P.W., Deal P.L. Simulator study of stall/post-stall characteristics of a fighter airplane with relaxed longitudinal static stability. - NASA TP-1538, Dec. 1979. - 223 pp.
References
1. Khaykin S. Neyronnye seti: Polnyy kurs: Per. s angl. - M.: Vil'yams, 2006. - 1104 s.
2. Kondrat'ev A.I., Tyumentsev Yu.V. Neyrosetevoe modelirovanie upravlyaemogo dvizheniya letatel'nykh apparatov // Vestnik Moskovskogo aviatsionnogo instituta. - 2010, tom 17, № 4. - S. 5-11.
3. Dreyfus G. Neural networks: Methodology and applications. - Berlin ao.: Springer, 2005. - 515 pp.
4. Egorchev M.V., Kozlov D.S., Tyumentsev Yu.V., Chernyshev A.V. Neyrosetevye poluempiricheskie modeli upravlyaemykh dinamicheskikh sistem / / Vestnik informatsionnykh i komp'yuternykh tekhnologiy. - 2013, № 9. - S. 3-10.
5. Egorchev M.V., Kozlov D.S., Tyumentsev Yu.V. Modelirovanie prodol'nogo uglovogo dvizheniya samoleta: sopostavlenie teoreticheskogo, empiricheskogo i poluempiricheskogo podkhodov // Nauchnyy vestnik MGTU GA. - 2015, № 1 (2011). -S.116-123.
6. Egorchev M.V., Tyumentsev Yu.V. Obuchenie poluempiricheskoy neyrosetevoy modeli upravlyaemogo dvizheniya samoleta // Sb. nauch. trudov XVI Vserossiyskoy nauch.-tekhn. konf. «Neyroinformatika-2014», ch. 2. - M.: Izd-vo MIFI, 2014. - S.263-272.
7. Klein V., Morelli E.A. Aircraft system identification: Theory and practice. - Reston, VA: AIAA, 2006. - 498 pp.
8. Aeromekhanika samoleta: Dinamika poleta - 2-e izd., pererab. i dop. / A.F. Bochkarev i dr. - M.: Mashinostroenie, 1985. -360 s.
9. Nguyen L.T., Ogburn M.E., Gilbert W.P., Kibler K.S., Brown P.W., Deal P.L. Simulator study of stall/post-stall characteristics of a fighter airplane with relaxed longitudinal static stability. - NASA TP-1538, Dec. 1979. - 223 pp.
Поступила 21.10.2016
Об авторах:
Егорчев Михаил Вячеславович, аспирант кафедры «Вычислительная математика и программирование», Московского авиационного института (национального исследовательского университета), E-mail: [email protected];
Тюменцев Юрий Владимирович, ведущий научный сотрудник кафедры «Динамика и управление летательных аппаратов» Московского авиационного института (национального исследовательского университета), кандидат технических наук, E-mail: [email protected].