Разработка системы наведения и стабилизации с нейрорегулятором на основе модели авторегрессии со скользящим средним

Кузнецов Борис Иванович; Василец Татьяна Юрьевна; Варфоломеев Алексей Алексеевич

УДК 681.5.01.23

Б.І. Кузнецов, Т.Ю. Василець, О.О. Варфоломієв

РОЗРОБКА СИСТЕМИ НАВЕДЕННЯ І СТАБІЛІЗАЦІЇ З НЕЙРОРЕГУЛЯТОРОМ НА ОСНОВІ МОДЕЛІ АВТОРЕГРЕСІЇ З КОВЗНИМ СЕРЕДНІМ

Виконано синтез системи наведення і стабілізації озброєння легкоброньоеаних машин з застосуванням нейромереже-вого регулятора на основі моделі авторегресії з ковзним середнім. Наведена структура і принцип дії нейрорегулятора. Розроблена схема системи наведення і стабілізації з пропорційним регулятором у контурі положення і нейромереже-вим регулятором у контурі швидкості. Виконаний синтез регулятора NARMA-L2 Controller. Проведено моделювання системи на ЕОМ і виконано аналіз динамічних характеристик системи.

Выполнен синтез системи наведения и стабилизации вооружения легкобронированных машин с применением нейро-сетевогорегулятора на основе модели авторегрессии со скользящим средним. Приведена структура и принцип действия нейрорегулятора. Разработана схема системи наведения и стабилизации с пропорциональным регулятором в контуре положения и нейросетевым регулятором в контуре скорости. Выполнен синтез регулятора NARMA-L2 Controller. Проведено моделирование системы на ЭВМ и выполнен анализ динамических характеристик системы.

ВСТУП

Постановка проблеми. Вдосконалення озброєння і систем управління вогнем є одним з найбільш важливих завдань в області підвищення тактико-технічних характеристик бойових машин піхоти і бойових колісних машин. Найбільш ефективним напрямом при модернізації системи управління вогнем є поліпшення системи наведення і стабілізації основного і допоміжного озброєння.

Вимоги, що підвищуються, до тактико-технічних характеристик і якості систем управління примушують шукати нові шляхи вдосконалення систем. Останнім часом багатообіцяючою альтернативою класичним методам побудови систем управління нелінійними об'єктами є штучні нейронні мережі. Важливою властивістю штучних нейронних мереж є їх здібність до навчання, що дозволяє отримати простіші рішення для складних задач управління. Крім того, наявність в структурі штучних нейронних мереж нейронів з нелінійними функціями активації дозволяє використовувати їх для вирішення задач управління нелінійними об'єктами, тоді як традиційні методи не забезпечують рішення подібних задач. Побудова системи управління на основі нейрорегулятора зводиться до послідовного вирішення задачі ідентифікації керованого об’єкта шляхом побудови його нейромоделі, а потім до побудови алгоритму управління відповідно до вибраної цілі управління і критерію якості управління.

Аналіз останніх досягнень і публікацій. Нейронні мережі надають альтернативну можливість для реалізації адаптивних, нелінійних систем регулювання, оскільки вони здатні вивчити динамічні взаємозв'язки на основі тренувальних даних, що дозволяє отримати простіші рішення для складних завдань управління [1, 2]. При цьому розрізняють структуро-вані і неструктуровані варіанти залежно від того, чи формують нейронні мережі елементи матриць аналітичних моделей або безпосередньо копіюють нелінійні взаємозв'язки між вхідними і вихідними сигналами об'єкту. За допомогою простих прямонаправленньїх нейронних мереж можна апроксимувати будь-які шматково-безперервні функції, унаслідок чого вони можуть бути застосовані для багатьох класів систем. В основному застосовуються два типи прямонаправ-

ленных нейронних мереж. Це багатошаровий персеп-трон і мережі з радіально-симетричними функціями. [3, 4]. Мережу можна тренувати в режимі online одночасно з процесом регулювання або в режимі offline на основі наперед накопичених тренувальних даних. Для тренування нейронних мереж існує цілий ряд випробуваних методів.

Мета статті. Метою роботи є синтез нейроме-режевої системи наведення і стабілізації озброєння легкоброньованих машин з нейрорегулятором на основі моделі авторегресії з ковним середнім, що відповідає заданим технічним вимогам до системи.

1. СХЕМА СИСТЕМИ НАВЕДЕННЯ І СТАБІЛІЗАЦІЇ З НЕЙРОРЕГУЛЯТОРОМ НА ОСНОВІ АВТОРЕГРЕСІЇ З КОВЗНИМ СЕРЕДНІМ

Математичну модель динаміки об’єкту управління системи наведення і стабілізації наведено у роботі [5]. Виконавчий пристрій стабілізатора озброєння складається з підсилювача потужності, приводного двигуна і кінематичного пристрою сполучення. Кінематична схема системи наведення і стабілізації містить пружні елементи, що істотно ускладнює розрахункову схему механічної частини системи, перетворюючи її на багатомасову. Для урахування пружності елементів кінематичного пристрою сполучення, механічна частина системи представлена у вигляді двох-масової системи. Модель складена з урахуванням моментів сухого тертя на валу двигуна і на валу робочого механізму, а також наявність люфту між зубами провідної і відомої шестерні.

У роботі [6] розглянута ефективна реалізація узагальненого управління з прогнозом з використанням багатошарової прямонаправленої нейтронної мережі, як нелінійної моделі об'єкту управління. Показано, що завдяки використанню оптимізаційного алгоритма Ньютона-Рафсона, число ітерацій, необхідних для збіжності, значно менше, ніж при використанні інших методів, внаслідок чого алгоритм є швидшим, ніж інші методи, і може використовуватися для управління в режимі реального часу.

У [5, 6] виконано синтез нейромережевої системи наведення і стабілізації озброєння легкоброньованих машин з використанням нейрорегулятора з про-

гнозом NN Predictive Controller. Розроблена двоконтурна система регулювання з нейронною компенсацією нелінійностей виконавчого пристрою стабілізатора озброєння в контурі регулювання швидкості. Регулятор положення може бути пропорційним або пропорційно-диференціальним. У роботах виконаний синтез і дослідження системи з нейромережевим регулятором з передбаченням NN Predictive Controller. Показано, що нейромережева система має високі показники якості функціонування.

Не дивлячись на очевидні достоїнства, управління з прогнозом вимагає великої кількості обчислювальних витрат і є досить складним для практичної реа-

лізації. Тому розглянемо можливість застосування більш простого регулятора на основі моделі авторегресії з ковзним середнім NARMA-L2 Controller для системи наведення і стабілізації озброєння легкобро-ньованих машин.

На рис. 1 показана структурна схема нейромере-жевої системи стабілізації озброєння легкоброньова-ної машини, розроблена в SIMULINK системи MATLAB. Ця структура включає блок керованого об'єкту Subsystem і блок контролера NARMA-L2 Controller, а також блоки генерації еталонного ступінчастого сигналу з випадковою амплітудою Random Reference, блок побудови графіка.

NARMA-L2 Controller

Схема моделі об'єкту управління приведена на рис. 2. Схема складена відповідно до рівнянь динаміки виконавчого пристрою стабілізатора озброєння, приведеними в [6]. У схемі не враховується збурювальний момент, обумовлений коливаннями корпусу носія при пересуванні машини по перетнутій місцевості і люфт між зубами провідної і відомої шестерні.

Схема об'єкту управління складена з урахуванням моменту сухого тертя в підшипниках приводного двигуна і моменту сухого тертя кінематичного пристрою сполучення. Для їх завдання використано два блоки MATLAB Fcn, призначені для написання виразів на мові MATLAB.

2. ПРИНЦИП ПОБУДОВИ НЕЙРОРЕГУЛЯТОРА NARMA-L2 CONTROLLER Нейромережевий регулятор NARMA-L2 використовує як модель керованого об'єкту модель нелінійної авторегресії з ковзним середнім (Nonlinear Autoregressive-Moving Average - NARMA-L2). При синтезі даного регулятора будується дискретна нелінійна модель нелінійного об'єкту управління як авто-регресійна модель з ковзним середнім, або NARMA-модель у формі

y(k + d) = N[y(k),y(k -1),...,y(k -n +1),

,u(k), u(k - 1),...,u(k -m +1)], де y(k) - вихід моделі; d - число тактів прогнозу; u(k) - вхід моделі.

На етапі ідентифікації будується нейронна мережа для NARMA-моделі, вигляду (1). Ця процедура

Рис. 2. Схема моделі об’єкту управління (Subsystem)

аналогічна процедурі ідентифікації при синтезі нейрорегулятором з прогнозом.

Якщо потрібно спроектувати систему, яка забезпечує рух по заданій траєкторії

y(k + d) = yr (k + d), то це означає, що необхідно сформувати регулятор наступного вигляду:

u(k) = G[y(k),y(k -1),...,y(k -n +1),yr(k + d), u(k -1),...,u(k -m +1)].

Хоча такий регулятор за допомогою нейронної мережі і може бути сформований, проте в процесі мінімізації середньоквадратичної помилки він вимагає надмірних обчислень, оскільки використовує динамічний варіант методу зворотного розповсюдження помилки. Для практичного вирішення завдання стеження

(1)

в [7] запропоновано наближену МАИМЛ-модель з виділеною складовою управління. Така модель регулятора, що іменується моделлю МАИМЛ-Ь2, має вигляд у(к + d) = /[у(к),у(к -1),...,у(к - п +1), и(к -1),...,

и(к - т +1)] + [у(к),у(к -1),..., (2)

у(к -п +1),и(к -1),...,и(к -т + 1)]и(к).

Перевага форми (2) полягає в тому, що тепер поточне управління можна безпосередньо обчислити, якщо відома бажана траєкторія уг, передісторія управління {у(к - 1),..., и(к - т + 1)}, а також передуючі і поточне значення виходу {у(к),у(к - 1),.,у(к - п + 1)}: Уг (к + d)- /[у(к), у(к -1),..., _

Безпосереднє застосування співвідношення (3) для реалізації регулятора складно, оскільки управління залежить від поточного значення виходу. Тому рівняння модифікується таким чином:

u(k +1) =

Уг (k + d)- f [y(k),y(k -1),..., ^ g[y(k),y(k -1),..., y(k -n +1), u(k -1),...,u(k -m +1)]

(4)

u(k) =

у(к -п +1), и(к -1),...,и(к -т +1)] ’ але при цьому параметр прогнозу повинен задовольняти умові й > 2.

На рис. 3 показана структура відповідного регулятора у вигляді нейронної мережі.

g[y(k),y(k -1),...,

y(k - n + 1),u(k -1),...,u(k - m +1)] y(k -n +1), u(k -1),...,u(k -m +1)]

(3)

Рис. 3. Структура NARMA-L2 регулятора у вигляді нейронної мережі

Перевага форми (4) полягає в тому, що тепер поточне управління можна безпосередньо обчислити, якщо відома бажана траєкторія yr, передісторія управління {u(k - 1),..., u(k - m + 1)}, а також передуючі і поточнезначеннявиходу {y(k),y(k - 1),., y(k - n + 1)}. Тут слід звернути увагу на ділянки мережі, які виконують апроксимацію нелінійних операторів g і/у вигляді виходів g = a2(t) і f = a4(t). Входами регулятора є сигнали y(t + 1) і u(t + 1) (останній реалізований у вигляді зворотного зв'язку), а також еталонний сигнал yr(t + 2). Блоки затримки TDL здійснюють запам'ятовування відповідних послідовностей входу і виходу, а потім використовуються двошарові нейронні мережі, які формують оцінки нелінійних операторів і обчислюють сигнал управління.

Загальна структурна схема системи з регулятором NARMA-L2 показана на рис. 4. На схемі явним чином виділена еталонна модель, яка задає бажану траєкторію для виходу керованого об'єкту.

У даній роботі виконаний синтез нейрорегулятора NARMA-L2 Controller за допомогою пакета при-

кладних програм Neural Network Toolbox системи MATLAB. Синтез нейрорегулятора складається з двох етапів: етап ідентифікації об'єкту управління і етап синтезу закону управління. На етапі ідентифікації розробляється модель керованого об'єкту у вигляді нейронної мережі, яка на етапі синтезу використовується для синтезу регулятора.

Рис. 4. Структурна схема системи з регулятором NARMA-L2

На першому етапі спочатку генерується навчальна вибірка, а потім відбувається завдання параметрів нейронній мережі і її навчання. Тренувальні дані генеруються шляхом подачі ступінчастих сигналів з випадковою амплітудою на об'єкт управління. Якість тренування мережі в значній мірі залежить від довжини навчальної вибірки і такту дискретності, що визначає інтервал між двома послідовними моментами знімання даних. Оптимальними значеннями цих параметрів відносно мінімуму середньоквадратичної помилки у вирішуваній задачі є наступні: кількість даних NB = (8^10)-103, такт дискретності - At = 0,001c. Для отримання представницької вибірки необхідно правильно задати максимальне tmax і мінімальне tmin значення інтервалу ідентифікації, тобто тривалість стрибків завдань. Величина їх залежить від параметрів об'єкту управління. У даній задачі максимальна тривалість стрибків завдань повинна бути приблизно рівна часу регулювання контуру швидкості, мінімальна - на порядок менше, тобто tmin = 0,01c, tmax = 0,1c.

Для нейрорегулятора NARMA-L2 Controller використовується мережа з прямою передачею сигналу, що характеризується наявністю зв'язків між нейронами тільки в прямому напрямі без зворотних зв'язків усередині мережі - багатошаровий персептрон. За допомогою багатошарового персептрона можна апро-ксимувати з бажаною точністю будь-які статичні функції. Попередні значення вхідних/вихідних координат у вхідному векторі дозволяють додати прямонаправленным мережам динамічні властивості.

При побудові нейронної мережі регулятора спочатку формується статична 6-шарова мережа. Мережа має 6 шарів з S нейронами в першому і третьому шарах і 1 нейроном в другому, четвертому, п'ятому і шостому шарах. Використовувані функції активації: гіперболічного тангенса (tansig) - в першому і третьому шарі, лінійна (purelin) - в другому, четвертому, п'ятому і шостому шарах. Найбільш важливим питанням є вибір кількості нейронів S першого і третього шарів. При малій кількості нейронів мережа не може виконувати поставлене завдання, а при великому спостеріг

гається явище перенавчання і зростає об'єм обчислень. Для даної задачі оптимальні значення знаходиться в межах S = 8-ь12, при цьому середня помилка навчання має порядок 1012, а миттєві помилки не перевищують 10 4^10 5. Потім формується мережа із структурою, відповідною рис. 3, шляхом перемикання зв'язків між шарами. Навчання мережі виконується з використанням функції trainlm, що відповідає алгоритму Левенберга-Марквардта.

При синтезі регулятора варіюється кількість елементів запізнювання на вході N і виході Nj моделі. Якнайкращі результати отримані при значеннях N = 1 і Nj = 5 відповідно.

3. МОДЕЛЮВАННЯ СИСТЕМИ І АНАЛІЗ ОТРИМАНИХ РЕЗУЛЬТАТІВ

Для визначення показників якості функціонування синтезованої нейромережевої системи було проведено моделювання системи при різних тестових вхідних сигналах: ступінчастому із змінною амплітудою, що знаходиться і діапазоні від ф3 = 1рад до ф3 = -Ірад, лінійно-наростаючому з мінімальною швидкість наростання юфтт = 0,00035 c_1, гармонійному з частотою 1 Гц і амплітудою 3°. Як показали дослідження, характеристики нейромережевої системи з нейрорегулятором NARMA-L2 Controller поступаються відповідним характеристикам системи з нейрорегулятором NN Predictive Controller.

В якості прикладу на рис. 5 приведені графіки перехідних процесів змінних стану системи при ступінчастій вхідній дії. В результаті досліджень встановлено, що при ступінчасті вхідній дії відробіток кута блоку озброєння в діапазоні від ф3 = 1рад до ф3 = -Ірад відбувається без перерегулювання за мінімально можливий час, визначуваний постійними часу електроприводу, при номінальній напрузі двигуна ид. Так, наприклад, кут ф3 = 0,05рад відпрацьовується за час t = 0,12c, що відповідає технічним вимогам до системи. Однак, в режимі стабілізації мають місце коливання змінних стану системи.

Рис. 5. Перехідні процеси стану системи з нейрорегулятором NN Predictive Controller: а - задаюча дія ф3 і кут ф; б - швидкість механізму <вм; в - швидкість двигуна <вд; г - момент пружності My, д - момент двигуна Мя; е - момент тертя

на валу механізму Мтр м

висновки

Для забезпечення високих динамічних характеристик системи наведення стабілізації озброєння лег-коброньованих машини у статті розглянуто можливість використання нейромережевого регулятора на основі моделі авторегресії з ковзним середнім NARMA-L2 Controller замість регулятора з прогнозом NN Predictive Controller, який забезпечує високі динамічні характеристики системи, але вимагає великої кількості обчислювальних витрат і є досить складним для практичної реалізації.

Розглянута структура і принцип дії нейрорегуля-торана основі моделі авторегресії з ковзним середнім. Виконано синтез нейрорегулятора NARMA-L2

Controller, який реалізований в пакеті прикладних програм Neural Network Toolbox системи MATLAB. У режимі Simulink розроблена система управління з нейрорегулятором NARMA-L2 Controller і проведено моделювання системи. Як показали дослідження, характеристики нейромережевої системи з нейрорегулятором NARMA-L2 Controller поступаються відповідним характеристикам системи з нейрорегулятором NN Predictive Controller.

СПИСОК ЛІТЕРАТУРИ

1. Клепиков В.Б., Палис Ф., Цепковский Ю.А. Гибридные нейронные сети в управлении электромеханическими системами // Вестник НТУ "ХПИ". Проблемы автоматизированного электропривода. Теория и практика. - 2003. -Вып.10. - Т.1. - С. 29-33.

2. Круглов В.В., Борисов В.В., Искусственные нейронные сети. Теория и практика. - М.: Горячая линия - Телеком, 2001. - 382 с.

3. Руденко О.Г, Бодянский Е.В. Основы теории искусствен-ныхнейронных сетей. - Харьков: ТЕЛЕТЕХ, 2002. - 317 с.

4. Терехов В.А., Ефимов Д.В., Тюкин И.Ю. Нейросетевые системы управления. - М.: ИПРЖР, 2002. - 480 с.

5. Кузнецов Б.И., Василец Т.Е., Варфоломеев A.A. Разработка нейросетевой системы наведения и стабилизации вооружения легкобронированных машин // Електротехніка і електромеханіка. - 2008. - №2. - C. 31-34.

6. Кузнецов Б.И., Василец Т.Е., Варфоломеев A.A. Нейроуправление нелинейным динамическим объектом с использованием метода обобщенного управления с предсказанием // Електротехніка і електромеханіка. - 2008. - №4. - C. 34-41.

7. Narendra K.S., Mukhopadhyay S/ adaptive Control Using Neural Networks and Approximate Models // IEEE Transaction of Neural Networks/ - 1997. - Vol.8. - P. 475-485.

Bibliography (transliterated): 1. Klepikov V.B., Palis F., Cepkovskij Yu.A. Gibridnye nejronnye seti v upravlenii 'elektromehanicheskimi sistemami // Vestnik NTU "HPI". Problemy avtomatizirovannogo 'elektroprivoda. Teoriya i praktika. - 2003. - Vyp.10. - T.1. - S. 29-33. 2. Kruglov V.V., Borisov V.V., Iskusstvennye nejronnye seti. Teoriya i praktika. - M.: Goryachaya liniya - Telekom, 2001. - 382 s. 3. Rudenko O.G, Bodyanskij E.V. Osnovy teorii iskusstvennyh nejronnyh setej. -Har'kov: TELETEH, 2002. - 317 s. 4. Terehov V.A., Efimov D.V., Tyukin I.Yu. Nejrosetevye sistemy upravleniya. - M.: IPRZhR, 2002. -480 s. 5. Kuznecov B.I., Vasilec T.E., Varfolomeev A.A. Razrabotka nejrosetevoj sistemy navedeniya i stabilizacii vooruzheniya legkobronirovannyh mashin // Elektrotehnika і elektromehanika. - 2008. - №2. - S. 31-34. 6. Kuznecov B.I., Vasilec T.E., Varfolomeev A.A. Nejroupravlenie nelinejnym dinamicheskim ob'ektom s ispol'zovaniem metoda obobschennogo upravleniya s predskazaniem // Elektrotehnika і elektromehanika. - 2008. - №4. - S. 34-41. 7. Narendra K.S., Muk-hopadhyay S/ adaptive Control Using Neural Networks and Approximate Models // IEEE Transaction of Neural Networks/ - 1997. - Vol.8. -R. 475-485.

Надійшла 22.02.2011

КузнецовБорисІванович, д.т.н., проф.,

Вастець ТетянаЮріїена, к.т.н., доц.,

Варфоломієе Олексій Олексійович, к.т.н.

Українська інженерно-педагогічна академія кафедра систем управління технологічними процесами і об’єктами

61003, Харків, вул. Університетська, 16 тел. (057) 733-79-59

Kuznetsov B.I., Vasilets T.E., Varfolomeev A.A.

Synthesis of a guidance and stabilization system with a neuro-controller on the basis of an autoregressive moving average model.

Synthesis of a light-armored vehicle armament guidance and stabilization system is performed with application of a neurocontroller on the basis of an autoregressive moving average model. The neuro-controller architecture and principle of operation are presented. A schematic model of the guidance and stabilization system with a proportional controller in the position loop and a neuro-controller in the speed loop is developed. NARMA-L2 controller is synthesized. Computer simulation is made, the system dynamic behavior analyzed.

Key words - neuro-controller, autoregressive moving average model, neural guidance and stabilization, NARMA-L2 controller control system, synthesis, analysis.

Synthesis of a guidance and stabilization system with a neuro-controller on the basis of an autoregressive moving average model

Текст научной работы на тему «Разработка системы наведения и стабилизации с нейрорегулятором на основе модели авторегрессии со скользящим средним»