УДК 004.896
З.В. Нагоев, МЛ. Анчёков
СИСТЕМА УПРАВЛЕНИЯ ОСТОЙЧИВОСТЬЮ ОДНООСНОГО
РОБОТА-САПЕРА
На примере одноосного мобильного робота рассматривается решение задачи динамического управления остойчивостью с помощью нейросетевого устройства управления. Применение схемы обучения без учителя на основе адаптивного нейросетевого критика позволяет достичь снижения числа нарушений стабилизированного состояния кабины в .
; ; .
Z.V. Nagoev, M.I. Anchekov ONE-AXIS SAPPER ROBOT STABILITY CONTROL SYSTEM
The decision of dynamic stabilization problem with the help of neural network controller for an example of mobile single-axed robot is considered. Applying the teacher free learning scheme based on adaptive neural network critic results in decrease of stabilization breaks per given time. Multiagent systems; neural networks; adaptive control.
.
средства (ОТС) в качестве мобильной платформы для мультиагентной группировки роботов-саперов (PC). Управление остойчивостью (УО) ОТС, снабженного возможностью возвратно-поступательного перемещения (ВПП) кабины по отношению к колесной базе вдоль курсового направления, предложенное в [1], [2], осуществляется при помощи изменения режимов работы привода ВПП кабины. Целью работы является создание системы УО одноосного PC, обеспечивающей автоматическую стабилизацию кабины. Основной задачей исследования является разработка адаптивных методов автоматического программного УО по данным датчиков положения кабины и гироскопов. Остойчивостью ОТС назовем его способность возвращаться в положение равновесия после прекращения действия , . -пенсированный реактивный момент на кабине и потеря управляемости при перемене режимов движения.
1. Задача адаптивного нейросетевого УО ОТС. По основным характеристикам ОТС с динамическим УО объединяет лучшие признаки колесных и шагающих устройств [4]. Отрицательная обратная динамическая связь позволяет
уменьшить чувствительность к изменениям различных параметров и к влиянию
,
предотвратить маятниковое раскачивание кабины. Проблема состоит в том, что невозможно заранее предвидеть все варианты нагружения и эксплуатационные .
Для решения этой проблемы необходимо разработать такую схему подбора , -
зации и принимает решение о необходимости дополнительного обучения - коррекции закона управления.
2. Система УО робота-сапера. С целью решения задачи была разработана
( ) ( . 1).
. 2.
Оно состоит из нейронной сети (НС) контроллера, непосредственно генерирующей , - , -
ления. Контроллер и критик являются трехслойными НС прямого распространения. На вход контроллера поступают следующие значения: а>/ - текущее значение угловой скорости каретки, (р, - текущее значение угла наклона каретки по отношению к горизонту, - желаемое значение угловой скорости, - желаемое значение угла наклона каретки по отношению к горизонту, р, - текущее положение каретки относительно рамы, д - переменная, описывающая состояния двигателей. Значения д описывают состояния трех двигателей в момент времени непосредственно перед принятием решения об управляющем воздействии контроллера в различных стартовых условиях. Остальные входы контроллера являются
.
(МУВН) получает их значения в асинхронном режиме, обеспечивает барьерную синхронизацию, нормирование в диапазон от 0,1 до 0,9 и подачу на вход контроллера в равные такты времени.
Рис. 1. Одноосный РС Рис. 2. Схема подключения НС
контроллера и АК
Для обозначения входа НС-контроллера на /'-м шаге времени мы будем также пользоваться символом = (щ, Щ, р^, щ , Щ , ^), х,£ [0,1;0,9]. Для выполнения некоторых задач РС потребуется изменение угла наклона каретки относительно горизонта в направлении продольной оси. Поэтому значения и (ра также подаются на вход устройства управления.
На выход контроллер выдает следующие значения: ^е{-1;0;1} - значение переключателя состояний двигателя управления остойчивостью (ДОЮ), С? - время старта ДОО, С^ - время окончания работы ДОО, С™- предполагаемое время смены режима движения кабины. При этом выполняются соотношения: С( > С^, С? > С^,
С™ > С?, где и - время формирования выхода контроллера (текущее время).
Далее эти значения передаются на вход НС-критика и параллельно с этим -.
Обозначим вектор выходов НС-контроллера на /'-м шаге времени символом
^ = (С1, С?, С™, й), у,е [0,1;0,9]. Так как обучающая выборка в различные моменты работы системы либо пуста, либо не полна, НС-контроллер не может быть
обучен по классической схеме обучения. Применение нейросетевого адаптивного ( ), -
ли самого этого процесса. АК представляет собой трехслойную НС прямого распространения, которая связана с НС-контроллером. На вход НС-критика на i-м
шаге подается вектор: Xf = (X, Y, tf ), где tf G [0.1; 0.9] - это время, когда в соответствии с измерениями датчиков произошло наруше-ние стабилизированного состояния (НСС) кабины ОТС.
t - , -
сгенерировать новое управляющее воздействие, то tf - это фактическое время тако-. . , возможны различные варианты соотношения времен tj и tj (рис. 3). - i-
Y[ = (Atf.Atf.Atf1, dc), у- G [0,1; 0,9], где d° - режим переключения ДУО, ре-
f
комендуемый критиком, A tf - приращение критика по tf, At^ - приращение крити-
f
ка по ^ , A tf1 - приращение критика по tf1. Эти значения используются в качестве
S S л S J" S л /
корректировок выходов контроллера: ti+1 = t + A t, t+1 = ti+1 + At^ , tm = tf + a tm
4+1 = 4+1 + ALi . -
на рис. 4.
( - D). -
ки регистрируют НСС кабины, фиксируется время tf. Если время НСС больше
( . 3), ,
контроллер недооценил продолжительность пребывания машины в стабилизированном состоянии после текущего управляющего воздействия. В этом случае необходимо откорректировать выходной вектор, обучить контроллер и вернуть управление СУ верхнего уровня.
ç tf
Ч tf *г tf t; tr tf
Рис 3. Соотношения времени событий в системе
Если время НСС лежит между временем старта и временем окончания рабо-
, ,
вернуть управление наверх. Если нарушение произошло раньше времени старта, тогда необходимо запустить прямой проход критика. После прямого прохода корректировки критика прибавляются к выходам контроллера. Эксперименты на прототипе одноосного PC показали, что в результате обучения контроллера по описанной схеме наблюдается снижение числа нарушений стабилизированного состояния кабины в единицу времени. .
ОУ ОТС по данным датчиков положения кабины и гироскопов.
Реализуемая в данном методе схема адаптивного подбора закона УО позволяет роботу самостоятельно анализировать возникающие нарушения стабилиза-
,
.
Рис. 4. Схема обучения НС-контроллера
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Беккер. Введение в теорию местность-машина. - М.: Машиностроение, 1973. - 520 с.
2. Патент РФ на изобретение «Одноосного вездехода» № 2102272.
3. Патент РФ на изобретение «Двухколенный двухколесный велосипед с плавающей кабиной» № 2090429.
4. Алхасов P.M. Моделирование и адаптивное управление нетрадиционными транспортными средствами с одноосным шасси: дисс. на соиск. уч. ст. к.ф.-м.н. - Нальчик, 2000.
5. Свидетельство №2102272 на изобретение "Одноосный вездеход". Патентообладатели: Хамуков Ю.Х., Озов P.M.
Нагоев Зелимхан Вячеславович
Институт информатики и проблем регионального управления Кабардино-Балкарского научного центра РАН. E-mail: [email protected]
360000, Кабардино-Балкарская Республика, г. Нальчик, ул. И. Арманд, 37-а. Тел.: 88662426552.
Анчёков Мурат Инуеович
Nagoev ZalimKhan Vjatcheslavovich
Institute for Computer Sciences and Regional Management Problems of Kabardino-Balkarian RAS Scientific Center. E-mail: [email protected].
37A, I. Armand street, Nalchik, Cabradino-Balkarian Republic, Russia. Phone: 88662426552.
Anchekov Mourat Inusovich