УДК 621.3.078.3
DOI: 10.24412/2071-6168-2024-10-520-521
МЕТОДИКА ФОРМИРОВАНИЯ БАЗЫ ЗНАНИЙ ДЛЯ НЕЙРОНЕЧЕТКОГО РЕГУЛЯТОРА, РЕАЛИЗУЮЩЕГО КВАЗИОПТИМАЛЬНОЕ ПО БЫСТРОДЕЙСТВИЮ УПРАВЛЕНИЕ ПРИВОДОМ
ОПТИКО-ЭЛЕКТРОННОЙ СИСТЕМЫ
О.В. Горячев, К.Н. Калиничев
Рассмотрены вопросы разработки и модернизации регуляторов для приводов оптико-электронных систем (ОЭС), а также использования нейро-нечёткого регулятора для реализации квазиоптимального по быстродействию управления приводом ОЭС. В среде программирования Matlab реализована методика формирования базы знаний для синтеза нейро-нечёткого регулятора. Достоверность полученных результатов подтверждена компьютерным моделированием. Полученные результаты внедрены в учебный процесс подготовки специалистов по системам автоматического управления на кафедре САУ ТулГУ.
Ключевые слова: оптико-электронная система, нейро-нечёткий регулятор, нейро-нечёткая система, ПИД-регулятор, квазиоптимальное управление.
Проблема разработки и модернизации высококачественных регуляторов для приводов оптико - электронных систем в последнее время наиболее актуальна [8]. Это обусловлено сложностью создаваемых приводов ОЭС и их широким использованием [4].
В современных системах классический ПИД-регулятор в большинстве случаев не справляется с установленными требованиями, так как имеет ряд недостатков:
1. Ограниченность входных сигналов, при которой хорошо настроенный на один сигнал ПИД-регулятор не может с заданными требованиями отработать другой входной сигнал. Например, хорошо настроенный на ступенчатое воздействие регулятор будет плохо отрабатывать гармонический входной сигналом и наоборот.
2. Сложность настройки для качественной работы на всем диапазоне входных сигналов.
3. Зависимость качества функционирования регулятора от параметров системы. Если параметры системы неизвестны или изменяются, регулятор может работать некорректно.
4. ПИД-регуляторы подвержены влиянию шумов, которые могут привести к потере устойчивости системы.
Для устранения представленных недостатков предложены регуляторы на базе нечеткой логики, которые имеют ряд положительных свойств [5,9-11]:
1) система управления строится на базе правил «если - то», что облегчает настройку такого регулятора специалистом;
2) возможность объединить базой правил несколько входных переменных;
3) толерантность к шумам и помехам: нечеткая логика позволяет регуляторам игнорировать случайные и аномальные данные, что повышает их устойчивость к шумам и другим источникам ошибок;
4) понимание принципа работы регулятора не требует глубоких математических знаний;
В свою очередь, эти регуляторы имеют рад существенных недостатков, что ограничивает их применение в реальных системах. К таким недостаткам относятся:
1) недостаточность или неопределенность знаний об исследуемой системе;
2) сложность при формировании базы правил. Количество правил в нечетком регуляторе определяется количеством входных переменных и количеством описывающих их лингвистических переменных по зависимости:
А = хп,
где A - количество правил, x - количество входных переменных, y - количество выходных переменных;
3) сложность в определении типа и параметров функции принадлежности.
Второй и третий пункт затрудняют проектирование нечетких регуляторов из-за большого количества параметров настройки.
Для решения возникающих проблем используются нейро-нечеткие регуляторы (ННР). В отличие от классических нечетких регуляторов ННР могут самообучаться и имеют хорошую степень интерпретируемости благодаря нечеткой логике. Корректно обученный нейро-нечеткий регулятор может обеспечить качественную работу системы на всем диапазоне входных сигналов без потери в точностных и динамических характеристиках.
При формировании обучающей выборки для ННР может использоваться метод «квазиоптимального» управления для быстро изменяющихся входных сигналов (режим переброса) и ПИ-регулятор для медленно изменяющихся входных сигналов (режим слежения).
Синтез ННР проводился на основе методов нечеткой логики и нейронных сетей с использованием пакета ANFIS системы Matlab и модели Simulink, которая представлена на рис. 1 [5,6,9-11].
В качестве обучающих входных сигналов выбраны следующие сигналы:
переброс на 90 градусов;
гармонический входной сигнал sin(0.5t);
гармонический входной сигнал 0.25 sin(5t);
линейно нарастающий входной сигнал.
Для синтеза квазиоптимального по быстродействию алгоритма управления, а также настройки ПИД регуляторов, объект управления приближенно описывается линейной моделью третьего порядка (1).
L— = U — i • R — С„ •
dt е j dtä у, • „ж
J_ = Ст^1—МИ,
ш,
(1)
=
= -,
где Ь — индуктивности якорной обмотки, Гн; £ — ток в якорной обмотке, А; и — напряжение, прикладываемое к якорной обмотке, В; R — активное сопротивление якорной обмотки; Се — коэффициент противоЭДС, В-с/рад; ш — угловая скорость ротора, рад/с; ] — приведённый момент инерции якоря, ктм2; Ст — коэффициент по моменту, Н-м/А; Мн — момент нагрузки, Н-м; (рИ — угол поворота нагрузки, рад; шИ — угловая скорость поворота нагрузки, рад/с; ц — передаточное число редуктора.
Рис. 1. Модель Simulink для формирования обучающей выборки ННР
Параметры математической модели подбираются либо на основе экспериментальных данных, если объект управления представлен как «черный ящик», либо если объект известен, вводятся в модель на основе паспортных данных. Тогда квазиоптимальный закон управления без учета малой постоянной времени для данной математической модели будет иметь вид:
и = китах • sign ^ - (Т2Х2 - KUn С учетом малой постоянной времени:
,1пки +Х2\ \sign(X2)]
к итах ' -I
и = ки„
■ sign
Уз + У2^2 + т) + (У1 — У2)Т — KUmaxT2 ln
\У2+:;г(У1-У2)\+кит
sign[y2 + ^ (yi — у 2)
(2)
(3)
К^тах I \ Ъ
где и - управляющее напряжение, итах - максимальное напряжение питания, К - коэффициент усиления, Т2 - постоянная времени ОУ, т - малая постоянная времени ОУ. х1: х2 - фазовые переменные, у1 прямого физического аналога не имеет, но отождествляется с током, у2 - скорость, у3 - угол.
Для реализации квазиоптимального управления с учетом малой постоянной времени требуется знание о трех переменных состояния объекта управления, что в реальных системах не всегда является возможным.
В реальной системе полученное время начала торможения не является оптимальным, его коррекция происходит по экспериментальным данным.
Настройка ПИ-регулятора происходит аналогичным образом для каждого из сигналов, исключая переброса. Приближенные параметры рассчитываются сначала на модели, а затем корректируются по экспериментальным данным. Параметры регуляторов записываются в инвариантную подсистему (рис. 2), которая в процессе работы переключает регулятор в зависимости от входного сигнала.
о
Reg :b in: Signal
Рис. 2. Инвариантная подсистема для переключения регулятора
521
Для формирования обучающей выборки необходимо записать ошибки по всем входным координатам, которые будет использовать в своей работе нейро-нечеткий регулятор (угол, скорость), а также управляющее напряжение. Далее по полученным данным формируется обучающая выборка (рис. 3).
Входной сигнал
Л И (1
УШНИЦИШИШЦ iililirl ШШ|Ш|Ш|Ш| ШпНшИ!
О 5 10 15 20 25 30 35 40
Time
Рис. 3. Обучающая выборка на примере входного сигнала
Все данные, необходимые для обучения нечёткого регулятора, дискретизируются с частотой 1 кГц. Такая частота позволяет обеспечить достаточную точность дискретизации и при этом не сильно перегрузить систему.
Обучение нечеткого регулятора происходит с помощью средств Matlab [12]. Перед обучением необходимо выбрать метод кластеризации данных. В представленной работе выбран универсальный метод кластеризации. Далее требуется определить количество функций принадлежности (ФП) и их форму. Matlab позволяет это сделать для каждого входного сигнала по отдельности. В данной работе количество ФП не изменяется и равно 5, вид функций принадлежности одинаков и описывается функцией Гаусса.
Для систем, в которых закон управления изменяется в зависимости от входного сигнала, предложенный алгоритм настройки ННР может быть полезен, так как спроектированный таким образом регулятор заменяет все другие используемые регуляторы. Это в свою очередь позволяет избежать нежелательных эффектов, которые возникают при переключении одного закона управления на другой.
Названия функций принадлежности, их количество и диапазоны их работы до начала обучения нейро-нечёткой системы (ННС) представлены на рис. 4, вид ФП - на рис. 5-7 [1-3].
Name Range Member ship Fu.nct ions
"InputSignal"
"Error"
"Speed"
-1
-1.571 -11.259
1.5708
I.5708
II.615
{1x5 fismf} {1x5 fismf} {1x5 fismf}
Рис. 4. Функции принадлежности до начала обучения
Функции принадлежности для Bxofla:lnpu1Signal
-0.5 0 0.5 1 1.5
Рис. 5. Вид ФП «InputSignab> до обучения ННС
1
0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0
Функции принадлежности для входа:Еггог
-ftr _/ Г7 /
\ / 1 А
\ П VT7 Г\ 7 \
V X У S,
-2 -1.5 -1 -0.5 0 0.5 1 1.5
Рис. 6. Вид ФП «Error» до обучения ННС
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0 -1
Функции принадлежности для BXOAa:Speed
7 I
\/ у
д
/ * \
\/ /ч \
5 -10 -5 0 5 10 15
Рис. 7. Вид ФП «Speed» до обучения ННС
Вид функций принадлежности после обучения нейро-нечёткой системы показан на рис. 8-10.
Функции принадлежности для входа:1пputSignal
Функции принадлежности для входа:Еггог
-1 -0.5 0 0.5 1 1.5 2
Рис. 8. Вид ФП «InputSignal» после обучения ННС
-г -1.5 -1 -0.5 О 0.5 1 1.5 2
Рис. 9. Вид ФП «Error» после обучения ННС
Функции принадлежности для BXOfla:Speed
-10 -5 0 5 10 15
Рис. 10. Вид ФП «Speed» после обучения ННС
После 50 эпох обучения ННС среднеквадратичная ошибка обучения составляет 69,8 мрад (рис. 11). Сравнение работы ПИД-регулятора и нейро-нечёткого регулятора после 50 эпох обучения представлено на рис. 12, разница между ошибками в этих случаях показана на рис. 13.
Из осциллограмм видно, что максимальная разница между ошибками при использовании классического ПИД-регулятора и нейро-нечёткого регулятора после 50 эпох обучения ННС составляет 150 мрад.
При увеличении количества эпох обучения нейро-нечёткой системы до 100 среднеквадратичная ошибка обучения равна 48,2 мрад (рис. 14), что почти в 1,5 раза меньше, чем при обучении ННС в 50 эпох.
Ошибка обучения
4
У- г............................. 1 ■
ишигшшшттптгаштптга г
Г
1
О 5 10 15 20 25 30 35 40
Время с
Рис. 11. Осциллограмма ошибки ННС после 50 эпох обучения
Рис. 12. Осциллограмма ошибок при работе ПИД- Рис. 13. Осциллограмма, показывающая разницу
регулятора и ННР после 50 эпох обучения между ошибками при работе ПИД-регулятора и ННР
после 50 эпох обучения
Ошибка обучения
Время, с
Рис. 14. Осциллограмма ошибки ННС после 100 эпох обучения
Сравнение работы ПИД-регулятора и нейро-нечёткого регулятора после 100 эпох обучения представлено на рис. 15, разница между ошибками в этих случаях - на рис. 16.
524
Рис. 15. Осциллограмма ошибок при работе Рис- 16- Осциллограмма, показывающая разницу
ПИД-регулятора и ННР после 100 эпох обучения между ошибками при работе ШД-регулятора и Шр
после 100 эпох обучения
Из осциллограмм видно, что максимальная разница между ошибками при использовании классического ПИД-регулятора и нейро-нечёткого регулятора после 100 эпох обучения ННС составляет 86 мрад, что в 1,77 раза меньше, чем при обучении в 50 эпох.
Выводы:
1. Рассмотрены вопросы использования нейро-нечёткого регулятора для реализации квазиоптимального по быстродействию управления приводом оптико-электронной системы.
2.Реализована методика формирования базы знаний для синтеза нейро-нечёткого регулятора в среде программирования Matlab. Предложенный подход упрощает построение регулятора, так как от оператора-настройщика не требуется формировать и оптимизировать базу правил, проводить подбор вида и параметров функций принадлежности.
3. Сформирована обучающая выборка, которая позволяет экспериментировать как с количеством функций принадлежности, так и с их видом. Однако, если количество эпох обучения недостаточно, установившаяся ошибка регулятора может быть большой. Увеличение количества эпох обучения приводит к значительному увеличению временных затрат на обучение нейро-нечеткой модели. При правильно подобранной конфигурации параметров время настройки регулятора сокращается в разы, что позволяет рассмотреть различные варианты регуляторов и выбрать наиболее подходящий для выполнения заданных требований.
Список литературы
1. Jang S. R. ANFIS: adaptive-network-based fuzzy inference system. IEEE Transactions on Systems, Man and Cybernetics. 1993. V.23. P.665-685.
2. Sugeno M. Industrial Applications of Fuzzy Control. 1985.
3. Sugeno M., Kang G. T. Structure identification of fuzzy model // Fuzzy Sets and Systems. 1988. V.28. P.15-
33.
4. Анучин А.С. Системы управления электроприводов: учебник для вузов. М.: Издательский дом МЭИ,
2019.
5. Воробьев В.В., Горячев О.В., Макаров Н.Н. Оптимизация следящих систем на классе входных сигналов с использованием нечеткой логики // Известия ТулГУ. Серия Проблемы специального машиностроения. Вып. 8. - Тула, ТулГУ, 2005. С. 164 - 168.
6. Герман-Галкин С.Г. Matlab & Simulink. Проектирование мехатронных систем на ПК. СПб.: Изд-во «Корона. Век», 2011. 368 с.
7. Горячев О.В. Интеллектуальные системы управления: учеб. пособие / О.В. Горячев; ТулГУ. Тула: Изд-во ТулГУ, 2021. 290 с.
8. Горячев О.В. Основы расчета и проектирования мехатронных модулей систем наведения и стабилизации: учеб. пособие / О.В. Горячев [и др.]; ТулГУ, Ин-т высокоточных систем им. В. П. Грязева. Тула: Изд-во ТулГУ, 2010. 233 с.
9. Демидова Г.Л., Лукичев Д.В. Регуляторы на основе нечеткой логики в системах управления техническими объектами. СПб: Университет ИТМО, 2017. 81 с.
10. Методы робастного, нейро-нечеткого и адаптивного управления: Учебник. / Под. ред. Н.Д. Егупова. М.: Изд-во МГТУ им. Н.Э.Баумана, 2002. 744 с.
11. Пегат А. Нечеткое моделирование и управление. М.: БИНОМ. Лаборатория знаний, 2011. 798 с.
12. ЦИТМ Экспонента - MATLAB&Simulink, Инженерные сервисы, Модельно-ориентированное проектирование. [Электронный ресурс] URL: https://www.mathworks.com/help/fuzzy/anfis.html (дата обращения: 25.05.2024).
13. Чемоданов Б.К. Следящие приводы: в 3 т., 2-е изд., доп. и перераб. / Б.К. Чемоданов [и др.]. М.: Издво МГТУ им. Н.Э. Баумана, 2003. 880 с.
Горячев Олег Владимирович, д-р техн. наук, профессор, [email protected]. tula. ru, Россия, Тула, Тульский государственный университет,
Калиничев Кирилл Николаевич, аспирант, [email protected], Россия, Тула, Тульский государственный университет
A METHOD FOR FORMING A KNOWLEDGE BASE FOR A NEURO-FUZZY CONTROLLER THAT IMPLEMENTS QUASI-OPTIMAL SPEED CONTROL OF THE DRIVE OF OPTOELECTRONIC SYSTEMS
O. V. Goryachev, K.N. Kalinichev
The issues of development and modernization of regulators for drives of optoelectronic .systems (OES), as well as the use of a neuro-fuzzy controller for the implementation of quasi-optimal speed control of the OES drive are considered. The Matlab programming environment implements a methodology for forming a knowledge base for the synthesis of a neuro-fuzzy regulator. The reliability of the results obtained was confirmed by computer modeling. The obtained results are implemented in the educational process of training specialists in automatic control systems at the Department of ACS TSU.
Key words: optoelectronic system, neuro-fuzzy controller, neuro-fuzzy system, PID controller, quasi-optimal control.
Goryachev Oleg Vladimirovich, doctor of technical sciences, professor, ovg@sau. tsu. tula. ru, Russia, Tula, Tula State University,
Kalinichev Kirill Nikolaevich, postgraduate, [email protected], Russia, Tula, Tula State University
УДК 621.3.078.3
Б01: 10.24412/2071-6168-2024-10-526-527
АНАЛИЗ МЕТОДОВ НАСТРОЙКИ, ОПТИМИЗАЦИИ И АДАПТАЦИИ ПИД-РЕГУЛЯТОРОВ
О.В. Горячев, К.Н. Калиничев
Рассмотрено применение ПИД-регуляторов в современных системах автоматического управления, методы их ручной и автоматизированной настройки, представлены варианты повышения эффективности таких регуляторов.
Ключевые слова: ПИД-регулятор, оптимизация, переходная характеристика, синтез, передаточная функция, адаптивное управление, гибридный алгоритм, иммунный регулятор.
ПИД-регуляторы широко распространены в современных системах автоматического управления благодаря своей эффективности и универсальности. Они используются в различных областях промышленности, таких как энергетика, химическая промышленность, металлургия и других. Указанные регуляторы успешно применяются в высокоточных системах, например, для стабилизации лазерных резонаторов и интерферометров в оптике и фотонике, для управления гироскопами на основе микроэлектромеханических систем с замкнутым контуром, а также для определения характеристик механических резонаторов в сканирующей зондовой микроскопии.
Алгоритмы управления, реализующие структуру ПИД-регулятора, обеспечивают высокую точность и стабильность работы систем управления, а также позволяют учитывать различные факторы, влияющие на динамику системы. Реализация принципа управления по отклонению и применение в цепи сигнала ошибки ПИД-регулятора позволяет регулировать выходную координату системы в соответствии с желаемым заданным значением, корректировать в режиме реального времени параметры регулятора с целью повышения точности, стабильности и надежности функционирования.
Анализ известных литературных источников позволяет сделать вывод о том, что современные методики настройки, оптимизации и адаптации ПИД-регуляторов основываются на различных методах и моделях, среди которых можно выделить нечеткие модели, непараметрические прогнозирующие модели и экспертные системы. Кроме того, для решения некоторых существующих проблем в области автоматизации и управления ПИД-регулирование комбинируется с другими алгоритмами для разработки более функционально завершенных контроллеров.
Используемые на практике методы настройки ПИД-регуляторов можно классифицировать на следующие основные группы.
4. Классические методы настройки [3,5,6,19,21]:
1.1.Метод Циглера-Никольса [6,19] является эмпирическим и появился одним из первых методов расчёта параметров ПИД-регулятора. Он использует только два параметра для описания объекта, которые определяются по переходной характеристике объекта управления. Вместо переходной характеристики объекта можно использовать параметры, определяемые по переходной характеристике замкнутой системы управления в режиме автоколебаний, а затем по формулам определять параметры регулятора.
1.2.Метод Чина-Хронеса-Ресвика - это модифицированный метод Циглера-Никольса, который предполагает предварительное определение времени задержки и времени выравнивания по переходной характеристике объекта, а затем по формулам вычисляются коэффициенты регулятора.
1.3. Спектральный метод предполагает компенсацию нулями регулятора нежелательных полюсов объекта и придание желаемых динамических свойств путём размещения полюсов в нужных участках комплексной плоскости.