Научная статья на тему 'Автоматическая настройка ПИД-регулятора с применением машинного обучения для обеспечения стабильной работы автономных электронных систем при термоциклировании'

Автоматическая настройка ПИД-регулятора с применением машинного обучения для обеспечения стабильной работы автономных электронных систем при термоциклировании Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
54
12
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
нейро-ПИД-управление / элемент Пельтье / контроль температуры / адаптивное управление / искусственные нейронные сети / neuro-PID control / Peltier element / temperature control / adaptive control / artificial neural networks

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — Чибисов Антон Вадимович, Попов Александр Григорьевич, Мозговой Николай Анатольевич, Пиджаков Валентин Алексеевич, Пиджаков Валентин Алексеевич

Данная статья посвящена применению методов машинного обучения для автоматической настройки коэффициентов ПИД-регулятора для обеспечения стабильной работы автономных электронных систем в условиях быстрых изменений температуры. Рассмотрена проблема влияния температурного режима на работу оптоэлектронных устройств и предложен способ её решения. Представлена архитектура нейронной сети, созданной для нелинейной настройки коэффициентов ПИД-регулятора для контроля элемента Пельтье на основе его математической модели. Проведен численный эксперимент для оценки эффективности применения созданного метода настройки и продемонстрировано увеличение точности контроля температуры рабочей поверхности при его использовании.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Automated machine learning adjustment of the PID-controller for stability of the autonomous electronic systems under thermal cycling

To maintain the operations of autonomous electronic systems during rapid temperature changes, we employ machine learning methods to adjust the coefficients of the PID-controller. As we consider the problem of the influence of temperature conditions on the operation of optoelectronic devices, we propose a new method for solving it by usage of the PID-controlled Peltier element. We present the architecture of a model-based neural network we created to non-linearly adjust coefficients of the PID-controller to manage the Peltier element. The effectiveness of the created tuning method is evaluated through a numerical experiment. Therefore, we prove an increase in the accuracy of the control of the working surface temperature by the use of the proposed method.

Текст научной работы на тему «Автоматическая настройка ПИД-регулятора с применением машинного обучения для обеспечения стабильной работы автономных электронных систем при термоциклировании»

УДК 519.7

А. В. Чибисов1, А. Г. Попов1'2, Н. А. Мозговой1, В. А. Пиджаков1,

С. А. Ульянов1'2

1 Федеральное государственное унитарное предприятие «Центральный научно-исследовательский институт химии и механики» им. Д. И. Менделеева 2 Московский физико-технический институт (национальный исследовательский университет)

Автоматическая настройка ПИД-регулятора с применением машинного обучения для обеспечения стабильной работы автономных электронных систем при термоциклировании

Данная статья посвящена применению методов машинного обучения для автоматической настройки коэффициентов ПИД-регулятора для обеспечения стабильной работы автономных электронных систем в условиях быстрых изменений температуры. Рассмотрена проблема влияния температурного режима на работу оптоэлектронных устройств и предложен способ её решения. Представлена архитектура нейронной сети, созданной для нелинейной настройки коэффициентов ПИД-регулятора для контроля элемента Пельтье на основе его математической модели. Проведен численный эксперимент для оценки эффективности применения созданного метода настройки и продемонстрировано увеличение точности контроля температуры рабочей поверхности при его использовании.

Ключевые слова: нейро-ПИД-управление, элемент Пельтье, контроль температуры, адаптивное управление, искусственные нейронные сети

А. V. Chibisov1, A. G. Popov1'2, N. A. Mozgovoy1, V. A. Pidgakov1, S. A. Ulyanov1'2

1

2

Automated machine learning adjustment of the PID-controller for stability of the autonomous electronic systems under thermal cycling

To maintain the operations of autonomous electronic systems during rapid temperature changes, we employ machine learning methods to adjust the coefficients of the PID-controller. As we consider the problem of the influence of temperature conditions on the operation of optoelectronic devices, we propose a new method for solving it by usage of the PID-controlled Peltier element. We present the architecture of a model-based neural network we created to nonlinearly adjust coefficients of the PID-controller to manage the Peltier element. The effectiveness of the created tuning method is evaluated through a numerical experiment. Therefore, we prove an increase in the accuracy of the control of the working surface temperature by the use of the proposed method.

Key words: neuro-PID control, Peltier element, temperature control, adaptive control, artificial neural networks

© Чибисов А. В., Попов А. Г., Мозговой Н. А., Пиджаков В. А., Ульянов С. А., 2024 © Федеральное государственное автономное образовательное учреждение высшего образования

«Московский физико-технический институт (национальный исследовательский университет)», 2024

1. Введение

Одной из основных проблем современных автономных устройств радиоэлектроники, работающих в условиях быстрых изменений температуры (термоциклирования), является постоянное изменение их функциональных характеристик |1|.

Наиболее чувствительны к изменениям температуры оптоэлектронные устройства на базе КМОП-матриц (матриц с комплементарной структурой металл-оксид-проводник).

При колебаниях температуры изменяется динамический диапазон получаемого изображения. Это связано с наличием темнового тока генерацией электронов в обедненной области устройства (рис. 1). Как правило, увеличение температуры на 10 градусов удваивает темновой ток. Абсолютное значение темнового тока может значительно изменяться между различными датчиками. Снизить влияние указанных эффектов на выходные характеристики КМОП-матриц (разрешение и т.д.) помогает система термостабилизации. Основным элементом такой системы может являться элемент Пельтье термоэлектрическое устройство, используемое для охлаждения или нагрева |2|.

10000

8085

0 -

0 10 20 30 40 50 Т,° С

Рис. 1. Зависимость шума КМОП-матрицы от температуры

Большинство существующих систем термокомпенсации используют ПИД-регулирование (пропорциональное интегрально-дифференциальное регулирование), обеспечивающее высокую точность поддержания температуры в медленно меняющихся процессах |.3, 4|. Вместе с тем существующие методы расчета параметров ПИД-регуляторов ориентированы на линейные системы, поскольку сам регулятор является линейным динамическим звеном. Типичный закон управления ПИД-регулятором и(Ь) для момента времени £ для такой системы можно представить как

и(г) = кре(г) + кг\ е(т)<1т + ка, (1)

где е(Ь) = х(Ь) — хец(£) - ошибка управления, то есть отклонение реального сигнала х(Ь) от желаемого хец(£); кр, кг ш кл - постоянные коэффициенты управления регулятора.

При термоциклировании коэффициенты кр, кгш кл часто требуют ручной подстройки по результатам измерений реальных значений температуры. Поэтому необходимы адаптивные методы регулирования, позволяющие автоматически изменять коэффициенты для закона управления и(Ь) = I(£) (подаваемый ток) в зависимости от входных данных (температуры). Использование нелинейных регуляторов (например, нечетких или нейронных регуляторов |5, 6|) позволяет добиться более высоких показателей качества переходного процесса.

В настоящее время нейронные сети активно используются для решения широкого круга задач. Так, например, в работе |7| рассматривается управление скоростью от крутящего момента в электроприводной системе и предлагается дополнять НМД регулятор нейросе-тевым регулятором, обучаемым с помощью алгоритма обратного распространения ошибки. Сигналы обоих регуляторов складываются, что позволяет получить нелинейный закон управления. В работе |8| для системы климат-контроля оранжереи используется ИВЕ

(Radial Basis Function, функция по радиальному основанию) сеть для подбора коэффициентов ПИД-регулятора. В работах [9-11] рассмотрен ПИД-регулятор с искусственной нейронной сетью с алгоритмом дифференциальной эволюции DEA (differential evolution algorithm) и показаны преимущества применения данного регулятора, такие как: отсутствие необходимости в математической модели системы объекта управления; простая структура диспетчера и алгоритма; удобство применения алгоритма в системах реального времени.

Представленные в этих работах результаты показывают хорошую адаптируемость и высокую надежность нейронных сетей в реальном времени. Но следует отметить также и их недостатки - сложную структуру и сравнительно долгое время обучения.

Таким образом, вышесказанное позволяет предположить положительный эффект от применения нейронных сетей в системе термокомпенсации для автонастройки коэффициентов ПИД-регулятора. Применение машинного обучения позволит автоматически изменять закон управления, в зависимости от температуры для систем с большим количеством датчиков (при большом объеме входных данных) благодаря методам «обучения» и интерполяции данных.

2. Постановка задачи

На рисунке 2 представлена конструктивная схема образца автономного устройства, которая представляет собой корпус видеокамеры, состоящего из объектива, корпуса КМОП-матрицы, элемента Пельтье и радиаторов холодной и горячей стороны.

1----5

Рис. 2. Конструктивная схема устройства, где 1 - корпус видеокамеры; 2 - теплоизолятор; 3 -холодная сторона элемента Пельтье; 4 - горячая сторона элемента Пельтье; 5 - объектив; 6 -электронный блок КМОП-матрицы; 7 - радиатор холодной стороны 8 - радиатор горячей стороны

На рисунке 3 представлена функциональная схема управления элементом Пельтье. Блок регулирующего устройства формирует ШИМ-сигнал (сигнал широтной импульсной модуляции), который поступает в блок преобразования тока, представляющий собой фильтр нижних частот для выпрямления тока, который позволяет избегать пульсаций и резких скачков тока, деформирующих элемент Пельтье [12].

Задающий блок ■ Регулирующее устройство ШИН ."V Блок преобразобаиия тока s Датчик тока N Элемент Пельтье

/\

>

Объект термостабилизации

Датчик температуры

Рис. 3. Функциональная схема управления

На рисунке 4 представлена функциональная схема регулирующего устройства, состоящая из блока обученной нейронной сети, которая автоматически подбирает коэффициенты

ПИД-регулирования. Основным источником информации для блока служит сигнал с температурного датчика и с датчика тока.

ватника

Рис. 4. Функциональная схема регулирующего устройства

Нейронная сеть обучается при изменяющемся внешнем воздействии, действующем на корпус видеокамеры, которое состоит из различных перепадов внешней температуры (рис. о), а также учитывает внутренний нагрев КМОП-матрицы.

Блок управления формирует ШИМ-сигнал, который поступает на блок фильтрации, представляющий собой выпрямитель тока, который позволяет избегать пульсаций и резких скачков тока, деформирующих элемент Пельтье [11].

Автоматическая настройка включает три этапа: идентификация, расчет параметров регулятора, настройка. Этап настройки может включать в себя подстройку, которая может быть поисковой (без идентификации объекта, путем поиска оптимальных параметров) и беспоисковой (с идентификацией).

3. Описание математической модели

На основании [12, 13] предложена математическая модель элемента Пельтье, которая представляет собой модель преобразования электрической энергии в тепловую. Она состоит из уравнения для соотношения температуры поверхности оптоэлектронного модуля Т и температуры рабочей поверхности элемента Пельтье Тшог]<: :

dT

Тс ^ + Т Tdelауedy

(2)

Tdelayed(t) + Т = Twork (t - tdel), (3)

где Тс - параметр, учитывающий динамику распространения тепла от элемента Пельтье к оптоэлектронному модулю, Tdei - температура рабочей стороны с учетом времени запаздывания tdd, t - текущий момент времени; и уравнения для температуры рабочей поверхности TWor к ■

TWork = (а\Т + а2.1 )I + a4(Toe — TWork) (.)

dt а3 '

где а\ - параметр, учитывающий эффект Пельтье; а2 - параметр, учитывающий электрическое сопротивление элемента Пельтье; аз - параметр, учитывающий теплоемкость рабочего объема; а4 - параметр, учитывающий теплообмен с окружающей средой; Тос - температура окружающей среды, I - ток, пропускаемый через элемент Пельтье.

Исключая неизвестную температуру рабочей стороны Tworк, мы можем записать дифференциальное уравнение второго порядка с запаздывающим аргументом для температуры поверхности оптоэлектронного модуля:

d2T 1 dT Тс dT (t + td d) a\I

dt2 Тс dt

a3

dt

- — • T + T (t + tde i) = a3

Ü2l2 + Ü4 To, аз

Известными недостатками данной модели является необходимость эмпирической оценки ряда параметров: времени запаздывания временной постоянной Тс и коэффициентов а\ — ац. Выбранные значения данных параметров для решаемой задачи приведены в табл. 1.

Таблица 1

Выбранные значения параметров

Параметр Значение

а1 0,5 В/К

й2 2 Ом

а3 25 Дж/К

а4 5 Вт/К

Тс 5 с

tdel 1 С

Оценка времени запаздывания особенно важна для реализации некоторых методов управления элементом Пельтье [11-13], поскольку предположение о малости этого параметра позволяет значительно упростить решение уравнения (5). При этом все указанные параметры входят в получаемую из (1) и (5) систему уравнений для управления замкнутой системой при помощи ПИД-регулятора:

т + Т-1Т =

(Тс(a2I(t) + aiT)I(t) + Tccu(Toc - Twork))

C г?' , (6)

I(t) = kp(T - Tdef) + кг (T(t) - Teff )dr + kdT

J 0

где Te// - целевая температура, Teff= 261,8 К.

Поскольку коэффициенты управления кр, ki ж kd из системы уравнений (6) определяются через эмпирически получаемые параметры из табл. 1, мы применяем для численного решения задачи их определения методы машинного обучения - нейронные сети. Это позволяет улучшить точность управления без прямого уточнения эмпирически определяемых параметров.

На рисунке 5 представлена нейронная сеть, разработанная нами для решения данной задачи в пакете Matlab. Для неё реализован алгоритм оперативного обучения, представляющий собой алгоритм обратного распространения ошибки для реализации метода градиентного спуска. Созданная нейронная сеть имеет архитектуру из трех последовательных групп слоев с долгой краткосрочной памятью, слоев dropout и слоев линейной активации. Как показал опыт работы с зашумленными сигналами напряжения от источников тока [14], подобная архитектура достаточно устойчива к флуктуирующим входным данным в системах управления и контроля.

В нейронную сеть дополнительно были внесены ограничения, накладываемые на выходы. Были заданы допустимые значения управляющего тока I £ [—3А;+3А\, скорости его изменения I £ [—0-1^:; +0-1^:], и точности их определения ai = 10 мА. Также были заданы правила изменения скорости обучения (начальный learning rate = 0.001, снижается вдвое каждые 1000 эпох); разработаны правила остановки обучения по росту ошибки на валидационном сете.

Функция потерь Qioss определялась исходя из уравнений (2) - (4) для момента to -момента окончания текущего управляющего воздействия I, как модуль отклонения мгновенной температуры поверхности оптоэлектронного модуля от целевой температуры:

Qloss = у/(Т\t=to - Teff )2- (7)

Для её расчета потребовалось использование дополнительной информации о значениях температуры окружающей среды в течение времени tdei после окончания каждого обу-

Рис. 5. Функциональная схема иейроииой сети

чающего сигнала, то есть учет времени запаздывания системы. Требования к обучающим, валидационным и тестовым наборам данных также были сформулированы исходя из времени дискретизации и времени задержки: длительность всех используемых сигналов должна была превышать tdei. Это позволило избежать необходимости прямого применения метода так называемого «обучения с подкреплением» за счет численного решения уравнения (5).

Обучение нейронной сети производилось на данных с различными видами внешнего воздействия, где изменялся период времени и экстремумы температуры. Для этого данные о работе устройства в лабораторных условиях были аугментированы (расширены) при помощи реализации модели (5) в среде моделирования COMSOL. Обучение нейронной сети проводилось на GPU (NVIDIA Quadro RTX 4000) и заняло 5000 эпох.

4. Результаты исследования

В рамках исследования для двух систем управления было проведено моделирование их работы с одинаковыми внешними условиями - для системы с нейросетевым расчётом параметров ПИД-регулятора и для обычного ПИД-регулятора. График заданной зависимости температуры окружающей среды от времени приведен на рис. б.

10 -93 -7 -

О 200 400 600 800 1000 1200

^ с

Рис. 6. Моделирование внешнего воздействия: график зависимости температуры окружающей среды Тос от времени Ь

На рисунке 7 представлены результаты моделирования. На графике красной линией показана работа системы, управляемой ПИД-регулятором с ручным подбором коэффициен-

тов. Видно, что есть резкие скачки разбросом ±1 °С вокруг заданного значения (-11,5 °С). Ошибка рассогласования при этом в среднем составляет 0,2 °С. Зеленой линией показана работа ПИД-регулятора с нейросетевым расчётом параметров. При изменении внешней температуры переход более плавный, отсутствуют резкие скачки перерегулирования. Средняя ошибка рассогласования снизилась в четыре раза и составила 0,05 °С.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рис. 7. Сравнение результатов работы ПИД-регулятора с нейросетевым расчётом параметров (зеленым) с результатом работы обычного ПИД-регулятора (красным)

5. Заключение

Исходя из реального опыта проектирования, можно подытожить, что для полноценного функционирования современных устройств, в первую очередь оптико-электронных, в условиях быстрых изменений температуры (термоциклирования) необходимы системы термокомпенсации.

Применение нейронных сетей в таких системах позволяет автоматически изменять закон управления, в зависимости от температуры для систем с большим количеством датчиков и существенно повысить точность регулирования.

Список литературы

1* Чибисов A.B., Попов А.Г., Мозговой H.A., Пиджаков В.А., Ульянов С.А. Автоматическая настройка ПИД-регулятора с применением машинного обучения для обеспечения стабильной работы автономных электронных систем при термоциклиро-вании. Труды 65-й Всероссийской научной конференции МФТИ в честь 115-летия Л.Д. Ландау. 3-8 апреля 2023 г. Аэрокосмические технологии. Москва : Физматкнига, 2023. С. 35б' ISBN 978-5-89155-388-0.

2, Серебро И.П. Обзор методов обеспечения теплового режима болометра инфракрасного диапазона. Труды 65-й Всероссийской научной конференции МФТИ в честь 115-летия Л.Д.Ландау. 3-8 апреля 2023 г. Аэрокосмические технологии. Москва : Физматкнига, 2023. С. 356. ISBN 978-5-89155-388-0.

3* Astrom К. J., Hagglund Т. Advanced PID control // System, and Automation Society. ISA The Instrumentation, 2006. P. 460.

4* Олссон Г., Пияни Дж. Цифровые системы автоматизации и управления. Санкт-Петербург : Невский диалект, 2001.

5. Бура,кое М.В., Коновалов А.С. Синтез нечетких логических регуляторов // Информационно-управляющие системы. 2011. С. 14-19.

6. Бура,ков М.В. Синтез нейронного регулятора // Теория и системы управления. Изв. Академии наук, 1999. С. 140-145.

7. Omatu S., Yoshioka М., Fujinaka Т. Neuro-PID Control for Electric Vehicle // Journal of Advanced Computational Intelligence and Intelligent Informatics. 2011. V. 15, N 7. P. 846852.

8. Zeng S., Ни H., Xu L., Li G. Nonlinear Adaptive PID Control for Greenhouse Environment Based on RBF Network // Sensors. 2012. N 12. P. 5328-5348.

9. Lu W., Yang J., Liu X. The PID Controller Based on the Artificial Neural Network and the Differential Evolution Algorithm 11 Journal of computers. 2012. V. 7, N 10. P. 2368-2375.

10. Бураков M.B., Полякова, Т.Г. Нейронный супервизор для управления нелинейным объектом // Сб. докл. «Завалишинские чтения'12». Санкт-Петербург : ГУАП, 2010. С. 2327.

11. Бура,ков М.В. Генетический алгоритм: теория и практика. Санкт-Петербург : ГУАП, 2008. С. 164.

12. Громов Ю.А. , Кожевников A.M. Моделирование термоэлемента Пельтье для процессов автоматизации систем обеспечения тепловых режимов радиоэлектронных средств // Интернет-журнал «Науковедение». 2015. Т. 7, № 3 (май-июнь).

13. Гринкевич В.А. Идентификация устройства на основе элемента Пельтье методом наименьших квадратов // Доклады АН ВШ РФ. 2020. № 1-2 (январь-июнь).

14. Попов А.Г., Мозговой Н.А., Сущеня Г.Н., Пиджаков В.А., Ульянов С.А. Применение методов глубокого обучения для анализа флуктуаций напряжения литиевых источников тока // Труды МФТИ. 2023. Т. 15, № 4. С. 150-161.

References

1. Chibisov А. V., Popov A.G., Mozgovoy N.A., Pidzhakov V.A., Ulyanov S.A. Automated machine learning adjustment of the PID-controller for stability of the autonomous electronic systems under thermal cycling. Proceedings of the 65th Ail-Russian Scientific Conference of MIPT in honor of the 115th anniversary of L.D. Landau. April 3-8 2023. Aerospace technologiess. Moscow : Fizmatkniga, 2023. P. 356. ISBN 978-5-89155-388-0. (in Russian).

2. Serebro I.N. Review of methods for ensuring the thermal regime of an infrared bolometer. Proceedings of the 65th Ail-Russian Scientific Conference of MIPT in honor of the 115th anniversary of L.D. Landau. April 3-8 2023. Aerospace technologies. Moscow : Fizmatkniga, 2023. P. 356. ISBN 978-5-89155-388-0. (in Russian).

3. Astrom K. J., Hagglund T. Advanced PID control. System, and Automation Society. — ISA The Instrumentation, 2006. P. 460.

4. Olsson G., Piani J. Digital automation and control systems. Sankt-Peterburg : Nevskv dialect, 2000. (in Russian).

5. Burakov M.V., Konovalov A.S. Synthesis of fuzzy logic controllers. Information and management systems. 2011. P. 14-19. (in Russian).

6. Burakov M. V. Synthesis of a neural regulator. Theory and control systems. Izv. Academy of Sciences. 1999. P. 140-145. (in Russian).

7. Omatu S., Yoshioka M., Fujinaka T. Neuro-PID Control for Electric Vehicle. Journal of Advanced Computational Intelligence and Intelligent Informatics. 2011. V. 15, N 7. P. 846852.

8. Zeng S., Hu H., Xu L., Li G. Nonlinear Adaptive PID Control for Greenhouse Environment Based on RBF Network. Sensors 2012. N 12. P. 5328-5348.

9. Lu W., Yang J., Liu X. The PID Controller Based on the Artificial Neural Network and the Differential Evolution Algorithm. Journal of computers. 2012. V. 7, N 10. P. 2368-2375.

10. Burakov M.V., Polyakova T.G. Neural supervisor for controlling a nonlinear object. Sat. report «Zavalishin Readings'12». Sankt-Peterburg : GUAP, 2010. P. 23-27. (in Russian).

11. Burakov M. V. Genetic algorithm: theory and practice. Sankt-Peterburg : GUAP, 2008. P. 164. (in Russian).

12. Gromov Yu.A., Kozhevnikov A.M. Modeling of a Peltier thermoelement for automation processes of systems for ensuring thermal conditions of radio-electronic equipment. Online journal «Science». 2015. V. 7, N 3 (May-June), (in Russian).

13. Grinkevich V.A. Device identification based on the Peltier element using the least squares method. Reports of the Academy of Sciences of the Higher School of the Russian Federation. 2020. N 1-2 (January-June), (in Russian).

14. Popov A.G., Mozgovoy N.A., Sushchenya G.N., Pidzhakov V.A., Ulyanov S.A. Application of deep learning methods for analyzing voltage fluctuations of lithium current sources // Proceedings of MIPT. 2023. V. 15,' N 4. P. 150-161. (in Russian).

Поступим в редакцию 09.02.2024

i Надоели баннеры? Вы всегда можете отключить рекламу.