Научная статья на тему 'ПРИМЕНЕНИЕ НЕЙРОИМИТАТОРОВ В ЗАДАЧЕ ОТЫСКАНИЯ КВАЗИОПТИМАЛЬНОГО УПРАВЛЕНИЯ НЕЛИНЕЙНЫМ ОБЪЕКТОМ'

ПРИМЕНЕНИЕ НЕЙРОИМИТАТОРОВ В ЗАДАЧЕ ОТЫСКАНИЯ КВАЗИОПТИМАЛЬНОГО УПРАВЛЕНИЯ НЕЛИНЕЙНЫМ ОБЪЕКТОМ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
0
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
квазиоптиальное управление / искусственная нейронная сеть / метод Черноусько-Крылова / принцип максимума Понтрягина / quasi-optical control / artificial neural network / Chernousko-Krylov method / Pontryagin maximum principle

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Феофилов Дмитрий Сергеевич

Задача отыскания квазиоптимального управления сложным динамическим объектом, содержащим нелинейность, в условиях неполной информации является трудновыполнимой. Одной из проблем при ее решении является невозможность ис-пользования аналитических подходов, например таких как принцип максимума Понтрягина. Это обусловлено тем, что описание таких систем с помощью дифференциальных уравнений имеет разрывные правые части. Еще одной особенностью является не-достаток информации об объекте управления. О нем известно лишь то, что он со-держит нелинейность из известного класса, а также его реакция на различные управляющие воздействия. Такой объект называется «серым ящиком». В настоящей работе рассматривается задача отыскания квазиоптимального программного управления сложным динамическим объектом, содержащим нелинейность, в условиях неполной информации. Для ее решения авторы предлагают применить модифицированный численный метод, основанном на принципе максимума Понтрягина и алгоритме последовательных приближений, разработчиками которого являются Ф.Л. Черноусько и И.А. Крылов, с использованием нейроимитатора объекта управления, точно повторяющим его динамику. Приведен пример работы представленного метода.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Феофилов Дмитрий Сергеевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPLICATION OF NEURO-SIMITATORS IN THE PROBLEM OF FINDING QUASI-OPTIMAL CONTROL OF A NONLINEAR OBJECT

The problem of finding quasi-optimal control of a complex dynamic object contain-ing nonlinearity under incomplete information conditions is difficult to solve. One of the prob-lems in solving it is the impossibility of using analytical approaches, such as the Pontryagin maximum principle. This is due to the fact that the description of such systems using differen-tial equations has discontinuous right-hand sides. Another feature is the lack of information about the control object. All that is known about it is that it contains nonlinearity from a known class, as well as its response to various control actions. Such an object is called a "gray box". In this paper, we consider the problem of finding quasi-optimal software control of a complex dynamic object containing nonlinearity under incomplete information condi-tions. To solve it, the authors propose to apply a modified numerical method based on the Pontryagin maximum principle and the algorithm of successive approximations, developed by F. L. Chernousko and I. A. Krylov, using a neurosimulator of the control object that accurate-ly repeats its dynamics. An example of the operation of the presented method is given.

Текст научной работы на тему «ПРИМЕНЕНИЕ НЕЙРОИМИТАТОРОВ В ЗАДАЧЕ ОТЫСКАНИЯ КВАЗИОПТИМАЛЬНОГО УПРАВЛЕНИЯ НЕЛИНЕЙНЫМ ОБЪЕКТОМ»

industry. In the field of microelectronics, the range of metal performance characteristics is of key importance. In this review, the change in the solubility of gallium under the influence of thermodynamic factors was considered.

Key words: gallium, eutectic, solubility, thermodynamic equilibrium, corrosion.

Petsukh Georgii Ruslanovich, junior, researcher, vka@,mil.ru, Russia, Saint-Petersburg, Military Space Academy,

Devyatkina Maria Alexandrovna, laboratory worker, Russia, Saint-Petersburg, Military Space Academy,

Babin Alexander Mikhailovich, researcher, Russia, Saint-Petersburg, Military Space Academy

УДК 62-529

Б01: 10.24412/2071-6168-2025-1-116-117

ПРИМЕНЕНИЕ НЕЙРОИМИТАТОРОВ В ЗАДАЧЕ ОТЫСКАНИЯ КВАЗИОПТИМАЛЬНОГО УПРАВЛЕНИЯ НЕЛИНЕЙНЫМ

ОБЪЕКТОМ

Д.С. Феофилов

Задача отыскания квазиоптимального управления сложным динамическим объектом, содержащим нелинейность, в условиях неполной информации является трудновыполнимой. Одной из проблем при ее решении является невозможность использования аналитических подходов, например таких как принцип максимума Понт-рягина. Это обусловлено тем, что описание таких систем с помощью дифференциальных уравнений имеет разрывные правые части. Еще одной особенностью является недостаток информации об объекте управления. О нем известно лишь то, что он содержит нелинейность из известного класса, а также его реакция на различные управляющие воздействия. Такой объект называется «серым ящиком». В настоящей работе рассматривается задача отыскания квазиоптимального программного управления сложным динамическим объектом, содержащим нелинейность, в условиях неполной информации. Для ее решения авторы предлагают применить модифицированный численный метод, основанном на принципе максимума Понтрягина и алгоритме последовательных приближений, разработчиками которого являются Ф.Л. Черноусько и И.А. Крылов, с использованием нейроимитатора объекта управления, точно повторяющим его динамику. Приведен пример работы представленного метода.

Ключевые слова: квазиоптиальное управление, искусственная нейронная сеть, метод Черноусько-Крылова, принцип максимума Понтрягина.

В настоящее время проблема синтеза управления для сложных нелинейных динамических объектов является одной из востребованных задач теории автоматического управления. Она подразделяется на два типа. Первый заключается в создании корректирующего устройства, осуществляющего управление замкнутым контуром. Второй подразумевает собой отыскание такого воздействия, которое будет удовлетворять заданному ал-

116

горитму при корректировании разомкнутого контура. Такое управление называется программным. Рассматривая подробнее вторую задачу, можно сделать вывод о том, что такое управление должно быть оптимальным или близким к нему, чтобы использовать все возможности объекта. Эту проблему решил Л.С. Понтрягин, доказав свою теорему о принципе максимума. Однако, такой подход позволяет находить оптимальное управление аналитическим методом. При работе с системами высокого порядка это вызывает трудности в связи с трудоемкостью вычислений. Возможным решением данной проблемы может быть интеграция численных итерационных методов в алгоритм, предложенный Л.С. Понтрягиным. Использовать метод последовательных приближений предложили Ф.Л. Черноусько и И.А. Крылов. Данный подход предполагает наличие полной верифицированной математической модели объекта управления, которую не всегда возможно получить. Необходимо комплексное решение, которое будет включать в себя использование численных методов и возможность работы с объектом типа «серый ящик»

Проанализировав существующие современные подходы к решению данной задачи, можно выделить несколько основных направлений развития. Первый метод предполагает идентифицировать объект управления с помощью алгоритмов машинного обучения, выявить оптимальную структуру нейронной сети и определить ее параметры [1-3]. Предлагается использование ИНС с радиальной базисной функцией, а для ее обучения генетические алгоритмы. Еще одним подходом к решению данной задачи является создание универсального решения для класса объектов. Так называемая AI Pontyagin [4-5] позволяет находить квазиоптиальное управление объектом, имея информацию только о поступающем на него воздействии и выходном сигнале. Данная нейронная сеть обучается на дифференциальных уравнениях системы, характеризующих ее динамику [6]. Однако, вышеописанные подходы имеют недостатки. Обучение представленных нейронных сетей требовательно к вычислительным ресурсам и времени, первый подход лишь реализует идентификацию объекта, а второй предполагает наличие точного верифицированного математического [7] описания системы для вычисления квазиоптимального управления.

В настоящей работе авторами предлагается использование искусственных нейронных сетей для синтеза нейроимитатора, точно повторяющего динамику объекта. Ставится задача синтеза квазиоптимального управления в условиях неполной информации и ограничений, наложенных на время и входное воздействие. Известно, что объект содержит нелинейность типа насыщение, однако его математическое описание достоверно неизвестно. Критерием оптимальности является максимизация выходной величины. Для решения поставленной задачи предлагается использование численного метода отыскания квазиоптимального управления Черноусько-Крылова, модифицированного авторами.

Постановка задачи. В общем случае задача отыскания оптимального управления ставится следующим образом [8].

Объект задается системой дифференциальных уравнений

% = № и) (1)

где x - n-мерная вектор-функция координат от времени t, u - m-мерная вектор-функция управления от времени t, f - n-мерная функция правых частей. Функция правых частей может быть как линейная, так и нелинейная или кусочно-непрерывная. Следует отметить, что наличие уравнений (1) не обязательно для нахождения управления рассматриваемым методом.

Фазовые переменные должны удовлетворять начальным условиям

x(to) = Хо (2)

где to - начальный момент времени.

Управляющие воздействия принадлежат известному заданному множеству U

UEU (3)

Минимизируемый функционал задан в общем виде

J = ZUciXi (Т),

lUcf* 0, (4)

Т > to.

где T - конечный момент времени, ci - коэффициенты при фазовых переменных (импульсы).

В большинстве случаев, задача выполняется в условиях ограниченного времени, так как при интеграции систем автоматического управления наиболее сложным является переходный период.

В целях поиска оптимального управления можно воспользоваться алгоритмом Черноусько-Крылова. Он выглядит следующим образом. Затем, после выбора ограничений на время, задается точность вычислений, дискретный вектор времени и управление (5), а также перевернутый вектор времени (7). Он необходим для того, чтобы осуществить обратную интеграцию функции Гамильтона.

t = (0, tend), At (5)

ut = u±, u2.....Un (6)

tr = (tend, 0), At (7)

Следом следует решение системы дифференциальных уравнений (1), которые необходимы для нахождения значения оптимальной координаты (перемещения) в конце периода времени. Требуется вычислить вектор приращений фазовых координат, который необходим для расчета градиента.

dx = Ax • (max(xtend) - min(xtend)) (8)

Вычисляется функция Гамильтона:

y(t, -ф) = -y(F, t, х, и, dx) • ф (9)

Далее с помощью алгоритма последовательных приближений рассчитывается изменение выходной величины и управления. Начинается цикл с изменением шага

и = а • ипею + (1 -а) • и0 (11)

Решается система дифференциальных уравнений (1) в прямом времени и определяется значение оптимизируемой координаты. Если новое значение больше, чем рассчитанное на предыдущей итерации, то цикл останавливается, рассчитывается изменение управляющего воздействия (12) и выходной координаты (13)

аи = (12)

Утах—У°тах /1 <л\

¿Ушах =----(13)

Утах

Предложенный метод относится к численным и итерационным подходам, что требует соблюдения условий сходимости. Авторы подчеркивают, что алгоритм подходит только для систем низкого порядка, что значительно сужает его применимость. Таким образом, с помощью метода Чер-ноусько-Крылова возможно получить управление, близкое к оптимальному, лишь в ограниченных случаях, когда динамика объекта описывается дифференциальными уравнениями низкого порядка.

Построение нейроимитатора. Рассмотрим задачу отыскания квазиоптимального управления в условиях неполной информации об объекте. Первым этапом является выбор архитектуры нейроимитатора. Он реализуется на цифровых устройствах, что позволяет считать его дискретным. В таком случае, записав разностные уравнения линейной системы, можно сделать вывод о том, что архитектура линейного нейроимитатора будет состоять из одного нейрона без функции активации, на вход которого подается вектор состояния системы и вектор управления. На рис.1. показана обобщенная структура нейроимитатора, точно повторяющего динамику линейной системы [9]

Рис.1. Обобщенная структура нейроимитатора, точно повторяющего

динамику линейной системы

119

Проанализируем случай построения нейроимитатора нелинейной системы. В данной работе рассматривается класс нелинейностей типа насыщение, наложенных на одну из переменных состояния. Основной проблемой построения такого нейромимтатора является выбор функции активации. Предлагается использование в качетсвее ее ReLU [10]. Это связано с простотой математического описания выделенного класса нелиней-ностей (14).

у(х) = —ге1и(х — И) + ге1и(х) — ге1и(—х) + ге1и(—х — И) (14) где положительная линейная часть ге1и(х), отрицательная линейная часть—ге1и(—х), положительное (верхнее) ограничение —ге1и(х — £) + ге1и(х), отрицательное (нижнее) ограничение —ге1и(—х) + ге1и(—х — £).

В соответствии с методикой, выражение для минимального размера скрытого слоя нейроимитатора имеет вид (13).

пШйеп = 4пзаг + 2пИп, (15)

где п - порядок системы, п = + иНи, ша! - ограниченные фазовые переменные, пНп - неограниченные фазовые переменные.

Следующим этапом является обучение нейронной сети. Оно осуществляется по методу обратного распространения ошибки [11]. Его суть заключается в том, что сигнал рассогласования между ожидаемым выходным сигналом и сигналом выхода нейронной сети передается к каждому нейрону в обратном направлении. Вычисляется градиент оптимизируемого функционала и на его основе корректируются коэффициенты весовых связей. Для использования такого метода необходима обучающая выборка. Она формируется на основании реакции объекта управления на типовые входные воздействия, такие как ступенчатая, гармоническая функция и меандр. Далее формируется таблица данных, включающая в себя вектор состояния объекта и вектор управления на каждом такте квантования. Полученная выборка делится в соотношении 70/30 на обучающую и тестирующую соответственно [12].

Таким образом, настройка нейроимитатора завершена. Он точно повторяет динамику объекта и может быть использован в алгоритме отыскания оптимального управления.

Модификация алгоритма Черноусько-Крылова. Рассмотрим логику работы алгоритма расчета квазиоптимального управления. В качестве примера приводится объект третьего порядка, на фазовую переменную скорости которого наложено ограничение типа насыщение.

^^, И хх < Я ог хх = Я алё ^^ ^и(хх) < 0

= 7 (Ки-х )Т (16)

0, а х± = Я алё ^^ >0

_ кХг—Х2

Х3 — ~2 ~ (1 7)

где Х1, Х2, хз - переменные состояния, - уровень ограничителя, и -управление, к, Т, % - параметры системы.

Отметим, что объект представляет собой системы типа «серый ящик» и о нем известно лишь то, что он имеет линейную и нелинейную часть. В таком случае, предлагается провести синтез двух нейроимитато-ров, один из которых точно повторяет динамику дискретного апериодического звена с ограничителем типа насыщение, а второй динамику линейного колебательного звена. Предложенная схема системы, состоящей из двух нейронных сетей, имеет вид, показанный на рис.2.

Рис. 2. Система нейронных сетей, точно повторяющих динамику дискретного объекта с наложенным на переменную х1 ограничением

типа насыщение

Данная система используется в численном алгоритме расчета квазиоптимального управления вместо дифференциального описания системы. На ее вход подается вектор, состоящий из управления и фазовых переменных на предыдущем шаге. Выходом является вектор переменных состояния. Положительными сторонами данного метода являются возможность вычисления градиента функционала при наличии разрывных правых частей в математическом описании системы и способность работы алгоритма с системами типа «серый ящик».

Пример работы алгоритма. Математическая постановка задачи нахождения квазиоптимального управления имеет вид (18).

х2(ь) ^ от, ь = [(0,2), 0.001],и еи, й = ±1 (18)

где U некоторое известное множество, в которое может входить оптимальное управление, D - ограничение на фазовую переменную.

Промоделируем алгоритм в двух случаях, при достижении ограничения по фазовой переменной и без него (рис.3-5).

121

х,и

0.30.20.10-0.1-0.2-

Рис. 3. Пример работы алгоритма без достижения ограничений (и=0.2)

3 -

х,и 2 ~

О

-2

0.00 0.25 0.50 0.75 1.00 1.25 1.50 1.75 2.00

Рис. 4. Пример работы алгоритма с достижением ограничения (u=1)

з -и,х 2 ~

1 ~ 0-1--2~

-30.00 0.25 0.50 0.75 1.00 1.25 1.50 1.75 2.00

Рис. 5. Пример работы алгоритма с достижением ограничения (u=3)

122

ЕЩ

X(t)

t

0.00 0.25 0.50 0.75 1.00 1.25 1.50 1.75 2.00

1 щ

¡Xft)

t

Рис.3 иллюстрирует случай, когда ограничения фазовой переменной не достигаются. Рис.4-5 показывают, что после достижения ограничения и увеличения модуля управления, процесс достижения максимальной величины не изменятеся, как и ее значение.

Результат работы алгоритма доказывает применимость нейронных сетей в численных алгоритмах расчета квазиоптимального управления. Для его успешной работы необходимо обучить нейроимитатор на точное повторение динамики объекта управления.

Вывод. Определение квазиоптимального управления представляет собой сложную задачу, которую не всегда возможно решить с помощью аналитических методов. В таких ситуациях прибегают к численным методам, одним из которых является алгоритм Черноусько-Крылова. Однако этот метод имеет свои ограничения, поскольку не может быть использован для высокопорядковых систем с нелинейными характеристиками. Применение нейроимитатора системы помогает не только преодолеть указанную проблему, но и решить другие задачи, такие как точный расчет градиента оптимизируемого функционала и нахождение квазиоптимального управления для систем, рассматриваемых как «черные ящики». Тем не менее, данная методика также обладает недостатком: вычислительные затраты на обучение нейронной сети увеличиваются с повышением порядка исследуемой системы.

Список литературы

1. Diveev A., Konstantinov S. Applying Neural Networks for the Identification of Control Object Mathematical Models for the Control Problems, 2022 8th International Conference on Control, Decision and Information Technologies (CoDIT), Istanbul, Turkey, 2022, P. 1059-1063. DOI: 10.1109/CoDIT55151.2022.9803986.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2. Naing N.N., Z. Min Khaing, Naing Z.M. Development of Methodology for System Identification of Non-linear System Using Radial Basis Function Neural Network // 2020 IEEE Conference of Russian Young Researchers in Electrical and Electronic Engineering (EIConRus), 2020. St. Petersburg and Moscow, Russia, 2020. P. 2390-2394. DOI: 10.1109/EIConRus49466.2020.9039297.

3. Hongliang L., Derong L., Ding W. Neural-network-based optimal control for discrete-time nonlinear systems using general value iteration // Proceedings of the 31st Chinese Control Conference, 2012. Hefei, China. P. 29322937.

4. J. K. P. Tsoi, N. D. Patel and A. K. Swain, "Grey-Box Neural Network System Identification with Transfer Learning on Ball and Beam System," 2018 International Joint Conference on Neural Networks (IJCNN), Rio de Janeiro, Brazil, 2018, pp. 1-8, doi: 10.1109/IJCNN.2018.8489103.

5. H. Xu and S. Jagannathan, "Neural Network-Based Finite Horizon Stochastic Optimal Control Design for Nonlinear Networked Control Systems," in IEEE Transactions on Neural Networks and Learning Systems, vol. 26, no. 3, pp. 472-485, March 2015, doi: 10.1109/TNNLS.2014.2315622.

6. R. Moghadam, P. Natarajan, K. Raghavan and S. Jagannathan, "Online Optimal Adaptive Control of a Class of Uncertain Nonlinear Discrete-time Systems," 2020 International Joint Conference on Neural Networks (IJCNN), Glasgow, UK, 2020, pp. 1-6, doi: 10.1109/IJCNN48605.2020.9206724.

7. Yuanyuan S., Baisen Z. Optimal Control Via Neural Networks: A Convex Approach // ICLR Conference. 2019.

8. Крылов И.А. Алгоритм метода последовательных приближений для задач оптимального управления / И.А. Крылов, Ф.Л. Черноусько // Журнал вычислительной математики и математической физики. 1972. Т. 12, № 1. С. 14-34.

9. Feofilov S.V., Kozyr A.V., Khapkin D.L. Structural and Parametric Synthesis of Neural Network Controllers for Control Objects with Limiters. Mekhatronika, Avtomatizatsiya, Upravlenie. 2023. 24(11). P. 563-572.

10. Nair V. Rectified Linear Units Improve Restricted Boltzmann Machines, Proceedings of the 27th International Conference on International Conference on Machine Learning : ICML'10, Haifa, Israel. Madison, WI, USA: Omnipress, 2010. P. 807-814.

11. Lecun Y. Gradient-based learning applied to document recognition, Proceedings of the IEEE. 1998. Т. 86. № 11. P. 2278-2324.

12. Feofilov S.V., Khapkin D.L. Application of Recurrent Neural Networks in Closed-loop Tracking Systems for Controlling Essentially Nonlinear Objects // Proceedings of 3rd International Conference on Control Systems, Mathematical Modeling, Automation and Energy Efficiency (SUMMA). Lipetsk: IEEE, 2021. P. 467-472.

Феофилов Дмитрий Сергеевич, лаборант, fd190 [email protected], Россия, Тула, Тульский государственный университет

APPLICATION OF NEURO-SIMITATORS IN THE PROBLEM OF FINDING Q UASI-OPTIMAL CONTROL OF A NONLINEAR OBJECT

D.S. Feofilov

The problem of finding quasi-optimal control of a complex dynamic object containing nonlinearity under incomplete information conditions is difficult to solve. One of the problems in solving it is the impossibility of using analytical approaches, such as the Pontryagin maximum principle. This is due to the fact that the description of such systems using differential equations has discontinuous right-hand sides. Another feature is the lack of information about the control object. All that is known about it is that it contains nonlinearity from a known class, as well as its response to various control actions. Such an object is called a

"gray box". In this paper, we consider the problem of finding quasi-optimal software control of a complex dynamic object containing nonlinearity under incomplete information conditions. To solve it, the authors propose to apply a modified numerical method based on the Pontryagin maximum principle and the algorithm of successive approximations, developed by F. L. Chernousko and I. A. Krylov, using a neurosimulator of the control object that accurately repeats its dynamics. An example of the operation of the presented method is given.

Key words: quasi-optical control, artificial neural network, Chernousko-Krylov method, Pontryagin maximum principle.

Feofilov Dmitry Sergeevich, laboratory assistant, _fd190 [email protected], Russia, Tula, Tula State University

УДК 004.67

DOI: 10.24412/2071-6168-2025-1-125-126

ОСОБЕННОСТИ ИСПОЛЬЗОВАНИЯ ТЕХНОЛОГИИ BIG DATA И AI В СОВРЕМЕННЫХ БИЗНЕС-ПРОЦЕССАХ

Н.А. Епрынцева

Данная статья посвящена современным информационным технологиям и выявлению особенностей их использования в нынешних экономических и социальных условиях. Была изучена специфика использования технологий BIG DATA и AI в современных условиях ведения бизнеса. Также были определены теоретические особенности использования искусственного интеллекта на нынешнем этапе развития IT-индустрии. Помимо этого, было изучено состояние нынешнего уровня развития информационных инструментов, применяемых в отечественной бизнес-среде. Изучены современные тенденции использования информационных технологий, а также определены проблемы их применения в бизнес-процессах и выявлены мероприятия, связанные с возможностями развития применения искусственного интеллекта, а именно технологий BIG DATA и AI на опыте отечественных организаций. Также были представлены основные тенденции и тренды, актуальные на сегодняшний день.

Ключевые слова: Информационные технологии, IT-индустрия, искусственный интеллект, IT-технологии, BIG DATA, автоматизация, машинное обучение.

В настоящее время информационные технологии являются одним из основных инструментов, влияющих на конкурентоспособность товаров и услуг, а также на развитие экономики в целом. Информационные технологии сегодня используются практически во всех сферах деятельности человека.

В условиях растущей конкуренции и постоянно меняющихся требований клиентов компании вынуждены искать новые способы решения задач, возникающих в процессе работы. В настоящий момент информационные технологии активно применяются во всех областях экономиче-

125

i Надоели баннеры? Вы всегда можете отключить рекламу.