УДК 681.513
Д.В. Козлов, асп., (4872)-34-58-50, 910-162-08-70,
МгКо21оуЭУ@гашЬ1ег.ш (Россия, Тула, ТулГУ),
B.В. Крючков, асп., (4872)-33-51-08, 919-078-21-78,
Ь1аскрксЬ@гашЬ1ег.щ (Россия, Тула, ТулГУ),
C.А. Шопин, асп., (4872)-40-27-25, 953-423-83-72,
881юрт@.шаП.щ (Россия, Тула, ТулГУ)
АППРОКСИМАЦИЯ ПОВЕРХНОСТИ ПЕРЕКЛЮЧЕНИЯ РЕЛЕЙНОГО РЕГУЛЯТОРА С ИСПОЛЬЗОВАНИЕМ УРАВНЕНИЯ В ЧАСТНЫХ ПРОИЗВОДНЫХ И НЕЙРОСЕТЕЙ
Предложен новый метод построения поверхностей переключения релейного регулятора с использованием интегральных базисов линейного уравнения в частных производных первого порядка и аппроксимации нелинейных функций с помощью радиально-базисных нейросетей.
Ключевые слова: характеристическое уравнение, интегральные базисы, поверхность переключения, аппроксимация функции нейросетью, квазиоптимальное быстродействие.
1. Введение
Из теории автоматического управления известно, что решение задачи определения оптимального по быстродействию управления для линейного неосциллирующего объекта, уравнение возмущенного движения которого описывается уравнением
йХ (? )/ & = АХ (?)+ Ви (?), (1)
где X е Яп - вектор отклонений фазовых координат объекта от заданной траектории движения; А - матрица параметров объекта, имеющая размер-
Т
ность п хп ; В = (Ь\,^2,...,Ьп) - вектор-столбец с элементами Ь- = 0,
I = 1. п -1, Ьп = 1; и - управляющее воздействие, причем |и(?) < 1, может
быть найдено в виде [5]
и = ^1&п(ц\ (2)
где у - некоторая функция, называемая поверхностью переключения.
Задача определения поверхности переключения у представляет собой достаточно сложную, не решенную до сих пор задачу
В р сботе [9 ] для функции переключения у получено следующее уравнение в частных производных:
(Х, X+1,•••, хп )+дду^/2 (х-, х-+l,..., хп )+ ... + дх1 дх1+1
+ ~д^/п-1(х-, X+1,•••, хп [/п (Х, X+1,•••, хп )-^(У/+1 )]= 0 (3)
дхп-1 дхп ’
где I = 1. п - интервал управления; п - порядок объекта; у- - поверхность переключение на - - ом интервале; / (х-, х-+1,., хп) - функция, полученная умножением - - ой строки матрицы А объекта на вектор
(хЬ х2, •, хп Т.
Уравнение (3) справедливо на всех интервалах движения изображающей точки в фазовом пространстве, причем на последнем оно вырождается в равенство у п = хп [5].
При аппроксимации функций у- полиномом определение коэффициентов степенного ряда связано не только с большим объемом вычислений, но и с переопределенностью системы уравнений для их нахождения
[4, 7, 11].
Известны попытки автоматического интегрирования уравнения (3) и определения функций у-, но не исходного объекта, а некоторого нового, полученного с помощью введения так называемых дополнительных обратных связей (ДОС) [8]. Данный подход также обладает рядом недостатков: введение ДОС для определения поверхностей переключения на всех интервалах движения часто невозможно реализовать физически; даже если все ДОС определены, новый объект не всегда оказывается устойчивым; система, работающая по синтезированному закону, может не соответствовать предъявляемым к ней требованиям.
Таким образом, разработка не только аналитических но и численных методов определения функций у- является весьма актуальной задачей.
2. Метод аппроксимации поверхности переключения
Как было показано в [3], решение уравнения (3) можно искать в виде некоторой функции, зависящей от его интегральных базисов [1]
у, = ^ (с|г >, С^,..., С(')), (4)
где С() - у -й интегральный базис - -й поверхности переключения, причем у = 1..Л -1.
Для поверхности переключения у- можно составить -(- -1)/2 интегральных базисов, однако достаточно использовать только независимые, количество которых равно - -1. Это позволяет уменьшить количество аргументов неизвестной функции Г- и в то же время сохранить всю информацию, полученную из уравнения (3).
Очевидно, что для систем высокого порядка функции Г- определить в замкнутой форме невозможно. Среди возможных вариантов их аппроксимации - использование нейронных сетей радиально-базисного типа, которые обладают высокими аппроксимирующими свойствами [6]. При таком подходе входами нейросети являются значения интегральных бази-
сов для точки фазового пространства, выходом - значение функции переключения ¥-.
Для аппроксимации функции ¥- необходимо построить отрезок оптимальной траектории объекта - множество точек {а}. Так как значение функции (4) для всех точек множества {а} равно нулю, то аппроксимация функции ¥- сводится к такому обучению нейросети, при котором для
множества комбинаций значений интегральных базисов С ()}, определяемых для всех точек {а} , выходом нейросети будет нулевой сигнал.
Для определения множества {а} предлагается использовать метод
обратного времени, при этом значения С(-) вычисляются по координатам
объекта, движущегося в обратном времени т = -, при заданной величине дискретизации параметра т- на - - ом интервале так называемого "попятного движения" [10].
Ниже приводится пример синтеза квазиоптимального по быстродействию регулятора для системы третьего порядка.
3. Квазиоптимальное управление системой трех интеграторов В качестве примера рассмотрим оптимальное по быстродействию управление объектом, уравнения движения которого в форме Коши имеют следующий вид:
х1 = х2, х2 = х3, х3 = и^). (5)
На основании (3), (5) можно составить уравнение для определения поверхности переключения на первом интервале движения
х2 +1^ х3 -:дуу1 ^^у 2 )= 0, (6)
дх1 дх2 дх3
где у 2 = х2 + х3 s'gn(xз) - уравнение поверхности второго интервала [3].
Независимые интегральные базисы
3 2
С1 = х1 + х2XзS'gn(у2)+ х3, С2 = х2 + s'gn(у2). (7)
При одной и той же топологии внутреннего слоя нейросети - количестве нейронов и организации связей между ними - точность аппроксимации функции одного переменного выше, чем функции нескольких переменных. По этой причине поверхность у1 целесообразно искать, например, в виде
у1 = С1 + ¥ (С2), (8)
где ¥ (С2) - функция, подлежащая аппроксимации.
Следуя изложенному выше в п.2, проинтегрируем уравнения (5) в обратном времени [10]:
х3 (т1 )= ит1 + Х3Ь Х2(т1)
х?
и — - х31т1 + х21;
Т1
6
^1(^1 ) = и~1 + Х31 -^1 Х21 Т 1 + Хц';
Т2
х31(т2 )= -ит2 + Х30;
х21(т2):
и
2
Т2
2
Х30Т2 + Х20;
(9)
Т3 Т2
0 211 11. х11(т2 )=-и~Г + Х30■“ - Х20Т2 + Х10;
2 I 6 2
где Т1 и Т2 - время движения объекта на первом и втором интервалах соответственно; (хю, Х20, Х30) - координаты начального положения объекта; (хц, Х21, Х31) - координаты объекта в момент смены знака сигнала управления.
Изменяя значения Т1 и Т2 на некотором интервале, определим из (9) и (7) соответствующие им значения координат Х1, Х2, Х3 и интегральных базисов С\ и С2.
Далее, используя в качестве входного сигнала С2, а в качестве выходного - С\, взятый со знаком "минус", произведем обучение нейросети с применением стандартного метода, например, "обратного распространения ошибки" [6]. На этом процедура синтеза квазиоптимального регулятора заканчивается.
В результате получаем квазиоптимальный регулятор, структура которого показана на рис. 1.
Рис. 1. Структура регулятора с радиально-базисной нейросетью
Моделирование перевода объекта (5) из начального состояния (1; - 0,5;1) в конечное (0;0;0) производилось в математическом пакете Ма1> ЬаЬ/ЗішиІіпк при шаге дискретизации, равном 0,01 с (рис. 2).
Графики переходных процессов близки к графикам, полученным при оптимальном законе управления [9] при тех же начальных условиях (рис. 3). Наибольшее отличие наблюдается по координате Х3, как наиболее близкой к управляющему сигналу, однако при уменьшении шага дискретизации до 0,001 с оно пропадает.
Рис. 2. Квазиоптимальное изменение координат объекта
и сигнала управления
Рис. 3. Оптимальное изменение координат объекта и сигнала управления
По сравнению со стандартными подходами решения задачи оптимального быстродействия описанный метод обладает рядом преимуществ:
- аналитически определяются новые обобщенные координаты объекта - интегральные базисы, из которых непосредственно состоит поверхность переключения у і ;
- аппроксимация поверхности переключения у і нейросетью с использованием интегральных базисов исключает необходимость аналитического определения функции ¥і;
- применение нейронных сетей позволяет использовать их адаптационные свойства для "подстройки" синтезированного регулятора в процессе эксплуатации объекта, контролируя и повышая тем самым его точность.
Таким образом, предлагаемый в работе метод, используя одновременно преимущества как аналитического, так и численного подходов решения задачи, существенно облегчает построение поверхности переключения с достаточной для практики точностью.
Список литературы
1. Зайцев В.Ф., Полянин А.Д. Справочник по дифференциальным уравнениям с частными производными первого порядка. М.: Физматлит, 2003. 416 с.
2. Клюев А.С., Колесников А.А. Оптимизация автоматических систем управления по быстродействию. М.: Энергоиздат, 1982. 240 с.
3. Козлов Д.В., Крючков В.В., Сурков В.В. Оптимальное по быстродействию управление для системы из трех интеграторов // Изв. ТулГУ. Сер. Проблемы управления электротехническими объектами. Вып. 3. 2005. С. 12-13.
4. Ловчаков В.И., Струков К.В., Ходаков М. В. Модификация решения задачи оптимального управления методом динамического программирования // Системы управления электротехническими объектами. Вып. 4: сб. научных трудов четвертой Всероссийской научно-практической конференции. Тула: ТулГУ, 2007. С. 144-146.
5. Ловчаков В.И., Сурков В.В., Сухинин Б.В. Оптимальное управление электротехническими объектами. Тула: ТулГУ, 2004. 150 с.
6. Медведев В.С., Потемкин В.Г. Нейроные сети. МаїЬаЬ 6. М.: Диалог-МИФИ, 2002. 496 с.
7. Прокофьев М.Е. Сравнение методов синтеза оптимального регулятора для колебательного объекта второго порядка // Системы управления электротехническими объектами. Вып. 4: сб. научных трудов четвертой Всероссийской научно-практической конференции. Тула: ТулГУ, 2007.
С. 121-123.
8. Соловьев А.Э. Частные случаи решения задачи аналитического конструирования оптимальных регуляторов // Изв. ТулГУ. Сер. Вычисли-
тельная техника. Информационные технологии. Системы управления. 2006. Вып. 3. Т. 2. С. 173-176.
9. Сурков А.В., Сухинин Б.В. Аналитическое конструирование оптимальных по быстродействию систем // Изв. ТулГУ. Сер. Проблемы управления электротехническими объектами. 2005. Вып. 3. С. 119-122.
10. Фельдбаум А.А. Основы теории оптимальных автоматических систем. М.: Наука, 1966. 624 с.
11. Ходаков М.В. Исследование оптимального управления двигателем постоянного тока ДИ-180 // Системы управления электротехническими объектами: сб. научных трудов четвертой Всероссийской научнопрактической конференции. Тула: ТулГУ, 2007. Вып. 4. С. 159-162.
D. Kozlov, V. Kryuchkov, S. Shopin
Switching surface approximation for time-optimal control using partial differential equation and neural networks
New method for switching surface approximation of relay regulator based on the usage of integral bases of 1st order linear partial differential equation and radial basis neural networks approximation of nonlinear functions is presented.
Keywords: characteristic equation, integral bases switching surface, approximation function neural network, quasi-optimalperformance.
Получено 12.01.10