Известия Тульского государственного университета
Естественные науки. 2014. Вып. 3. С. 158-166 = Прикладная математика и информатика =
УДК 519.81
Формирование оптимального закона системы управления динамическим объектом ЛПТ-поиском
Аннотация. Рассмотрены вопросы формирования оптимального закона системы управления динамическим объектом ЛПТ-поиском. Многокритериальная оптимизация осуществляется на основе использования ЛПТ-последовательности.
Ключевые слова: ЛП Т-последовательность, пространство параметров, оптимизация, оптимальное управление, макропеременные.
Проблема синтеза эффективных систем управления различных объектов, связанная в первую очередь с удовлетворением совокупности технических требований, которые определяют качество движения в переходных процессах и в установившихся режимах работы, является кардинальной в теории и технике построения сложных систем автоматического управления.
Для динамического объекта заданы система дифференциальных уравнений (1)-(2), начальное состояние (3), установлены критерии качества управления (4) и ограничения (5).
Дифференциальные уравнения объекта в общем виде
М. В. Грязев, О. А. Кузнецова
Введение
1. Управляемый динамический объект
х = Г (х, и, ¿)
(1)
или в развернутом виде
¿7 (1) = 9] (¿1, ■■■ , гл, Х1, ... , Хп) , 3 = 1, й; Хi (^ = ¡г (Х1, ... , Хп) + , г = й + 1, ..., ц, ц ^ п; Хг+1 (¿) = ¡г+1 (Х1, ... ,Хп) + иг+1 + ¿7+1;
Хп (^ = ¡п (Х1, ... , Хп) + иг + .
В этой системе уравнений ж = [ж1,..., жп] т — вектор параметров объекта в пространстве состояний, ж € Еп, и = [и^... ,иг] т — вектор управления, и € и С Ет, и — ограниченное замкнутое множество, г = [г1,..., г^] —вектор внешних возмущений размерности / (ж, и) = [/1 (ж, и) ,..., /п (ж, и)] т — вектор функции, описывающий непрерывное однозначное отображение:
/ (ж, и): Яп х Яг ^ Яп
Каждая такая система уравнений удовлетворяет условиям существования решений, отвечающих любой совокупности начальных данных:
ж0 = [ж°,...,жП]Т, ж0 € Кп, * ^ 0. (3)
Каждое управление и и пара начальных данных ж0, определяют полное движение системы ж, и, т.е. кривую в п + г-мерном пространстве [1].
Оценка режимов управляемого динамического объекта определяется критериями следующего вида [2-4]:
Ф (и); = 6, (ж )) + ^ Ег (ж (*), и (*)) ^ ^ шш, г = 1,..., т, (4)
0
где *у — длительность процесса управления. Первое слагаемое выражения (4) характеризует точность управления конечным состоянием системы. Второе слагаемое определяет качество процесса управления на интервале [0, Ьу] и выполнение ограничений
¿у
= J г (ж,и) ^ 0, I = 1,... (5)
Необходимо найти оптимальное управление и (ж, Ь) за счет решения оптимизационной задачи (1)—(4) с учетом соответствующих ограничений. Определен класс однозначных отображений:
5 = { (ж, А) : г = 1,...,в} , (6)
где А — вектор параметров, в* (ж, А) : х Еп ^ Еп.
Решение задачи (1)—(9) представляет оптимальное множество Парето:
Р = { вЦ (ж, А) € 5 : г = 1,..., в, 3 = 1,...,п } . (7)
Множество Парето сформировано при следующих условиях:
Ув* (ж, А) € 5, УА € Яп Зв?(ж,А) € Р ЗА € Яп, Ф (в? (ж, А)) < Ф (ж, А)),
где Ф (ж, А)) = [Ф1 (ж, А)) ... Фт (в* (ж,А))]Т — вектор выполненных критериев (3), считая, что и = в* (ж, А) и выполняются условия Ф (в*' (ж, А)) < Ф (в*'' (ж, А)), если Ф; (в*' (ж, А)) < Ф; (в*'' (ж, А)), г = 1, ... , т и ЗФк (в*' (ж, А)) < Фк (в*'' (ж, А)), 1 < к < т.
2. Формирование оптимального управления
Поиск оптимальной системы управления динамическим объектом выполняется в соответствии с методологией ЛПт-поискового метода синтеза системы управления. Метод синтеза предполагает использование макропеременных, связанных с инвариантными множествами и скоростным градиентом.
Цели оптимального управления определяют макропеременные и инвариантные множества. Относительно макропеременных необходимо различать внешнее и внутреннее управление.
Можно привести несколько форм записи в форме уравнения с учетом внутренней переменной Фз [5]:
Фз = 7з1 (Жг+1 - VI) + ... + 7^ (Хп - и,п) , 8 = 1,..., Л, (8)
или
Фз = ^2 взк Хк + 6 (Х1,...,ХМ) , (9
к=1
где 7з,7в — весовые коэффициенты, — «внутренние» управления.
В окрестности этого многообразия функции фз непрерывны вместе с производными
дфз дфз дфз _ .
я—'я—'...^я-' 8 =1,...,Л>
дх1 дх2 дхп
т.е.
Иш Фз (Х1,... ,Хт) = Фз (аь ... ,ат).
Движение изображающей точки синтезируемой системы должно удовлетворять системе функциональных уравнений относительно макропеременных:
Тзфз (*) + Сз (Фз) =0' 8 = 1' . . . ' Л. (10)
Уравнения (10) являются уравнениями Эйлера-Лагранжа и доставляют минимум сопровождающего функционала (11), который отражает интегральные свойства синтезируемой системы
* = 0
о
^ л
Ес2 (Фз) + £ т2Ф 2 (<) + и2
,з=1 з=1
(11)
Уравнения определяют устойчивые экстремали Фз (¿), доставляющие минимум сопровождающего функционала (11), с выполнением ранговых условий [5], уравнения (10) определяют в фазовом пространстве координат Х1, ... , Хп некоторое п — ^-мерное многообразие переменных, образованное интегральными кривыми системы (10), из которых только одна проходит
через данную точку указанного многообразия. В окрестности этого многообразия функции ф8 непрерывны вместе с производными
(¿) = 9з (¿1, ... , га, XI, ... , Хп) , 3 = 1, ..., й;
X (^ = ¡г (Х1, ... , Хп) + , г = й + 1, ..., у, у ^ п;
Xг+1 (¿) = ¡г+1 (Х1, ... , Хп) + иг+1 + ;
Хп (^ = ¡п (Х1, ... , Хп) + и + га; (12)
Хп+* (*) = -1/% (фв), 8 = 1,... Л; л л
Хп++1 (¿) = ^ е2 ш ^ т2ф 2 (*) + и2.
8=1 8=1
При необходимости к системе уравнений (12) добавляются критериальные уравнения, учитывающие энергетические и другие свойства.
Отличительная особенность постановки проблемы синтеза системы состоит в способе генерации такой совокупности обратных связей - законов управления и (ф) = и (х) , которые переводят систему из произвольного исходного состояния в окрестность желаемых многообразий ф8 (х) = 0, а затем обеспечивают асимптотически устойчивое движение вдоль этих многообразий вплоть до попадания на заданный аттрактор. Необходимо, опираясь на модель объекта и системы управления, сформировать закон управления и.
Задача поиска оптимального закона управления может решаться различными методами, которые широко представлены в соответствующей литературе, например в [6].
3. Алгоритмы оптимального управления
Алгоритм 1. Разработанная модель оптимизационного расчета обладает следующими особенностями:
- обеспечивает учет нескольких критериев, имеющих разную физическую природу;
- обеспечивает учет желаемых свойств движения системы;
- выполняет учет влияния внешних возмущающих факторов за счет перевода их в дифференциальные уравнения;
- имеет возможность управления не только координатами системы, но и внутренними (производными) координатами.
Отличительная особенность постановки проблемы синтеза системы состоит в способе генерации такой совокупности обратных связей - законов управления и (ф) = и (х) , которые переводят систему из произвольного исходного состояния в окрестность желаемых многообразий ф8 (х) = 0, а затем обеспечивают асимптотически устойчивое движение вдоль этих многообразий вплоть до попадания на заданный аттрактор.
Необходимо, опираясь на модель объекта и системы управления, сформировать закон управления и.
Возможны следующие решения данного вопроса:
- управление и может иметь скалярную и векторную форму реализации;
- управление и может иметь аналитическую зависимость от координат и внешних факторов;
- при формировании закона управления может закладываться принцип «черного ящика»;
- создание структуры с генетическим алгоритмом;
- поисковый метод в сочетании с аналитическим способом формирования структуры.
Исходя из сформулированной ранее цели управления, рассмотрим схему поиска оптимального закона управления методом ЛПТ-поиска, применительно к задаче структурно-параметрического синтеза системы управления динамическим объектом.
На этапе поиска структуры управления используем принцип декомпозиции расширенной системы [5]. Размерность декомпозиции определяется соотношением
ё1ш£ = п + г — Лш, (13)
где п + г — размерность исходной расширенной системы, ш — размерность вектора управления, Л — число вводимых инвариантных многообразий.
Из соотношения следует, что с увеличением числа каналов управления процесс динамической декомпозиции системы значительно ускоряется, а процедура аналитического синтеза векторных законов управления существенно упрощается.
Выполняются обратные действия с полученными уравнениями (8)-(10) и уравнениями расширенной системы (12). Получаем, что уравнения вычисляются по формулам
Цг+1 = —/¿+1 (хЬ . . . ,Хп) — Zj+1 — Д1/Д,
..................(14)
= — /п (Х1, ...,Хп) — га — Дп/Д,
где
Д
711 712 721 722
7т 1 7т2
71т 7 2т
7тт
= 0, Д1 =
Ф1 712 Ф2 722
Фт
7т2
Дп
711 712 721 722
7т 1 7т2
71,т-1 Ф1
7 2т Ф2
7тт
Фт
71т 7 2т
7тт
= 0,
= 0,
при Ф8 = 0
Ф« = 7^ 1 (г) + 2 (г) + ... + 7 тЬп (г) - т1 ф« (<£«) •
т«
Выражения (14) позволяют установить перечень элементов, входящих в управления и соотношения между элементами.
На основании уравнения (14) введем следующую запись для управления в виде
п 1
и = ^ аг Хг + С3 • (15)
г=1 ¿=1
Коэффициенты при и образуют многомерное пространство варьируемых параметров ац, с^ € А. Решение исходной задачи (3)-(9) выполняется ЛП т-поиском [7-12] с использованием равномерного зондирования пространства параметров А точками ЛПт-последовательности и представляет оптимальное множество Парето (11), на основе которого окончательно принимается решение относительно вектора управления и = (вг, А).
Алгоритм 2. Для решения задачи синтеза управления используем метод скоростного градиента для отыскания функциональной зависимости управления. Скоростной градиент предназначен для решения задач управления непрерывными по времени системами, в которых цель управления задана при помощи целевой функции. Применим алгоритм скоростного градиента для непрерывной нестационарной системы (1) при цели управления, заданной соотношением Нш ( (х (г), г) = 0, где ( (х, г) —
гладкая целевая функция [13,14].
Для построения алгоритма вычисляется скалярная функция Я = и (х, и, г) — скорость изменения величины ( = ( (х (г), г) в силу уравнения объекта (1):
и (Х, и, г) = д(дх,ь) + [УхЯ (Х, г)]Т г (Х, и, г). (16)
Затем находят градиент функции и (х, и, г) по входным переменным
уии (х, и, г) =
ди Т 'дГ'
ди ди
Т
Ух Я (х,г). (17)
Наконец, задается алгоритм изменения и (г) дифференциальным уравнением
^ = -ГУади(х,и,г), (18)
где Г = ГТ > 0 — симметрическая положительно определенная матрица, например, Г = &ад • • •, 7т}, 7г > 0.
Для правильного и обоснованного выбора параметров алгоритмов скоростного градиента требуется проверка условий их применимости. Такие условия для различных случаев можно найти в [13-15]. Основные из них: выпуклость функции и (х,и,£) по и и существование «идеального управления» — вектора и* такого, что и (х,и*,£) ^ 0 для всех Х (условие достижимости).
Метод скоростного градиента (СГ) и градиентный метод тесно связаны с понятием функции Ляпунова V (х) — функции состояния системы, убывающей вдоль ее траекторий. Функция Ляпунова является абстрактным аналогом таких физических характеристик, как энергия и энтропия. Важно, что функция Ляпунова может использоваться не только для анализа, но и для синтеза систем, т.е. для решения обратных задач. В частности, конечная форма СГ-алгоритмов получается, если в качестве функции Ляпунова взять саму целевую функцию: V (х) = Q (х). Дифференциальная форма СГ-алгоритмов соответствует выбору V (х,и) = Q (х) + 0, 5 (и — и*)т Г-1 (и — и*), где и* - желаемое («идеальное») значение управляющих переменных. При обосновании градиентного метода в качестве функции Ляпунова используется квадрат расстояния до идеального управления: V (х) = |и — и*|2.
В окончательном виде система уравнений примет вид:
(¿) = 9з (¿1, ... , ¿а, Х1, ... , Хп) , 3 = 1, ..., й; Хг (¿) = ¡г (Х1, ... , Хп) + , г = й + 1, ..., ^ ^ п; хг+1 (¿) = ¡г+1 (Х1, ... , Хп) + иг+1 + ¿¿+1 ;
Хп (¿) = ¡п (х1, ... , Хп) + и + га; (19)
Хп+з (¿) = —1/ТзСз (Фз), 8 = 1, ... Л;
лл хХп+з+1 (¿) = £ С2 (Фз) + £ Тз2ФФ2 (¿) + и2;
з=1 з=1
и (¿) = —Г Уии (х, и, ¿).
В результате решения системы управления определяем структуру вектора управления
и = (8^, А) ,
где
8^ = — Г Уии (х, и, ¿) , значения варьируемых параметров А зависят от
Vx Q (х, ^ .
Остальные действия выполняются, как в алгоритме 1.
А = ¡
д^ ди
Заключение
Применение в математической модели оптимизационного расчета уравнений движения с макропеременными устанавливает желаемые свойства системы.
Совокупность значений варьируемых параметров A определяет основные характеристики процессов движения динамической системы.
Структура управления формируется алгоритмом скоростного градиента.
Список литературы
1. Зубов В.И. Лекции по теории управления. СПб.: Лань, 2009. 496 с.
2. Беллман Р., Дрейфус С. Прикладные методы динамического программирования. М.: Физматлит, 1965. 457 с.
3. Грязев М.В., Кузнецова О.А. Применение ЛП ^последовательности при оптимизации динамического объектом // Изв. ТулГУ. Естественные науки. 2013. Вып. 1. С. 142-153.
4. Грязев М.В., Кузнецова О.А. Возможность использования ЛП т-последова-тельности при оптимизации динамического объекта // Изв. ТулГУ. Естественные науки. 2013. Вып. 2. Ч. 1. С. 137-147.
5. Колесников А.А. Синергетические методы управления сложными системами: Теория системного синтеза. М.: КомКнига, 2006. 240 с.
6. Хлебников М.В., Поляк Б.Е., Кунцевич В.М. Оптимизация линейных систем при ограниченных внешних возмущениях (техника инвариантных эллипсоидов) // Автоматика и телемеханика. 2011. № 11. С. 9-59.
7. Кузнецова О.А. Многокритериальная оптимизация асинхронного электропривода. Тула: Изд-во ТулГУ, 2009. 104 с.
8. Кузнецова О.А. Адаптивный метод исследования пространства параметров. Тула: Изд-во ТулГУ, 2012. 288 с.
9. Грязев М.В., Кузнецова О.А. ЛП т-поиск при решении задач оптимального управления динамическим объектом с упругими связями // Изв. ТулГУ. Естественные науки. 2013. Вып. 2. Ч. 1. С. 148-160.
10. Афанасьева С.М., Кузнецова О.А. Программный комплекс многокритериальной оптимизации // Современные направления теоретических и прикладных исследований 2013: сб. науч. трудов SWorld, матер. Междун. науч.-практич. конф. Технические науки. Одесса: КУПРИЕНКО, 2013. Т. 9. Вып. 1. С. 22-24.
11. Кузнецова О.А. , Сушкин В.А. Диалоговая система многокритериальной оптимизации и синтеза оптимальных законов управления // Сборник научных трудов Sworld: матер. Междун. науч.-практич. конф. Технические науки. Одесса: Черноморье, 2010. Т. 4. С. 47-55.
12. Кузнецова О.А. Формирование управления в пространстве варьируемых параметров // Сборник научных трудов Sworld: матер. Междун. науч.-практич. конф. Технические науки. Одесса: Черноморье, 2010. Т. 5. С. 61-63.
13. Мирошник И.В., Никифоров В.О., Фрадков А.Л. Нелинейное и адаптивное управление сложными динамическими системами. СПб.: Наука, 2000. 550 с.
14. Фомин В.Н., Фрадков А.Л., Якубович В.А. Адаптивное управление динамическими объектами. М.: Наука, 1981. 448 с.
15. Фрадков А.Л. Адаптивное управление в сложных системах. М.: Наука, 1990.
Грязев Михаил Васильевич ([email protected]), д.т.н., профессор, ректор, кафедра математического моделирования, Тульский государственный университет.
Кузнецова Ольга Алексеевна ([email protected]), к.т.н., доцент, кафедра математического моделирования, Тульский государственный университет.
Shaping the optimum law managerial system by dynamic object
LPT-searching for
M.V. Gryazev, O.A. Kuznetsova
Abstract. The Considered questions of the shaping the optimum law managerial system by dynamic object LPT-searching for. The Method is founded on use to Sobol sequences.
Keywords: Sobol sequences, method of parameters' space, optimization, optimal control, macrovariable.
Gryazev Michael ([email protected]), doctor of technical sciences, professor, rector, department of mathematical modeling, Tula State University.
Kuznetsova Olga ([email protected]), candidate of technical sciences, associate professor, department of mathematical modeling, Tula State University.
Поступила 20.08.2014