Научная статья на тему 'Методика последовательного многошагового синтеза оптимальных управлений'

Методика последовательного многошагового синтеза оптимальных управлений Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
273
58
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — Яковенко П. Г.

Предложена методика последовательного синтеза оптимальных управлений в линейных и нелинейных системах при ограничении координат, основанная на многократном численном решении дифференциальных уравнений, методах динамического программирования и имитационного моделирования, принципах "перемены цели" и "ведущего слабого звена". Оптимальный по быстродействию закон управления сиаемой соаавляется из управлений, найденных для малых шагов во время переходного процесса.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

METHOD OF CONTINUOUS MULTI-STEP SYNTHESIS OF OPTIMAL CONTROLS

The presented method of sequential synthesis of optimal controls in linear and non-linear systems under limitation of coordinates is based on repeated numerical solutions of differential equations, methods of dynamic programming and imitative simulation, principles of "changing the target" and "leading weak element". The low of control, which is optimal on speed), is combined from the controls obtained for small steps during transitional process.

Текст научной работы на тему «Методика последовательного многошагового синтеза оптимальных управлений»

плекте с инструментом по вырезке прокладок на месте. В 2002 году планируется освоить производство листа графитового армированного шириной 1240 мм.

Для замены асбометаллических прокладок по ГОСТ 28759.7-90 и спирально-навитых прокладок по ОСТ 26.260.454-93 НПО "Унихимтек" поставляет разнообразные типы прокладок:

- ПГФ неармированные с обтюраторами из нержавеющей стали по наружному и внутреннему диаметрам;

- ПОГФ на стальном основании;

- ПЗГФ завальцованные (как круглые, так и прямоугольные), в которых ТРГ 'ТраФлекс" полностью или частично защищены оболочкой из нержавеющей стали.

Прокладки диаметром до 1600 мм изготавливаются в Челябинском филиале, а для прокладок диаметром 1600...4000 мм поставляются составные части для их сборки на месте установки.

На теплообменниках Сызранского НПЗ по очи-

стке нефти от серы (Р= 60 кгс/см2 и 7М80 °С) на фланцевом соединении не стали устранять традиционные дефекты в сопряжении с восьмигранными прокладками, а установили под прокладки ленту из ТРГ ТраФлекс". За год эксплуатации ни по одному из фланцев нет замечаний.

Наибольший эффект получается при комплексной установке уплотнений из ТРГ ТраФлекс” на арматуре, насосах и фланцевых соединениях.

На Рязанском НПЗ на установке А37/3 при работе на экстрактном растворе (фенол 80 %, масло, смолы 20 %) замена сальниковых уплотнений поршневых насосов типа ПДГ 60/25, сальниковых уплотнений регулирующей арматуры и прокладок фланцевых соединений трубопроводов и арматуры исключила течи рабочей среды, что в течение года коренным образом улучшило экологическую обстановку в производственном корпусе.

Комплексное применение на Куйбышевском НПЗ прокладок фланцевых армированных и сальниковых уплотнений штока арматуры исключило течи тяжелых газойлей на установке АВТ-5.

УДК 681.5.01

МЕТОДИКА ПОСЛЕДОВАТЕЛЬНОГО МНОГОШАГОВОГО СИНТЕЗА ОПТИМАЛЬНЫХ

УПРАВЛЕНИЙ

П.Г. Яковенко

Томский политехнический университет E-mail: [email protected]

Предложена методика последовательного синтеза оптимальных управлений в линейных и нелинейных системах при ограничении координат, основанная на многократном численном решении дифференциальных уравнений, методах динамического программирования и имитационного моделирования, принципах "перемены цели' и 'ведущего слабого звена". Оптимальный по быстродействию закон управления системой составляется из управлений, найденных для малых шагов во время переходного процесса.

Введение

Синтез оптимальных управлений в системах с ограничением координат традиционными методами не всегда возможен. Трудности возникают в случае изменения возмущающих воздействий и заданий во время переходных процессов. Продвижение к глобальной цели обычно осуществляется за счет соответствующей координации действий подсистем. Глобальная цель развертывается в подцели, причем, часто лишь после достижения подцели появляется возможность оценить целесообразность принятия того или иного закона управления. Метод динамического программирования позволяет решать задачи, которые не решаются классическими методами вариационного исчисления путем прямой оптимизации исходного функционала, однако

и с его помощью не всегда удается оптимизировать управление в нелинейных системах.

Оптимизация законов управления технологическими процессами в реальном масштабе времени микропроцессорными средствами с учетом нелинейностей и ограничений фазовых координат требует разработки простых алгоритмов, способных обеспечить качественный синтез дискретных управляющих воздействий. Для этих целей следует применять новые нестандартные подходы, в которых требуется не столько искусство математика, сколько хорошее знание рассматриваемой технической задачи и понимание того, какими факторами можно пренебречь и к каким последствиям это приведет. Создание таких алгоритмов оптимального управления возможно с применением элементов ло-

гики, системного анализа и метода избыточных переменных.

1. Методика последовательного многошагового

синтеза оптимальных управлений

Во всяком действии легко увидеть его составные части, более мелкие действия. Они должны выполняться не в произвольном порядке, а в определенной последовательности. В сложных системах наблюдается иерархическая система противоречий, которую можно использовать. В настоящее время широко применяется для анализа структур сложных процессов и систем имитационное моделирование, которое позволяет постичь суть явления, не прибегая к экспериментам на реальном объекте. На имитационных моделях возможен поиск оптимальных управлений путем исследования процессов, получаемых в результате приложения пробных управляющих воздействий. Новые методики синтеза оптимальных управлений могут быть созданы на основе методов динамического программирования [1] и имитационного моделирования, принципов "перемены цели" и "ведущего слабого звена".

Принцип "перемены цели" служит в качестве средства приспособления системы к изменению параметров, фазовых координат, ограничений и требований к переходным процессам. Принцип "ведущего слабого звена" подразумевает объединение слабых и сильных звеньев для достижения цели. В течение переходного процесса главными на разных этапах становятся разные ограничения и требования, причем, некоторые ограничения могут и не стать главными для конкретного процесса и не участвовать в формировании оптимального управления. Наличие в любой момент времени переходного процесса только одного "слабого звена" позволяет упростить синтез управлений.

Оптимизация по быстродействию закона управления системой, у которой траектория движения не зависит от предыстории, а определяется только исходным состоянием, возможна на основе принципа, согласно которому любой конечный участок оптимальной траектории от любой промежуточной точки до конца является тоже оптимальной траекторией, если считать исходную промежуточную точку началом траектории.

Разработана методика синтеза оптимальных управлений линейными и нелинейными системами. Оптимальный закон управления составляется из управлений, найденных во время переходного процесса для малых интервалов времени. Расчет осуществляется с учетом ограничений фазовых координат, критерия оптимальности, конечного и начального состояния системы. Поиск оптимальных управлений на малых интервалах времени ведется последовательно с учетом значений координат системы, полученных при оптимальном управлении на предыдущих шагах.

На первом этапе методом динамического программирования с учетом принятых ограничений

рассчитывают оптимальное управление для очередного шага. Это управление в дальнейшем может быть скорректировано после проведения проверок на отсутствие нарушений ограничений координат во время переходного процесса. На втором этапе определяют координаты системы в результате выполнения пробного шага с найденным прогнозируемым оптимальным управлением. Расчеты ведутся последовательно от входа к выходу системы. На третьем этапе методом имитационного моделирования выполняют перевод системы по оптимальному закону с учетом принятых ограничений из состояния, полученного в результате выполнения пробного шага, в равновесное состояние. Под равновесным состоянием понимается состояние системы, в котором она может оставаться длительное время без изменения координат. На четвертом этапе сравнивают значения координат системы при переводе ее по оптимальному закону в равновесное состояние с допустимыми значениями координат. Если нет нарушений принятых ограничений, то примененное на пробном шаге управление считается оптимальным, и его можно использовать для расчета реальных координат системы на очередном шаге.

Если наблюдаются нарушения принятых ограничений, то примененное на пробном шаге управление не является оптимальным, его следует скорректировать и повторить расчеты по описанному циклу, начиная с расчета координат системы после выполнения пробного шага. Оптимальные управления на отдельных шагах интегрирования составляют в конечном итоге оптимальный закон управления системой.

Перевод системы в равновесное состояние выполняется методом имитационного моделирования путем изменения в иерархической последовательности всех координат до установившихся значений. При изменении координат до установившихся значений по оптимальным законам могут формироваться различные цели, однако всегда используется принцип "ведущего слабого звена" и идет подстройка под самое "сильное" в данный момент ограничение.

Сложность состоит в необходимости одновременного выхода на установившееся значение как анализируемой координаты, так и всех предшествующих координат. Задача усложняется с повышением порядка системы. Все расчеты выполняются по циклическим алгоритмам. Особенностью предложенной методики, в отличие от других методов решения многошаговых задач, является использование промежуточных критериев, позволяющих сразу отсечь заведомо неприемлемые управления [2] и тем самым сократить объем вычислений.

В некоторых случаях удается получить простые аналитические выражения для расчета процесса перевода объекта в установившиеся состояния после выполнения пробного шага, что открывает широкие перспективы по разработке алгоритмов синте-

за в реальном масштабе времени микропроцессорными средствами оптимальных управлений объектами высоких порядков.

2. Оптимальное управление линейным объектом

Объект описывается системой уравнений

= Хг,

с1Х-

Л

Л

= и,

где Хь Х2, Х3 - координаты системы, и- управляющее воздействие, I - время.

Управляющее воздействие и и координата Х} ограничены на уровнях Цм и Хм

10(01 < ии,

т < х*.

Определим оптимальное управление 11(1), обеспечивающее минимальное время Т перевода объекта из исходного состояния Аг,(0)=0, Аг2(0)=0, А'3(0)=0 в заданное состояние Х|(Т)=^М, /2(Т)=0, /3(7)=0. Решение задачи с помощью предложенной методики предполагает, что речь идет о системе с квантованием координат по уровню и по времени. При этом объект описывается системой разностных уравнений

Аґ

АХ

= Хг,

Аґ

АХ,

А/

2=Х3,

=и,

где АДГ,, АХ2, АХ, - приращения координат системы за шаг интегрирования А/. Управление (7(0 вычисляется в виде последовательности значений Щ

А,-ис.

Для исходного состояния системы рассчитывается прогнозируемое оптимальное управление и определяются координаты системы в результате выполнения первого пробного шага. Затем выполняется перевод системы в равновесное состояние. Ставится задача изменения координаты Х2 с предельными возможностями до уровня Х2=0 (с одновременным выходом координаты Х3 на уровень Х3=0). Для этого находится оптимальное управление и рассчитываются значения координат системы в результате выполнения второго пробного шага. Затем по циклическому алгоритму решается задача изменения координаты Х3 с предельными возможностями до уровня Х3(к)=0. Определяются коорди-

наты системы Х1(к) И Х2(К) при Х3(к) =0. Производится оценка значения координаты Х2(к). Если оно не равно нулю, то рассчитывается еще один пробный шаг по скорейшему достижению координатой Х2 нулевого значения, причем, в качестве начальных условий используют координаты системы с предыдущего второго пробного шага. По циклическому алгоритму изменяется координата Х3 с предельными возможностями до нулевого значения, оценивается значение координаты Х2 и далее по описанному циклу. Таким способом удается достичь значений Х2(р)=0 и Х3(р)=0, соответствующих равновесному состоянию системы. Оценивается значение координаты Х1(р). Если оно не превышает значения Хм, то использованное на первом пробном шаге управление считается оптимальным. В случае нарушения ограничения (Х1(р)>Хм) следует изменить прогнозируемое оптимальное управление на первом пробном шаге и повторить расчеты по описанному циклу, начиная с расчета координат системы после выполнения первого пробного шага.

Определение оптимального управления для рассматриваемого объекта на (п+1) шаге выполняется в следующей последовательности. Начальное состояние объекта характеризуется координатами Х1(п), Х2(п„ Х3(п). Методом динамического программирования рассчитывается управление, обеспечивающее максимальное приращение координаты X, на (п+1) шаге интегрирования.

Определяется требуемое приращение по координате X.

А^1(п+и Хм<Хт,

вычисляется значение координаты Х2, способное обеспечить это приращение

-^2(л+1) = 1^'

Определяется требуемое приращение по координате Х2

А^2(л+1) = ^2(л+1)^2(л)

и значение координаты Х3, способное обеспечить это приращение

^3(л+1) = ^Хцп+\) /^-

Вычисляется требуемое приращение по коорди-

нате X

■3

АХ

3(я+1)

: -^3(л+1) ^З(л)

и обеспечивающее его управление

Цл+1) = ^3(л+1) /&■

Это управление ограничивается, при необходимости, на уровне им. Рассчитываются координаты объекта с найденным управлением после выполнения первого пробного шага (Х11(п+1), Х21(п+1), Хз1(п+1))

Хз1(п+1)—Х3(п) +и(п+1)- А1,

Х21(п+1)—Х2(п)+Х3цп+1)-А1,

Хщп+о —Х1(п) +Х21(п+1)- А1.

Они используются в качестве начальных условий для перевода объекта в равновесное состояние.

Перевод объекта в равновесное состояние начинается с расчета второго пробного шага (и+2), вы-

полняемого с целью скорейшего достижения координатой Х2 значения Х2=0. В качестве начальных условий используются координаты системы X, цп+1), Х21(п+1). Х31(П+|), полученные в результате расчета первого пробного шага. Расчет ведется методом динамического программирования, аналогично первому пробному шагу, только теперь изменена цель управления. По аналогичной методике определяются координаты системы в результате выполнения второго пробного шага Х12(п+2), Х22(п+2), Х32(п+2) В качестве "ведущего слабого звена" вновь выступает ограниченное управление.

Новые координаты объекта Х32(п+2), Х22(п+2), Х12(п+2) используют в качестве начальных условий в циклическом алгоритме, обеспечивающем изменение координаты Х3 до значения Х3=0, соответствующего установившемуся значению координаты Х2. Расчеты выполняют методом динамического программирования.

После достижения координатой Х3 значения Х3=0 оценивается значение координаты Х2. Если оно оказывается больше Х2(Т), то рассчитывается новый пробный шаг по скорейшему достижению координатой Х2 значения Х2(Т), только в качестве начальных условий используют координаты объекта Х32(п+2)> Х22(п+2)> Х12(п+2)> ПОЛучеННЫе В результате выполнения предыдущего второго пробного шага. Вновь используется циклический алгоритм, обеспечивающий изменение координаты Х3 до значения Х3=0, и оценивается значение координаты Х2.

Расчеты по такому циклу продолжают до тех пор,

пока координата Х2 не достигнет значения Х2=0. Иногда для одновременного достижения координатами Х2 и Х3 значений Х2= 0 и Х3=0 приходится использовать метод последовательных приближений. Полученные значения Х2=0 и Х3=0 соответствуют установившемуся состоянию объекта. Оценивается значение координаты X]. Если оно не превышает значение Хм, то найденное на первом пробном шаге управление и(п+1) считается оптимальным. В противном случае управление на (п+1) шаге определяется методом последовательных приближений из диапазона (~им ...+им). Для последующих шагов синтез управления выполняется по аналогичной методике.

Заключение

Методика последовательного многошагового синтеза управлений позволяет определять оптимальные по быстродействию управления во время переходного процесса при наличии ограничений и нелинейностей путем суммирования управлений, получаемых для малых интервалов времени. Возможен синтез микропроцессорными средствами в реальном масштабе времени оптимальных управлений высокоскоростными подвижными объектами, автоматизация сложных производственных процессов, определение предельных динамических возможностей исполнительных устройств. Повышение порядка системы и числа ограничений не вызывает принципиальных трудностей.

СПИСОК ЛИТЕРАТУРЫ

1. Беллман Р. Динамическое программирование. - М.: Изд-во Иностр. лит., 1960. - 400 с.: ил.

2. Yakovenko P.G. Mobile objects control // Proc. the Third Russian-Korean Intern. Symp. on Science and Technology. KORUS’99. - Novosibirsk. - 1999. - Vol. 1. - P. 20-24.

i Надоели баннеры? Вы всегда можете отключить рекламу.