УДК 681.511
В.А.Фатуев, д-р техн. наук, проф., зав. кафедрой, (4872) 36-97-83, [email protected] (Россия, Тула, ТулГУ),
М.А.Сафронова, канд.техн. наук, доц., (4872) 33-05-08, [email protected] (Россия, Тула, ТулГУ)
УПРАВЛЕНИЕ ДИНАМИЧЕСКИМИ СИСТЕМАМИ С ИСПОЛЬЗОВАНИЕМ СИТУАЦИОННЫХ И РЕГРЕССИОННЫХ МОДЕЛЕЙ
Рассмотрены задачи идентификации и оптимального по быстродействию управления динамическими системами, основанные на объединении ситуационных и регрессионных моделей.
Ключевые слова: динамические системы, идентификация, ситуационные и регрессионные модели, оптимальное управление.
Традиционно управление сложными динамическими системами осуществляется детерминированными способами с применением математических моделей и методов, относящихся к теории оптимизации. Такой подход достаточно хорошо отработан и применим в случае эксплуатации систем в стационарной среде при наличии точных математических моделей.
Задача о быстродействии является одной из актуальных задач оптимального управления. Её решение представляет значительный теоретический и практический интерес для многих технических динамических систем. Она возникает, например, при выводе потенциально опасных объектов из предаварийных состояний.
Сказанное объясняет актуальность разработки и применения методологии формирования целесообразных управленческих решений, основанных на объединении ситуационных моделей и регрессионных моделей. Причем, процесс управления динамическими системами состоит в разработке, принятии и реализации как стратегических, так и тактических управленческих решений.
Суть стратегического управления, основанного на ситуационных моделях, заключается в определении отклонений фактических значений наиболее важных параметров управления от нормативных значений этих параметров. Ситуационное управление динамическими системами начинается с системного анализа, в котором часто выделяют информационный, целевой, ситуационный, организационно-функциональный и функционально-стоимостной анализы [1]. Все эти разновидности анализа тесно взаимосвязаны. Рассмотрим реализацию основных видов анализа более подробно.
Информационный анализ. Ситуационный анализ объекта управления (ОУ) начинается с определения множества ситуаций. Целью инфор-
118
мационного анализа является описание ОУ с помощью модели “черный ящик”, выявление механизмов, с помощью которых возможно влиять на его функционирование. Входными управляемыми параметрами являются те параметры X = {х15х2,...,xnxN }, которые могут целенаправленно изменяться с помощью определенных регулирующих органов. Входными неуправляемыми параметрами - параметры Z = {г1,z2,...,2ч,...,zQ }, характеризующие состояние и отражающие воздействие окружающей среды на функционирование управляемого объекта (процесса). Множество выходных характеристик (показателей) обозначим как Y = {у1, у2,...,ут,...ум }•
Для реальных объектов и процессов характерно наличие ограничений на предельные значения выходных характеристик ут еУ объекта управления. Обозначим их соответственно ут тп , ут тах и ут пот - минимальное, максимальное и номинальное значения. Амплитуды допустимых размахов отклонений выходных показателей в сторону увеличения обозначим как А1ут (инкрементное отклонение), а в сторону уменьшения - ^ут. Нарушение допустимого диапазона выходных характеристик в результате эксплуатации ОУ грозит гибелью системы и воспринимается как аварийный режим, а приближение их значений к границам допустимого диапазона - предаварийный режим. При дискретном управлении процедура принятия решения инициируется в определенные дискретные моменты времени ?.
Используя инкрементно-декрементный подход, входным воздействием ип (например, одной из возможных альтернатив по переводу объекта их предаварийного состояния в штатное) будем считать дискретное изменение значения параметра хп еХ в сторону увеличения 1хп = хп + ип, либо уменьшения dxn = хп -ип. Причем и = {и1,и2,...,ип,...uN } - множество возможных входных воздействий на объект управления.
Целевой анализ. Основной задачей целевого анализа является определение приоритетности или весовых коэффициентов целей управления gd е G на различных этапах жизненного цикла динамической системы.
Ситуационный анализ. Для идентификации и двоичного кодирования ситуаций, характеризующих состояние ОУ, с каждым параметром ут е У свяжем две тенденции Tj и Tj+1. Индекс ] отражает разряд кода ситуации, используемый для указания на то, что j-aя тенденция присутствует в описании ситуации, когда он принимает значение «1» (истина), или отсутствует, если у-й разряд кода имеет значение «0» (ложь). Для определенности системы кодирования ситуаций примем, что все тенденции с нечетными ] отражают уменьшение значения / -ого параметра, а с четными j+1 отражают увеличение значения этого же параметра.
Обозначим множество возможных тенденций через
Т = {'Х:,Т2,..,Т],Т+х,...,Тгм+2Q } и осуществим кодирование полного множества
ситуаций в пространстве тенденций Т.
Следующим этапом ситуационного анализа является формирование матрицы кодов ситуаций |С| размерностью (22м+2Q ,2М + 2Q), которая составляется с применением двоичного кодирования подобно тому, как кодируется в двоичной системе натуральный ряд целых чисел.
Для оценки предпочтительности ситуаций, характеризующих состояние ОУ, предполагается их ранжирование. Для этого, в соответствии с определенной целью управления gd, множество Т разделяется на подмно-
гр + гр — гр Н ^
жества Т ,Т ,Т - позитивные, негативные, нейтральные тенденции соответственно в отношении достижения цели gd при управлении объектом (процессом).
Далее определяется ранг г1 I -той ситуации, характеризующей состояние ОУ, по степени предпочтения для достижения цели управления
gd.
При разработке моделей «возмущение в среде - девиации» и «входное воздействие - девиации» определяется множество регулируемых параметров X = {х1,х2,...,хп,...,xN } и на их основе формируется кортеж входных действий и = {и1,и2,...,ип,...uN } на ОУ.
Процедура генерации и анализа альтернативных воздействий на ОУ осуществляется в режиме реального времени. Из множества допустимых альтернативных воздействий и+ = {и+, и +,..., и+}, и+ еи , в каждой I -ой ситуации на ОУ формируется подмножество допустимых Ugd е и+ в соответствие с целью управления gd и выбирается наилучшая альтернатива, обеспечивающая перевод ОУ в состояние, с максимальным рейтингом г1 тах. Обозначим ее через и°, где и° е и^ . Если окажется несколько переходов к ситуациям с одинаковым рангом, то предпочтение отдается переходу, которое требует наименьшего воздействия на ОУ.
Итерационное повторение процедуры анализа переходов позволяет сформировать стратегию для достижения цели как множество наилучших альтернатив для каждой возможной ситуации с, в виде множества рекомендаций типа: «В ситуации с на ОУ, характеризующейся тенденциями Tj, наилучшими входными воздействиями являются и° ».
Таким образом, по результатам ситуационного анализа определяются параметры X = {х1,х2,...,хп,...,xN } ОУ, которые необходимо будет изменить в сложившейся ситуации для перевода объекта управления в наилучшее (штатное) состояние, а также определяются необходимые входные воздействия на него и = {и1,и2,...,ип,...,uN } по отношению к его текущему со-
стоянию Y = {у!, у2,...,Ут,...Ум }-
При тактическом управлении динамическими системами определяется направление и интенсивность входных воздействий на ОУ. Для решения этих задач используется принцип максимума Л.С. Понтрягина [2]. Поскольку получение аналитического решения задачи оптимального по быстродействию управления является труднореализуемым, в большинстве случаев используют численное решение. Обзор методов приближенного решения задачи оптимального по быстродействию управления показал, что наиболее эффективным для решения поставленной задачи является метод, предложенный Я.М. Берщанским [3]. Он позволяет обходиться без достаточно точного начального приближения.
Рассмотрим дискретную модель управляемой и наблюдаемой системы п-го порядка без внутреннего шума [4]:
с(к +1) = Т х (к) + Ги (к);
Y(к) = НТ х(к) + е(к), где к - дискретное с шагом Дt - время;
х (к) - п-мерный вектор состояния; и (к)- входное воздействие (управление);
(1)
Т =
" 0 1 0 . . 0"
0 0 1 . . 0
0 0 0. . 1
_£1 <£2 £ . . £ п _
- коагулированная матричная форма, опреде-
ляемая вектором оценок неизвестных параметров £г;
Г - вектор оценок неизвестных параметров;
У ^) - выходно й сигнал;
Т
= [1,0,к ,0];
е(к) - вектор внешнего шума.
Данная модель при нулевых начальных условиях и конечной памяти сводится к динамической регрессионной модели вида:
с
h
k с
У(*) = Ё ™і (С )и(k - і) + е(к),
і=1
С
где (С) - і-я ордината импульсной переходной функции;
ч(С) = кТ Т(і-1) ~Г,і = ЇД;
— —
С = (ат, Гт) - вектор неизвестных параметров;
—т
и = (и(к -1),и(к - 2),...,u(k -/)).
——
Оценивание вектора С возможно с помощью нелинейных методов наименьших квадратов [5,6].
При управлении потенциально опасными динамическими системами от качества построенной модели зависит, например, возможность перевода объекта из предаварийного состояния в штатное. Анализ точности полученных оценок неизвестных параметров модели возможен путем построения доверительных областей [7]. Доверительную область можно построить следующим способом: доверительная область, накрывающая вектор истинных значений параметров С определяется неравенством:
С - С! СХ С - С]< 2nFa (2п, N - 2п)
(3)
где D(C) - доверительная область; ^а (2п, N — 2п)- значение ^-критерия соответствующее уровню значимости а = 1 - Р при числах степеней свободы 2п и ^2п.
Для построения доверительной области используется следующий способ: вместо построения границы эллипсоида определяется положение
его осей и их длины. Направление осей эллипсоида D(C) совпадает с характеристическими векторами матрицы cov(C). Длина /-ой полуоси эллипсоида равна
=
2п N ^
—— ^ (2п, N - 2п)Х (У, - ЇЇт (С)й1 (к -1))2
N - 2п <=1 _, (4)
где X/ - характеристическое число матрицы cov(C),
Y - дискретное значение выхода.
Для того, чтобы найти точки пересечения границы и полуосей гиперэллипсоида необходимо решить систему уравнений, которая для п = 2 имеет вид:
Г* — *1 = у — У1 = Z — Z1 = 5 — ^
а Ь с й
(* — *1)2 + (у — у1)2 + (z — zl)2 + (5 — ^1)2 = L2,
где (*1, у1, Zl, ^1) - центр гиперэллипсоида, а, Ь, с, й - координаты собствен-
ного вектора.
На основе полученных значений (С, принадлежащих доверительной области определяемой выражением (3) формируется множество возмож-
т
—
ных значений Сд, которые может принимать вектор С. Для каждого элемента С множества Сд вычисляется значения критерия тїп 3(С,).
и ^)
Критерий оптимальности задается в виде:
tk
3 = !1й^ = ік- to, (5)
где ^ - начальный момент времени.
- конечный момент времени.
Задача анализа сводится к исследованию неразличимости значений
критерия шш 3(С/) для множества Сд. и (t)
Один из возможных подходов задания отношения неразличимости состоит в том, чтобы ввести некоторый порог Ас и считать решения
<1, («2 е Сд неразличимыми, если квадрат разности значения
шт 3 (С1) — шт 3 (С2) не превышает этого порога. и(t) и(t)
Это приводит к отношению неразличимости вида:
(«1 * <2 ^ (ш1~п 3(С1) — ш1~п 3(С*2))2 ЙАс, <1,С2 е С.Ч . (6)
и(^ и(^
Таким образом, если множество значений ш1~п 3(С/) для («/ е Сд
и ^)
удовлетворяет отношению неразличимости, то анализируемая модель пригодна для решения задачи оптимального по быстродействию управления [5, 7, 8].
Рассмотрим пример идентификации и определения модели управления динамической системой. Предположим, объект управления характеризуется входными управляемыми параметрами X = {*1, *2} и выходными характеристиками Y.
В соответствии с целью определяются исходные данные для задачи, такие, как:
- множество управляемых параметров Х;
- множество управляющих воздействий /;
- множество выходных параметров системы У.
Определим полное множество ситуаций. Для этого целесообразно разбить множество ситуаций на 2 группы:
- допустим, ситуация положительная £+ ={£0, S2}, S + е S,
- допустим, ситуация негативная £— = £ } £— е £ .
t
0
Ситуация S0 характеризуется стабильным состоянием ОУ. Ситуация ^ характеризуется положительным изменением параметра у1. Ситуация
S2 характеризуется отрицательным изменением параметра у1 .Любые переходы из множества S- в S+ - целесообразные переходы; из S+ в S- - нецелесообразные переходы.
На следующем этапе совместно с экспертом составим таблицу реакций объекта управления на регулирующее воздействие. При управлении переходами ситуаций из одной в другую может выть выполнено некоторое множество управляющих действий и = {и15и2,...,ин }. Тогда воздействия
можно интерпретировать следующим образом: и1 = х1(Т) - увеличение х1. и 2 = х1(^) - уменьшение х1. и3 = х2 (^) - уменьшение х2. и4 = х2(Т)- увеличение х2.
С учетом принятых обозначений может быть построена таблица реакций (табл. 1).
Таблица 1
Матрица реакций объекта управления
Действие У1
положительное изменение параметра отрицательное изменение параметра
и1( х1 ^ 0 0
и2 (х1 0 0
из(Х2 ^ 1 0
и4 (Х2 ^ 0 1
В результате, по результатам ситуационного анализа определяются параметры X = {х15х2,...,хпхы } ОУ, которые необходимо будет изменить в сложившейся ситуации для перевода объекта управления в наилучшее (штатное) состояние, а также определяются необходимые входные воздействия на него и = {м1,иг,...,ип,...,ин } по отношению к его текущему состоянию
Г У2,._ Ут ,.. -Ум }.
Применяя описанные выше подходы и методы, определим неизвестные параметры линейной динамической системы 2-ого порядка для оптимального по быстродействию управления, используя специальное разработанное программное обеспечение.
Входными параметрами являются:
- постоянная времени Т1 =2,0 с;
- постоянная времени Т2=4,0 с;
- среднее квадратичное отклонение случайной помехи ое = 0,5;
- длина тестирующего сигнала = 15;
- значение порога неразличимости = 0,05;
- передаточный коэффициент = 1;
- доверительная вероятность = 97%.
Подадим на вход модели сигнал, вид которого представлен на
рис. 1.
После проведения имитации получим выходной сигнал. Импульсная переходная функция имеет вид, представленный на рис. 1.
Рис. 1. Графики входного сигнала и импульсной переходной
функции
В результате идентификации получены следующие оценки вектора неизвестных параметров модели:
€ =-0,474629736461234; а2 = 1,38874526520944;
Ц = 1,00000000002659Е - 8;
& = 0,0857675768283603.
Уточнение оценок неизвестных параметров модели представлено на
рис. 2.
Изменение параметра а1 Изменение параметра даттаї
_________________,_____,__________________ 0,001 ------------------.-----.----------.-----
Рис. 2. Графики изменения оценок неизвестных параметров
модели за время Т
На основе полученных данных можно сделать вывод о корректно проведенной процедуре идентификации, а также о достоверности выда-
ваемых ею результатов.
Вычислим значения критерия тт 7(С.) для каждого элемента (,
и ^ )
г = 1,8. (табл.2).
Таблица 2.
Значения критерия тіп 7(б.) для разных точек (С.
и (г)
ё. тіп 7 ((.) и (г)
(-0,64365239; 0,32839987; 0,10966718; 0,13346262) 2,0778
(-0,64365161; 0,32840144; 0,00940308; 0,01144535) 2,0754
(-0,64365231; 0,32840003; 0,10594133; 0,12892865) 2,0778
(-0,64365169; 0,32840127; 0,01312893; 0,01597931) 2,0762
(-0,64365229; 0,32840006; 0,10467349; 0,12738581) 2,0778
(-0,64365171; 0,32840123; 0,01439677; 0,01752214) 2,0763
(-0,64365233; 0,32839999; 0,10665352; 0,12979531) 2,0763
(-0,64365167; 0,32840131; 0,01241675; 0,01511265) 2,0761
Для всех точек С., г = 1,8 строится отношения неразличимости следующего вида:
<С. « С. -о- (min 7(С.) - min 7(С. ))2 < Ас, г Ф .
и (г) и (г)
Задается порог неразличимости Ас = 0,05 .
На основе полученных данных можно сделать вывод о пригодности модели для синтеза оптимального по быстродействию управления на основе неразличимости значений критерия тіп 7 (С.).
и (г)
Список литературы
1. Годынский Э.Г., Мартынова М.А. Разработка и использование сигнатурных ситуационных моделей при формировании стратегий управления в чрезвычайных ситуациях // Мониторинг и прогнозирование чрезвычайных ситуаций: тезисы докладов научно-технической конференции/ СПб, 1999. С.17-19.
2. Понтрягин Л.С. Математическая теория оптимальных процессов. М.: Наука, 1976. 392 с.
3. Берщанский Я.М. Об одном методе решения задач линейного и выпуклого программирования //ЖВМ и МФ. 1970. Т. 10. №3. С.621-629.
4. Фатуев В А., Лазукин А.А. Построение моделей линейных динамических систем, ориентированных на оптимальное по быстродействию
126
управление.// Известия ТулГУ. Серия “Вычислительная техника. Информатика.” Вып.5. 1999. С. 146-153.
5. Фатуев В.А. Построение оптимальных моделей динамики по экспериментальным данным: учеб. пособие. Тула: ТулГУ, 1993. 104 с.
6. Фатуев В.А., Маркова Т.Н. Математические модели объектов управления: учебное пособие. Тула: ТулГУ, 2002. 119 с.
7. Фатуев В.А.. Лазукин А.А. Анализ пригодности моделей линейных динамических систем для оптимального по быстродействию управления. // Известия ТулГУ. Серия “Вычислительная техника. Информатика.” Вып.5. Тула 1999. С. 169-175.
8. Фатуев В.А., Лазукин А.А. Оптимальное по быстродействию управление на основе неточных моделей динамики // 12-я Международная науч. конф.: тезисы докл. Новгород: Новгород, гос. ун-т, 1999. С. 139-141.
V.A. Fatuev, M.A. Safronova
MANAGEMENT OF DYNAMIC SYSTEMS WITH USE SITUATIONAL AND REGRESSION MODELS
Problems of identification and optimum management on speed by the dynamic systems, based on association situational and regression models are considered.
Key words: dynamic systems, identification, situational and regression models, optimum control.
Получено 20.01.12
УДК 517.8
В.А. Фатуев, д-р техн. наук, проф., зав. кафедрой, (4872) 36-97-83, [email protected] (Россия, Тула, ТулГУ),
В.А. Ковешников, канд. техн. наук, доц., 8-903-697-15-36, [email protected] (Россия, Тула, ТулГУ)
ЭКСПЕРИМЕНТАЛЬНЫЕ ИССЛЕДОВАНИЯ УНИВЕРСАЛЬНОГО АЛГОРИТМА СЛУЧАЙНО-ГЕНЕТИЧЕСКОЙ ОПТИМИЗАЦИИ
Рассматриваются результаты экспериментальных исследований случайногенетического алгоритма. В качества теста используются известные задачи коммивояжера со случайными точками, расположенными на прямой окружности и плоскости.
Ключевые слова: генетический алгоритм, задача коммивояжера, параметрическая оптимизация, неопределенность, тестовые функции.
В работе [1] формализован универсальный алгоритм случайногенетической оптимизации. При этом достигается высокая точность, схо-