ИРКУТСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ПУТЕЙ СООБЩЕНИЯ
Маджара Т.И. УДК 681.3.06,519.688,004.891
ПОДХОД К ЧИСЛЕННОМУ РЕШЕНИЮ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С ВЫЧИСЛИТЕЛЬНЫМИ ОСОБЕННОСТЯМИ
Практика численного исследования задач оптимального управления с использованием современных программных комплексов [1-4] показывает, что далеко не всегда удается провести решение от начала и до конца без использования специальных подходов, подразумевающих многократный запуск комплекса в совокупности с изменением программной постановки задачи. В частности, это связано с возникновением в процессе счета разного рода нештатных ситуаций, следствием которых является аварийное завершение работы программного комплекса.
Задача оптимального управления (ЗОУ). Пусть задан отрезок времени Т = [У0 у ], на котором определены вектор-функции и((У) е Ят, х(У) еЯ", У еТ, задающие управление и фазовое состояние некоторого объекта в момент времени У и удовлетворяющие системе дифференциальных уравнений:
с1х/М = / (У,х,и), х(У0 ) = х 0. (1)
Наложены ограничения на управление:
и(у)еи е Ят У еТ. (2)
Вектор-функция х(У) предполагается кусочно-дифференцируемой, а и(У)- кусочно-непрерывной. Множество пар (х(У),и(У)), удовлетворяющих перечисленным условиям, называют множеством допустимых и обозначают Б. На множестве Б задан функционал:
I =
р(х(У1)) + _[/0 (У,х(У),и(У)^У.
Задача состоит в поиске последовательности {х8(У),и8(У)} с Б на которой !(х. и т! ^ 1(х,и), 8 ^да.
Класс задач оптимального управления с вычислительными особенностями (ЗОУВО). В
данной работе под задачей оптимального управления с вычислительными особенностями будем понимать имеющую решение задачу,
у которой в последовательности улучшающих управлений, генерируемых программным комплексом существует элемент, использование которого в последующих процедурах вычислительного метода приводит к аварийному завершению работы. На всем множестве ЗОУВО выделим класс задач, в которых:
- в системе дифференциальных уравнений, описывающих исследуемую модель, нарушаются условия роста [5], гарантирующие существование решения на заданном отрезке времени;
- генерируемые в процессе работы программного комплекса улучшающие управления и соответствующие им траектории на некоторых участках отрезка времени нарушают области определения элементарных функций, входящих в правую часть системы дифференциальных уравнений;
- генерируемые в процессе работы программного комплекса траектории имеют участки со значениями, выходящими за границы возможностей машинного представления чисел с плавающей точкой (появляются уходящие «в бесконечность» траектории, условия роста при этом могут и не нарушаться)
Некоторые подходы к численному решению ЗОУВО. Общим подходом, позволяющим успешно решать задачи оптимального управления с вычислительными особенностями можно назвать метод «продолжения по параметру» [6]. В нашем случае этот метод будет подразумевать ввод в задачу нескольких классов постановочных параметров, изменяющих постановку задачи и погружающих ее в параметрическое семейство аппроксимирующих вспомогательных задач. Например, вместо управляемой системы (1) рассматривается система:
е
УПРАВЛЕНИЕ В ТЕХНИЧЕСКИХ СИСТЕМАХ
(х. ¡(Ц. = р. I. (?,х,и),
х
& ) =
(3)
х
Здесь р = {р. } - векторный параметр, р. е (0,1], I = 1,п , п - размерность фазового пространства. Очевидно, что при р1 = р2 =•• •••=рп =1 система (3) полностью идентична исходной. На практике, обычно, рассматривается частный случай построения вектора параметра, когда р1 = р2 =••=рп = р. Далее, значение параметра р, при котором соответствующая ему задача идентична исходной будем обозначать р*. Представленный выше вид параметризации, можно успешно заменять и/или дополнять такими эффективными методами, как изменение начальных условий задачи Коши (1), изменение форм границ областей определения элементарных функций, входящих в правую часть динамической системы (1), ослабление или усиление ресурса управления путем параметризации ограничений (2), построение составных целевых функционалов специального вида, учитывающих специфику задачи и т.д.
Приведем общий вид итерационного метода нахождения оптимального управления в исходной задаче на основе решений серии задач из параметрического семейства:
1. Зададим начальное значение параметра р = р0 ф р* и обозначим Z{p0 ,и°Ро } - соответствующую ему задачу оптимального управления, где и°р = и0 - начальное управление в исходной задаче. Значение р0 выбирается таким образом, чтобы задача Z{p0 ,и0Ро } решалась программным комплексом в штатном режиме. Обозначим ир - полученное на выходе оптимальное управление.
2. Пусть проведено к итераций метода, то есть имеется и метра р = рк Арк+ 1:|р"~(рк +Арк+1 )|<р*-р^ таким образом, чтобы задача оптимального управления Z{pk +Арк+1,ир(?)| решалась программным комплексом в штатном режиме. Обозначим ир - полученное на выходе оптимальное управление.
3. Положим рк +1 = рк +Арк+1 и продолжим процесс с пункта 2.
Итерации продолжаются до тех пор, пока после выполнения некоторого шага к * не выполнится условие р = р*. Полученное при решении задачи ^{рк>-1 + Арк, ,ир > (£)|, управле-
~ (V) и некоторое значение пара-Зададим приращение
(£) = и *, - оптимальное управление
ние и
исходной задаче.
Описанный выше метод применим к широкому классу динамических систем, что, однако, не гарантирует успеха неспециалисту в данной предметной области. Такую гарантию может дать только привлечение знаний и опыта эксперта.
Элементы модели действий эксперта при численном решении ЗОУВО. При построении модели учитывались 6 принципов, которыми руководствуется эксперт в процессе поиска последовательности значений постановочных параметров при решении ЗОУВО:
- весь процесс решения задачи разбит на ряд этапов, на протяжении каждого которых шаг по параметру остается неизменным;
- длина каждого из таких этапов варьируется в зависимости от текущего поведения процесса решения;
- уменьшение шага по параметру обычно влечет улучшение качества решения задач из параметрического семейства и, одновременно, увеличение времени решения исходной задачи;
- резкое увеличение шага по параметру обычно влечет ухудшение качества решения задач из параметрического семейства, при этом положительное влияние такого шага на скорость решения исходной задачи остается далеко не очевидным фактом;
- после фиксирования на определенном значении параметра нештатной ситуации при решении соответствующей задачи параметрического семейства, производится уменьшение шага по параметру с обязательным предварительным «откатом» его значения (с соответствующей функцией управления) на некоторое расстояние от вызвавшего «АВОСТ», что позволяет избежать использования функций управления, «испорченных на подходах»;
- на протяжении всего хода решения, в целях ускорения процесса поиска оптимального управления в исходной задаче постоянно производятся попытки «осторожного» увеличения шага по параметру.
Под качеством решения задач из параметрического семейства здесь понимается разумное сокращение числа решаемых вспомогательных ЗОУ.
Действия эксперта при численном решении исследуемого класса задач носят многовариантный характер, поэтому полное описание разработанной модели достаточно объемно и выходит за рамки данной статьи. Ограничимся здесь лишь описанием основных объектов предметной области — локальных и по-
в
ИРКУТСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ПУТЕЙ СООБЩЕНИЯ
лных вычислительных стратегий, определяющих последовательность перебора постановочных параметров.
Пусть параметрическое семейство задач порождается значениями параметра p, изменяющимися в пределах отрезкаP = [р0 ,р*] Построим всевозможные разбиения данного интервала на N частей: = {р'' =[p/,p'i+l ] сP:
__N-1 1
p>i <р>+1,1 = 0,N-1,р0 = P0,PN = p',P = и^' где
. =0 ]
' = 1,2,... - номер разбиения. Внутри каждого из отрезков Р.' зададим фиксированный на нем шаг Ар' >0 таким образом, чтобыЗк/ е Z+ :р' + +к/Ар' = р'.+1 ,Z+ - множество натуральных чисел. Посредством задания такого шага на интервале Р.1 задается равномерная сетка:
О' ={ст; = р' + тАр' ,т= 0,к1 ,ст;0 = р' ,ст1. = р' , }
. I ¡х п * . ' ' . ' . 0 * . ¡к' .+1 1
Тройки Б/ =(р' ,р/+1 ,Ар'). = 0,N-1 назовем локальными вычислительными стратегиями в разбиении с номером
Определим понятие успешности локальной стратегии. Зафиксируем некоторое разбиение с номером ' и рассмотрим серию задач оптимального управления, последовательно решаемых в соответствии с выбранной локальной стратегией
Б =(р, ,р+1 ,ар. ):
Z{Pi К.-.} ^ К, ,Z{Pi +ар, К.} ^ ир.+Ар. —
...^{р + к Ар. ,и * ... } ^ и *
( . . . р. + (к-1)Ар. ( р
валов представляет собой неравномерную сет-
N-1
ку О N = ' на Р. Соответствующая полной
. = 0
вычислительной стратегии S'N сетка О N, определяет ход всего процесса решения исходной ЗОУ, задавая начальное значение постановочного параметра р = р0 и дальнейший переменный шаг Ар. его изменения на всем интервале Р. Пример полной вычислительной стратегии представлен на рис 1. В данном примере N = 5,' фиксирован, узлы сетки О обозначены на оси белыми точками.
к0 = 2 *1=3
4 *4 = 4
Ши_ III 1 1 1 '4 Р
ДР1 к 4 ЛР4
р. + к. Ар.
Запись z{p,u0p ир означает, что ир - решение соответствующей задачи оптимального управления из параметрического семейства с фиксированным значением параметра р и стартовым управлением ир0, найденное программным комплексом в штатном режиме. Факт фиксирования нештатной ситуации будем обозначать z{p,up } ^0.
Локальную вычислительную стратегию Б. будем называть успешной, если при последовательном решении всей описанной выше серии задач оптимального управления программный комплекс отработал в штатном режиме.
Полной вычислительной стратегией в разбиении с номером ' назовем множество
N-1
Бы = и Б', представляющее собой неравномер-
. =0
ное разбиение интервалаР на N участков, каждый из которых, в свою очередь, разбит нак' равных интервалов длины Ар1. . Множество точек, являющихся границами данных интер-
I-у-II-^-Л (-рЛ-у-II-^-Л
Р0 Р, Рг Р, Ра Рис 1. Полная вычислительная стратегия
Как и локальные вычислительные стратегии, полные стратегии характеризуются степенью успешности их применения. Будем говорить, что полная вычислительная стратегия успешна, если успешны все входящие в нее локальные стратегии. Отметим также, что задача нахождения успешной полной стратегии эквивалентна нахождению решения исходной ЗОУВО.
Пространством полных вычислительных стратегий назовем множество:
Б = и
(4)
N = 1,2,. '=1,2,—
Полную стратегию SN е Б будем называть корректной, если Зр0,Б0:Б0 =(р0,р1,Ар0 )е SN, при этом задача z{p 0 ,и0} решается штатно.
Далее в описании модели на пространстве полных вычислительных стратегий задаются критерии сравнения его элементов и приводятся методы отыскания корректных «начальных» стратегий. Затем, все приведенные в начале данного раздела принципы действий эксперта моделируются в виде многовариантных итерационных процедур «улучшения», построенных на элементах пространства (4). Конечной целью этих процедур является по-воз-можности скорейшее отыскание любой полной успешной стратегии, что эквивалентно построению решения исходной ЗОУВО.
Архитектура программного комплекса для решения ЗОУВО. Программный комплекс построен в виде двухуровневой иерархичес-
е
УПРАВЛЕНИЕ В ТЕХНИЧЕСКИХ СИСТЕМАХ
кой структуры, естественным образом отражающей взаимодействие эксперта с его вычислительным инструментом — алгоритмической программой, реализующей один или более методов решения ЗОУ. Верхний (управляющий) уровень комплекса называется интеллектуальным динамическим планировщиком (ИДП) и включает в себя программную реализацию модели действий эксперта на основе формализма правил-продукций, выполненную на языке декларативного программирования CLIPS [7]. Функциями ИДП являются:
- интерпретация команд пользователя;
- определение наличия в задаче потенциально «опасных» компонент, таких как присутствие в динамической системе дробных выражений и элементарных математических функций с ограниченной областью определения;
-принятие решения о методе параметризации задачи;
- генерирование и реализация схем подбора последовательности постановочных параметров в виде локальных вычислительных стратегий;
- формирование программных постановок для нижнего (вычислительного) уровня.
Нижний (вычислительный) уровень называется исполнительным модулем и выполняет следующие функции:
- компоновка и запуск соответствующих исполняемых файлов с вычислительными процедурами для каждой конкретной ЗОУ из аппроксимирующего семейства на основе сформированных ИДП программных постановок;
- проверка успешности генерируемых ИДП локальных вычислительных стратегий.
Модельный пример. Рассмотрим задачу оптимального управления:
x1 = ux1 x2; x1 (0)= 0,5; I = xf (20) + x22 (20)^ min; x2 =(x 1 + u)log10(x1 )+ u2; x2(0)=1; t e[0,20]; |u(t)|<1; u0(t) = 1;
Вычислительной особенностью данной задачи является то, что в процессе улучшения начального управления на первой же итерации соответствующие траектории выходят за границы возможностей машинного представления чисел с плавающей точкой уже при t = 1,91. В табл. 1 приводятся результаты вычислений с использованием предлагаемого подхода, полученные программным комплексом, реализованным в соответствии с описанной архитектурой.
Заключение. Одним из основных недостатков всех существующих комплексов решения задач оптимального управления является неотчуждаемость их от разработчика. Предложенный подход позволяет оснастить
Таблица 1
Результаты вычислений с использованием предлагаемого подхода
Значение p Функционал I Режим работы исполнительного модуля План вычислений (локальные выч. стратегии)
1.0 - АВОСТ -
0.9 - АВОСТ (0.9/1/0.1)
0.5 - АВОСТ (0.5/0.6/0.1)(0.6/1/0.2)
0.2 - АВОСТ (0.2/1/0.2)
0.1 - АВОСТ (0.1/0.4/0.1)(0.4/1/0.2)
0.05 0.971192013 Штатный (0.05/0.06/0.01)(0.06/0.1/0.02)(0.1/0.4/0.1)(0.4/1/0.2)
0.06 0.920602190 Штатный (0.06/0.1/0.02)(0.1/0.4/0.1)(0.4/1/0.2)
0.08 0.920602190 Штатный (0.06/0.1/0.02)(0.1/0.4/0.1)(0.4/1/0.2)
0.1 0.920602190 Штатный (0.1/0.4/0.1)(0.4/1/0.2)
0.2 0.378758101 Штатный (0.1/0.4/0.1)(0.4/1/0.2)
0.3 0.378758101 Штатный (0.1/0.4/0.1)(0.4/1/0.2)
0.4 8.390892e-2 Штатный (0.4/1/0.2)
0.6 2.765573e-2 Штатный (0.4/1/0.2)
0.8 1.269062e-2 Штатный (0.4/1/0.2)
1.0 7.037542e-3 Штатный -
1.
ИРКУТСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ПУТЕЙ СООБЩЕНИЯ
уже существующие комплексы системами 2. экспертной поддержки для решения рассмотренного класса задач оптимального управления, что существенно повышает эффектив- 3. ность работы пользователей, не имеющих достаточной квалификации в рассматриваемой проблемной области. Еще одним преимуществом предложенного подхода является воз- 4. можность независимой модернизации управляющей и исполнительной компонент комплекса.
Работа частично поддержана грантами 5. РФФИ 06-07-89215, 07-07-00265, 08-07-00172 и РГНФ 07-02-12112.
6.
БИБЛИОГРАФИЯ
1. Федоренко, Р.П. Приближенное решение 7. задач оптимального управления.- М.: Наука, 1978.- 488 с.
Евтушенко, Ю.Г. Методы решения экстремальных задач и их применение в системах оптимизации.- М.: Наука, 1982.- 432 с. Тятюшкин, А.И. Численные методы и программные средства оптимизации управляемых систем.- Новосибирск: Наука, 1992.- 193 с.
Горнов, А.Ю., Диваков, А.О. Программный комплекс OPTCON для решения задач оптимального управления. Руководство пользователя.- Иркутск, 1990.- 36 с. Филиппов, А.Ф. Дифференциальные уравнения с разрывной правой частью.- М: Наука, 1985.
Холодниок, М., Клич, А., Кубичек, М., Марек, М. Методы анализа нелинейных динамических моделей.- М.:Мир, 1991.- 368 с. Частиков, А.П., Гаврилова, Т.А., Белов, Д.Л. Разработка экспертных систем. Среда CLIPS. BHV.-СПб, 2003.- 608 с.
Новиков M.A.
УДК 531.36
ЗНАКООПРЕДЕЛЕННОСТЬ И ТЕОРЕМА ФИНСЛЕРА
Введение.
Необходимость применения форм выше второго порядка возникает в теории устойчивости движения [1] при использовании второго метода Ляпунова, и в качественной теории дифференциальных уравнений [2]. По вопросу о знакоопределенности форм V(х) выше квадратичных имеется ряд публикаций, например [3-8]. Обратим внимание на следующие работы: предложенный в [4] подход доставляет только достаточные условия знакоопределенности однородных и неоднородных форм любого числа переменных, исследования в [3, 8] проведены прямым анализом корней уравнения V(z,l) для формы четвертого порядка двух переменных V(х 1, х2 ), при этом они дают необходимые и достаточные условия знакоопределенности. Очевидны трудности, препятствующие их распространению на большее число переменных. Применение Ган-келевых форм [5-7] позволяет получать необходимые и достаточные условия знакоопределенности форм двух переменных, и легко допускает повышение порядка форм. В его осно-
ве лежит теорема Якоби [9], опирающаяся на теорему Штурма [10, 11] определения числа вещественных корней уравнения V(z,l)= 0 на заданном отрезке (-да, +да). Указанные методы получения необходимых и достаточных условий знакоопределенности однородных форм не допускают прямого распространения на формы большего числа переменных.
В связи с этим в статье изложен новый подход к вопросу о знакоопределенности однородных форм четвертого порядка двух переменных
Ф(х, у) = х4 + рх2у2 + цху3 + гу4, (1)
где х, у е N ; р, д, г — вещественные (г > 0). § 1. Редукция формы четвертого порядка к квадратичной форме.
Метод исследования знакоопределенности (1) состоит в сведении к квадратичным формам [9]. Для формы (1) составим степенную замену переменных:
^ = х2, ^ = ху, ^ = у2. (1Л)