УДК 004.02:517.97
И.Ю. ГРИШИН, канд. техн. наук, зав. кафедрой, РВУЗ "КГУ",
Ялта
ОСНОВАННЫЙ НА ПРИНЦИПЕ МАКСИМУМА МЕТОД
РЕШЕНИЯ ЗАДАЧИ НЕЛИНЕЙНОГО БИНАРНОГО
ПРОГРАММИРОВАНИЯ
Рассмотрен метод решения задачи динамического нелинейного бинарного программирования, когда динамика оптимизируемого процесса описывается разностным уравнением Риккати. Такая задача возникает при разработке методов и алгоритмов оптимального управления статистическими измерительными информационными системами. Для решения предложено применить дискретный принцип максимума в матричном виде и метод последовательных приближений. Библиогр.: 10 назв.
Ключевые слова: бинарное программирование, измерительная информационная система, оптимальное управление, алгоритм.
Постановка проблемы. При решении задачи управления измерительными информационными системами (ИИС) достаточной статистикой является ковариационная матрица ошибок оценок параметров траекторий сопровождаемых объектов [1]. В процессе минимизации показателя качества сопровождения объектов выбираются оптимальные управляющие воздействия (момент измерения, измерительный канал, объект измерения и т.д.). Управляемые параметры, с точки зрения оптимизационного процесса, представляют собой совокупность бинарных переменных, которые должны быть выбраны на интервале сопровождения таким образом, чтобы минимизировать заданный показатель качества, включающий в себя функции ковариационных матриц в конечный и текущие моменты времени. Существующие методы решения подобных задач [2] основаны на модификациях алгоритма полного перебора и непригодны для применения в системах управления реального времени. Указанная задача относится к классу ЖР-полных. Следовательно, необходимо разработать метод, позволяющий приближенно, но достаточно быстро решать указанную задачу.
Анализ публикаций. Рассматриваемая задача управления ИИС в режиме оценивания параметров траекторий объектов является нелинейной задачей бинарного программирования. Для ее решения могут быть применены различные численные методы решения оптимизационных задач. Многие из этих методов к настоящему времени представлены в публикациях в виде ряда алгоритмов, учитывающих особенности решения на ЭВМ подобного класса задач [3, 4].
Разработанные для решения целочисленных задач алгоритмы можно разбить на две группы: алгоритмы перебора и алгоритмы отсечения.
С помощью алгоритмов, как первой, так и второй группы может быть получено точное решение рассматриваемой задачи управления наблюдениями. Однако все существующие к настоящему времени методы не могут быть использованы в алгоритмическом обеспечении систем управления реального времени, поскольку решение подобных задач требует существенных временных затрат, измеряемых десятками секунд для небольшого количества управляемых параметров и сопровождаемых объектов (до 5 - 10) и часами для реальных ИИС, когда число управляемых параметров может достигать нескольких десятков при количестве сопровождаемых объектов до нескольких сотен. Предлагаемый метод главных граней [5], возможно, позволит решать подобные задачи, но он требует еще длительной доработки для практического применения в системах управления реального времени. Следовательно, точные методы не могут быть использованы в практических алгоритмах управления.
Цель статьи. Разработать метод оптимизации управления для применения в системах управления реального времени.
Изложение основного материала. Учитывая динамический характер задач управления наблюдениями, для приближенного их решения могут быть использованы алгоритмы, основанные на дискретном аналоге принципа максимума [6]. Причем, учитывая, что управляемый объект наиболее ясно и просто записывается в матричном виде, целесообразно применить и принцип максимума (минимума) в матричном виде [7].
Качество управления наблюдениями в задаче фильтрации измеряемых параметров можно охарактеризовать следующим функционалом:
N Г Т М Т
-1=3 Ё ^ (< (< ))+ЁЁ[1(<) г 1 (0+
г=1 [<=1 ] =1 <=0
+а1 (<)(1 -а1 (<- 1))у 1 (<)]}•
к
Здесь ^(^ (<)хРг- (<)) = Ё * ^ (<)Тги’ (<) - характеризует взвешенную
У=1
величину ошибки фильтрации координат /-го объекта, причем возможность изменения элементов диагональных матриц Иг- (<)
позволяет выделять те координаты, точность оценивания которых желательно повысить; ¥г ) - корреляционная матрица ошибок
оценивания координат /-го объекта в /-й момент времени; элемент матрицы управления а!] (<) е (0, 1}, 1 - производится измерение
параметров /-го объекта/-м каналом в /-й момент времени; Г ■ (<), у^ (<)
- параметры, характеризующие соответственно "стоимости" проведения измерения и переключения /-го канала в /-й момент времени.
Задача управления наблюдениями ИИС при сопровождении объектов заключается в нахождении параметров процесса
а(0), а(1), ..., а(Т-1),
%(0), %(1), ..., %(Т-1), %(Т), / = 1, 2,..., N, )
удовлетворяющих ряду условий. При этом выполнены начальные условия Тг-(О) = Тг0, / = 1, 2,.N, и функционал (1) принимает
наименьшее возможное значение.
Суть предлагаемого метода состоит в следующем.
Уравнение состояния представляется в виде
¥ г (< +1)- ¥, (< ) = ¥, (<, ¥, (<), а(< )) =
ф,¥ г (< )ф т - ¥г (<)- Фг¥ г (< )ф т х
М
х Ё (а1 (<)н; (я;Ф/(<) фтя; + я] )-1 н; }ф,¥г (<)фт , (3)
1=1
X (< +1) - X (<) = FN+! (<) = а(<) - X (<),
¥г(0) = ¥/0, X(0) = 0, / = 1, 2,., N; < = 1, 2,., Т-1.
Здесь Фг - матрица экстраполяции параметров с момента времени / на момент / - 1; И - - матрица наблюдения; М - количество каналов
наблюдения; N - количество наблюдаемых объектов.
Таким образом, задача управления ИИС в режиме сопровождения объектов состоит в минимизации функционала по матрице управления а (<), удовлетворяющей ограничениям и при наличии связей, заданных в
виде системы разностных уравнений.
Введем матрицу состояния
У() = [ У1 (X У 2 ^ X ., У N ^ X У N+1 ^)] =
= [<^ (/), ^ (Г), ..., Ф N (Ъ X ()] , (4)
/ = 1, 2,..., N, у N+1 () = X (/).
Тогда гамильтониан системы может быть представлен в следующем
виде
N+1
!■ +1), аО)) = Ё F и, у к), аО )Рт и +1) +
Н(у ^X Р^ + l), Ф)) = Ё Fг У/ (1), а(/)]Р/Т (1 + 1)
N М/=1 (5)
- Ё Ш (г)¥/ (/)) +Ёа1 ()[Г 1 (/) + (1 - х1/ (0)у 1 (/)]}.
N М
+ Ё ^(к/ (<)¥/ (})) +Ё а1 (‘)[Г 1V) +
/=1 1=1
Канонические уравнения для расчета матриц сопряженных переменных Р, (/). / = 1. 2,..., N +1 к матрицам состояния у, (/) представляются в виде
Р/(/ +1)-Р/(/) = -5Я)р(' + !)- а()), / = 1, 2,...,N + 1. (6)
& V)
Граничные условия для сопряженной системы задаются в конце интервала наблюдения
Р/(Т)= (¥)•(Т))] = АТ(Т), / = 1, 2, ..., N, Р^1 (Т)= 0. (7)
Проанализировав состав выражения можно сделать вывод о том, что гамильтониан имеет структуру
N М
Н (у(/), Р(/ +1), а(г ))= Н 0 + ЁЁ а (г)на (/). (8)
/=1 1=1
Таким образом, гамильтониан линеен по управлениям аи (/), что
является важным выводом для синтеза практически реализуемых алгоритмов управления.
Применение дискретного принципа минимума состоит в том, что на оптимальной в смысле минимума функционала (1) последовательности матриц управления а^), t = 1, 2,Т-1, удовлетворяющей заданным условиям, гамильтониан Н, определяемый соотношениями (5) или (8), достигает своего минимума. Из минимума гамильтониана Н с учетом ограничений на а ^), следует вывод, что в каждый момент времени
t e {i, 2, ...,T-1} оптимальное управление a (t) будет удовлетворять
Ha (t )> min Ha (tX
ve{1, 2,.., N}
j e{1, 2, ...,M}, t e{1, 2,..., T -1}.
(9)
2. а1 (t) = 1 в том случае, когда существует такое значение из множества / е {1, 2, N}, для которого выполняются условия
(10)
j e{1, 2,...,M}, t e{1, 2, ..., T-1}.
3. aj (t) могут быть особыми управлениями, которые подробно
рассмотрены в монографии [8], однако практика применения рассматриваемого метода для управления ИИС в естественных условиях функционирования показала, что они не встречаются и могут обсуждаться с сугубо теоретической точки зрения.
Обычно получить аналитическое решение в рассматриваемой задаче оптимального управления ИИС в режиме сопровождения объектов в большинстве случаев не удается (за исключением случаев применения таких фильтров обработки поступающей информации о целях, в которых динамика ковариационных матриц ошибок оценок параметров описывается линейными уравнениями). Поэтому применяются численные методы для ее решения, например, основанный на дискретном принципе максимума метод, называемый методом последовательных приближений [9, 10].
Выводы. В результате проделанной работы предложен метод решения прикладной задачи нелинейного бинарного программирования, который не требует для своей реализации больших вычислительных затрат и может быть применен в системе управления реального времени.
Список литературы: 1. Grigorev F.N. Control of the observation process in continuous systems / F.N. Grigorev, N.A. Kuznetsov // Probl. Contr. and Inform. Theory. - 1977. - Vol. 6 (3).
- P. 181-201. 2. Ахо А. Построение и анализ вычислительных алгоритмов / А. Ахо, Дж. Хопкрофт, Дж. Ульман. - М.: Мир, 1979. - 536 с. 3. Романовский Н.В. Алгоритмы решения экстремальных задач / Н.В. Романовский. - М.: Наука, 1977. - 352 с. 4.ХохлюкВ.И. Задачи целочисленной оптимизации (преобразования) / В.И. Хохлюк. - Новосибирск: НГУ, 1979. - 92 с. 5. Grishin I. Linear programming: a new polynomial-time algorithm /1. Grishin ,
G. Potapov // Вісник Східноукраїнського національного університету ім. В. Даля. - 2007. -№ 1 (107). - С. 113-119. 6. Фан Лянь-Цэнь. Дискретный принцип максимума / Лянь-Цэнь Фан, Чу-Сен Вань. - M.: Мир, 1967. - 180 с. 7. Athans M. The matrix minimum principle /MAthans. - Massachusetts Institute of Technology Electronic Systems Laboratory Report ESL-R-317, Cambridge, Massachusetts, 1967. - 19 p. 8. Григорьев Ф.Н. Управление наблюдениями в автоматических системах / Ф.Н. Григорьев, НА. Кузнецов, А.П. Серебровский. - М.: Наука, 1986. - 216 с. 9. Крылов И.А. О методе последовательных приближении для решения задач оптимального управления / И.А. Крылов, Ф.Л. Черноусько // Журн. вычислит. мат. и мат. физ. - 1962. - Т. 2. - № 6. - С. 1132-1139. 10. Крылов И.А. Алгоритм метода последовательных приближений для задач оптимального управления / И.А. Крылов, Ф.Л. Черноусько // Журн. вычислит. мат. и мат. физ. - 1972. - Т. 12. - № 1. - С. 14-34.
Статью представил д.ф.-м.н., проф. РВУЗ "КГУ" Мицай Ю.Н.
УДК 004.02:517.97
Заснований на принципі максимуму метод розв’язання задачі нелінійного бінарного програмування / Грішіш І.Ю. // Вісник НТУ "ХПІ". Серія: Інформатика та моделювання. - Харків: НТУ "ХПІ". - 2012. - № 62 (968) - С. 46 - 51
Розглянутий метод розв’язання задачі динамічного нелінійного бінарного програмування, коли динаміка процесу, що оптимізується, описується різницевим рівнянням Рікаті. Така завдача виникає при розробці методів і алгоритмів оптимального управління статистичними вимірювальними інформаційними системами. Для вирішення запропоновано застосувати дискретний принцип максимуму в матричному виді і метод послідовних наближень. Бібліогр.: 10 назв.
Ключові слова: бінарне програмування, вимірювальна інформаційна система, оптимальне управління, алгоритм.
UDC 004.02:517.97
Method of solution of nonlinear binary programming problem, which is based on maximum principle / Grishin I.Y. // Herald of the National Technical University "KhPI". Subject issue: Information Science and Modeling. - Kharkov: NTU "KhPI". - 2012. - №. 62 (968)
- P. 46 - 51
The method of solving of problem of the dynamic nonlinear binary programming is considered, when the dynamics of the optimized process is described by difference Riccati equation. This problem arises in the development of methods and algorithms for optimal control of the statistical measurement of information systems. To apply the solutions proposed discrete maximum principle in matrix form and the method of successive approximations. Refs.: 10 titles.
Keywords: binary programming, measuring information system, an optimal control algorithm.
Поступила в редакцию 30.07.2012