ISSN 2079-3316 ПРОГРАММНЫЕ СИСТЕМЫ: ТЕОРИЯ И ПРИЛОЖЕНИЯ № 4(18), 2013, с. 107-125 УДК 517.977
В. И. Гурман, И. С. Гусева
Модели управляемых систем, порождающие магистральные решения задач оптимального управления
Аннотация. Предлагается один из подходов к построению математической модели сложной динамической системы из класса моделей линейных по управлению, для которых характерны магистральные оптимальные решения, получаемые методами теории вырожденных задач. Приближенные магистральные решения используются в качестве первого приближения в многоэтапной процедуре уточнения, как самой модели, так и решения оптимизационной задачи. Эффективность такого подхода демонстрируется на прикладной задаче моделирования и исследования социо-эколого-экономической системы региона.
Ключевые слова и фразы: Математическая модель, вырожденная задача, магистральное решение, ослабленная система, скользящий режим, эколого-экономическая задача.
Введение
В современной научной литературе нет строгой формулировки понятия математического моделирования. В целом, под этим термином понимается некий научный подход к построению и использованию математической модели исследуемой реальной системы, объекта, явления, процесса, направленный на сокращение времени и средств, затрачиваемых на исследование реального объекта — прогнозирования поведения при различных условиях, решение соответствующих математических задач в формализованной постановке, в частности, задач оптимизации.
Работа выполнена при финансовой поддержке Российского Гуманитарного Научного Фонда (проект 11-02-00171-а), Российского Фонда Фундаментальных Исследований (проект 12-01-00256-а).
© В. И. Гурман, И. С. Гусева, 2013
© Институт программных систем им. А.К. Айламазяна РАН, 2013 © Бурятский государственный университет, 2013
© Программные системы: теория и приложения, 2013
Понятие математической модели развивалось в работах [1-12] и многих других. Общий принцип построения математических моделей состоит в том, что задается некоторый класс подходящих моделей, из которого выбирается конкретная путем уточнения тех или иных зависимостей, параметрической идентификации и т.п.
Происходит непрерывное усложнение систем, исследуемых математическими методами и, соответственно, возрастают трудности самого процесса исследования. При решении прикладных задач оптимального управления из техники, экономики и других областей эти трудности часто связаны с таким их характерным свойством как вырожденность. Под этим понимается наличие в исследуемой задаче скрытых пассивных дифференциальных связей или дискретных цепочек, исключение которых по существу не меняет искомого решения. Это свойство затрудняет применение общих методов, но, с другой стороны, открывает возможности упрощений при исследовании за счет применения специальных методов теории вырожденных задач [13-16]. Как известно, характерным признаком вырожденности является наличие в исследуемой модели линейных управлений. Задачи для такого класса моделей, с одной стороны, распространены на практике как самостоятельные, а с другой, получаются в результате перехода к эквивалентным ослабленным системам путем овыпукле-ния множества скоростей в исходной модели или его подмножеств [17,18].
Общий подход специальных методов теории вырожденных задач как раз и состоит в поиске и исключении пассивных связей. В итоге, исходная задача, нерегулярная с точки зрения общих методов, заменяется точно или приближенно регулярной производной задачей, имеющей меньший порядок, что означает упрощение исходной. В свою очередь, если производная задача вырождена, то она вновь может быть преобразована к производной задаче (второй ступени) и т.д. до тех пор, пока такая процедура возможна.
Понижение порядка означает, что её решение может не удовлетворять исходным граничным условиям. В этом случае соответствующее решение исходной задачи называется магистральным [19]. В случае неограниченного управления соответствующее магистральное решение называется идеальным.
Магистральные решения представляют большой интерес при исследовании сложных систем. В ряде случаев, когда в исходной модели напрямую нельзя найти магистральное решение, то такую модель можно приближенно заменить другой, имеющей магистральное решение. В любом случае, получается некоторое приближенное решение исходной задачи, которое может быть использовано как эффективное начальное приближение в некотором итерационном методе поиска решения. Таких методов в настоящее время разработано много, о чем достаточно полное представление дают, например, обзоры, содержащиеся в [20,21]. Среди них отметим наиболее эффективные, основанные на нелокальном улучшении управления на итерациях [21-23]. Но они ведут к искомому решению гарантированно лишь при наличии хорошего начального приближения, для поиска которого, как правило, никаких рецептов не предлагается.
Цели данной работы:
(1) предложить для выбора начальной математической модели сложной динамической системы класс моделей с линейным управлением, для которого задачи оптимального управления в стандартной постановке имеют магистральные решения;
(2) разработать многоэтапную процедуру исследования на этой основе;
(3) продемонстрировать эффективность в целом такого подхода на представительной прикладной задаче.
1. Обоснование класса моделей
Предлагается для выбора исходной модели рассматривать класс непрерывных систем, описываемый следующими соотношениями:
где g(t, x,ui) — векторная функция, h(t, х) — (пх &)-матричная функция ранга к, многозначная функция U(i, х) — общего вида, к < п.
Предполагается, что матрица h(t, х) удовлетворяет условию коммутативности:
(1)
х = g(t, x,u\) + h(t, x)v>2, x € К", t € T = [if, tp], ux € U(i, x), u2 € R,
T dhi
hjdhn =o, ^
1 ' ' iii
где кт, Н — то- и /-столбцы матрицы х) соответственно, дкт/дх, дк¡/дх — матрицы частных производных кт, к; по компонентам х. Очевидно, при к = 1 это условие заведомо выполняется.
Эта концепция модели удобна тем, что позволяет выполнить для ее эффективного исследования в достаточно общем виде преобразование к производной системе, известное из теории вырожденных задач:
(3) у = ■Пхд(1,х,и1) +
и\ € и(1,х), х € 0,(Ь,у) = [х : у = г)(Ь,х)},
где у = ц(Ь,х) (у € К"- к) — интеграл соответствующей предельной системы
(4) ^ = к(г,х)и2, и2 € Кк,
где г — вектор координат на интегральном многообразии. При этом существуют функции г = С,х) и ^(Ъ,у,г), такие что отображения у = г/^, х), г = £(Ъ, х) и х = £(1, у, г) взаимно однозначны при каждом
г.
В случае неограниченного управления исходная и производная системы эквивалентны, т.е. любая траектория производной системы в пространстве (Ь, х) может быть аппроксимирована последовательностью траекторий х8(1) исходной системы с любой степенью точности при достаточно большом управлении и2. Если управление и2 ограничено, тогда решение производной системы может рассматриваться как эффективное приближение при подходящем допустимом управлении.
Если поставлена задача оптимального управления (в стандартной форме)
, , х(Ь[) = Х[, х € Х^) С К", х(Ър) = хр,
() I = ^(х(Ьр)) ^ ,
то возникает соответствующая производная задача
)= У1, У € \(1) С К"- к, у(1р)= ур, (6) з = ^(у(1р)) ^ М, ру(у)=шш^(ф,у,г)).
Как видно, эта задача имеет порядок (п — к) ив этом смысле проще исходной.
Формально модель (1) можно рассматривать как самую общую модель — дифференциальную управляемую систему, в которой выделена часть, линейно зависящая от управления. Если таковая отсутствует, то достаточно положить к = 0.
Однако, с учетом указанных выше полезных ее свойств, возникает естественный вопрос — насколько она является общей для описания типичных ситуаций. Ответ на этот вопрос дает рассмотрение наряду с обычной дифференциальной системой общего вида так называемой ослабленной системы [17,18]. Подробнее, дифференциальная управляемая система
(7) ¿ = / (г,х,и), г & т = [гТ,гР], х & мп, и & и (г,х) с мр
может быть представлена в форме дифференциального включения:
В работах конструктивного и прикладного направления, как правило, рассматриваются множества решений указанных систем (7), (8) допустимых решений, где функции х (траектории) — кусочно-гладкие, а и (программы управлений) — кусочно-непрерывные. Ослабленная система получается овыпуклением правой части (8):
где Vc = со V — это выпуклое замыкание множества V.
Один из фундаментальных фактов теории управления состоит в том, что, несмотря на то, что множество скоростей в (9) может быть существенно шире, чем исходное множество скоростей, даже иметь большую размерность, обе системы эквивалентны в том смысле, что любое решение системы (9) может быть приближено с любой точностью допустимыми решениями системы (8). Доказательство этого утверждения дано в работе [17] при естественных предположениях. В ходе доказательства выясняется специфическая конструкция последовательности аппроксимирующих решений, имеющая важное значение для практики, о которой условно говорят, что она стремится к скользящему режиму на рассматриваемом отрезке.
При практическом применении операции овыпукления на первый план выдвигается вопрос о представлении выпуклой оболочки V через элементы описания V посредством наиболее распространенной записи в терминах управляющих переменных х = /(Ь,х,и), и & И(1,х), т.е. в конечном счете — представления выпуклой оболочки через элементы множества и. Возможны различные представления
(8)
х & V (г,х), V (г,х) = / (г,х, и (г,х)).
(9)
х & Vc (Ь, х),
V с. Прежде всего — это универсальное представление на основе известной теоремы Каратеодори о выпуклой оболочке:
т— 1
(10) X = /(г,х,ио) (Ъ,х,и1) — /^,х,и0)),
I =1
т- 1
а1 < 1, м; € И(£, х), щ > 0.
=1
Конкретно в данном представлении фигурирует (п + 1) элемент множества и (то = п +1) и п дополнительных переменных а1, играющих наряду с щ,ио роль управлений, если п — размерность х. Его преимущества — универсальность и «непосредственность». Основной недостаток — большое число управляющих переменных (р(п + 1) + п) в сравнении с исходной системой (р переменных). Этот недостаток можно устранить переходом к «минимальному» описанию посредством параметрического уравнения несущей плоскости множества V с и выпуклой области на этой плоскости, т.е. в пространстве ее параметров:
(11) X = А(г,х)+ В(г,х)-ш, -ш € W(t,x).
Здесь всего ц < п управляющих переменных, в качестве которых выступают параметры несущей плоскости. Однако нахождение функций А(Ь, х) и В(1, х) и описания области W связано в общем случае с достаточно трудоемкой процедурой, далеко еще не отработанной до «стандартной», хотя во многих конкретных случаях представление (11) получается непосредственно.
Существует возможность уменьшить число переменных по сравнению с универсальным представлением за счет конкретизации множества V. Например, для множества V С К3 вида
V = [у: V3 = (у1)2 + (у2)2, V3 < с}
(усеченный параболоид) возможно такое представление:
х = Уо + а(и1 — юо),
где 0 < а < 1, VI пробегает множество V, Уо — фиксированная точка на V. В этом случае V с описывается с помощью четырех (вместо 1 ) переменных при стандартном представлении. Выбор подобного представления может быть сделан при конкретном геометрическом анализе исходных данных задачи.
Если множество V дискретное, состоящее из конечного числа точек (т), то выпуклая комбинация из всех таких точек позволяет свести дело к задаче с т линейными управлениями а1, поскольку все VI (щ) известны. Если V задано как регулярная решетка, то число переменных может быть уменьшено путем отбора из всего дискретного множества граничных точек, т.е. таких, которые при овыпуклении окажутся на границе выпуклого множества.
Из этих сопоставлений видно, что типичная модель — дифференциальная система общего вида — может быть заменена с любой степенью точности эквивалентной ей моделью — ослабленной системой вида
, . х = д(Ь,х,их) + ,х,и\)и-2, х & М"
( ) их & И^,х), и2 & Мй.
В отличие от предлагаемой конструкции (1), здесь п х /г-матрица ,х,и\) ранга к зависит от другого управления и\. Если зафиксировать некоторую кусочно-постоянную программу и\*(Ь) = ич, ц & \рд, Ь и переходить к производной системе на интервалах постоянства, то на каждом таком интервале получается семейство производных систем с параметром ич, из которого можно выбирать конкретную в начальной точке интервала. Поскольку кусочно-постоянная функция аппроксимирует кусочно-непрерывную с любой точностью с уменьшением интервалов, то предложенный класс моделей с «изолированным» линейным управлением является достаточно общим для точного или приближенного с любой точностью представления системы общего вида.
Отметим, что к рассматриваемому типу относятся, в частности, такие достаточно хорошо изученные модели как линейные
(13) х = А(г)х + в(г)и и билинйные
р
(14) х = А(г) + ^в,] (г)и>.
3 = 1
Для них инварианты предельной системы заведомо находятся аналитически.
2. Процедура исследования
С учетом всего сказанного предлагается следующая общая процедура исследования задачи оптимального управления в стандартной постановке.
1. Выписывается предельная система при идеализирующем предположении о неограниченности линейного управления и2:
—— = ки,х,и\)и2, «2 & Мй; ах
находятся ее инварианты, иначе — семейство интегральных многообразий у1 = т/1^,х,и{), г = 1, ...,п-к, или, в векторной записи у = ц(Ь,х,и1), у & Мп-к.
2. Записывается производная система на каждом интервале постоянства (щ^)):
У = г]х 9(I ,Х,иХ) + Щ, их & и^,х), у = г/(г,х,и1), х & ,у) = т~1(г,у,их),
* = Й = (£)■< = '• 2.....п, ,- = !,2.....= £
и соответствующая производная задача
у(£ 1) = У1, у(*^) = ур, у & ^(г),
J =Р У (у(Ь р)) ^ Ш, ^ У (у) = шш^ (ф р ,у, г),их).
3. Шаги 1 и 2 повторяются, если в результате шага 2 получается модель типа начальной (12).
4. Решается идеальная производная задача, получается соответствующее идеальное магистральное решение (с разрывной траекторией).
5. Производится аппроксимация полученного идеального магистрального решения подходящим допустимым решением в окрестностях точек разрыва траектории, получается приближенно-оптимальное магистральное решение.
6. Полученное на шаге 5 решение уточняется в некоторой итерационной процедуре улучшения.
Далее сформулируем некоторые замечания относительно процедуры исследования задачи:
— На шагах 4 и 6 могут применяться линейная (13) и билинейная (14) модели по принципу локализации для реализации эффективного улучшения на итерациях.
— Для прикладных задач характерны фазовые ограничения. Переход к производным задачам существенно облегчает их учет, так как переводит часть переменных состояния в управляющие.
— Класс выбора исходной модели можно существенно расширить, если априори ориентироваться на приближенные методы исследования, то можно применять наряду с переходом к ослабленной системе нелокальную аппроксимацию в рассматриваемом классе, например, по методу наименьших квадратов.
— На этапе улучшения приближенного магистрального решения вполне успешно может быть применена модель дискретно-непрерывной системы (ДНС) [24].
3. Приложение к эколого-экономическим задачам
В данном разделе рассматривается агрегированная версия модели региона [2 5 ], описывающая взаимодействие экономической, природной и социальной составляющих с учетом инновационных процессов. На этой модели в [26] исследована задача оптимизации стратегий устойчивого развития региона при идеализированных допущениях с целью оценки предельно допустимых затрат на инновационную деятельность в условиях дефицита реальных статистических данных в терминах затраты-результаты. Здесь более детально изучается один из допустимых вариантов решений указанной задачи с учетом реалистических ограничений модели.
3.1. Модель региона
Рассматривается концептуальная модель региона, отражающая взаимодействие трех секторов — производственного, социо-природо-восстановительного и инновационного и описываемая следующими соотношениями:
с = (Е — А) у — Ви — А2^ — В2и2 — А"V — В"и",
г = г + N (г — г) — Су + С2 г + гтог — ехг,
(15) к = и — Щк, к2 = и2 — [б2 ]к2, к" = и" — [5У ]ку,
0 < у < Г(к), 0 < г < Г2(к2), 0 < V < Г(ку),
а —
9 = —(V + Н-)(9 — 9), 9(0) =0. к
Здесь у, г, V — векторы выпусков продукции по отраслям, активного природо-социо-восстановления, активных инноваций, с — конечное потребление; (к, кг, к"), (Г(к) , Г2(к2), Г"(к")), (и, и2, и"), (5, 52, 5")
— основные фонды, мощности и инвестиции (векторы) и темпы амортизации в экономическом, природо-социо-восстановительном и инновационном секторах (диагональные матрицы); р — матрица-строка цен (ценовых поправок); г — вектор индексов состояния природной среды и социума; в — вектор инновационных индексов (агрегированное описание изменения за счет инноваций элементов матриц А, А7', В, В2, С, С2 и других параметров); в — предельная граница инновационных индексов; г(Ь) — заданная функция (опорная), например
Т Г
получаемая из статистического прогноза; гто , ех' — миграционные потоки загрязнений и ресурсов; А, А7', А" — матрицы прямых затрат в экономическом, природо- социо-восстановительном и инновационном секторах; В, В2, В" — матрицы фондообразующих затрат в указанных секторах; N — матрица коэффициентов взаимовлияния компонентов природной и социальной подсистем; С — матрица коэффициентов прямого воздействия отраслей экономики на компоненты природной и социальной подсистем; Н — коэффициент, отражающий влияние инвестиций и диффузии инноваций.
Данная модель может трактоваться как непрерывная, так и дискретная по времени. Точкой сверху в непрерывном варианте обозначаются производные по времени (так к = ¿к/А и т.д.), а в дискретном
— конечные разности (к = (к(1+К) — к(1))/Н и т.д.), где к — временной шаг, который удобно задавать равным единице времени (типично — году), к = 1. Все величины в правых частях уравнений и в конечных соотношениях берутся в момент
Агрегирование параметров (и определение их зависимости от в) может быть выполнено различными способами. Один из естественных способов подробно описан в [25].
В общем случае все матрицы и функции Г(к), Г2(к2), Г"(к") могут зависеть от £ и вектора в, а также от г для учета инноваций, необратимости природных процессов при чрезмерных воздействиях, экономических ущербов от ухудшения качества природной среды и т.п. Эти зависимости уточняются при планировании сценарных расчетов, а по умолчанию принимаются линейными, например
= ^ + А(^)(т — г).
Основные типичные ограничения на управляющие воздействия представлены в модели. Возможны дополнительные ограничения, связанные с конкретными задачами, например, по трудовым ресурсам, по располагаемым инвестициям, ограничения, отражающие требования устойчивого развития, и т.п.
В качестве критерия оптимальности рассматривается максимум функционала благосостояния П_р = П(Ь р) — конечного значения накопленного дохода за вычетом штрафа за нарушение ограничений устойчивого развития П(£), динамика которого описывается уравнением
(16) П=(рс- Б (г)) е-рЬ = (р((Е - А)у - Ви - А2 г- Вгиг - А"у - Вуиу) - Б(в, г))е-рг при заданных ограничениях и заданном состоянии в начале периода:
П(0) =0, к(0) =к0, кг (0) = к§, ку (0) =ку0, г(0) =г0, 0(0) =0,
где р — матрица-строка прогнозируемых цен (ценовых поправок), Б — штраф за нарушение условий устойчивого развития, — вектор штрафных коэффициентов; р — коэффициент дисконтирования.
При подходящем выборе параметра р функционал П можно трактовать и как накопленное душевое потребление, если принять, что население растет экспоненциально (в этом случае р рассматривается как сумма темпов дисконтирования и роста населения).
Понятие «инновация» трактуется формально как любое целенаправленное изменение параметров созданной ранее, в каком-то смысле традиционной модели.
3.2. Оптимизация стратегии устойчивого развития региона
Более детально рассматривается модель (15) на одном из допустимых вариантов решений задачи пункта 3.1 с учетом реалистических ограничений модели. Из методических соображений предполагаем, что инновационным изменениям подвергаются лишь элементы матриц А и С (которые и по содержанию — наиболее существенные параметры). Они рассматриваются как функции 9. Остальные параметры считаются константами. Восстановительный и инновационный секторы работают с полным использованием мощностей, которые принимаются линейно зависящими от основных фондов: Гг =
7zkz, Г = 7vkv. Мощности производственных отраслей (производственные функции) Гг(кг) считаются вогнутыми функциями. Темп дисконтирования р полагается нулевым. Ограничения на г учитываются косвенно посредством штрафов. Население и трудовые ресурсы по отраслям принимаются постоянными. Выпуски и основные фонды отраслей ограничены снизу из условий минимальной занятости населения. Штрафной коэффициент s = 10000, коэффициенты функции Кобба-Дугласа а и ß принимаются равными 0.5 и 10 соответственно, параметры Ау = 200 и Н = 0.01. Параметр В принимается постоянным и равным Во.
Задача решается в два этапа. На первом этапе применяется метод кратных максимумов, при котором управления u, uz и uv предполагаются неограниченными, для компонентов к, kz, kv имеются нижние границы (), а верхняя (^ и нижняя (•)i границы в° строятся как решения уравнений относительно этих переменных из (15) при v3 = 73куз с условиями на левом и правом концах.
Далее рассматривается обобщенный лагранжиан Кротова, задавая функцию Кротова в виде p = я + д(к, kz,ку, г, в):
rtF
L = G - Rdt.
о
G = д (kF, kzF, kvF, rF, 0F) - д (ко, к^, ку, го, во),
К = Р((1 - А(в))у -Ви - А'^'к" - В7'и7 - Ау^ку - Вуи")-
дд дд - дд - Б (г) + — (и - 6 к) - — № + Н )(в - в) + ^ (и - Зуку)+
+ дд (и - 6*кг)+дд (г -г) - с (в)у++'1тГ -ехГ )■
Применяя последовательно метод кратных максимумов [13], получим следующие результаты. Минимизация по у дает:
1Уи -
\yi,
, уи Г(к), при к > 0, y(t) = ' < 0
при к < 0,
где к = р(1 - А(6) - r/zC(в)), rf = (Cz7z)-1p(Äz7z + özBz). Соответственно
R = к(в) у\и — pBSk — S(r) + /z(r + N (r — r) + imr — exr).
Минимизируя далее по в, получим нижнюю границу в = в¡(t) = в — (в — вр) exp( H(tр — t)) при всех t, так как к(в) — убывающая функция в. Минимум по к достигается в точке к(Oi(t)), такой что к(6i(t)) = к1 при к(9) < 0 и к(9l(t)) — решение уравнения dR/dk = 0 с учетом вогнутости Г(к) при к(в) > 0. Минимум по г достигается в стационарной точке г, удовлетворяющей условию dR/dr = 0, поскольку на г ограничений нет. Тогда
L =р (В*кхр + В°кр + nzrp — Q(0i(t))) + const,
где Q(0i(t)) — значение интеграла в выражении при найденных оптимальных значениях переменных. Значения кр, кр, и кр принимаются равными значениям на последней магистрали. Результат минимизируется по вр, что даст окончательное магистральное решение.
Данная конструкция функции Кротова соответствует двукратному переходу от исходной задачи к производной: вначале получается первая производная задача, где роль управлений наряду с исходными играют к, ^ и к", затем делается переход к следующей производной задаче, путем перехода к единственной фазовой переменной
С = п+ р(Вк + Вzkz + В "к") — р" (в — f) + рР г,
где р" = p(Av^v + SvВ"). Это задача первого порядка для уравнения (17) С = К 0, г) = к(в)у — рВ5к — S(r)+'qz (f + N (г — f) + imr — ехг) с функционалом I = (tр) ^ inf при начальном условии
С(0) = Со = р(В0к0 + + В"к") — р" \n-r (во — в) + рРг0
и при указанных выше ограничениях на остальные переменные.
Минимизация этого функционала сводится к максимизации правой части уравнения (17), которая совпадает с выражением функции R и дает уже найденное разрывное магистральное решение (второй ступени). Его траектория, как видно, разрывна в начальный момент и в точках переключения компонент к, внутри промежутка (0, Ьр), т.е. представляет собой чередование нескольких непрерывных магистралей.
Для аппроксимации магистрального решения в исходном классе допустимых процессов применяется алгоритм с минимальным числом переключений исходных управлений [27]. Расчеты проводились для условного региона (таблица 1), прототипом которого служит Байкальский регион по состоянию на 2010 год. На рисунках 1-3 представлены магистральное решение и один из членов аппроксимирующей
последовательности. При магистральном решении получено значение благосостояния Пр = 7485, а при аппроксимации Пр = 7154 (млрд.руб.). Видно, что управление, реализующее это решение, носит сложный переключательный характер даже при минимально возможном для данной реализации числе точек переключения. Это обусловлено, во-первых, наличием двух магистральных участков (соответствующих нижней границы к и его стационарному оптимуму), а во-вторых, более сложной реализацией магистрали второй ступени по сравнению с [28].
Таблица 1. Данные условного региона.
Параметр Значение Парам. Знач. Парам. Знач.
20 «0 0.1 У1 50 млрд.руб.
0.05 А0 0.5 А(9) (1 + ав)А0
5г 0.05 Р 1 Со 0.04
5" 0.05 го 0.8 С (в) (1 + (1 + а)в)Со
к 100 млрд.руб. Гр 0.9 N -0.001
к 400 млрд.руб. г 1 в 100,..., 10000
кр 800 млрд.руб. В0 1 а 0.5,0.7, 0.8
о0 0 В " 1 Р 10, 2.2,1.1
Ор -0.75 в -0.8 А" 200, 250, 300
Аг 8000 Вх 1
Решение в целом с учетом граничных условий оказывается разрывным: переходы между граничными точками и магистралью и между магистралями происходят «скачком». Каждый скачок реализуется последовательностью кусочно-гладких траекторий при неограниченно возрастающих управлениях в окрестностях точек разрыва, а практически — при достаточно больших управляющих воздействиях.
Магистральное решение задачи устойчивого социо-эколого-эконо-мического развития региона находится из достаточно простых соотношений и позволяет получить практически значимые выводы, поскольку исходные идеализирующие допущения достаточно хорошо отражает реальную ситуацию. В частности ему соответствует важный критерий устойчивости развития региональной системы, который включает не только экономические, но и экологические и социальные параметры. В отличие от критерия, полученного в [28], где
к ( >
I----1
-| | | > управление и
11 /
11 I____
11
^управление и
10 15
^ аппроксимация
магистраль
в
а)
б)
Рис. 1. Значения инвестиций в трех секторах (а) и основных фондов в природо-восстановительном секторе (б)
И')'
аппроксимация
магистраль
г г г г г и
V1 2 У к 3
к {г )
к,
/
/
/
аппроксимация
магистраль
а)
б)
Рис. 2. Значения основных фондов в инновационном (а) и производственном (б) секторах
и.и",и
I | управление II
к
к
I
у к-3
восстановительные и инновационные мощности принимались неограниченными, а учитывались только затраты на текущее функционирование соответствующих секторов, здесь, как видно, он включает и инвестиционные параметры, а именно, коэффициенты фондообразу-
_ °'8
Г (г ).
1,00 Г
о,«
м^]
магистраль
аппроксимация
а)
б)
Рис. 3. Значения инновационного сектора (а) и индекса состояния природной среды и социума (б)
г
г
ющих затрат В7' и В".
При ограниченных инвестициях как управляющих воздействиях магистральный характер решения сохраняется, но оно становится приближенным и в дальнейшем может быть использовано в качестве эффективного начального приближения в итерационной процедуре улучшения [29] для полной модели. Однако при этом переключения компонент не будут синхронизированы, и число точек переключения (в общем случае 2п, где п — размерность вектора к) может быть достаточно большим. В таком случае для повышения эффективности итераций улучшаемый процесс целесообразно рассматривать как дискретно-непрерывный, где дискретными шагами служат моменты переключений, и применять соответствующие алгоритмы улучшения (например, [30,31]) аналогично тому, как это делалось при практической реализации скользящих режимов [32].
4. Заключение
Таким образом, класс моделей, линейных по управлению, порождающих магистральные решения задач оптимального управления, существенно расширенный за счет перехода к эквивалентным ослабленным системам путем овыпукления множества скоростей, оказывается достаточно общим для построения математических моделей
сложных динамических систем. Это позволяет строить эффективные многоэтапные процедуры исследования с использованием исходной модели и соответствующего глобально-оптимального приближенного магистрального решения в качестве начального приближения. Для практического использования этого подхода важно предложенное преобразование исходной системы посредством семейства производных систем, когда коэффициенты при линейных управлениях зависят от других управлений. Эффективность предложенного подхода демонстрирует решение практически значимой задачи поиска стратегии устойчивого развития.
[1 [2 [3 [4 [5 [6 [7 [8 [9 [10 [11 [12 [13 [14 [15
Список литературы
Матросов В. М. Метод сравнения в динамике систем // Дифференциальные уравнения. I, 1974. Т. 10, № 5, с. 1547-1559. |[]
Матросов В. М. Метод сравнения в динамике систем // Дифференциальные уравнения. II, 1975. Т. 11, № 3, с. 403-417. |
Месарович М., Мако Д, Такахара Я. Теория иерархических многоуровневых систем. М. : Мир, 1973.— 344 с. |
Месарович М., Такахара Я. Общая теория систем: математические основы. М. : Мир, 1978.— 312 с. |
Моисеев Н. Н. Численные методы в теории оптимальных систем. М. : Наука, 1971.— 328 с. |
Моисеев Н. Н. Математические задачи системного анализа. М. : Наука, 1981.— 488 с. |
Советов Б. Я., Яковлев С. А. Моделирование систем. М. : Высшая школа, 2001.— 343 с. |
Шеннон Р. Имитационное моделирование систем : Искусство и наука. М. : Мир, 1978.— 424 с. |
Самарский А. А. Математическое моделирование и вычислительный эксперимент // Вестник АН СССР, 1979, № 5, с. 38-49. |
Самарский А. А., Михайлов А. П. Математическое моделирование : Идеи. Методы. Примеры. М. : Физматлит, 2002.— 320 с. |
Мышкис А. Д. Элементы теории математических моделей. М. : КомКнига, 2007.— 192 с. |
Морозов К. Е. Математическое моделирование в научном познании. М. : Мысль, 1969.— 212 с. |[]
Гурман В. И. Вырожденные задачи оптимального управления. М. : Наука, 1977.— 304 с. |[], 3.2
Гурман В. И., Ни М. К. Вырожденные .задачи оптимального управления (обзор) // Автоматика и телемеханика. I, 2011, № 3, с. 36-50. t Гурман В. И., Ни М. К. Вырожденные задачи оптимального управления (обзор) // Автоматика и телемеханика. II, 2011, № 4, с. 57-70. t
[16] Гурман В. И., Ни М. К. Вырожденные .задачи оптимального управления (обзор) // Автоматика и телемеханика. III, 2011, № 5, c.32—46. f[]
[17] Гурман В. И. Принцип расширения в задачах управления. М. : Наука. Физ-матлит, 1997.— 288 c. f[], 1, 1
[18] Warga J. Relaxed Variational Problems // Journal of Mathematical Analysis and Applications, 1962. Vol. 4, no. 1, p. 38-43. f[], 1
[19] Гурман В. И. Магистральные решения в процедурах поиска оптимальных управлений // Автоматика и телемеханика, 2003, № 3, c. 61-71. f[]
[20] Батурин В. А., Урбанович Д. Е. Приближенные методы оптимального управления, основанные на принципе расширения. Новосибирск : Наука, 1997.— 175 c. f[]
[21] Срочко В. А. Итерационные методы решения задач оптимального управления. М. : Физматлит, 2000.— 160 c. f[]
[22] Krotov V. F. Global methods in optimal control. New York : Marcel Dekker, 1996.— 408 p. f
[23] Булдаев А. С. Методы возмущений в задачах улучшения и оптимизации управляемых систем. Улан-Удэ : Издательство БГУ, 2008.— 260 c. f[]
[24] Расина И. В. Итерационные алгоритмы оптимизации дискретно-непрерывных процессов // Автоматика и телемеханика, 2012, № 10, c. 3-17. f2
[25] Гурман В. И., Рюмина Е. В. Моделирование социо-эколого-экономической системы региона. М. : Наука, 2001.— 175 c. f3, 3.1
[26] Будаева Д. Ц., Гусева И. С., Насатуева С. Н. Влияние инвестиций и прямых инновационных затрат на оптимальные стратегии развития региона // Программные системы: теория и приложения: электрон. научн. журн., 2012. Т. 3, №5(14), http://psta.psiras.ru/read/psta2012_5_23-32. pdf, c. 23-32. f3
[27] Гусева И. С. Магистральное решение второго порядка в задаче экономического роста с учетом инноваций // Вестник БГУ. Вып. 9. Математика и информатика, 2008, c. 19-25. f3.2
[28] Ухин М. Ю., Ачитуев С. А. Оптимизация стратегий развития региона на многокомпонентной модели // Автоматика и телемеханика, 2008, № 3, c. 178-189. f3.2, 3.2
[29] Гурман В. И., Матвеев Г. А., Трушкова Е. А. Социо-эколого-экономическая модель региона в параллельных вычислениях // Управление большими системами.— Вып. 32, 2011, c. 109-130. f3.2
[30] Гурман В. И., Расина И. В. Сложные процессы // Методы решения задач оптимального управления на основе принципа расширения. --Новосибирск : Наука, 1990, c. 84-94. f3.2
[31] Расина И. В. Две формы достаточных условий оптимальности и метод улучшения второго порядка для сложных процессов // Юбилейный сборник научных трудов к 10-летию СИПЭУ. — Иркутск : Издательство Макаров, 2004, c. 180-192. f3.2
[32] Гурман В. И. Улучшение управления, реализующего скользящий режим // Автоматика и телемеханика, 2008, № 3, c. 161-171. f3.2
Рекомендовал к публикации д.т.н. В. И. Гурман
Об авторах:
Владимир Иосифович Гурман
д.т.н., профессор, г.н.с. ИЦСА Института программных систем им. А.К. Айламазяна РАН
e-mail: [email protected]
Ирина Сергеевна Гусева
аспирант Бурятского Государственного Университета специальности 05.13.18 «Математическое моделирование, численные методы и комплексы программ»
e-mail: [email protected]
Образец ссылки на эту публикацию:
В. И. Гурман, И. С. Гусева. Модели управляемых систем, порождающие магистральные решения задач оптимального управления // Программные системы: теория и приложения : электрон. научн. журн. 2013. T. 4, №4(18), с. 107-125.
URL: http://psta.psiras.ru/read/psta2013_4_107-125.pdf
V. I. Gurman, I.S. Guseva. The Control System Models with the Turnpike Solutions In the Optimal Control Problems.
Abstract. It is proposed one of approaches to constructing of complex dynamic system's mathematical model on the base of linear on control model's class. Turnpike solutions are typical for this models when optimal control problem are investigated. The approximate turnpike solutions are used as a first approximation in multistage specification procedure, both the model and the solution of optimization problem. Effectiveness of such approach is shown on an applied modeling and research problem of social-ecology-economic region system. (in Russian)
Key Words and Phrases: Mathematical model, degenerate problem, turnpike solution, relaxed system, zero-overshoot response, ecology-economic problem.