УДК 519.816.4:517.977.54
© К. С. Сорокин
РЕШЕНИЕ ОДНОЙ ДВУХКРИТЕРИАЛЬНОЙ ДИНАМИЧЕСКОЙ ЗАДАЧИ С УЧЕТОМ РИСКОВ I 1
Ключевые слова: риски, критерии, стратегии, гарантированное решение, неопределенность.
Abstract. Explicit solution with respect to outcome and risks of one multi-criteria linear-quadratic dynamic problem under uncertainty is being found by means of the fMapleG programming system.
Введение
Новые тенденции в экономике потребовали, чтобы в математических моделях экономической динамики учитывались, во-первых, многокритериальный ^характер© задачи, во-вторых, наличие в системе неопределенного фактора и, наконец, в-третьих, требование оптимального сочетания исходов (значений критериев) и рисков по всем критериям. Такие задачи (без учетов рисков) впервые исследовались в [1; 2] с позиции принципа макси-минной полезности [3]. Однако указанный подход рассчитан на ^катастрофу© и поэтому приводит к ^заниженным© гарантиям, кроме того, он не учитывает риски. Избежать этих недостатков позволяет применение подходящей модификации принципа минимаксного сожаления [4]. Как раз такой подход и использован в статье [5]. В данной работе с помощью системы fMapleG 2 для конкретной двухкритериальной задачи с линейной динамикой и
1Работа поддержана грантом РФФИ (02-01-00612).
2Waterloo Maple, Maple 8.00
при неопределенности построен явный вид функций риска, а во второй части этой работы будет найден явный вид компонент гарантированного по исходам и рискам решения.
1. Постановка задачи
Рассмотрим конкретную двухкритериальную динамическую линейно-квадратичную задачу при неопределенности
<£,и, 2, [МХ],Ъ,и, х0)Ы,2>. (1.1)
В (1.1) управляемая динамическая система Т, описываестся дифференциальным уравнением
х = х + и + х, х(0) = 0, (1.2)
где скалярные х — фазовое пространство, и — управляющее воздействие ЛПР (лица, принимающего решение), х — неопределенный фактор; фиксированы момент $ = 1 окончания процесса управления и начальная позиция (¿о, хо) = (0,0). В (1.1) и далее используются два класса стратегий и неопределенностей.
В первом при построении гарантированного решения задачи (1.1) применяется множество позиционных неопределенностей 2:
2 = [Ъ + х(£, х) |х(£, х) = Ж(£)х + д(£) (1.3)
уж•), д(Ое с[о,$]}
и множество и позиционных стратегий и:
и = [и ^ и(Ь, х) |и(Ь, х) = Р(£)х + р(Ь) (1.4)
ур(•), рОе см}.
Во втором при построении функции риска, используется множество 2г программных неопределенностей :
21 = [Ъг + хЩ|х[£] = х[£] + соб^) Ух[£о] е М1} (1.5)
и множество Uz позиционных контрстратегий Uz :
Uz = {Uz ^ u(t, x, z[t))\u(t, x, z[t)) = P(t)x + p(t)}. (1.6)
В (1.3), (1.4), (1.6) могут применятся любые скалярные непрерывные на [0,1] функции P(t),Q(t),p(t),q(t) —за счет этого и получаются приведенные выше множества; в (1.5) множество Zt образуется за счет всевозможных скалярных величин z[to] € М1. Отметим, что в задаче прогнозирования (или планирования) неопределенностью может являться цена выпускаемой продукции z[t] на некотором промежутке времени [to,tf]. В этом случае диффренциальное уравнение
z = —z + b(t), z[to] € R1
представляет собой модель Эванса установления равновесной це-zt
t
zt
для Zt + z[t] имеет место включенпе Zt С Z.
Процесс принятия решения в задаче (1.1) происходит следующим образом: ЛПР выбирает конкретную стратегию
U ^ u(t, x) = P(t)x + +p(t), U € U.
Независимо от его действий в задаче (1.1) реализуется некоторая конкретная неопределенность
Z € Z, Z ^ z(t, x) = Qt, x)x + q(t).
Затем находится решение x(t) , t € [0,1] уравнения
x x u t, x z t, x +[1 + P(t) + Q(t)]x + \p(t) + q(t)], x(t0) = x0
xt
u t P t x t p t
выбранной ЛПР стратегии и гЩ = Я^)х(Ь) + д(Ь), появившейся в системе независимо от его действий неопределенности. Наконец, на всех возможных тройках (х(1),иЩ,хЩ|£ € [0,1]) определены два критерия, характеризующие качество функционирования управляемой системы Т,:
Л(и,г,£о,хо) =
1
= —х2(1) + / (—2 и?Щ + г2Щ + 2и[£]г[£] }(И,
^и^,^,х0)= (1'8)
1
= —х2(1) + J (— и2Щ + 2г2Щ + 2и[£]х(£) }&.
о
На ^содержательном уровпеб задачей ЛПР является выбор такой стратегии и € Ы, при которой оба критерия принимали бы возможно большие значения, а их функции риска (определены ниже) — возможно меньшие. При этом ЛПР вынужден учитывать возможность реализации любой неопределенности Ъ € 2.
Ы
на Ыг, а 2 — на 2(, происходит аналогичным образом. Отличие лишь в том, что ЛПР выбирает конкретную контрстратегию иг € , одновременно реализуется программная неопределенность , заранее известная ЛПР
(г4 ^ хЩ,и(1, х(1), гЩ) = Р(1)х + р{Ь))
и тогда система (1.7) преобразуется в
х = х + и(1, х, гЩ) = [1 + Р(Щх + р^) + гЩ, х(0) = 0. (1.9)
С помощью решения £ € [0,1], уравнения (1.9) форми-
руются реализации иЩ = и(1,х(1),хЩ) = Р(^р^) + р(1) и на всевозможных тройках {х{1),иЩ,гЩ|£ € [0,1]) заданы функционалы (1.8).
2. Построение функции риска
Для каждого г = 1,2 рассмотрим вспомогательную однокритериальную динамическую линейно-квадратичную задачу при неопределенности
<Е, Ыг, 2*,]*(и* ,г^о,хо)), (2.1)
где Е та же, что и в (1.1), множества Ыг и определены в (1.6) И (1.5) соответственно, критерии 7г(иг, , ¿о, хо) , (г = 1, 2)
заданы в (1.8).
г
жде всего необходимо решить следующую вспомогательную оптимизационную задачу:
Н)
найти контрстратегию Щ € Ыг , удовлетворяющую условию:
шах ,2 4,£сьхо) *(иР , ¿съ хо) ^05 ^о] ? (2-2)
и
при ограничениях (1.2), любых € 2т и всех начальных позициях (¿о, хо) € [0,1) х М1 .
Затем, следуя идеям принципа минимаксного сожаления Се-виджа [4], функция риска Ф%(и по г-му критерию ]
определяется следующим равенством:
Фг(и ,%,г0,ха) = ]%[Ъ ,го,хо] — ]%(и ,Ъ,г$,хо). (2.3)
Она численно оценивает риск (сожаление) ЛПР в том, что при реализации неопределенности он (исходя из наличия не одного, а двух различных критериев) выбирает и использует стра-
(%)
тегию и , а не г'самую хорошую для негоб контрстратегию Щ , удовлетворяющую условию (2.2).
При нахождении из (2.2) используется метод динамического программирования в следующей формулировке.
Введем функции
т, ч ду1 ду1 г
И^1(^х,и, г, V]) = —— + —— (х + и + г) + от дх
+ ——(—х + соб(£)) — ‘¿V? + х2 + 2 их,
И^, X, и, г, У2) = + ^-(х + и + г) +
«4 Г , (2'4)
+ (—г + соб^)) — и + 2г +2 их.
Утверждение 2.1. Пусть существуют
a) функции и^% (Ь, х, г, У%), (г = 1, 2) ,
b) непрерывно дифференциируемые функции У%(Ь,х,г),
г,
1°) при всех (х,г) € М2
У*(1 ,х,г) = —х2,(г = 1,2), (2.5)
2°) для любых (Ь, х, г, У%) € [0,1] х М3 (г = 1, 2) тах Ь, х, и, г, У%) = Ь, х, (Ь, х, г, У),г, У), (2.6)
и
3°) для всех (Ь,х,г) € [0,1] х М2
Ь,х,и % (Ь,х,г,У%( 1,х,г)),г,У1( Ь, х,г))=0, (г = 1,2) (2.7)
4 °) функция и % {Ь,х,г,Уг{ Ь,х,г)) = и(% [Ь,х,г] такова, что
контрстратегия и£г^ ^ Ц% [Ь,х,^ принадлежит Ыг .
(%)
Тогда контрстратегия иг удовлетворяет первому равенству из (2.2) при ограничениях (1.2), где х(Ьо) = хо, любых Ъ4 € 24 и всех (Ьо,хо) € [О, 1) х К .
С помощью этих достаточных условий найдем явный вид контрстратегии и^ • С учетом (2.4), достаточные условия существования Ц% (Ь,х,г,У%) в (2.6) примут вид:
. _ п. ^1 . п и = Л (9*\
ди ! ду2 1гб(г)(*,а:,г,Уг) ^ V* ^¡^)- 1^-®/
Неравенство из (2.8) имеют место, а из равенства в (2.8) получаем
и^^,х,г, У\) = и^Ць, х, г, У2) = + х (2.9)
дх дх
Ищем теперь решение (2.7) с граничным условием (2.5) в виде (г = 1,2).
Уí{Ь, х, г) =
= Ь)х2 + 2 3^ Ь)хг + Хг{ Ь)г2 + &( Ь)х + 2^( Ь)г + Ь). (2.10)
Подставляя (2.10), (2.9) в (2.7), (2.5) и приравнивая коэффициенты при х , г2 , хг, х , г и свободные члены, получаем, что (2.7), (2.5) имеют место, если ©ДЬ), ЗДЬ), ХДЬ), Ь), 2^ДЬ), иДЬ) являются решениями системы дифференциальных уравнений
' 01 + 201 + ^©1 = 0, ©1(1) = -1; (2.11а)
31 + + |©1 = 0, 31(1) = 0; (2.116)
Х\ — 2Л”1 + 2^1 + ------- —-—(-1 = 0, = 0;
2 (2-11) ¿¡1 + (1 + t = 0, ^1(1) = 0; (2.11с)
Ш ~т + Х\ соя£ + ^(Зх + 3)^1 = 0, 771(1) = 0;
I
¿1 — г]1 + -£2 = 0, со>1 (1) = 0;
^ 2
' 02 + 202 + (в2 + 1 )2 = 0, ©2(1) = -1;
,
^ X — 2Х2 + 232 + З2 + 2 = 0, Х2(1) = 0;
£2 + (2 + ©2К2 + 32 сояЬ = 0, {г(1) = 0;
Щ - Щ + X СОБЬ + (32 + 1)6 = 0, П2(1) = 0;
—2щсо^Ь + £^ = ^, и2(1) = 0.
Первые уравнения в приведенных выше системах представляют дифференциальные уравнения типа Риккати. Найдя их решения ©ДЬ), Ь € [0, 1], и подставив ©^ = ©ДЬ), (г = 1,2) во второе и
(2.12а)
(2.126)
(2.12)
(2.12с)
четвертое уравнение этих систем, приходим к линейным неоднородным уравнениям с непрерывными коэффициентами относительно Еі(£), &(£), (г = 1,2) . Подставляя решения 0;(£) , Ег(£) , £(£), (і = 1,2) ,в (2.10), (2.9), получаем контрстратегии
11^ -г и^[Ь,х,г] = и^(£, х,г,Уі(£,х,2:)) =
1 (2.13)
= + (“і(0 + Ц*+&(*)]»
и<2) -ь х, г] = и^(г, х, 2, У2(£, х, 2Г)) = 14
[©2 (і) + 1]х + ^2(£)г + &(£)]*
Очевидно включение Є иг , (г = 1,2). По утверждению 2.1 определенные в (2.17) и (2.19) контрстратегии решают задачу (2.2). Далее рассмотрим зависимости основных параметров данной системы от времени £ Є [0,1] и от начального значения ¿[¿о] = ¿о Є [—1,1]. График зависимости решения г(і,го) уравнения і = —2 + собі от і и го приведен на рис. 1.
Рис. 1
График зависимости решения 2о) уравнения
х = х + и^[£, ж, г[Ь}] + гЩ —
[1 + |е1(4)]а + ^[3 + 21(4)М‘] + |й(*). х<1)(0| го) = О
ОТ I И 2Г0 , здесь гЩ = 20) взято из рис. 1, приведен на рис. 2.
Рис. 2
График зависимости решения х^2^(£,2о) уравнения
х = £ + гД2)[г, ж, г [г]] + ^[¿] =
= [2 + 02(0]^ + [1 + Н2(£)Мг] + 6(0» г(2)[0, го] = о
от ^ и го , здесь (г[£] = г(£, го) взято из рис. 1)приведен на рис. 3.
Рис. З
График зависимости реализации контрстратегии и^[Ь, г0), г[£, ¿г0]] = о) из (2.13) от £ и г0 , здесь
г(£,2о) взято из рис. 1, а £^(£, ¿о) взято из рис. 2, приведен па рис. 4.
Рис. 4
График зависимости реализации коитрстратегии ?г(2)[£, а-(1)(£, 2о),ф}2о]] = и^(Мо)
из (2.14) от < и го. здесь гг(£, г0) взято из рис. 1, а х(2)(г,2о) взято из рис. 3. приведен на рис. 5.
Рис. 5
С помощью построенных в (2.13), (2.14) контрстратегий (У* , (г = 1,2) найдем согласно (2.3), (2.2) и (1.8) функции риска по каждому критерию:
Фг (и, Ъ, ¿о, Хо) =
1
I - 01(г)Н1(£)а;Й2(£) + ^[1 - -
о
-0,(%(‘М*) - =!(*)& (*)*М - ^Й(*) + 2«2И - 2иЩг[1]},а
^2(и, 2, ¿0? Хо) =
1
I {[! - @2(0К2(0 - 2®2(0^2(0х(г)г(¿) - Е|я2[г] -
о
-202(г)Ы*Мг) - 2Е2(£)Ы0гМ - Й(0 + ^2М ~ и[г]х(*)}&.
Автор благодарит профессора В. И. Жуковского за постановку задачи и обсуждение работы.
Список литературы
1. Жуковский В. И., Дочев Д. Т. Векторная оптимизация динамических систем. Болгария. Русе: Центр но Математике, 198.1.
2. Zhukovskiy V. I., Salukvadze М. Е. The Vector-Valued Maximin. N.Y. etc.: Academic Press, 1994.
3. Wald A. Contribution to the theory of statistical estimation and testing hypothesis //Annual Math. Statist. 1939. JV* 10. P. 299-326.
4. Savege L.Y. The theory of statistical decision //J. American Statistic Association 1951. №46. P. 55-67.
•5. Жуковский В. И.. Сорокин К. С. Риски и исходы в одной многокритериальной динамической задаче. (В пастоящем сборнике.)
6. Колемаев В. А. Математическая экономика. М.: ЮНИТИ, 2002.
7. Подиновский В. В., Ногин В. Д. Парето-оптимальные решения многокритериальных задач. М.:Наука, 1982.
8. Жуковский В. И. Введение в дифференциальные игры при неопределенности. М.: МНИИПУ, 1997.
9. Понтрягин Л. С. Обыкновенные дифференциальные уравнения М.: ГИФМЛ, 1961.