Научная статья на тему 'Решение одной двухкритериальной динамической задачи с учетом рисков I'

Решение одной двухкритериальной динамической задачи с учетом рисков I Текст научной статьи по специальности «Математика»

CC BY
72
21
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РИСКИ / КРИТЕРИИ / СТРАТЕГИИ / ГАРАНТИРОВАННОЕ РЕШЕНИЕ / НЕОПРЕДЕЛЕННОСТЬ

Аннотация научной статьи по математике, автор научной работы — Сорокин Константин Сергеевич

С помощью системы «Maple» для двухкритериальной задачи с линейной динамикой и при неопределенности построен явный вид функций риска и найден явный вид компонент гарантированного по исходам решения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Solution of some bicriterial dynamic problem with account of risks I

Explicit solution with respect to outcome and risks of one multi-criteria linear-quadratic dynamic problem under uncertainty is being found by means of the «Maple» programming system.

Текст научной работы на тему «Решение одной двухкритериальной динамической задачи с учетом рисков I»

УДК 519.816.4:517.977.54

© К. С. Сорокин

[email protected]

РЕШЕНИЕ ОДНОЙ ДВУХКРИТЕРИАЛЬНОЙ ДИНАМИЧЕСКОЙ ЗАДАЧИ С УЧЕТОМ РИСКОВ I 1

Ключевые слова: риски, критерии, стратегии, гарантированное решение, неопределенность.

Abstract. Explicit solution with respect to outcome and risks of one multi-criteria linear-quadratic dynamic problem under uncertainty is being found by means of the fMapleG programming system.

Введение

Новые тенденции в экономике потребовали, чтобы в математических моделях экономической динамики учитывались, во-первых, многокритериальный ^характер© задачи, во-вторых, наличие в системе неопределенного фактора и, наконец, в-третьих, требование оптимального сочетания исходов (значений критериев) и рисков по всем критериям. Такие задачи (без учетов рисков) впервые исследовались в [1; 2] с позиции принципа макси-минной полезности [3]. Однако указанный подход рассчитан на ^катастрофу© и поэтому приводит к ^заниженным© гарантиям, кроме того, он не учитывает риски. Избежать этих недостатков позволяет применение подходящей модификации принципа минимаксного сожаления [4]. Как раз такой подход и использован в статье [5]. В данной работе с помощью системы fMapleG 2 для конкретной двухкритериальной задачи с линейной динамикой и

1Работа поддержана грантом РФФИ (02-01-00612).

2Waterloo Maple, Maple 8.00

при неопределенности построен явный вид функций риска, а во второй части этой работы будет найден явный вид компонент гарантированного по исходам и рискам решения.

1. Постановка задачи

Рассмотрим конкретную двухкритериальную динамическую линейно-квадратичную задачу при неопределенности

<£,и, 2, [МХ],Ъ,и, х0)Ы,2>. (1.1)

В (1.1) управляемая динамическая система Т, описываестся дифференциальным уравнением

х = х + и + х, х(0) = 0, (1.2)

где скалярные х — фазовое пространство, и — управляющее воздействие ЛПР (лица, принимающего решение), х — неопределенный фактор; фиксированы момент $ = 1 окончания процесса управления и начальная позиция (¿о, хо) = (0,0). В (1.1) и далее используются два класса стратегий и неопределенностей.

В первом при построении гарантированного решения задачи (1.1) применяется множество позиционных неопределенностей 2:

2 = [Ъ + х(£, х) |х(£, х) = Ж(£)х + д(£) (1.3)

уж•), д(Ое с[о,$]}

и множество и позиционных стратегий и:

и = [и ^ и(Ь, х) |и(Ь, х) = Р(£)х + р(Ь) (1.4)

ур(•), рОе см}.

Во втором при построении функции риска, используется множество 2г программных неопределенностей :

21 = [Ъг + хЩ|х[£] = х[£] + соб^) Ух[£о] е М1} (1.5)

и множество Uz позиционных контрстратегий Uz :

Uz = {Uz ^ u(t, x, z[t))\u(t, x, z[t)) = P(t)x + p(t)}. (1.6)

В (1.3), (1.4), (1.6) могут применятся любые скалярные непрерывные на [0,1] функции P(t),Q(t),p(t),q(t) —за счет этого и получаются приведенные выше множества; в (1.5) множество Zt образуется за счет всевозможных скалярных величин z[to] € М1. Отметим, что в задаче прогнозирования (или планирования) неопределенностью может являться цена выпускаемой продукции z[t] на некотором промежутке времени [to,tf]. В этом случае диффренциальное уравнение

z = —z + b(t), z[to] € R1

представляет собой модель Эванса установления равновесной це-zt

t

zt

для Zt + z[t] имеет место включенпе Zt С Z.

Процесс принятия решения в задаче (1.1) происходит следующим образом: ЛПР выбирает конкретную стратегию

U ^ u(t, x) = P(t)x + +p(t), U € U.

Независимо от его действий в задаче (1.1) реализуется некоторая конкретная неопределенность

Z € Z, Z ^ z(t, x) = Qt, x)x + q(t).

Затем находится решение x(t) , t € [0,1] уравнения

x x u t, x z t, x +[1 + P(t) + Q(t)]x + \p(t) + q(t)], x(t0) = x0

xt

u t P t x t p t

выбранной ЛПР стратегии и гЩ = Я^)х(Ь) + д(Ь), появившейся в системе независимо от его действий неопределенности. Наконец, на всех возможных тройках (х(1),иЩ,хЩ|£ € [0,1]) определены два критерия, характеризующие качество функционирования управляемой системы Т,:

Л(и,г,£о,хо) =

1

= —х2(1) + / (—2 и?Щ + г2Щ + 2и[£]г[£] }(И,

^и^,^,х0)= (1'8)

1

= —х2(1) + J (— и2Щ + 2г2Щ + 2и[£]х(£) }&.

о

На ^содержательном уровпеб задачей ЛПР является выбор такой стратегии и € Ы, при которой оба критерия принимали бы возможно большие значения, а их функции риска (определены ниже) — возможно меньшие. При этом ЛПР вынужден учитывать возможность реализации любой неопределенности Ъ € 2.

Ы

на Ыг, а 2 — на 2(, происходит аналогичным образом. Отличие лишь в том, что ЛПР выбирает конкретную контрстратегию иг € , одновременно реализуется программная неопределенность , заранее известная ЛПР

(г4 ^ хЩ,и(1, х(1), гЩ) = Р(1)х + р{Ь))

и тогда система (1.7) преобразуется в

х = х + и(1, х, гЩ) = [1 + Р(Щх + р^) + гЩ, х(0) = 0. (1.9)

С помощью решения £ € [0,1], уравнения (1.9) форми-

руются реализации иЩ = и(1,х(1),хЩ) = Р(^р^) + р(1) и на всевозможных тройках {х{1),иЩ,гЩ|£ € [0,1]) заданы функционалы (1.8).

2. Построение функции риска

Для каждого г = 1,2 рассмотрим вспомогательную однокритериальную динамическую линейно-квадратичную задачу при неопределенности

<Е, Ыг, 2*,]*(и* ,г^о,хо)), (2.1)

где Е та же, что и в (1.1), множества Ыг и определены в (1.6) И (1.5) соответственно, критерии 7г(иг, , ¿о, хо) , (г = 1, 2)

заданы в (1.8).

г

жде всего необходимо решить следующую вспомогательную оптимизационную задачу:

Н)

найти контрстратегию Щ € Ыг , удовлетворяющую условию:

шах ,2 4,£сьхо) *(иР , ¿съ хо) ^05 ^о] ? (2-2)

и

при ограничениях (1.2), любых € 2т и всех начальных позициях (¿о, хо) € [0,1) х М1 .

Затем, следуя идеям принципа минимаксного сожаления Се-виджа [4], функция риска Ф%(и по г-му критерию ]

определяется следующим равенством:

Фг(и ,%,г0,ха) = ]%[Ъ ,го,хо] — ]%(и ,Ъ,г$,хо). (2.3)

Она численно оценивает риск (сожаление) ЛПР в том, что при реализации неопределенности он (исходя из наличия не одного, а двух различных критериев) выбирает и использует стра-

(%)

тегию и , а не г'самую хорошую для негоб контрстратегию Щ , удовлетворяющую условию (2.2).

При нахождении из (2.2) используется метод динамического программирования в следующей формулировке.

Введем функции

т, ч ду1 ду1 г

И^1(^х,и, г, V]) = —— + —— (х + и + г) + от дх

+ ——(—х + соб(£)) — ‘¿V? + х2 + 2 их,

И^, X, и, г, У2) = + ^-(х + и + г) +

«4 Г , (2'4)

+ (—г + соб^)) — и + 2г +2 их.

Утверждение 2.1. Пусть существуют

a) функции и^% (Ь, х, г, У%), (г = 1, 2) ,

b) непрерывно дифференциируемые функции У%(Ь,х,г),

г,

1°) при всех (х,г) € М2

У*(1 ,х,г) = —х2,(г = 1,2), (2.5)

2°) для любых (Ь, х, г, У%) € [0,1] х М3 (г = 1, 2) тах Ь, х, и, г, У%) = Ь, х, (Ь, х, г, У),г, У), (2.6)

и

3°) для всех (Ь,х,г) € [0,1] х М2

Ь,х,и % (Ь,х,г,У%( 1,х,г)),г,У1( Ь, х,г))=0, (г = 1,2) (2.7)

4 °) функция и % {Ь,х,г,Уг{ Ь,х,г)) = и(% [Ь,х,г] такова, что

контрстратегия и£г^ ^ Ц% [Ь,х,^ принадлежит Ыг .

(%)

Тогда контрстратегия иг удовлетворяет первому равенству из (2.2) при ограничениях (1.2), где х(Ьо) = хо, любых Ъ4 € 24 и всех (Ьо,хо) € [О, 1) х К .

С помощью этих достаточных условий найдем явный вид контрстратегии и^ • С учетом (2.4), достаточные условия существования Ц% (Ь,х,г,У%) в (2.6) примут вид:

. _ п. ^1 . п и = Л (9*\

ди ! ду2 1гб(г)(*,а:,г,Уг) ^ V* ^¡^)- 1^-®/

Неравенство из (2.8) имеют место, а из равенства в (2.8) получаем

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

и^^,х,г, У\) = и^Ць, х, г, У2) = + х (2.9)

дх дх

Ищем теперь решение (2.7) с граничным условием (2.5) в виде (г = 1,2).

Уí{Ь, х, г) =

= Ь)х2 + 2 3^ Ь)хг + Хг{ Ь)г2 + &( Ь)х + 2^( Ь)г + Ь). (2.10)

Подставляя (2.10), (2.9) в (2.7), (2.5) и приравнивая коэффициенты при х , г2 , хг, х , г и свободные члены, получаем, что (2.7), (2.5) имеют место, если ©ДЬ), ЗДЬ), ХДЬ), Ь), 2^ДЬ), иДЬ) являются решениями системы дифференциальных уравнений

' 01 + 201 + ^©1 = 0, ©1(1) = -1; (2.11а)

31 + + |©1 = 0, 31(1) = 0; (2.116)

Х\ — 2Л”1 + 2^1 + ------- —-—(-1 = 0, = 0;

2 (2-11) ¿¡1 + (1 + t = 0, ^1(1) = 0; (2.11с)

Ш ~т + Х\ соя£ + ^(Зх + 3)^1 = 0, 771(1) = 0;

I

¿1 — г]1 + -£2 = 0, со>1 (1) = 0;

^ 2

' 02 + 202 + (в2 + 1 )2 = 0, ©2(1) = -1;

,

^ X — 2Х2 + 232 + З2 + 2 = 0, Х2(1) = 0;

£2 + (2 + ©2К2 + 32 сояЬ = 0, {г(1) = 0;

Щ - Щ + X СОБЬ + (32 + 1)6 = 0, П2(1) = 0;

—2щсо^Ь + £^ = ^, и2(1) = 0.

Первые уравнения в приведенных выше системах представляют дифференциальные уравнения типа Риккати. Найдя их решения ©ДЬ), Ь € [0, 1], и подставив ©^ = ©ДЬ), (г = 1,2) во второе и

(2.12а)

(2.126)

(2.12)

(2.12с)

четвертое уравнение этих систем, приходим к линейным неоднородным уравнениям с непрерывными коэффициентами относительно Еі(£), &(£), (г = 1,2) . Подставляя решения 0;(£) , Ег(£) , £(£), (і = 1,2) ,в (2.10), (2.9), получаем контрстратегии

11^ -г и^[Ь,х,г] = и^(£, х,г,Уі(£,х,2:)) =

1 (2.13)

= + (“і(0 + Ц*+&(*)]»

и<2) -ь х, г] = и^(г, х, 2, У2(£, х, 2Г)) = 14

[©2 (і) + 1]х + ^2(£)г + &(£)]*

Очевидно включение Є иг , (г = 1,2). По утверждению 2.1 определенные в (2.17) и (2.19) контрстратегии решают задачу (2.2). Далее рассмотрим зависимости основных параметров данной системы от времени £ Є [0,1] и от начального значения ¿[¿о] = ¿о Є [—1,1]. График зависимости решения г(і,го) уравнения і = —2 + собі от і и го приведен на рис. 1.

Рис. 1

График зависимости решения 2о) уравнения

х = х + и^[£, ж, г[Ь}] + гЩ —

[1 + |е1(4)]а + ^[3 + 21(4)М‘] + |й(*). х<1)(0| го) = О

ОТ I И 2Г0 , здесь гЩ = 20) взято из рис. 1, приведен на рис. 2.

Рис. 2

График зависимости решения х^2^(£,2о) уравнения

х = £ + гД2)[г, ж, г [г]] + ^[¿] =

= [2 + 02(0]^ + [1 + Н2(£)Мг] + 6(0» г(2)[0, го] = о

от ^ и го , здесь (г[£] = г(£, го) взято из рис. 1)приведен на рис. 3.

Рис. З

График зависимости реализации контрстратегии и^[Ь, г0), г[£, ¿г0]] = о) из (2.13) от £ и г0 , здесь

г(£,2о) взято из рис. 1, а £^(£, ¿о) взято из рис. 2, приведен па рис. 4.

Рис. 4

График зависимости реализации коитрстратегии ?г(2)[£, а-(1)(£, 2о),ф}2о]] = и^(Мо)

из (2.14) от < и го. здесь гг(£, г0) взято из рис. 1, а х(2)(г,2о) взято из рис. 3. приведен на рис. 5.

Рис. 5

С помощью построенных в (2.13), (2.14) контрстратегий (У* , (г = 1,2) найдем согласно (2.3), (2.2) и (1.8) функции риска по каждому критерию:

Фг (и, Ъ, ¿о, Хо) =

1

I - 01(г)Н1(£)а;Й2(£) + ^[1 - -

о

-0,(%(‘М*) - =!(*)& (*)*М - ^Й(*) + 2«2И - 2иЩг[1]},а

^2(и, 2, ¿0? Хо) =

1

I {[! - @2(0К2(0 - 2®2(0^2(0х(г)г(¿) - Е|я2[г] -

о

-202(г)Ы*Мг) - 2Е2(£)Ы0гМ - Й(0 + ^2М ~ и[г]х(*)}&.

Автор благодарит профессора В. И. Жуковского за постановку задачи и обсуждение работы.

Список литературы

1. Жуковский В. И., Дочев Д. Т. Векторная оптимизация динамических систем. Болгария. Русе: Центр но Математике, 198.1.

2. Zhukovskiy V. I., Salukvadze М. Е. The Vector-Valued Maximin. N.Y. etc.: Academic Press, 1994.

3. Wald A. Contribution to the theory of statistical estimation and testing hypothesis //Annual Math. Statist. 1939. JV* 10. P. 299-326.

4. Savege L.Y. The theory of statistical decision //J. American Statistic Association 1951. №46. P. 55-67.

•5. Жуковский В. И.. Сорокин К. С. Риски и исходы в одной многокритериальной динамической задаче. (В пастоящем сборнике.)

6. Колемаев В. А. Математическая экономика. М.: ЮНИТИ, 2002.

7. Подиновский В. В., Ногин В. Д. Парето-оптимальные решения многокритериальных задач. М.:Наука, 1982.

8. Жуковский В. И. Введение в дифференциальные игры при неопределенности. М.: МНИИПУ, 1997.

9. Понтрягин Л. С. Обыкновенные дифференциальные уравнения М.: ГИФМЛ, 1961.

i Надоели баннеры? Вы всегда можете отключить рекламу.