Математическое моделирование экономико-экологической системы региона с применением теории динамических игр с природой

Самойленко Наталья Сергеевна; Мешечкин Владимир Викторович

УДК 519.83

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ ЭКОНОМИКО-ЭКОЛОГИЧЕСКОЙ СИСТЕМЫ РЕГИОНА С ПРИМЕНЕНИЕМ ТЕОРИИ ДИНАМИЧЕСКИХ ИГР С ПРИРОДОЙ

Н. С. Самойленко, В. В. Мешечкин

MATHEMATICAL MODELING OF THE REGIONAL ECONOMIC-ECOLOGICAL SYSTEM USING THE THEORY OF DYNAMICAL GAMES WITH NATURE

N. S. Samoylenko, V. V. Meshechkin

Статья посвящена исследованию приложений динамических игр с природой как нового класса игровых моделей, предложенного в работах профессора Кемеровского государственного университета Н. Н. Данилова. В виде динамической игры с природой построена математическая модель экономико-экологической системы региона, проведен ее анализ и выполнены расчеты оптимальных (в смысле критериев Вальда, Гурвица, Сэвиджа) стратегий.

The article is devoted to researching applications for dynamical games with nature as a new class of game models proposed in the works of professor N. N. Danilov, Kemerovo State University. Mathematical model of a regional economic-ecological system as a dynamical game with nature is built, its analysis is carried out and calculations of optimal (in terms of Wald, Hurwicz, Savage criteria) strategies are made.

Ключевые слова: математическое моделирование, теория игр, экономико-экологические системы.

Keywords: mathematical modeling, game theory, economic-ecological systems.

Введение

Теория игр - совокупность математических методов анализа и оценки конфликтных ситуаций - имеет широкое применение в вопросах бизнеса в условиях конкуренции, в планировании военных операций и управлении военной техникой, в самых разнообразных задачах организации народного хозяйства и управления производством. Теория игр помогает выбрать лучшие стратегии с учетом представлений о других участниках, их ресурсах и их возможных поступках [1].

В последнее время наблюдается стремительное повышение интереса к теории игр и значительное возрастание ее роли. Одним из бурно развивающихся разделов теории игр являются динамические игры, с помощью которых удается создавать адекватные модели для исследования практических задач из области экологии, экономики, менеджмента, международных отношений, охраны окружающей среды и др. Это обусловливается необходимостью учитывать временной аспект в многочисленных взаимодействиях между субъектами: фирмы, работающие на одном и том же рынке, знают, что они встретятся снова в последующих периодах, из аналогичного предположения исходит правительство, определяя свою внешнеторговую политику. Кроме того, многие экономические параметры, такие как инвестиции в производственные мощности, расходы на рекламу и пр., оказывают свое влияние на предложение и спрос лишь в будущем. Поэтому методы теории динамических игр все чаще применяются при анализе вопросов стратегического поведения в сложных социально-экономических и экологических системах, развивающихся во времени (см., напр., [2]). Сама теория динамических игр тоже не стоит на месте, в ней появляются новые разделы, позволяющие описывать различные варианты динамического взаимодействия игроков, и новые методы для их анализа. К таким новым разделам можно отнести динамические матричные игры, динамические игры с природой и динамические биматричные игры,

предложенные профессором математического факультета Кемеровского государственного университета Н. Н. Даниловым [3; 4].

Данная работа посвящена применению теории динамических игр с природой для моделирования деятельности производственного сектора региона как экономико-экологической системы, в которой учитывается как экономическая выгода от производственной деятельности, так и ущерб от загрязнения окружающей среды. В основу положена методология статьи [4], где автор предложил понятие динамических игр с природой, введя в модель игры с природой фактор времени, определил классы допустимых стратегий и проанализировал динамические аналоги принципов оптимальности Вальда, Гурвица, Сэвиджа.

Построение математической модели эконо-миико-экологической системы региона в виде динамической игры с природой

Рассматривается производственный сектор региона, выпускающий некоторую продукцию. При этом в процессе производства образуются вредные вещества, которые выбрасываются в окружающую среду и в возмещение ущерба от которых производители вынуждены уплачивать штрафы. Тогда целью производственного сектора будет максимизация экономической прибыли с учетом выплат за загрязнение природной среды.

Для получения математической модели производственного сектора построим динамическую модель игры с природой, применив терминологию и аппарат работы [4].

Исследуемая система сознательно будет рассматриваться в упрощенной форме, с одной стороны, удобной для представления в матричном виде и для интерпретации, а с другой, - в достаточной мере отражающей специфику изучаемого объекта.

Введем обозначения для построения модели.

t - параметр времени, соответствующий году и принимающий дискретные значения (t = 0,1,..., Т).

К^) - величина основных фондов производственного сектора в момент времени t.

I (^ - инвестиции (валовые капитальные вложения) в момент t. Их величина для производственного сектора в каждый момент ограничена сверху максимальным значением ).

Валовые капитальные вложения идут на приращение основных фондов К(Г) (чистые капитальные вложения) и на замещение изношенного капитала, то есть на восстановление изношенной части основных производственных фондов (амортизационные отчисления).

Тогда, зная размер инвестиций, можно построить уравнение динамики основных фондов:

К^ +1) = I(^ + К(0 ~/и(0 • К(0, (1)

где /и(11) - темп изнашивания основных фондов (за год t из строя выходит /и^) • К(t) единиц основных фондов) [5].

В начальный момент ? = 0 заданы основные фонды производственного сектора:

К(0) = К0. (2)

Условия (1), (2) определяют динамику основных фондов на отрезке [0, Т].

Через F : Я1 ^ Я1 обозначим функцию, описывающую производственные возможности региона в зависимости от размера основных фондов. Величина F(К^)) представляет собой объем выпуска производственного сектора, если основные фонды равны

к (0.

Для определенности будем считать, что объем производства в каждый момент t прямо пропорционален основным фондам, то есть функция F имеет следующий вид:

F(К^)) = у«) • КЦ). (3)

Обозначим через р цену выпускаемого продукта, тогда доход производственного сектора в момент t будет равен р • F(К ^)).

При этом производственный сектор будет нести производственные издержки С (К ^)), величина которых определяется формулой:

С(К (0) = &•№ • F (К (t)), (4)

где ю - цена затрат, а ^(t) - величина затрат на единицу выпуска в момент времени t.

Обозначим 0(К ^)) сумму штрафов, назначаемых

за выбросы загрязняющих веществ в окружающую среду. Будем предполагать, что они пропорциональны объему производства:

О (К ^)) = 5 •а^) • F (К ^)), (5)

где а(^ - величина загрязнения на единицу выпуска,

5 - цена за выброс одной единицы загрязнителя.

Итоговой характеристикой для производственного сектора, оценивающей эффективность его работы, будет суммарная прибыль за весь период [0, Т].

Прибыль производственного сектора в каждый момент t определяется не только доходом от реализации продукции, но и производственными издержками, а также издержками, вызванными загрязнением окру-

жающей среды:

П(K (t)) = p • F(K(t)) - С(K (t)) - G(K(t)) . (6)

Подставляя (4) и (5) в (6), получаем:

П(K (t)) = p • F(K(t)) --a • P{t) • F(K(t)) - S • a(t) • F(K(t)) =

= (p -a • P(t) -S • a(t)) • (F(K(t))), t = 1,...,T.

Тогда суммарная прибыль за весь период времени, которую и будет максимизировать производственный сектор, равна

X (p -a •Pit) - S • a(t)) • (F (K (t))).

t=1

На размер прибыли производственного сектора будет влиять его стратегия при выборе объема выпускаемой продукции, а также природоохранное законодательство, политика администрации региона и территориальных органов Министерства природных ресурсов и экологии Российской Федерации в области экологического регулирования.

В настоящее время величина и порядок выплаты штрафов за возмещение ущерба от негативного воздействия на природу в России определяются Законом «Об охране окружающей природной среды» [6]. В данной статье примем в качестве допущения, что величина штрафа за единицу выброса заранее производственному сектору не известна и может принимать значения в некотором диапазоне [0, Smax], где Smax -максимально допустимая величина штрафа за единицу выбросов. Такое предположение приводит к возникновению ситуации неопределенности и позволяет построить модель в виде игры с природой, где 1-м игроком является производственный сектор, который распоряжается инвестициями I(t), а 2-м игроком будет выступать «природа» как состояние природоохранного законодательства, в условиях которого функционирует производственный сектор, со стратегиями, соответствующими устанавливаемым значениям штрафа на единицу загрязнения окружающей среды. При этом считается, что 2-й игрок пассивный и характеризуется тем или иным состоянием [7].

Интервал возможных значений штрафов [0, Smax] разобьем дискретными точками S1 (t) = 0 , S2 (t), S3 (t)

, ..., Sn (t) = Smax, которые и будут стратегиями «природы» в каждый момент t.

Аналогично, учитывая максимальный размер инвестиций Imax(t) для каждого момента времени t, произведем дискретизацию диапазона [0,Imax(t)]: I1(t) = 0,

I2(t ), I3(t), ..., Im(t) = Imax(t). Э™ величины будут

стратегиями 1-го игрока - производственного сектора.

При выборе производственным сектором стратегии I (t) на следующем шаге он перейдет в состояние K(t +1) = I,, (t) + (1 - ^(t)) • K(t). Если при этом «природа» окажется в состоянии Sj (t), то прибыль производственного сектора будет равна:

Пу (K (t)) = П j (K (t), S. (t), L (t)) = = p • F (K (t)) - a • P(t) • F (K(t)) -

- S. (t) a(t )• F (K (t)).

Перебирая все возможные значения ,, ., получаем матрицу значений П. (К (Г)), которая является матрицей выигрыша игрока 1 для данного момента времени Г:

СПИ(К(0) П12(К(Г)) ... П,(К(Г))^

ПК)) па(К(г)) ... п,(К(Г))

А(К(Г)) =

.(7)

ЧПЛ1(К(Г)) ПШ2(К(Г)) ... п,(к(г))]

Изменяя Г от 1 до Т, получаем последовательность игровых матриц, в которых стратегии «природы» не известны. Для каждого Г эти матрицы определяют игру с природой, в которой производственный сектор вынужден выбирать свою стратегию выпуска продукции с учетом состояний «природы».

Записанные соотношения формируют модель производственного сектора на отрезке [0, Т], в которой основные фонды играют роль фазовых переменных, характеризующих состояние производственного сектора в каждый момент времени, инвестиции являются управляющими переменными, а суммарная прибыль - критерием качества. Однако при этом принятие решения производственным сектором происходит в условиях неопределенности, так как величины штрафов в конкретные моменты ему не известны.

Поэтому построенную модель будем рассматривать как динамическую игру с природой и для ее решения используем соответствующие игровые принципы оптимальности (Вальда, Гурвица, Сэвиджа), распространив их на динамику.

Формализация игровых принципов оптимальности для динамической игры с природой

С помощью системы (1) - (2) функционирование производственного сектора можно представить следующим образом: в состоянии К 0 под действием выбранных в момент Г = 0 управлений 11 (0) производственный сектор переходит в новое состояние К(1) = I,.(0) + (1 — и(0)) •К(0). Если при этом величина штрафов (стратегия «природы») окажется равной

5. (0), то прибыль производственного сектора будет равна

П (К(1)) = (р —ю 3(1) — SJ (0) • а(1)) • ^(К(1))).

Под влиянием выбранных в состоянии К(1) управлений производственный сектор переходит в новое состояние К(2) = I,. (1) + (1 — и(1)) • К(1), получая при этом прибыль

П I (К (2)) = (р — /3(2) — Sj (1) • а(2)) • ^ (К (2)))

и так далее. На последнем шаге (Г = Т — 1), находясь в состоянии К(Т — 1), под действием выбранных управлений производственный сектор переходит в состояние К (Т) = I, (Т — 1) + (1 — и(Т — 1)) • К (Т — 1) с прибылью:

П I (К(Т)) = (р — ю • 3(Т) — 5. (Т — 1) • а(Т)) • ^(К(Т))).

В результате получается хронологически упорядоченная последовательность значений основных фондов производственного сектора

К (•) = {К0, К (1),..., К (Т)}, которую будем называть траекторией системы (1) -

(2), соответствующей последовательности управлений

I (•) = {I ,(0), I .(1),..., I. — (Т — 1)}.

Стратегии «природы» 5. (Г) также можно объединить в последовательность, получив траекторию

5 (•) = {^(0)5. (1),...,5.—1(Т — 1)}.

Построенные последовательности стратегий будут являться допустимыми управлениями 1-го и 2-го игроков соответственно.

Цель игрока 1 представим как максимизацию значения следующего функционала:

F (К )(•), 1(-), 8(-)) = £ П1[_1 и( К (Г) =

1=1

= § (р — ю • 3(Г) — Б. (Г) • а (Г)) • ^ (К (Г))),

г=0

где I(•) и 5(•) - последовательности стратегий игроков, выбираемых ими в играх с природой с матрицами А(К (Г)), Г = 1,..., Т .

Используя формализацию работы [4], определим классы допустимых стратегий игроков в рассматриваемой модели.

Множество всех стратегий игроков 1 и 2 обозначим символами Ф: и Ф5 соответственно.

Совокупность

Г (К0, Т) = (£ (К0, Т); ФI, Ф 5; ^ , (8)

где £ (К0, Т) - символическое обозначение системы

(1) - (2), назовем динамической игрой с природой.

Процесс управления производственным сектором с помощью модели (8) можно представить следующим образом. В начальном состоянии К 0 игроки выбирают некоторые стратегии

ф,(•) = {I,(0),I.(1),...,— (Т — 1)} е ФI,

фЕ(•) = {5. (0)5 (1),..,5/т—1 (Т — 1)} е ФЕ , которые порождают траекторию

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

К (•) = К (., К0, ф, (•), ф3 (•)) = {К0, К (),..., К (Т)}.

Во всех точках траектории К(•) (кроме К0) заданы игры с природой с матрицами вида (7) для Г = 1,..., Т . Пары стратегий (1.0 (0), 5.0 (0)), ...,

(^ (Т —1), 1 (Т -1)) определяют выигрыши

П,0,л(К (1)^ ..., П.Т—1 * м(К (Т ))

первого игрока. Следовательно, при выборе управлений (ф7 ( •), ф5 ( •)) = (I ( •), 5 ( •)) выигрыш первого игрока равен величине

F(К0фОф (•)) = F(К(•),I(•),5(•)) = £ П.. (К(Г)).

Г=1

Для построения принципов оптимального выбора стратегий игроком 1 в динамической игре (8) используем приведенные в [4] определения.

1. Каждой траектории К (•) поставим в соответст-

Т

вие число ¥в (К ( • )) = £ тах шт П Г (К (Г)),

Г= и =1,..,т],^ =1,...,п

которое будет называться ценой Вальда для траектории К (•).

Определение 1. Стратегия ф^Ое ФI называется

оптимальной по Вальду стратегией 1-го игрока в игре которое назовем ценой Гурвица для траектории К(•). (8), если

min VB(K(•,K0,I*(•),S(•))) =

S ОєФ

max min VB (K(•, K0, I(•), S(•))),

I (Оє^ S(ОєФ

Определение 2. Стратегия ф1 (•) е Ф1 называется оптимальной по Гурвицу стратегией 1-го игрока в игре (8), если

шт Уг (К(•, К0, I*(•), 5(•))) =

5 (-)еФ2

где I (•) - управление, входящее в состав стратегии

&*(•) •

_* . .

Критерием Вальда, как правило, руководствуется где I (•) - управление, входящее в состав стратегии

= Vr (K(•, K^I(•), S(•))),

I (ОєФ! S(•)єФ2

при выборе рисковых решений в условиях неопределенности субъект, не склонный к риску или рассматривающий возможные ситуации как пессимист.

2. Каждой траектории К (•) поставим в соответствие число

(K(л» = | max

t=lи

Я min Пі (K(t)) +

jt - =1,...,n И’Л-1

+(1- Я) miix П. l(K(t))

jt-l =1.....n t -1 t-1

О <Я< 1,

f maxП ll(K(t))- Піі(K(t))

4-1 1

miax П^Д K (t))- П2і( K (t))

ф(о.

Критерий Гурвица позволяет руководствоваться при выборе рискового решения в условиях неопределенности некоторым средним результатом эффективности, находящимся между оптимистическим и пессимистическим значениями.

3. Наряду с матрицей (7) в состоянии К (Г) введем в рассмотрение матрицу риска:

R(K (t)) =| |rt-1 jt-l(K (t ))||:

miaxП ll(K(t))- Пml (K(t))

V .t-l

max П ^ (K (t))- Піи(K (t))

miax Пип (K (t))- П2и( K (t))

max ПП. ln (K (t))- Пт (K (t))

(9)

Каждой траектории K (•) поставим в соответствие

T

число Vc (K (•)) = y min max rt (K (t)), которое

" it-, =l,...,m jt-, =1,...,n t-1 ■jt-1

назовем оценкой риска по Сэвиджу для траектории K (•).

Определение 3. Стратегия (^(а Ф1 называется оптимальной по Сэвиджу стратегией 1-го игрока в игре (8), если

max V(K(-,K,I*(•),S(•))) =

S(Oe0S

= nninniax VC (K(s K0, I (•), SQ)),

I (-)аф S(•)a<pS

где I (•) - управление, входящее в состав стратегии .

Критерий Сэвиджа используется при выборе рисковых решений в условиях неопределенности, как правило, субъектами, не склонными к риску.

Нахождение оптимальных траекторий в построенной динамической игре с природой

Рассмотрим последовательно функционирование производственного сектора в исследуемой модели.

В состоянии K0 под действием выбранного в момент t = 0 управления I (0) производственный сектор переходит в новое состояние:

K(1) = I(0) + (1- М(0)) • K(0).

Под влиянием выбранных в состоянии K(1) управлений производственный сектор переходит в состояние

К (2) = I (1) + (1 — и(1)) • К (1) = I (1) + (1 — и(1)) • I (0) +

+(1 — и(1)) • (1 — и(0)) • К (0).

Аналогично, на следующем шаге осуществляется переход в состояние

К (3) = I (2) + (1 — и(2)) • К (2) =

= I (2) + (1 — и(2)) • I (1) +

+(1 — и(2)) • (1 — и(1)) • I (0) +

+(1 — и(2)) • (1 — и(1)) • (1 — и(0)) • К (0), и так далее.

Из (3) - (5) следует, что производственные издержки С (К (Г)) должны вычисляться по формуле:

С (К (Г )) =ю3(Г) •у (Г) • К (Г),

а сумма штрафов О (К (Г)), назначаемых за выбросы

загрязняющих веществ в окружающую среду, - по формуле:

О (К (Г )) = 5 (Г) а(Г) у (Г) • К (Г).

Если в момент времени Г = 0 величина штрафов (стратегия «природы») окажется равной 5(0), то прибыль производственного сектора для Г = 1 будет равна: П (К (1)) = (I (0) + (1 — и(0)) • К (0)) •

•у(0) • (р — ю-3(1) — 5 (0) • а(1)).

Аналогично, в состоянии К(2) игрок 1 получает прибыль:

П (К (2)) = (I (1) + (1 — и(1)) • I, (0) +

+(1 — и(1)) • (1 — и(0)) • К(0)) •уЦ) •

•( р — ю-3(2) — 5 (1) а(2)).

В состоянии К (3) игрок 1 получает прибыль:

П (К (3)) = (I (2) + (1 — и(2))-1 (1) +

+(1 — и(2)Н1 — и(1)> I (0) +

+(1 — и(2)) • (1 — и(1)) • (1 — и(0)) • К (0)) • у (2) •

• (р — ю3(3) — 5 (2) • а(3)).

Остановимся пока на этом состоянии и зафиксируем индексами .Г , .Г номера выбиравшихся на отрезке времени [0, 3] стратегий. Тогда суммарная прибыль игрока 1 на этом промежутке вычисляется по следующей формуле:

£ П—,,(К(Г)) = 10 (0) • (Г(0> (р—ю 3(1)—50 (0) • а(1))) +

Г=1

+ ((1 — и(1)) • у(1) • (р — Ю 3(2) — ^ (1) • а(2))) + +((1 — и(2)) • (1 — ()) • У(2) • (р—ю 3(3) — ^ (2) • а(3) + +

+14(1)‘

7(1)- (р -0-3(2) - Б,^1) -«(2)) + ^ (1 -^(2))-(1 -^(1)) -Г(2). Л

-(р -а 3(3) -Б,2(2) .«(3))

+

V V

/ у

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

+1,2 (2) ■ р2) • (р - а 3(3) - ^.2 (2) - «(3))) +

+К(0) ■ ((1 - М0)) ■ р - а 3(1) - (0) ■ «(1)+ К0) +

+(1 - ^(1)) ■ (1 - М0)) ■ 7(1) ■ р - а 3(2) - Б. (1) ■ «(2)) +

+(1 -М2))-(1 -^(1))-(1 -^(0))- '

■ 7(2)- (р -а 3(3) -Б.2(2) -«(3)),

где у(ґ) - коэффициент пропорциональности между основными фондами и объемом выпуска в (3).

Разобьем полученную формулу на части, выделив в ней стратегии природы Б, (ґ) и производственного

сектора I (ґ) на каждый момент ґ. При этом получим следующие выражения для отдельных компонент:

Н , (К (1)) = I (0) ■ (7(0) ■ (р -о 3(1) - Б. (0) ■ «(1))) +

+К(0) ■ (1 - М0)) • р -0-3(1) - Б. (0) ■ «(1)) 7(0),

(10)

Н , (К (2)) = 1.(0)

(1-^(1)}-

7(1) -р -ю-3(2) - Б. (1) -«(2)) +1 (1) - р) • (Р - а 3(2) - Б, (1) - «(2))) ^(1-^(1))(1 -М0))-

-(р-о-3(2) - Б, (1)-«(2))-7(1)

+К(0) ■

)+

Л

(11)

Н , (К(3)) = I: (0) -

(1 -М2))-(1 -^(1))-

(12)

•7(2) • (р — ю(3) — 5. (2) а(3)+

+!** (1) • (7(2) • ( — ю 3(3)—5. (2) • а(3) + (1 — и(2))) -

I , (2) • (у(2) • (р — ю 3(3) — 5. (2) • а(3))) +

С(1 — и(2))-(1 — ^(1))(^—^(0)) ^

+К (0) • , , ,

V •( — ю3(3) — 5. (2) а(3)) • 7(2))

где I* (Г) - оптимальная стратегия, выбранная игроком 1 в момент времени Г.

Преобразуем (10) - (12), переписав эти выражения следующим образом:

Н . (К (1)) = 7(0) • (I, (0)+К (0) • (1 — и0))) •

•(р — 0-3(1) — 5. (0) • а(1)),

Н . (К (2)) = 7(1) • (I* (0) • (1 — К)) +1, (1) +

+К (0) • (1 — и(1)) • (1 — и(0))) • (р — ю 3(2) — ^ (1) • а (2)),

СI ,*(0)41 — и(2))(1 — и(1)) +

Н . (К (3)) = 7(2) • 0*

. 1ч+/,1 (1)(1 — и(2)) +1, (2) +

+К (0) • (1 — и(2)) • (1 — и(1)) • (1 — и(0))) •

•( — ю-3(3) — 5 (2) -а(3)).

Полученные соотношения позволяют проследить закономерность изменения величины Н во времени и записать общий вид выражения для произвольно-

го ґ:

Н, (К(ґ)) = 7(ґ -1)--(р-о3(ґ) - Б, (ґ -1)-«(ґ))•

(13)

I , (ґ -1) +Х11 (?)-

ґ = 2,3,4,

П (1 — и(в))+К(0)• П(1 — К*))

V 0=г+1 *=0 у

Из величин (13) при разных значениях , = 1,...,т и . = 1,..., п составляем вспомогательные матрицы выигрышей Н (К (Г)) для каждого момента Г.

Как видно из формулы (13), элементы вспомогательной матрицы Н (К (Г)) на каждом шаге зависят от оптимальных стратегий, выбранных игроком 1 на предыдущих шагах. Таким образом, взяв в качестве оптимальной одну из своих т стратегий при Г = 1 , игрок 1 может получить в момент Г = 2 одну из т возможных вспомогательных матриц Н(К(2)). Оптимальная стратегия на втором шаге для каждой такой матрицы, в свою очередь, также определяет т воз-

ч_* 2

можных продолжений, то есть всего получается т вспомогательных матриц Н(К(3)), зависящих от выбора оптимальных стратегий I (0) и I (1) и так далее.

Последовательно увеличивая Г и применяя к вспомогательным матрицам (13) критерии Вальда, Гурвица, Сэвиджа, можно определить оптимальные стратегии в соответствующие моменты времени и по-

Л

строить оптимальную траекторию для игрока 1 (производственного сектора).

Пример

Для иллюстрации описанного выше теоретического материала приведем расчеты модельного примера, позволяющие определить оптимальные стратегии производственного сектора в условиях неопределенности, вызванной неизвестными значениями штрафов за выбросы вредных веществ в окружающую среду.

Пусть в модели производственного сектора Т = 3, начальное значение основных фондов К(0) = 300, цена товара р = 12 , цена затрат ю = 15 .

Величина затрат на единицу выпуска а(Г) = 0,45, Г = 0,1,2,3.

Коэффициент пропорциональности между основными фондами и загрязнением 3(Г) = 0,6 , Г = 0,1,2,3.

Темп изнашивания основных фондов и (Г) = 0,45, Г = 0,1,2,3.

Коэффициент пропорциональности между основными фондами и объемом выпуска 7(Г) = 0,5, Г = 0,1,2,3.

Будем предполагать, что возможные величины штрафов в каждый момент Г реализуются из множества 5(Г) = {^(Г), 52(Г), 53(Г), 54(Г)} = {2,5,8,11}, а возможные размеры инвестиций выбираются из множества I (Г) = {!,(Г), 12 (Г), Ш, 14 (Г) } = {0,9,18,23}.

При Г = 1 по формуле (10) строим вспомогательную матрицу:

с 346,5 123,75 —99 —321,75'

355,95 127,12 —101,7 —330,52

365,4 130,5 —104,4 —339,3

,370,65 132,37 —105,9 —344,17 у

Для критерия Вальда в каждой строке этой матрицы находим минимальное значение, а из полученных чисел выбираем максимальное: -321,75.

Это число соответствует стратегии ^, которая будет являться оптимальной для Г = 1 . С использованием этой стратегии и формул (10) рассчитывается следующая вспомогательная матрица для Г = 2 :

с 95,28 18, 71 —8,23 —14,72'

104,73 23,11 —12,20 —28,41

114,18 27,5 —16,16 —42,10

,119,43 29,95 —18,37 —49,71 у

В каждой строке полученной матрицы находим минимальное значение и из них выбираем максимальное: -14,72.

Это число соответствует стратегии Д, которая снова (как и для Г = 1 ) будет оптимальной. По данной стратегии рассчитывается следующая вспомогательная матрица для Г = 3 :

с 18,71 —8,23 —14,72 12,45'

22,09 — 11,38 —25,79 30,11

25,46 —14,53 —36,79 47,77

ч 27,34 —16,28 —42,92 57,58у

В каждой строке матрицы определяем минимальное значение, из них выбираем максимальное (-14,72) и для последнего шага снова в качестве оптимальной получаем стратегию ^.

В результате находим оптимальную траекторию для игрока 1 по критерию Вальда:

IВо = {IВ(0), IВ(1), IВ (2)}={1,1,1}.

Далее применим критерий Гурвица. Пусть Л = 0,5, то есть позиция игрока 1 - средняя между крайним оптимизмом и крайним пессимизмом.

Возьмем начальную матрицу (14) и в каждой ее строке найдем минимальное и максимальное значения.

По правилу выбора оптимальной стратегии в критерии Гурвица вычисляем линейную комбинацию для первой строки:

—321,75 • 0,5 + (1 — 0,5) • 123,75 = 12,375.

Аналогичные расчеты проводим для остальных строк. В результате получаем следующий набор чисел:

12,375; 12,71; 13,05; 13,23.

Из этих значений выбираем наибольшее (13,23), соответствующее стратегии 14, которая будет оптимальной при Г = 1 .

По стратегии !4 рассчитываем следующую вспомогательную матрицу для Г = 2 :

с 108,57 23, 46 —12,03 —27,05'

118,02 27,85 —15,99 —40,74

127,47 32,25 —19,96 —54,43

ч 132,72 34,69 —22,16 —62,04у

Заметим, что в силу выбора при Г = 1 другой стратегии (14 в отличие от ^) эта матрица не совпадает со вспомогательной матрицей, использовавшейся на соответствующем шаге при вычислении критерия Вальда.

В каждой строке полученной матрицы находим минимальное и максимальное значения и применяем методику нахождения оптимальной стратегии по Гур-вицу, что дает нам набор чисел:

40,75; 38,68; 36,51; 35,33.

Из этих величин выбираем наибольшую (40,75), соответствующую стратегии ^, которая будет оптимальной для Г = 2 .

Используя эту стратегию, рассчитываем вспомогательную матрицу для Г = 3 :

с 18,71 —8,23 —14,72 12,45'

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

22,09 — 11,38 —25,79 30,11

25,46 —14,53 —36,79 47,77

ч 27,34 —16,28 —42,92 57,58у

В каждой строке матрицы находим минимальное и максимальное значения, применяем формулу критерия Гурвица и из чисел -10,33; -10,15; -6,84; -5,003

выбираем наибольшее, соответствующее стратегии 14, которая будет оптимальной для Г = 3 .

В итоге получаем оптимальную траекторию производственного сектора по критерию Гурвица:

I *(•) = {I *(0), IГ (1), I Г* (2)} = {4,1,4}.

И, наконец, рассмотрим критерий Сэвиджа.

В каждом столбце начальной вспомогательной матрицы (14) находим максимальное значение:

370,65; 132,37; -99; -321,75.

Далее строим матрицу риска по формуле (9): с24,15 8,625 0 0 ^

Я( К (1)) =

14,7

5,25

0

5,25

1,87

0

2,7

5,4

6,9

8,77 17,55 22, 42

Н (К (2)) =

109,93

119,38

124,63

24,96 -13,68 29,36 -17,65 31,8 -19,85

-19,54 Л -33,23 -46,9 -54,53

В каждом столбце матрицы Н (К (2)) находим

максимальное значение:

124,63; 31,8; -9,72; -19,54.

По полученным данным рассчитываем матрицу риска:

с 24,15 11,23

Я(К (2)) =

14,7

5,25

0

6,83 2, 44 0

0

3,96

7,93

10,1

0 Л 13,69 27,38 34,99

Н (К (3)) =

24,96 —13,68 —35,41 28,34 —16,83 —46,44 30,21 —18,58 —52,58

Ч 7 7 7 ■ /

В каждом столбце данной матрицы определяем максимальное значение:

30,21; -10,21; -24,37; 72,43,

27,30Л 44,96 62,62 72, 43

после чего вычисляем матрицу риска:

(8,625 0 0

Я(К (3)) =

5,25

1,87

0

3,14

6,29

8,04

11,03

22,07

28,208

45,13 Л 27,47 9,81 0

В каждой строке этой матрицы находим максимальное значение и выбираем из них минимальное (14,7), соответствующее стратегии !2, которая будет оптимальной при Г = 1 .

По стратегии /2 рассчитывается следующая вспомогательная матрица для Г = 2:

с100,48 20,57 —9,72

В каждой строке матрицы Я(К(3)) находим максимальное значение, из них выбираем минимальное (22,07) и видим, что при Г = 3 оптимальной будет стратегия /3.

В результате получаем оптимальную траекторию производственного сектора по критерию Сэвиджа: !*(•) = {!*(0), I*®, I* (2)} = {2,2,3}.

Номера оптимальных стратегий 1-го игрока в динамической игровой модели производственного сектора, найденные на основе различных критериев, можно свести в обобщающую таблицу.

Критерий Номер оптимальной стратегии игрока 1 для момента времени t

X = 1 ґ = 2 ґ = 3

Вальда 1 1 1

Гурвица 4 1 4

Сэвиджа 2 2 3

В каждой строке этой матрицы находим максимальное значение и из них выбираем минимальное (14,7), соответствующее стратегии !2, которая снова оказалась оптимальной.

По стратегии !2 рассчитывается следующая вспомогательная матрица для Г = 3 :

с 21,59 —10,53 —24,37

Окончательно оптимальная траектория производственного сектора выбирается из предложенных в зависимости от предпочтений производителей и их склонности к риску.

Заключение

Проведенные исследования продемонстрировали возможность прикладного использования новой теории динамических игр с природой для моделирования взаимодействий в различных сложных системах в условиях неопределенности на примере экономикоэкологической системы региона. Применение теоретико-игрового аппарата позволяет произвести стратегический анализ, определить наиболее важные и требующие учета факторы при принятии решений, что, в конечном счете, повышает эффективность функционирования системы.

Рассмотренный в статье подход позволяет с новой точки зрения исследовать задачи со стратегически обусловленными действиями и изучать поведение человека в различных ситуациях в рамках экономической науки, политологии, социологии, психологии и пр., учитывая при этом изменение во времени условий или факторов, могущих повлиять на ситуацию.

Литература

1. Мазалов, В. В. Математическая теория игр и приложения: учеб. пособие / В. В. Мазалов. - СПб.: Лань, 2010. - 446 с.

2. Зенкевич, Н. А. Динамические игры и их приложения в менеджменте: учеб. пособие / Н. А. Зенкевич, Л. А. Петросян, Д. В. К. Янг. - СПб.: Высшая школа менеджмента, 2009. - 416 с.

3. Данилов, Н. Н. Динамические матричные игры. Обоснование применения принципа минимакса в классе чистых комбинированных стратегий / Н. Н. Данилов // Вестник КемГУ - 2012. - Вып. 2(50). - С. 42 - 48.

4. Данилов, Н. Н. Математическая модель менеджмента в условиях неопределенности в форме динамической игры с природой I Н. Н. Данилов II Вестник КемГУ. - 2012. - Вып. 3(51). - С. 110 - 114.

5. Данилов, Н. Н. Курс математической экономики: учеб. пособие I Н. Н. Данилов. - М.: Высшая школа, 200б. - 407 с.

6. Федеральный закон Российской Федерации от 10.01.2002 № 7-ФЗ «Об охране окружающей среды» (ред. от 02.07.2013). - Режим доступа: http:IIwww.consultant.ruIpopularIokrsredI

7. Дубров, А. М. Моделирование рисковых ситуации в экономике и бизнесе: учеб. пособие I А. М. Дубров, Б. А. Лагоша, Е. Ю. Хрусталев; под ред. Б. А. Лагоши. - М.: Финансы и статистика, 2000. - 17б с.

Информация об авторах:

СамойленкоНаталья Сергеевна - студентка математического факультета КемГУ, 8 (3842) 54-25-09, [email protected].

Natalia S. Samoylenko - student at the Mathematical Faculty, Kemerovo State University.

Мешечкин Владимир Викторович - научный руководитель, кандидат физико-математических наук, доцент кафедры математической кибернетики КемГУ, 8 (3842) 54-25-09, [email protected].

Vladimir V. Meshechkin - research advisor, Candidate of Physics and Mathematics, Assistant Professor at the Department of Mathematical Cybernetics, Kemerovo State University.

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Самойленко Наталья Сергеевна, Мешечкин Владимир Викторович

Похожие темы научных работ по экономике и бизнесу , автор научной работы — Самойленко Наталья Сергеевна, Мешечкин Владимир Викторович

MATHEMATICAL MODELING OF THE REGIONAL ECONOMIC-ECOLOGICAL SYSTEM USING THE THEORY OF DYNAMICAL GAMES WITH NATURE

Текст научной работы на тему «Математическое моделирование экономико-экологической системы региона с применением теории динамических игр с природой»