О некоторой общей схеме формирования критериев оптимальности в играх с природой

Лабскер Л.Г.

Ф МАТЕМАТИКА ДЛЯ ЭКОНОМИКИ

Л. Г. Лабскер профессор кафедры "Математическое моделирование экономических процессов"

О НЕКОТОРОЙ ОБЩЕЙ СХЕМЕ ФОРМИРОВАНИЯ КРИТЕРИЕВ

ОПТИМАЛЬНОСТИ В ИГРАХ С ПРИРОДОЙ

Аннотация

Предлагается некоторая общая схема формирования критериев выбора оптимальных стратегий в играх с природой. В рамках этой схемы вводятся понятия функции игры, показателей игры и показателей оптимальности и неоптимальности стратегий. На основе предложенной схемы выделяются некоторые классы критериев, которые, с одной стороны, включают в себя известные классические критерии, такие как критерии Вальда, Сэвиджа, Гурвица и др., а с другой стороны, дают возможность получать новые критерии оптимальности. Устанавливается эквивалентность некоторых из рассмотренных критериев. Приводится пример нахождения оптимальных стратегий по рассмотренным критериям.

Ф Часто во многих задачах финансово-экономической сферы приходится принимать решения в условиях недостаточной осведомленности или полной неосведомленности о состояниях окружающей эти задачи среды. Математические модели подобных ситуаций называются "играми с природой", где под "природой" понимается окружающая среда. Обозначим ее буквой П. Лицо, принимающее решение или выбирающее стратегию действий, называется игроком. Обозначим его через А.

Считаются известными всевозможные состояния П1, П2, ..., Пп природы П, которые она проявляет случайным образом независимо от действий игрока А, не противодействуя злонамеренно его стратегиям. Природа может находиться только в одном из отмеченных состояний, но в каком именно - неизвестно, хотя в некоторых случаях могут быть известны лишь вероятности этих состояний

п

ч = р(П^ 42 = р(П2Х.- Чп = р(Пп); е Ч] = 1.

]=1

Известны также возможные стратегии Аь А2, ..., Ап игрока А и его выигрыши а> 0 при каждой из стратегий Д и каждом из состояний природы П. Эти выигрыши можно расположить в виде матрицы выигрышей:

а) =

А, П1 П2 Пп

А1 3ц 312 31п

А2 321 а 22 а2п

Ат am1 ат2 amn

qj q1 q2 qn

В нижней строке матрицы указаны вероятности д, состояний природы Пу, ] = 1, п.

Предположим, что игрок А, не зная состояния природы, выбрал стратегию А. Если природа приняла состояние П, то выигрыш игрока А будет а,. Но если бы игрок А заранее знал, что природа примет состояние Пу, то он выбрал бы стратегию А/0, при которой достигается наибольший выигрыш а,., т.е.

Разность

в = max a.. = a

> 1 . I1 .

У-

(1)

Г = в1 - aj

(2)

между выигрышем в игрока А при заранее известном ему состоянии природы П. и выигрышем а, при незнании игроком А состояния природы называется риском при стратегии А, и состоянии природы Пу. Таким образом, риск г, есть та часть наибольшего выигрыша впри состоянии природы Пу, которую игрок А не выиграл, применяя стратегию Д , по причине незнания состояния природы.

Матрица

(rij) :

Ai П2 Пп

A1 Г11 Г12 Г1п

A2 r21 r22 Г2п

Am rm1 rm2 rmn

qj q1 q2 qn

называется матрицей рисков. В последней строке указаны вероятности состояний природы qj, j = 1, ..., n. Так как 0 < a. < в (правое неравенство следует из (1)), то из (2) получаем, что 0 < г. < в-.

Вероятность q. состояния природы П является очевидно вероятностью выигрыша aj и риска г. при каждой стратегии A, i = 1, ..., m.Поэтому каждую стратегию A. можно интерпретировать как дискретную случайную величину, которая может принимать значения, равные выигрышам ал, ..., ain или рискам rn, ..., rn с соответствующими вероятностями q1, ., qn.

Задача игрока А состоит в выборе из возможных стратегий A, ..., Am оптимальной. Таким образом, речь идет о решении задачи в чистых стратегиях ([1], с. 502, 508). Оптимальность стратегии понимают в различных смыслах и выбирают ее по различным критериям. Отметим, например,

классические критерии Байеса ([2], с. 119 ; [3], с. 46), Лапласа ([1], с. 500; [2], с. 119; [4], с. 103), Вальда ( [1], с. 504; [3], с. 91; [5], с. 56), Сэвиджа ([1], с. 504; [3], с. 92; [5], с. 57), Гурвица ([1], с. 505; [2], с. 120; [3], с. 47; [5], с. 57).

Цель настоящей статьи - предложить некоторую общую схему формирования критериев выбора оптимальных стратегий, на основе которой можно выделить некоторые классы критериев, включающие в себя отмеченные классические критерии и дающие возможность получать новые критерии оптимальности.

@ Результат игры в общем случае зависит от трех числовых параметров: выигрышей а игрока А, рисков г, которые появляются при выборе игроком А той или иной стратегии, и вероятностей д состояний природы. Желание "свернуть" эти три параметра в один показатель приводит к некоторой числовой функции, зависящий от этих трех параметров. Обозначим ее в(а, г, д) и назовем функцией игры. Характер зависимости функции игры в от а, г и д мотивируется логикой применяемого критерия. Значения

= °(ау’гу’Ч})’ 1 1 •••т; з =1 •••п

функции игры назовем показателями игры. Эти показатели образуют матрицу игры

(Gij) =

\nj Ai П1 П2 Пп

Ai Gii G12 Gin

A2 G21 G22 G2n

Am Gmi Gm2 Gmn

Критерий предполагает задание некоторой числовой функции ф векторного аргумента (Gn,Gin), i = 1, m, значение которой

Gj = ф(Сд,..., Gin),i = 1,..., m, назовем показателем стратегии A.

Затем среди показателей G, стратегий Ai выбирается экстремальный Ext G.. Для одних критериев это максимальное значение: Ext = max, а

1<i<m

для других минимальное: Ext = min.

* В [2], с. 119, говорится, что "Байес в 1763 г. предложил считать равными вероятности отдельных состояний природы". В этой связи заметим, что Байес скончался в 1761 г., а соответствующая его статья вышла из печати посмертно в 1763 г.

Если Ext = max, то показатель Gi назовем показателем оптимальности стратегии A,; если же Ext = min, то Gi назовем показателем неоп-тимальности стратегии Ai.

Оптимальной по критерию называется стратегия AiQ, для которой достигается экстремум показателя G, , т.е.

Применяя описанную схему, сформируем некоторые классы критериев.

Ф Максиминные критерии (крайнего пессимизма).

Для этих критериев

Ext Gi = max G.,

1< i < m 1< i< m (3)

а показатели стратегий Ai определяются следующим образом:

Gi = ф(вц,...,в n) max Gj

1< j < n

и являются, в силу (3), показателями оптимальности стратегий.

Таким образом, G, является наихудшим показателем игры при стратегии A■.. Отсюда следует, что функция игры G(a, r, q) должна быть неубывающей по выигрышу а и невозрастающей по риску r.

На показатели игры также оказывают влияние вероятности состояний природы q. Так, например, если наихудший, т.е. наименьший выигрыш ац при стратегии Ai имеет достаточно малую вероятность qy, то считать его практически наименьшим уже нецелесообразно. Чтобы этот выигрыш оставался и практически наименьшим, он должен иметь достаточно большую вероятность. С рисками обстоит все наоборот: чтобы наихудший, т.е. наибольший риск Гц при стратегии Ai оставался практически наибольшим, его вероятность должна быть также достаточно большой. Это говорит о том, что функция игры должна невозрастать по вероятности q.

Итак, логика максиминного критерия определяет характер поведения функции игры в зависимости от выигрыша а, риска r и вероятности q:

G(a, r, q) v по a; - по r; - по q.

Для удобства различий в дальнейшем для максиминного критерия обозначим функцию игры G через W, показатели игры Gj через Wy, показатели оптимальности G, стратегий Ai через W.

Таким образом, для максиминного критерия функция игры

W(a,r,q) v по a; - по r; - по q, (4)

показатели игры

Wij = W(aj, j qj), i = 1, ..., m; j = 1, ..., n, показатели оптимальности стратегий

W= min Wj1, i = 1,..., m.

1<j<n 1

Оптимальной по максиминному критерию считается стратегия AiQ, для которой

max W = W. .

1<i<m 0

Максиминный критерий является критерием крайнего пессимизма лица, выбирающего стратегию, так как ориентирует его на наихудшее для него проявление состояний природы и как следствие - на весьма осторожное поведение при принятии решения.

Конкретная функция игры W(a,r,q) может быть выбрана по-разному, но с непременным требованием обладания свойствами (4).

Примерами максиминных критериев с конкретными функциями игры W(a,r,q) могут служить следующие критерии:

3.1. W(a,r,q) = a;

3.2. W(a,r,q) = (1-q)a;

3.3. W(a,r,q) = a-r;

3.4. W(a,r,q) = (i-q)a-qr.

То, что каждая их этих функций обладает свойствами (4), можно проверить по знаку частных производных.

В критерии 3.1 показателями игры являются выигрыши: Wij=aij, а потому он не учитывает ни рисков, ни вероятностей состояний природы. Критерий 3.1 является критерием Вальда ([1], с. 504; [3], с. 91; [5], с. 56), позволяющим обосновать выбор решения в условиях полной неопределенности, т.е. в условиях незнания вероятностей состояний природы. Критерий 3.2 учитывает выигрыши и вероятности состояний природы, но не учитывает риски. В критерии 3.3 учитываются выигрыши и риски без учета вероятностей состояний природы. И наконец, в критерии 3.4 учитываются выигрыши, риски и вероятности состояний природы.

Для минимаксного критерия функцию игры обозначим через S(a,r,q). Она должна быть невозрастающей по выигрышу а и неубывающей по риску r и по вероятности q состояний природы:

Э(а,г,д) - по а; ^по г V по д.

(5)

Тогда Эу = Э(ау, у ду ) - показатели игры. Показатели стратегий определяются следующим образом:

Стратегия А г. считается оптимальной, если

тип Э = Э0. (7)

1< I < т 0

В силу (7) показатели Э являются показателями неоптимальности стратегий А.

То, что функция игры Э(а, г, д) должна обладать свойствами (5) мотивируется аналогично мотивировке в п. 3 с учетом (6) и (7).

Приведем некоторые минимаксные критерии с конкретными функциями игры Э(а,г,д), удовлетворяющими условиям (5):

4.1. Э(а,г,д) = г;

4.2. Э(а,г,д) = дп

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4.3. Э(а,г,д) = г-а;

4.4. Э(а,г,д) = дг-(1-д)а.

Критерий 4.1, в котором показатели игры - риски, не учитывает ни выигрышей, ни вероятностей состояний природы. Это есть критерий Сэвиджа ([1], с. 504; [3], с. 92, [5], с. 57).

Сравнивая максиминные и минимаксные критерии, можно высказать следующее.

Утверждение 1. Максиминные критерии 3.3 и 3.4 эквивалентны соответственно минимаксным критериям 4.3 и 4.4:

Первая их этих эквиваленций означает, что стратегия А является оптимальной по критерию 3.3 тогда и только тогда, когда она оптимальна по критерию 4.3.

Аналогичное объяснение относится и ко второй эквиваленции.

Доказательство. Докажем сначала эквиваленцию 3.3 «• 4.3. Так как функции игры W и Э соответственно критериев 3.3 и 4.3 удовлетворяют равенству Э = -^ то и показатели игры удовлетворяют аналогичному равенству = -^. Тогда

Э = ф(Э-1, . ., 5 п) = тах I = 1, ..., т.

1 <" ; <" п ■>

1< у < П

(6)

откуда

minS = min( - W.) = -max Wi.

\<i<m \<j<m J \<i<m

Таким образом, S, будет минимальным для номера i, для которого Wi будет максимальным, и эквиваленция 3.3 «• 4.3 доказана.

Совершенно аналогично доказывается и эквиваленция 3.4 «• 4.4. v

В данном случае функция игры, которую мы обозначим через M(a, г, q), должна не убывать по выигрышу а и по вероятности q состояний природы и не возрастать по риску r :

M(a, г, q) v а; —I по г по v q. (8)

Показатели игры М= M(aj, j qj). Показатели оптимальности стратегий

М; = ф(М/1, . ., М in) = max Mn, i = 1, ..., m .

1 < j < n

Оптимальной называется стратегия A0, для которой

max M = M .

1<i<m ' 4

Максимаксные критерии являются критериями крайнего оптимизма, поскольку предполагают, что природа будет находиться в наиболее благоприятном для игрока А состоянии и потому в качестве оптимальной выбирается стратегия, при которой максимальный показатель игры -показатель оптимальности максимален среди максимальных показателей всех стратегий.

В качестве максимаксных критериев с конкретными функциями игры M(a, г, q), обладающими свойствами (8), можно взять, например, следующие:

5.1. M(a, r, q) = а;

5.2. M(a, r, q) = qa;

5.3. M(a, r, q) = a-r,

5.4. M(a, r, q) =qa-(1-q)r.

В критерии 5.1 показателями игры являются выигрыши Mj = an, и мы получаем максимаксный критерий относительно выигрышей ([2], с. 42).

Функция игры, обозначим ее через E(a, r, q), выбирается невозрастающей по выигрышу а и по вероятности q состояний природы и неубывающей по риску r:

E(a, r, q) — по а; v по г — по q. (9)

В качестве показателей неоптимальности стратегий Аi берутся

Ei = ф(£,1, ..., E n) = min Ej, i = 1, ..., m,

1< j < n

где Ej = E(aj, г,, qi) - показатели игры.

Оптимальной назначается стратегия A минимизирующая показатель неоптимальности Et, т.е.

min E. = E,.

1<i<m 0

Миниминные критерии также являются критериями крайнего оптимизма, поскольку под оптимальной стратегией понимается стратегия, при которой показатель неоптимальности минимален среди показателей не-оптимальности всех стратегий.

Примерами миниминных критериев с функциями игры E(a, г, q) со свойствами (9) могут быть:

6.1. E(a, г, q) = г,

6.2. E(a, г, q) = (1-q)r

6.3. E(a, r, q) = r-a;

6.4. E(a, r, q) = (1-q)r -qa.

Показателями игры в критерии 6.1 являются риски, и он, таким образом, превращается в миниминный критерий относительно рисков.

Утверждение 2. Максимаксные критерии 5.3 и 5.4 эквиваленты соответственно миниминным критерием 6.3 и 6.4:

5.3 » 6.3, 5.4 » 6.4.

Доказательство аналогично доказательству утверждения 1, а именно для критериев 5.3 и 6.3 имеем: E = -M и, следовательно, Ej = -M/j, откуда

E: = min(- MH) = - max MH = -Mi.

1< j<mx 3' 1< j<n :

Поэтому

min Ej = min(- Mi) = - max Mr

1<i<m 1<i<n 1<i<m

Таким образом, эквиваленция 5.3 6.3 доказана.

Аналогично доказывается и эквиваленция 5.4 «• 6.4. v

Для лучшей обозримости стрелок, указывающих в (4), (5), (8) и (9) на невозрастание или неубывание функций игры рассмотренных критериев в пп. 3, 4, 5, 6 в зависимости от выигрышей а, рисков r и состояний природы q, сведем их в следующую таблицу.

Таблица 1

Аргументы функций игры Функции игры и критерии

W(a, r, q) S(a, r, q) M(a, r, q) E(a, r, q)

max min min max max max min min

a v —i v —i

r —1 v —i v

q —1 v v —i

Из этой таблицы видно, что стоящие в первой строке стрелки, обозначающие поведение функций игры в зависимости от выигрышей а, соответствуют первому значку в названии критерия: max - v, min —i, ,max -v, min —i. А стрелки во второй строке, обозначающие поведение функций игры в зависимости от рисков r , противоположны стрелкам первой строки.

Функция игры L(a, r, q) должна неубывать по выигрышу а и невоз-растать по риску r:

L(a, r, q) v по а; — по r. (10)

Показатели оптимальности стратегий Д0 определяются следующим образом: 0

Li = Ф(1(1, ..., L n) = £ Lj, i = 1, ..., m , (11)

j=1

где Lj = L(a-ij, r-j, qj) - показатели игры.

По определению оптимальной является стратегия Ai0, максимизирующая показатель оптимальности L:

max Li = Li .

1<i<m 0

В качестве функций игры L(a, r, q), удовлетворяющих условиям (10), можно взять функции:

7.1. L(a, r, q) = qa;

7.2. L(a, r, q) = q(a-r).

Если в критерии 7.1 q1 = ... qn = —, то показатели игры принимают

n

вид

L = q a = — a , i = 1, .... m; j = 1, .... n,

V J J V n

а показатели оптимальности стратегий A превращаются (см. (11)) в среднее арифметическое выигрышей при стратегии А:

1 "

Ц =-£а г = 1> т. п1=1 1

Такой критерий был предложен Байесом ([2], с. 119; см. также сноску на с. 2). Этот критерий также называют ([1], с. 503) "критерием недостаточного основания" Лапласа (т.е. у нас нет достаточного основания отдать предпочтение какому-нибудь состоянию природы).

Если в критерии 7.1 вероятности состояний природы я1 яп различны, то показатели игры

Ц = ча.г = 1,...т;1 = 1> .... п

а показатели оптимальности стратегий А будут представлять собой взвешенное среднее выигрышей при стратегии А, взятых с весами я1..........

Яп-

п

Ц =£ ча.г 1 .... т.

1=1

Получившийся критерий называют критерием Лапласа ([2], с. 119.).

® Критерии минимизации взвешенного среднего показателя неоптимальности стратегий.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Для данного критерия функция игры К(а, г, я) невозрастает по выигрышу а и неубывает по риску г

К(а, г, я) —I по а; V по г, (12)

показатели игры К= К(а,, г> Я), показатели неоптимальности стратегий А,

К,= ф(К„, К п)= £к„ .

1= 1

Оптимальной считается стратегия Д/0, минимизирующая показатель неоптимальности К,.

шт К = К .

1<г<т 0

Примерами таких критериев с функциями игры К(а, г, я), удовлетворяющими условиям (12), могут служить критерии.

8.1. К(а, г, я) = ЯГ;

8.2. К(а, г, я) = Я(г-а).

В критерии 8.1 показатели неоптимальности стратегии А, представляют собой взвешенное среднее рисков при стратегии А, с весами я1, ■■■,

Яп, и критерий 8.1, таким образом, является критерием минимизации взвешенного среднего риска.

Относительно критериев 7 и 8 имеет место следующее.

Утверждение 3. Все четыре критерия 7.1, 7.2, 8.1, 8.2 эквивалентны между собой:

7.1 ^ 7.2 » 8.1 » 8.2. (13)

Доказательство. Рассмотрим, например, критерии 7.1 и 8.2. Показатели оптимальности в критерии 7.1 и неоптимальности в критерии 8.2 стратегий соответственно равны

п п

Цг = Ё чаV и Ki = Ё чЛ - 1

]=1 ]=1

Складывая Ц с К и используя при этом определение риска (2), получим

п п п п

К + Ц = Ё1 = Ёч/Р]- а]) = Ё Ч]в] - ЁЧ]а1 = в - Ц (14)

]=1 ]=1 ]=1 1=1

п

где в = Ё Ч]в] - взвешенное среднее максимальных выигрышей при ка-

]=1

ждом состоянии природы П. Из (14) имеем:

К = в - 2 Ц.

Аналогичным образом можно получить выражение К через Ц для других пар критериев 7.1 и 8.1, 7.2 и 8.2. Полученные выражения представлены в табл. 2.

Таблица 2

Критерии Критерии 8.1 8.2

^Показатели неоптимальности стратегий критерия 8 Показатели оптимальности ч. стратегий критерия 7 к,=Еч3гч 1=1 К, = Е?1 - а1) 1=1

7.1 п Ц = Е 1=1 к=в - Ц К, = в - 2Ц

7.2 п Ц, =Е У/а .1 " 1 1=1 к, = \ (в - Ц) к II - Ц

Из этой таблицы очевидно, что поскольку в для данной матрицы выигрышей (а,у) есть величина постоянная, то показатель неоптимально-сти К в каждой клетке обращается в минимум при том же значении /, при котором показатель оптимальности ^ обращается в максимум. Следовательно, имеем следующие эквиваленции критериев:

7.1 ^ 8.1, 7.1 ^ 8.2, 7.2 ^ 8.1, 7.2 ^ 8.2, из которых следует требуемая экиваленция (13).

Отметим, что эквиваленция 7.1 ^ 8.1 - известный факт (доказанный, например, в [1], с. 502).

Из эквиваленции (13) можно сделать вывод о том, что из критериев

7.1, 7.2, 8.1, 8.2 достаточно применить один, причем с более простой функцией игры.

® Максиминно-максимаксные критерии.

Такие критерии представляют собой комбинации максиминного и максимаксного критериев. В качестве показателя оптимальности стратегии А, берется величина

Н (X) = (1 - Х)Щг + ХМ, , = 1, ..., т,

где Хе[0,1]- коэффициент оптимизма, а Щ = ш1пЩ. и М, = штМ.. - по' 1<]<п 1 1< ]<Н 1

казатели оптимальности стратегии А соответственно в максиминном и максимаксном критериях (см. п. 3 и п. 5). При этом функции игры в этих

двух критериях целесообразно использовать соответствующие друг другу. Это соответствие показано в табл. 3.

Таблица 3

Критерии Выигрыши а Риски г Вероятности состоя- нии при- роды 9 № (а, г, щ) М (а, г, щ)

9.1 + а а

9.2 + + (1-9)а ща

9.3 + + а-г а-г

9.4 + + + (1-щ)а-щг ща-(1-щ)г

Оптимальной считается стратегия А-,, максимизирующая показатель оптимальности ЯД):

тахНг (а) = Н (а).

1<г<т 0

Коэффициент оптимизма X выбирается субъективно в пределах от 0 до 1, включая концы, в зависимости от опасности ситуации: чем более опасной представляется ситуация, тем меньше оптимизма и тем меньше коэффициент оптимизма X; чем более благоприятная ситуация, тем больше оптимизма и значит X можно выбирать ближе к 1.

При наименьшем значении коэффициента оптимизма X = 0 данный критерий превращается в максиминный критерий крайнего пессимизма, а при наибольшем значении коэффициента оптимизма X = 1 рассматриваемый критерий превращается в максимаксный критерий крайнего оптимизма. При X = 1/2 максиминно-максимаксный критерий можно считать критерием реализма.

Критерий 9.1 является критерием Гурвица относительно выигрышей ([1], с. 505; [2], с. 120; [3], с. 47; [5], с. 57).

® Минимаксно-миниминные критерии.

Минимаксно-миниминные критерии являются результатом комбинации минимаксного и миниминного критериев. Показатель неоптималь-ности стратегии А определяется следующим образом:

Бг (А) = (1 - А)5г + АЕ, г = 1, ..., т, где Xe[0,1]- коэффициент оптимизма, а 5 . = тах 5.. и е. = тт Е.. - пока-

г 1<. < п г г 1< .< п г

затели неоптимальности стратегии А, соответственно в минимаксном и миниминном критериях (см. п. 4 и п. 6). Функции игры в этих двух критериях лучше выбирать соответствующими друг другу, как это указано в табл. 4.

Таблица 4

Критерии Выигрыши Риски г вероятности состоя- ний при- роды ц Б (а, г, ц) М (а, г, ц)

10.1 + г г

10.2 + + цг (1-Ц)г

10.3 + + г-а г-а

10.4 + + + цг-(1-ц)а (1-Ц)г-ца

Оптимальной по критерию является стратегия А-,, для которой

1пшБ, (я)= До (Я).

1<,< т 0

Данный критерий превращается в минимаксный критерий при X = 0, в миниминный критерий при X = 1, в критерии Гурвица относительно рисков при Б(а,г,д) = Е(а,т,ф = г (критерий 10.1).

Утверждение 4. При одном и том же коэффициенте оптимизма X максиминно-максимаксные критерии 9.3 и 9.4 эквиваленты соответственно минимаксно-миниминным критериям 10.3 и 10.4.

Доказательство. Для критериев 10.3 и 9.3 имеем:

а, (Я)=(1 - я) + ЯЕ , =(1 - Я)- V)+ я(- М, )=-[(1 - + ЯМ, ]=-Н, (Я),

откуда

шт Б, (Я) = шт[- Н! (Я)] = - тах Н! (Я),

1<,<т 1<,<т 1<,<т

т.е. показатель неоптимальности й(Х) будет минимальным для того значения /, для которого показатель оптимальности Н(Х) будет максимален. Таким образом, эквиваленция 9.3 «• 10.3 доказана.

Эквиваленция 9.4 о 10.4 доказывается аналогично. у

(11)ПРИМЕР. Рассмотрим игру с природой, в которой игрок А имеет возможность применить одну из четырех стратегий А-|, А2, А3, А4, а природа П может находиться в одном из трех состояний П|, П2, П3 с вероятностями соответственно ц1 = 0,7; д2 = 0,1; д3 = 0,2. Известны выигрыши (а/,) игрока А. Найдем оптимальные стратегии по рассмотренным выше критериям.

Выпишем таблицы показателей игры и в дополнительных столбцах - показатели оптимальности и неоптимальности для соответствующих критериев. При этом на основании утверждений 1-4 из эквивалентных критериев будем рассматривать только один.

Таблица для критериев 3.1 и

5.1

Таблица для критерия 3.2

(а,) =

\Л,- а\ П1 П2 П3 М-, Ч П, А'-\ П1 П2 П3

А1 4 7 1 1 7* А1 1,2 6,3 0,8 0,8

А 4 3 5 3* 5 (I1 - V] К ) = ^2 1,2 2,7 4,0 1,2

Аз 6 5 2 2 6 А3 1,8 4,5 1,6 1,6*

А4 0 6 3 0 6 А4 0,0 5,4 2,4 0,0

Таблица для критериев 4.1 и 6.1

Таблица для критерия

4.2

(/ =

\лу А/ П1 П2 П3 э,- Б, А/ П1 П2 П3 э,-

А1 2 0 4 4 0* А1 1,4 0,0 0,8 1,4

А2 2 4 0 4 0* (ЯГ/) = А2 1,4 0,4 0,0 1,4

А3 0 2 3 3* 0* А3 0,0 0,2 0,6 0,6*

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

А4 6 1 2 6 1 А4 4,2 0,1 0,4 4,2

Таблица для критерия 3.3 и 5.3 рия 3.4

Таблица для крите-

(а—г/=

П1 П2 П3 М-, \ П/ А' П1 П2 П3

А1 2 7 -3 -3 7* А1 -0,2 6,3 0,0 -0,2

А2 2 -1 5 -1* 5 ((1-Я,)а- ,)= А2 -0,2 2,3 4,0 -0,2

А3 6 3 -1 -1* 6 А3 1,8 4,3 1,0 1,0*

А4 -6 5 1 -6 5 А4 -4,2 5,3 2,0 -4,2

Таблица для критерия 5.2 и 7.1

Таблица для крите-

рия 6.2

(Я а/ :

К П1 П2 П3 М-, Ц Ж А,, П1 П2 П3 Б-,

А1 2,8 0,7 0,2 2,8 3,7 А1 0,6 0,0 3,2 0,0*

А2 2,8 0,3 1,0 2,8 4,1 ((1/) = А2 0,6 3,6 0,0 0,0*

А3 4,2 0,5 0,4 4,2* 5,1* А3 0,0 1,8 2,4 0,0*

А4 0,0 0,6 0,6 0,6 1,2 А4 1,8 0,9 1,6 0,9

Таблица для критерия 5.4

(Я, а, -(1 /) :

V А- \ П1 П2 П3 М,

А1 2,2 0,7 -3,0 2,2

А2 2,2 -3,3 1,0 2,2

А3 4,2 -1,3 -2,0 4,2*

А4 -1,8 -0,3 -1,0 -0,3

Теперь выпишем таблицы показателей оптимальности для критериев 9 с коэффициентом оптимизма X = 1/2.

Таблица для критерия 9.1 Таблица для крите-

рия 9.2

А = шт а.. 1< 1<3 1 М, = шах а.. 1<1<3 1 Н,(1/2)= = 2 ( + м.) А, Ш = шт( 1-о -)а.. 1<1<з' 1 г. М1 = шах ага.. 1<1<3 1 Н,(1/2)= = 2 ( + М, )

А 1 7 4* А1 0,8 2,8 1,8

А 3 5 4* А2 1,2 2,8 2,0

Аз 2 6 4* Аз 1,6 4,2 2,9*

Ац 0 6 3 А4 0,0 0,6 0,3

Таблица для критерия 9.3 Таблица для

критерия 9.4

А, = ЩзК-,1) М, = шах(а.- г 1) Н,(1/2)= = }(Ш- + м,) А, ^= 1.(( 1-а.;а1-1) М, = шах (а -аи-1< 1<31 г1 - (1 - ) Н,(1/2)= =1 (Ш, + М,) г ‘

А1 -3 7 2 А1 -0,2 2,2 1,0

А2 -1 5 2 А2 -0,2 2,2 1,0

Аз -1 6 2,5* А3 1,0 4,2 2,6*

А4 -6 5 -0,5 А4 -4,2 -0,3 -2,25

Выпишем таблицы показателей неоптимальности для критериев 10.

Таблица для критерия 10.1 ________________ Таблица для критерия 10.2

А, 5,= шах г. 1<1<3 1 Е= шт г, 1<1<3 у (1 + ) )=

А1 4 0 2

А2 4 0 2

А3 3 0 1,5*

А4 6 1 3,5

5,= Е,= Н,(1/2)=

А, шах 1<1<3 1 1 шт(1 - а1)Г1 1 ( + Е г ) 2

А1 1,4 0,0 0,7

А2 1,4 0,0 0,7

А3 0,6 0,0 0,3*

А4 4,2 0,9 2,55

Звездочкой * во всех таблицах отмечены оптимальные по соответствующему критерию стратегии.

Для лучшей обозримости сведем полученные результаты в таблицу.

Таблица оптимальных стратегий по различным критериям

№ критерия Критерии. Функции игры Оптимальная стратегия

3 Максиминные критерии (крайнего пессимизма)

3.1 W(a,r,q)=a А2

3.2 W(a,r,q)=(1-q)a А3

3.3 W(a,r,q)=a-r А2 , А3

3.4 W(a,r,q)=(1-q)a-qr А3

4 Минимаксные критерии (крайнего пессимизма)

4.1 Э(э,г,ц)=г А3

4.2 3(а,г,д)=дг А3

5 Максимаксные критерии (крайнего оптимизма)

5.1 М(а,г^)=а А1

5.2 М(а,г,д)=да А3

5.3 М(а,г^)=а-г А1

5.4 М(а,г^^а-(1^)г А3

6 Миниминные критерии (крайнего оптимизма)

6.1 Б(а,г,д)=г А-ъ А2, А3

6.2 Е(а,г^)=(1-д)г 3 С Л А1

7 Критерий максимизации взвешенного среднего выигрыша (критерий Лапласа)

7.1 Ца,^^а А3

9 Максиминно-максимаксные критерии с коэффициентом оптимизма А.=1/2

9.1 W(a,r,q)= М(а,г^)=а 3 А1

9.2 W(a,r,q)=(1-q)a; М (a,r,q)=qа А3

9.3 W(a,r,q)= М(а,г^)=а-г А3

9.4 W(a,r,q)=(1-q)a-qr; М(a,r,q)=qa-(1-q)r А3

10 Минимаксно-миниминные критерии с коэффициентом оптимизма А,=1/2

10.1 S(a,r,q)=E(a,r,q)=r А3

10.2 S(a,r,q)=qr; Е^,г^)=(1^)г А3

Из этой таблицы видно, что в качестве оптимальной стратегии А1 и А2 вы-

ступают по 5 раз, стратегия А3 - 16 раз, а стратегия А4 - ни разу. у

Поэтому, если у лица, принимающего решение, нет серьезных возражений, то стратегию А3 можно считать оптимальной.

Литература

1. Вентцель Е.С. Исследование операций. М.: Советское радио, 1972.

2. Дубров А.М., Лагоша Б.А., Хрусталев Е.Ю. Моделирование рисковых ситуаций в экономике и бизнесе. М.: Финансы и статистика, 1999.

3. Князевская Н.В., Князевский В.С. Принятие рискованных решений в экономике и бизнесе. М.: ЭБМ - Контур, 1998.

4. Федосеев В.В. Экономико-математические методы и модели в маркетинге. М.: Финстатинформ, 1996.

5. Чернов В.А. Анализ коммерческого риска. М.: Финансы и статистика, 1998.

6. Исследование операций в экономике / Под ред. проф. Н.Ш. Кремера. М.: ЮНИТИ, 1997.

О некоторой общей схеме формирования критериев оптимальности в играх с природой Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Лабскер Л. Г.

Похожие темы научных работ по математике , автор научной работы — Лабскер Л. Г.

Текст научной работы на тему «О некоторой общей схеме формирования критериев оптимальности в играх с природой»