Исследование модели контроля с неполной информацией при наличии дискретных статистически независимых информационных параметров

Матюнин Евгений Васильевич

УДК 519.83

Исследование модели контроля с неполной информацией при наличии дискретных статистически независимых информационных параметров

Е.В. Матюнин

Алтайский государственный университет (Барнаул, Россия)

A Study of an Incomplete Information Model of Control with Discrete Statistically Independent Information Parameters

E. V. Matyunin

Altai State University (Barnaul, Russia)

Рассматривается нахождение ситуаций равновесия в модели контроля с неполной информацией. Модель контроля формализуется как байесовская игра с двумя лицами, принимающими решения. Нахождение ситуаций равновесия проводится в рамках рассмотрения данной модели в виде статической и динамической игры с неполной информацией. Исследуются варианты теоретико-игровых моделей при неполной информированности первого игрока о возможных типах второго игрока, при неполной информированности второго игрока о возможных типах первого игрока и при двусторонней неполной информированности игроков о возможных типах друг друга. В качестве неконтролируемых случайных информационных параметров принимаются коэффициенты функции трудозатрат и функции затрат на контроль. Рассматриваются ситуации равновесия Нэша-Байеса для статических игр, а также ситуация совершенного равновесия Нэша-Байеса в случае рассмотрения динамической модели игры. Показано влияние различной информированности игроков, которая определяется субъективным представлением игрока о возможных типах других игроков, на выбираемые игроками стратегии и получаемые значения целевых функций каждого участника игры.

Ключевые слова: игры с неполной информацией, равновесие Нэша-Байеса, байесовские игры, модели контроля.

БОТ 10.14258Лгуа8и(2014)1.2-18

In this paper, we investigate equilibrium states of incomplete information model of control. The formal description of the model of control is a Bayesian game with two decision-makers. Determination of equilibrium states is performed with consideration of this model to be in the form of static and dynamic games with incomplete information. We study various types of game-theoretic models with incomplete knowledge of the first player about possible types of the second player and vice versa, and models with bilateral incomplete knowledge of players about possible types of each other. Labor cost function coefficients and control cost function coefficients are treated as uncontrolled information parameters. We consider the Bayesian Nash equilibrium for static games, as well as the perfect Bayesian Nash equilibrium for dynamic games. Also, we demonstrate the influence of players various awareness types on strategies and objective functions chosen by each game participant. The player awareness is defined by player subjective representation of possible types of other players.

Key words: incomplete information games, Bayesian

Nash equilibrium, Bayesian games, models of control

Введение. Формальное описание байесовской игры предполагает введение неполной информированности игрока о стратегиях и целевых функциях других участников игры в зависимости от определенных в модели случайных информационных параметров [1]. Некоторые модели байесовских игр (в частности,

логистические модели цепочки поставок с неполной информацией) описывались в работе [2]. Широкое применение байесовские игры также нашли в приложениях теории аукционов. Наиболее полное исследование задач теории аукционов проводится, например, в работе [3]. Мы будем исследовать нахождение

ситуации равновесия для модели контроля в рамках описания информационной обстановки данной модели в виде байесовской игры. Рассмотрение решения статических игр с неполной информацией проведем в рамках равновесия Нэша-Байеса, решение динамических игр с неполной информацией (или иначе — сигнальных игр) — в рамках совершенного равновесия Нэша-Байеса. Существование данных ситуаций равновесий рассматривалось в работе [4].

Дадим формальное определение байесовской игры с неполной информацией.

Байесовская игра задается пятеркой О = {М, П, 5, и, Р}, где N = {1,..,п} — множество игроков; 5 = х... х 5п — множество всех стратегий игроков, где 5. — набор возможных стратегий ьго игрока (5. = {5й,...,5.т;}) , где т' е Я, . = {1,...,п} ; О = Т1 х...хТп — множество всех типов игроков, где Т — набор возможных типов ьго игрока (Т = {^,...,^}), где т еЯ,' = {1,...,п}; и = 5хТ ^ Я — множество всех функций выигрышей игроков; Р = Р1 х...хРп — множество представлений всех игроков о типах других игроков; Р — множество представлений ьго игрока о типах других игроков, где Р = (Р.,,...,Р ,...,Р '); Рг — множество представле-

' г1 ' хт Ц А

ний Ц -го типа ьго игрока о типах других игроков, таких что Р.: t' ^ АН _'), где АН ) — семейство

Ц Ц _ Ц _ Ц

всех вероятностных мер на множестве t _._,,, где индекс i в записи Ц указывает на то, что Ц = {1,...,т.}.

Р (t11,.., t1m1 ,..., t(í_1)1,.., t(' _1)ml_t,t('+1)1,..,t('+1)ml+t,..., t1n,.., ^^пт,, \ t'ml )

условная вероятность события t , если собственный тип игрока определен как t ц.

Равновесие Нэша-Байеса в играх с неполной информацией. В игре О = {М, П, 5, и, Р} ситуация (511,.., /т) называется равновесием Нэша-Байеса, если для любого игрока i и для любого его типа I. .г е Т, Ц = {1,...,т..} выполняется условие:

где е! — функция выигрыша контрольного органа; /Ё — функция выигрыша исполнителя; а — коэффициент линейной функции штрафа; Ь — коэффициент функции трудозатрат; с — коэффициент функции затрат на контроль; т — коэффициент функции системных потерь; е — уровень исполнения 0<е<е<е) ; q — уровень контроля (0 < q < q < q < 1) ;

Игровые отношения участников системы контроля наиболее полно проявляются при выполнении условия л1а ■ с ■ Ь ■ т < с ■ а [6]. В дальнейшем будем использовать обозначения «И» — исполнитель, «КО» — контрольный орган.

Дискретные информационные параметры игроков. Случай 1. Неполная информированность игрока «И» относительно типов игрока «КО»

Предположим, «КО» может быть двух типов: первый — с низкими затратами на контроль, второй — с высокими затратами на контроль. На принадлежность к определенному типу указывает информационный параметр c.

Соответственно, определяем п[< ц,, где ц — параметр, указывающий на низкие затраты на контроль, ц — параметр, указывающий на высокие затраты на контроль. «КО» точно знает свой тип, при этом «И» ничего не знает о параметре п, но предполагает, что «КО» первого типа встречается с вероятностью второго типа — с вероятностью (1 _ 9).

Следовательно, задача контроля с неполной информированностью игрока «И» примет вид

fiKO = (С1 • q + т ■ е2) ^ min ; (3)

<ii <<?i

fiKO = С ■ q2 + m ■ е2) ^ min ; (4)

q <q2 <<J2

м[и.^^н,),5* '(t ,.),t')]>м,.[и.(5(а.),/ ,.),t')]

Г 'ЦЦ _Ц _Ц Ц' Ц ' Ц ' _а _а а

Vв, е 5., где М' [и.(5*,. и ),5* _' (t _'),t')] — математи-

Ц 1 Ц Ц Ц _Ц _Ц Ц.

ческое ожидание функции вероятностной меры Р. И _, \ t.) [5]. В частности, если множество типов Т определено дискретными случайными величинами, то стратегия (t,) является оптимальным откликом на стратегии других игроков, если

5' ,(г,) е агишах V и. (в,, в * ,(г ,), г,) ■ Р (г .1 г.),

и и . _ о А_у . а _ а _ а а . _ а 1 а

1 eT-,

ч -ч -ч

j = {1,.., m{}.

Исследование задачи контроля с неполной информацией. Рассмотрим модель системы контроля, описанную в работе [6]

fK0(q,е) = (c■ q + m■ е2) ^ min_; (1)

q<q<q

fH (q, е)=

a ■ q ■ е + —

£

■ min , (2)

f* =

a ■ (9■ qi + (1-9) ■ q2) ■ е + -

г

• min .

(5)

Следует отметить, что данная постановка задачи удовлетворяет постановке байесовской задачи, приведенной выше, с тем условием, что мы имеем дело с независимыми случайными величинами и условные вероятностные меры в данной задаче совпадают с безусловными.

Запишем равновесие Нэша-Байеса для задачи контроля (3)-(5)

arg min (ci ■ qi + m ■ е );

qi <qi <qi

arg min (c2 ■ q2 + m ■ е );

q2 <q2 <q2

arg min

£<£<£

a ■ (9■ qi + (i-9) ■ q2) ■ е + -

г

Поскольку принятие решений игроками происходит одновременно и функции /1КО, /2КО линейны, то стратегии q1*,q2 доставляют минимальное значение функциям выигрышей /1КО, /2КО на нижних границах интервалов и ^2] соответственно.

Для функции /И условие оптимальности 1-го порядка примет вид

д_

де

a • (9 • qi + (1 -9) • q2) • е + -

г

fiKO = (ci • qi + т • (Р • ei2 + (1 -p) • е22)) ^ min_; (6)

qi <qi <qi

/2КО = (c2 • q2 + m • (p • ei2 + (i-p) • e22)) ^ min_; (7)

q2 <q-2 <q-i

frn =

/2И =

b

a • (9• qi + (i-9) • q2) • ei +

• (9• qi + (i-9)• q2)• e2 + +

■ min ; (8)

e, <e <e.

• min .

£2 <e2 <e2

(9)

a • (9 • qi + (i -9) • q2)- —

= 0.

Запишем полученные оптимальные стратегии игроков

qi = qi; q2 = q^;e =

b

a(9qi + (i - 9)q2)

В зависимости от значений параметров а, Ь, q минимальные значения целевой функции игрока «И» могут приниматься как на границе интервала [г;г],

так и при е =

b

¡а^ + (1 - в^

Случай 2. Неполная информированность игрока «К» относительно типов игрока «И»

Пусть «И» может быть двух типов и типы игроков определяет коэффициент трудозатрат Ь, соответственно, для первого типа — Ь1, для второго типа — Ь2. Игрок «И» точно знает, какого он типа, игрок «КО» считает, что «И» — первого типа с вероятностью в, второго типа — с вероятностью (1 — в).

Поскольку /КО линейна относительно q и принимает свое минимальное и максимальное значение на границах интервала ^; ^ ] независимо от выбора стратегий вторым игроком, оптимальные стратегии

будут иметь вид q* = q, ei* =

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

b

i

a • q

V

b

2

a • q

Случай 3. Двусторонняя неполная информированность игроков при наличии статистически независимых информационных параметров

Предположим, «КО» может быть двух типов: с параметром п — для первого типа, п2 — для второго типа. Аналогично «И» имеет два типа: с параметрами Ь1 и Ь2 для первого и второго типа соответственно. Оба игрока точно знают свои собственные типы. Игрок «КО» считает, что «И» первого типа встречается с вероятностью р , второго типа — с вероятностью (1 — р). Игрок «И» считает, что «К» первого типа встречается с вероятностью в, второго типа — с вероятностью (1 — в). Исследуемая задача контроля при двусторонней неполной информированности игроков, где параметры Ь1 , Ь2 , п1 , п2 имеют независимые распределения вероятностей, принимает следующий вид:

Оптимальные стратегии для равновесия Нэша-Байеса в задаче контроля (6)-(9) со статистически независимыми информационными параметрами

имеют вид qi = qi, q2 = q2

£ =

1

b

a(9qi + (i - 9)q2)

a(9q± + (i - 9)q)

Динамическая модель контроля с неполной информацией в рамках совершенного равновесия Нэша-Байеса

Рассмотрим динамическую игру, в которой сначала решение принимает один игрок, а затем, зная стратегию первого игрока, решение принимает второй игрок. Неполная информированность в данном случае определяется не только информационными параметрами, но и очередностью принятия решений. Игрок, который является «последователем» (т.е. тот, который выбирает стратегию вторым), уже может точно знать вид стратегии игрока-«лидера» (принимающего решение первым), но при этом может не знать тип игрока, с которым он имеет дело. Можно провести аналогию между равновесием Штакельберга в играх с полной информацией (относительно возможных типов игроков) и совершенным равновесием Нэша-Байеса (PBE — Perfect Bayesian Equilibrium) для игр с неполной информацией за тем исключением, что при нахождении PBE помимо очередности принятия решений может меняться также и представление игроков о возможных типах друг друга на каждом шаге подыгры.

Ситуация совершенного равновесия Нэша-Байеса — это такая ситуация, при которой игрок дает лучший отклик на стратегии других игроков в рамках рассматриваемого информационного множества. Модели контроля в рамках равновесия по Штакельбергу, где «лидером» является игрок «КО», подробно рассмотрены в работах [7, 8]. Были определены значения параметров, при которых возможны устойчивые состояния системы, рассматриваемой в виде иерархической игры. Наряду с такого рода системами также возможно существование систем, где игроком-лидером является исполнитель. Рассмотрим совершенное равновесие Нэша-Байеса на первом шаге подыгры, определим лучший отклик игрока «КО»

в условиях, когда игрок «И» сообщает свой выбор стратегии, также зависящий от действий игрока «КО».

Пусть игрок «И» может быть двух типов: с информационными параметрами Ь1 — для первого типа и Ь2 — для второго. Игрок «КО» имеет информационное преимущество относительно первого игрока в том смысле, что будет знать стратегии, выбираемые первым игроком. Но при этом не будет знать, с каким именно типом второго игрока он имеет дело, поэтому пытается находить среднее значение по стратегиям второго игрока. Как и в предыдущих случаях, «КО» предполагает, что вероятность появления игрока «И» первого типа равна р , а второго типа 1 — р .

Модель контроля принимает вид

/1И =

/2 И =

a • q • — +

b1

a • q • —2 + -

■ min ;

• min ;

—2 >—2 2

fKo =(c • q+m •( p • —1*2 +(1 - p) •—2

■ min .

q<q<q

arg min

—2 >—2 <—2

a • q • —1 +

b1

a • q • —2 + -

arg min (c • q + d • (p • e[2 + (1 — p) •

q<q<q\ ^

Записывая оптимальные стратегии для игрока «И»,

b

[qp q2]. пРи —1* =

- —2 =

a • q

оптимальную

стратегию игрока «КО» определяет минимизация следующего выражения:

c • q + m •

I-2 I-2

p •ßq + (1—p) чр-

v a • q V a • q

(10)

Условие оптимальности первого порядка для (10) имеет вид

dq

c • q + m

p ^ + (1 — p) ^ a • q a • q

p • Л - (1 - p) • Л

a • q a • q

= 0;

Оптимальный отклик игрока «КО» на действия игрока «И» определяется следующим выражением:

q=

Vc • a • m • (p • b + (1 — p) • b2)

c • a

Запишем ситуацию совершенного равновесия Нэша-Байеса (РВЕ) для данной модели:

получаем е1 =

'1а • q V а • q

Игрок «КО» принимает решения, уже зная выбранные игроком «И» стратегии. Если оптимальные стратегии игрока «И» е1* = е1, е2* = е2, целевая функция /КО принимает минимум на нижней границе интервала

Заключение. Приведем сравнительную таблицу значений стратегий и функций ожидаемой полезности игроков для статической игры с полной информацией в рамках равновесия по Нэшу и для статической и динамической игры в рамках равновесия Нэша-Байеса и совершенного равновесия Нэша-Байеса (РВЕ).

Определим две игры в случае полной информации со следующими значениями параметров, предполагая не нулевой уровень контроля:

Случай 1: а = 100, с1 = 2, т = 90, Ь1 = 1, q = 0,1.

Случай 2: а = 100, с2 = 4.5, т = 90, Ь2 = 1, q = 0,25.

Рассмотрим задачу контроля с неполной информацией для таких же значений параметров и уровня контроля, как и в задаче с полной информацией. Предположим, вероятности появления различных типов игроков имеют следующие значения:

д 2 3

0 = -; p = -.

3 4

Таблица

Значения стратегий и функций игроков в статических и динамических играх с полной и неполной информацией в рамках равновесия по Нэшу, равновесия Нэша-Байеса и РВЕ

Тип игры, значения параметров и принципы поведения игроков Стратегия игрока «КО» q* Стратегия игрока «И» £* Функция ожидаемой полезности /ко Функция ожидаемой полезности /и

Статическая игра с полной информацией. Случай 1 0,1 0,316 9,200 6,325

Окончание таблицы

Статическая игра с полной информацией. Случай 2 0,25 0,141 1,997 4,576

Статическая игра с неполной информацией. Случай 1. 2 с1 ^2>С2) и в = — 0,1 (0,25) 0,258 6,200 (7,125) 7,746

Статическая игра с неполной информацией. Случай 2. 2 q1>cl>Mq1>cl Ь2) и в=— 0,1 0,316 (0,224) 7,700 6,325 (6,708)

Статическая игра с неполной информацией. Случай 3. Значения ^, /ко при и р = — Значения е , /И при 4 2 ql,q2A,(ql,q2 Ь2) и в = — 0,1 (0,25) 0,258 (0,183) 5,450 (6,375) 7,746 (8,216)

Динамическая игра с неполной информацией. р = —. Значения е , /И при Ь1,(Ь2) 0,627 0,316 (0,224) 3,021 23,005 (18,503)

Исходя из значений стратегий и целевых функций, видим, что в статической игре в рамках нахождения равновесия по Нэшу на функцию ожидаемого выигрыша одного игрока влияют лишь значения вероятностей появления определенных типов другого игрока. Игрок «И» не информирует игрока «КО» о своих действиях и о виде своей целевой функции, поэтому «КО» определяет свой лучший отклик на действия «И» как с[ = q , независимо от распределения вероятностей типов игрока «И». Выбор игроком «КО» минимального из возможных значений q , с одной стороны, умень-

шает его затраты на проведение контроля, но, с другой стороны, существенно снижает сам уровень контроля. Ситуацией с меньшими системными потерями является ситуация, в которой игрок «И» сообщает игроку «КО» выбираемую стратегию. В таблице 2 данная ситуация рассмотрена в рамках совершенного равновесия Нэша-Байеса в подыгре и показывает значительное снижение потерь игрока «КО», а также значительное увеличение потерь игрока «И» в данной информационной ситуации по сравнению с ситуацией равновесия Нэша-Байеса в статической игре.

Библиографический список

1. Харшаньи Дж., Зельтен Р. Общая теория выбора равновесия в играх / пер. с англ. Ю.М. Донца, Н.А. Зенкевича, Л.А. Петросяна, А.Е. Лукьяновой, В.В. Должикова; под ред. Н.Е. Зенкевича. — СПб., 2001.

2. Wu H., Parlar M. Games with Incomplete Information: A Simplified Exposition with Inventory Management Applications // International Journal of Production Economics, 2011. — Vol. 133, Iss. 2.

3. Mierendorff K. The Dynamic Vickrey Auction // Games and Economic Behavior, 2013. — Vol. 82.

4. Meirowitz A. On the Existence of Equilbria to Bayesian Games with Non-finite Type and Action Spaces. Economics Letters, 2003. — Vol. 78, Iss. 2.

5. Jimenez-Martinez A. A Model of Interim Information Sharing under Incomplete Information // Int J Game Theory. — 2006.

6. Мамченко О.П., Оскорбин Н.М. Модели иерархических систем. — Барнаул, 2007.

7. Жариков А.В. Модели стимулирования агентов промышленной корпорации в условиях асимметрии информированности // Известия Алт. гос. ун-та. — 2010. — №1/2(65).

8. Максимов А.В., Оскорбин Н.М. Многопользовательские информационные системы: основы теории и методы исследования : монография. — Барнаул, 2005.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

lls

Аннотация научной статьи по математике, автор научной работы — Матюнин Евгений Васильевич

Похожие темы научных работ по математике , автор научной работы — Матюнин Евгений Васильевич

A Study of an Incomplete Information Model of Control with Discrete Statistically Independent Information Parameters

Текст научной работы на тему «Исследование модели контроля с неполной информацией при наличии дискретных статистически независимых информационных параметров»