Научная статья на тему 'Об оптимальных стратегиях асимметрично информированных участников игровых взаимодействий'

Об оптимальных стратегиях асимметрично информированных участников игровых взаимодействий Текст научной статьи по специальности «Математика»

CC BY
205
31
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АСИММЕТРИЧНАЯ ИНФОРМИРОВАННОСТЬ / ВЕРОЯТНОСТНАЯ НЕОПРЕДЕЛЕННОСТЬ / БАЙЕСОВЫ ИГРЫ / РАВНОВЕСИЕ БАЙЕСА – НЭША / ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ / ЧИСЛЕННОЕ РЕШЕНИЕ. / ASYMMETRIC INFORMATION / PROBABILISTIC UNCERTAINTY / BAYESIAN GAMES / BAYESIAN NASH EQUILIBRIUM / CALCULUS OF VARIATIONS / NUMERICAL CALCULATION

Аннотация научной статьи по математике, автор научной работы — Алгазин Геннадий Иванович, Матюнин Евгений Васильевич

Рассматривается принятие оптимальных решений асимметрично информированными участниками игровых взаимодействий в условиях вероятностной неопределенности. Проводится исследование равновесия Байеса – Нэша в байесовых играх. Показывается, что в предложенных постановках байесовых игр нахождение равновесия Байеса – Нэша сводится к решению систем интегральных уравнений. Рассматриваются численные методы и предлагается алгоритм программной реализации решения данного типа задач.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Optimal strategies of players under asymmetric information

Optimal decisions of players under asymmetric information and probabilistic uncertainty are studied using the concept of the Bayesian Nash equilibrium. Calculation of the Bayesian Nash equilibrium for the class of games considered is reduced to solving a system of integral equations. We suggest numerical methods and provide the algorithm to find the solution in such games.

Текст научной работы на тему «Об оптимальных стратегиях асимметрично информированных участников игровых взаимодействий»

УДК 519.865.3 ББК 22.18

ОБ ОПТИМАЛЬНЫХ СТРАТЕГИЯХ АСИММЕТРИЧНО ИНФОРМИРОВАННЫХ УЧАСТНИКОВ ИГРОВЫХ ВЗАИМОДЕЙСТВИЙ

Алгазин Г. И.1

(Алтайский государственный университет, Барнаул) Матюнин Е. В.2

(ООО «МЕМ», Барнаул)

Рассматривается принятие оптимальных решений асимметрично информированными участниками игровых взаимодействий в условиях вероятностной неопределенности. Проводится исследование равновесия Байеса - Нэша в байесовых играх. Показывается, что в предложенных постановках байесовых игр нахождение равновесия Байеса -Нэша сводится к решению систем интегральных уравнений. Рассматриваются численные методы и предлагается алгоритм программной реализации решения данного типа задач.

Ключевые слова: асимметричная информированность, вероятностная неопределенность, байесовы игры, равновесие Байеса - Нэша, вариационное исчисление, численное решение.

1. Введение

Настоящая работа посвящена математическому обоснованию выбора решений при рассмотрении задач с вероятностной неопределенностью в том случае, когда не все

1 Геннадий Иванович Алгазин, доктор физико-математических наук, профессор ([email protected]).

2 Евгений Васильевич Матюнин, главный инженер ([email protected]).

взаимодействующие элементы располагают одинаковой информацией о существенных параметрах, влияющих на принятие решений. Такого рода задачи являются довольно распространенными в социальных и экономических системах. Причины, по которым важная для принятия решений информация, носящая случайный характер, известна одним участникам системы и недоступна другим, также весьма разнообразны.

В данной области исследования широкое применение получили теоретико-игровые подходы. В отечественной литературе эта область широко освещалась в работах, относящихся к теории активных систем [3-6, 13, 16, 18 и др.]. В зарубежной литературе задачи принятия решений в условиях вероятностной неопределенности исследовались в рамках теории контрактов, в качестве примера могут служить работы [23, 26, 29]. В обзорной работе [3] проводится сопоставление основных аспектов теории контрактов и теории активных систем. Авторы указывают на то, что данные области исследования развивались практически независимо, при этом были получены близкие результаты. Подробная классификация различных типов информированности элементов активных систем (в том числе асимметричной информированности) приводилась в [14].

Применительно к активным системам асимметрия информированности центра относительно типов агентов исследовалась, например, в работах [8, 12]. Рассматривалась внутренняя вероятностная неопределенность, где центру не известны типы агентов, но известно, что они описываются распределением Парето. Такого рода задачи возникают, например, при определении оптимального стимулирования или контроля персонала [11]. Также важной прикладной областью, привлекающей внимание исследователей, является разработка автоматизированных систем поддержки принятия решений. При проектировании алгоритмов работы в основу данных систем зачастую закладываются механизмы функционирования и принятия оптимальных решений в условиях асимметрии информированности [2]. В ряде работ уделяется внимание различным способам снижения асимметричности информации,

например, таким, как рыночные сигналы [31] или механизмы с сообщением информации [14].

Широкое применение в теоретико-игровом моделировании систем с вероятностной неопределенностью получили байесовы игры. В них структура информированности игроков задаётся с использованием дискретных либо непрерывных случайных параметров (определяющих типы игроков). Байесовы игры имеют приложение в таких областях, как построение оптимальных экономических механизмов, теория аукционов, теория организации промышленности [32]. Практическое применение теория байесовых игр с асимметрией информированности игроков нашла в описании логистических цепочек поставок [33], интернет-рекламе, проектировании беспроводных сетей и телекоммуникаций [24], инвестиционном менеджменте, где аналитику необходимо предоставить инвестору вид траекторий изменения доходности проекта от изменения некоторых значимых параметров системы [27], и многих других областях.

Исследование асимметрии информированности участников игровых взаимодействий в условиях вероятностной неопределенности относительно существенных параметров системы проводится также в рамках рефлексивных игр. В работе [20] рассматривается рефлексивная игра с асимметричным общим знанием участников о значении величины действий, выполнение объема которых влечет за собой выплату им вознаграждения. В статье [21] исследуется влияние взаимной информированности на выбор стратегий участниками одноходовых рефлексивных игр. Сопоставление подходов байесовых и рефлексивных игр рассматривалось в работе [15], где указывалось на то, что основная трудность исследования байесовых игр в общем случае связана с тем, что их структура имеет достаточно громоздкую конструкцию. Кроме того, были получены выводы о нецелесообразности использования бесконечной глубины структуры информированности для нахождения как информационного равновесия в рефлексивных играх, так и для нахождения равновесия Байеса - Нэша в байесовых играх.

Следует отметить, что универсального «аппарата» аналитического решения байесовых игр (в рамках равновесия

Байеса - Нэша) до сих пор не предложено. Также крайне мало работ, в которых применяются аналитические методы исследования, направленные на поиск общих закономерностей байесовых игр с асимметричной информацией. Поэтому в представленном исследовании авторы акцентируют внимание на математических аспектах принятия решений в условиях асимметрии информированности (относительно существенных вероятностных параметров системы), когда каждый участник взаимодействия вынужден определять стратегию поведения, предполагая, что оппонентам известна недоступная ему информация. При этом он может не представлять в точности, в какой мере его собственная информация известна другим.

Будем рассматривать решение непрерывных байесовых игр, используя в качестве математического аппарата исследования вариационное исчисление, так как стратегиями участников являются некоторые решающие правила (функции), определенные в пространстве допустимых решающих правил, доставляющие максимум целевым функционалам игроков и зависящие от входящих в рассматриваемую модель случайных параметров. Оптимальность выбора полученных стратегий обосновывается нахождением решения соответствующих задач вариационного исчисления с дополнительными условиями асимметрии информированности. Разработка методов решения байесовых игр с учетом этих условий игроками при обосновании оптимальности стратегий будет определять оригинальность проведенного авторами исследования.

Структура изложения материала настоящей статьи следующая: во втором разделе приводятся информационные формулировки байесовых игр. В третьем разделе предложено использование дополнительных условий асимметрии информированности в дифференциальной форме для байесовых игр. Четвертый раздел посвящен решению байесовой игры с полиномиальными целевыми функциями игроков. В пятом разделе рассматриваются численные методы нахождения равновесия Байеса - Нэша, сводящегося к решению систем интегральных уравнений Фредгольма. Шестой раздел посвящен рассмотрению примера конкурентного взаимодействия двух предприятий, принимающих решения по выбору оптимальных

планов производства в условиях асимметрии информированности. В заключении обсуждаются основные результаты и перспективы продолжения исследований. В приложении приводится доказательство теоремы о существовании равновесия Байеса - Нэша в рассматриваемых байесовых играх.

2. Общая теоретико-игровая модель с неполной информированностью участников

Приведем общую формулировку байесовой игры, следуя работе [25]. Байесова игра задается набором:

О = {Ы, 0, X, Б, Р}, где N = {1,...,п} - множество игроков;

X = П X - множество допустимых действий игроков

(X- - набор возможных действий /-го игрока);

© = ^©. - множество всех типов игроков (0г - набор

возможных типов /-го игрока, типы задаются случайными параметрами);

Б:XЯ - множество всех функций выигрышей игроков;

Р = П Р - множество представлений всех игроков о типах

iGN

соперников (множество функций распределения типов игроков).

Стратегией /-го игрока в данном случае является отображение

х, (в'): 0, ^ X,,

где в' - вектор случайных параметров, определяющих тип /-го игрока.

Принято выделять три информационные формулировки байесовых игр, зависящих от того, принимаются ли решения до наблюдения реализовавшихся значений типов игроков либо после [28]. При этом на момент принятия решения может иметь место как частичная, так и полная реализация значений всех случайных параметров, определяющих типы игроков.

Рассмотрим типы равновесий Байеса - Нэша, соответствующие различным информационным формулировкам байесовых игр (в настоящей работе будут исследоваться только ситуации равновесия в чистых стратегиях).

1. Сложившаяся игровая ситуация x*(-),..., xn(-) называется ситуацией равновесия Байеса - Нэша в ex ante («предварительной») формулировке, если V i е N выполняется:

(1) Е[в]/г (x* (вг), x*_i (в-i), в) > E[e]fi (x (вг), x*_i (в-), в),

где E[] - оператор математического ожидания, f - функция выигрыша i-го игрока. В том случае, если типы игроков являются непрерывными случайными величинами, оптимальные стратегии игроков в рамках ex ante равновесия Байеса - Нэша (1) определяются в виде:

x;(0')eArg max \ ft (хг.(<? ), (¿Г ), в\ёР(в),

xi(S )GXi 0

где х" ¡(в ') - оптимальные отклики всех игроков на действия 7-го игрока; Xt - множество допустимых стратегий-функций i-го игрока; в- - вектор случайных параметров, определяющих типы игроков отличных от i-го; в - вектор всех типов игроков рассматриваемой системы.

C информационной точки зрения формулировка ex ante байесовой игры предполагает рассмотрение взаимодействий участников до получения игроками информации о реализовавшихся значениях случайных величин. Таким образом, участникам известны только функции распределения типов.

2. Interim («промежуточное») равновесие Байеса - Нэша -равновесие, при котором каждый игрок уже информирован о реализовавшемся значении своего типа, но не информирован о значениях типов других игроков. Состояние равновесия Байеса - Нэша для данной формулировки игры рассматривается в следующем виде:

в (X* в' ), X-i в ), в', ^ )> Ев (Хг (в ), X— в ), в', ).

Формализация данного вида равновесия Байеса - Нэша изначально закладывает асимметричную информированность участников игрового взаимодействия о типах друг друга.

3. Ex post («завершенная») формулировка байесовой игры рассматривается после получения значений исходов для каждого игрока. То есть после того как типы всех участников стали известны. Ex post равновесие Байеса - Нэша записывается в виде:

/ (X* (в'), x_ (в'), в', в-') > / (x (в'), x_ (в'), в', в-').

В работе не будет заостряться внимание на данном случае, так как такого рода игровая ситуация предполагает полную информированность участников обо всех параметрах системы.

3. Формализация условий асимметрии

информированности в задачах принятия решений

В начале раздела рассмотрим содержательный пример информационного взаимодействия в условиях вероятностной неопределенности при асимметрии информированности. В данном примере также будет представлен переход от «предварительной» к «промежуточной» формулировке байесовой игры.

В качестве такого примера могут служить игровые взаимодействия в модели конкуренции двух фирм (например, модели конкуренции Курно, Чемберлина [30]), выходящих на рынок с однотипным товаром. При нахождении рациональных стратегий поведения может рассматриваться достаточно большое число параметров, которые влияют на ожидаемую прибыль каждой фирмы. Среди них могут быть параметры, о значениях которых участники взаимодействия информированы не полностью, например, один участник может быть не информирован о достаточно большем числе параметров, влияющих на определение себестоимости товара оппонентом. Такими параметрами могут быть тарифы электроэнергии, заработная плата персонала, эффективность используемого оборудования, различные накладные расходы (например, затраты на ведение рекламной компании), которые являются

существенными с точки зрения участников взаимодействия при выводе товара на рынок. При этом зачастую необходимо определить стоимость продукта и рынки сбыта до того момента, когда будут известны конкретные значения случайных параметров (на начальном этапе известны только вероятностные меры, полученные на основе анализа различных статистических данных), либо конкретные реализовавшиеся значения некоторых параметров так и не станут известны определенным игрокам. Такой информационный случай при рассмотрении задачи в виде байесовой игры соответствует как раз ex ante формулировке данного игрового взаимодействия. Переход от «предварительной» к «промежуточной» формулировке в модели конкуренции Чемберлина происходит в тот момент, когда каждая фирма получает информацию о том, конкретные реализовавшиеся значения каких случайных параметров она сможет наблюдать, а о значениях каких случайных величин так и не будет информирована. Принятие рациональных решений в такой информационной ситуации предполагает нахождение оптимальных стратегий участниками игрового взаимодействия в условиях асимметрии информированности.

Перейдем к формализации условий асимметрии информированности. Рассмотрим байесову игру двух лиц, введенную в разделе 2, где второй игрок не будет иметь информации о реализовавшихся значениях параметров в1 = (в, ..., в), в1 е 01, а первый игрок не будет информирован о реализовавшихся значениях набора параметров в2 = (вй+1, ..., вг), в2 е ©2. Вектор информационных параметров ве © имеет следующую структуру: в= (в, ..., в, ви+1, ..., вг), © = ©1 и ©2 - множество всех информационных параметров системы; множество всех индексов случайных параметров обозначим I; множество индексов, отражающих номера компонент вектора параметров, неизвестных первому игроку, обозначим I2 е I, второму игроку - I1 е I. Решения участниками принимаются в предположении, что никакой дополнительной информации по реализации значений вектора параметров в 1 для второго игрока, в2 для первого игрока, не ожидается [7]. Применяя принцип усреднения для устранения

неопределенности, формально считаем, что принимаемое оперирующей стороной решение зависит от того, какие значения примут неопределенные параметры, определяющие её тип, и от усредненных значений параметров оппонента. В работах [9, 10] асимметрию информированности игроков относительно существенных параметров рассматриваемой системы, применительно к задачам с вероятностной неопределенностью, предлагалось формализовывать введением дополнительных ограничений следующего вида:

ад

(2)

дд1

■ = 0 (] = И +1,...,г);

дХ2(0 = 0 (г = 1,...,И).

двг

Качественно условия (2) означают, что стратегия конкретного игрока не зависит от параметров, точные значения которых так и не станут ему известны в ходе игрового взаимодействия, но могут быть известны оппоненту. Подобные условия (в виде не строгих неравенств) использовались в работах [1, 4], но они имели иной содержательный смысл.

Далее в работе будем рассматривать тип задач, удовлетворяющих следующим начальным предположениям:

1) на момент принятия решения о выборе стратегий игроки не знают реализовавшиеся значения своих типов (либо эти значения еще не реализовались);

2) каждый игрок сможет наблюдать значение своего типа, но не получит никакой дополнительной информации о реализовавшемся значении типа оппонента (условие асимметрии информированности (2));

3) для оценки своего выигрыша игроки на момент принятия решения рассматривают следующую функцию ожидаемой полезности:

и = |/г (X(6г),х- (в-)66)сР(6) ^ тах;

@ хг(6 )

4) игрок / рассматривает функционирование своей системы в предположении, что он оперирует стратегией-функцией х*,(6')

и, соответственно, определяет ожидаемый выигрыш в предположении того, что придерживается данной стратегии.

Таким образом, будем рассматривать нахождение ex ante равновесия Байеса - Нэша c описанными выше условиями асимметрии информированности участников взаимодействия.

4. Равновесие Байеса - Нэша в играх двух лиц

с асимметрией информированности участников

В качестве метода нахождения равновесия Байеса - Нэша рассмотрим сведение решения байесовой игры к задаче оптимального управления в случае несовпадающей информированности субъектов управления. Оператор управления состояниями субъекта функционирует в динамической случайной среде. Пусть в1, в2 - случайные векторы с функциями распределения ^(в1), Pi(e2). Множества индексов Ii, I2 определяют структуру управляющих переменных xi(0, Х2О.

Более подробно решение байесовой игры с асимметричной информацией рассмотрим для задачи с полиномиальными целевыми функциями, где r = 1, h = 1, т.е. в= (в, в). Предположим, в целевую функцию первого игрока искомые стратегии xi(-), Х2О входят со степенями n, m, второго игрока -со степенями k, l, и целевые функции имеют вид:

п т п

fx = In " а)" + Ч2 " aУ ~b)2 + 2q13 (x, - a)2 6X +... + q4402,

k_ l k_ Л = " Cf + 2SU (X1 " C)2 (*2 " e)X2 + 1S13 (Xj -c)2 6X + ... + S44d2,

где Xj = Xj (6> ),

X2 ~ X2

Запись целевых функций в матричной форме выглядит следующим образом:

/ (Xi (в,),x2 (в2) А,в2) = AQAt,

/2 (Xi (в ) , X2 (в2 ) ,в,, в2 ) = BSB\

где

Q = QT =( qj ) , S = S T =( Sj ), Sj E R , qj e R

- некоторые коэффициенты (/, ] = 1, ..., 4),

( п т \ ( к

А =

(х1-а)2,(х2-Ь)2 ,0,02 ,В= (хг-с)2,(х2-е)2,01,0:

'2

/V /

Для устранения неопределенности будем использовать оператор математического ожидания.

Пусть выполнены следующие условия:

1) случайные величины 01, 02, определяющие типы

игроков, распределены на интервалах 0, 01 ], [02, 02 ] соответственно. Будем рассматривать случай, где

[01, 0] = [02, 02] = [0, 0], Я , Я;

2) х ('), х2 (') - выпуклые и непрерывно дифференцируемые функции по 0, 0 на интервале [0, в] ;

3) Р(0,0) = Р(0)'Р2(0) (т.е. 0, 0 - независимые случайные величины);

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4) функции распределения Р1 (02), Р2 0) непрерывны по

01, 02 ;

5Х1(') П дХ20 п

5) выполняются условия: -= 0, -= 0;

д02 50

0 0

6) { р (02)ё02 = 1, | р2 (01)ё01 = 1, где р (02) , Р2 (01) -0 0

плотности распределения соответствующих случайных параметров.

Рассмотрим случай, где целевые функции игроков зависят и от 01, и от 02, при этом первый игрок находит стратегию, зависящую от параметра 01 (сможет наблюдать реализовавшееся значение случайной величины), а второй игрок находит стратегию, зависящую от параметра 02. Условия вида (2) позволяют обосновать нахождение ситуации равновесия Байеса - Нэша для игры с асимметрией информированности участников. Ситуация равновесия Байеса - Нэша в данном случае записывается в следующей форме (не учитывается

момент реализации значений соответствующих случайных величин):

Ев/i (X* (в1), X* в ), в)> Ев/1 (Xi (в ), X* в ), в), Е[в]/2 (X* (в ), X* в ), в)> Е/ (X* (в1), X2 (в2 ), в),

где в = в в2 ) .

Так как стратегии игроков определяются в виде некоторых функций, зависящих от параметров в1, в2, то для нахождения решения рассматриваемой игры необходимо найти решение следующей задачи вариационного исчисления: их = J fx (xj, х2,вх,в2 )dP(9) —» max,

•max,

Л2

(4)

дв2 56»!

где М1, И2 - функции ожидаемой полезности игроков, определяющие ожидаемый выигрыш, в предположении того, что игроки будут оперировать стратегиями-функциями хх, х2, усредняя параметры, значения которых соответствующим участникам известны не будут.

Полученные выражения рассматриваем как задачу оптимального управления, где х15 х2 - управление, а

ограничения

=р =0

дв2 ' двх

являются дифференциальной связью и выполняются во всех точках непрерывности управления на ©. Таким образом, исследуемые задачи управления являются задачами со свободными концами и требуют нахождения стратегий, доставляющих экстремум функционалам среди всех

0

U2

0

допустимых функций х, е (л . . х2 е С} . . лежащих

заданных вертикалях.

Составим функции Лагранжа для задачи (4):

( ря- \

с/0,

1л=\^/,(х„х2,в„в2)р(в) + цх(в,)

[в2 И

дхх

на

д0

с/0,

где Л1, Лг, *(•), *г(0 - множители Лагранжа, р(0) - плотность распределения вектора 0.

Выпишем условия оптимального в слабом смысле стохастического процесса по хг, х2:

_8_ дх^

д

А А А) Р (в)+м (в1)

дх~,

Л

Лз/з (х, х2,0,02) р (в) + ц2 (в2)

д(/1(х1ААА)рМ))_дм1{д,)

V д02 У

= 0,

д0

= 0:

^-1 уу

йх,

д0

2

Условия трансверсальности для свободных границ записываются в виде

* (0) 0400=0,

* (°2) 10е[0,0] = 0-

02 ^[02,02 ]

Пусть Л1 = 1, Л2 = 1. Принимая во внимание, что

0

0

Л2 (02 ) 1аеГ« Д!" |

0 I (х, (61 ), Х2 (02 ) ДД ) Р (02 ))

дос.

Л (01 ) 1е1еГдд

сх,,

получаем необходимые условия экстремума следующего вида:

02 а(Ц (х, (01 ) , Х2 (02 ) ,01,02 ) Р1 (02 ))

12 V 2 , дху

| 5( 12 ( Х (01 ) , Х2 (02 ) ,01,02 ) Р2(0,) )

2 V 2; дхп

% " 0,

" 0.

Следовательно, нахождение ситуации равновесия Байеса -Нэша игры (4) сводится к решению следующей системы интегральных уравнений:

(

(

\\

Чп

-— + - а)2 ди (х2 - Ь)2 + + д14в2

( пр0) )-1

% " о,

(х2-е)" 1-1 ( к- ^

2 _1-+ (^2"е)2 512(Х! -С)2 +5230! +52402

22

(Р (01 )Г

91 " 0.

Таким образом, мы получили систему интегральных уравнений, решения которой являются искомыми стратегиями-функциями игроков в задаче (4).

Тип полученных интегральных уравнений зависит от степеней подынтегральных полиномов и значений коэффициентов. Например, при п = т = к = I = 2, полученное выражение является системой интегральных уравнений Фредгольма второго рода.

Приведем теорему о существовании равновесия Байеса -Нэша в задачах вида (4). Существование равновесия Байеса -Нэша в чистых стратегиях зависит от существования

—2

в.

2

2

неподвижной точки оператора в бесконечномерном пространстве.

Стратегия игрока в этом случае является измеримой функцией Xj(0j) : 0, —> А',, где xj(9j)eXj - пространство измеримых функций, реализующих отображение из ©г в X, с нормой следующего вида: || хг ||= sup | xi (Ьг) |, / = {1, 2}.

Для рассмотрения вопросов существования равновесия Байеса - Нэша в игре вида (4) сформулируем следующую теорему о существовании неподвижной точки отображения метрического пространства в себя.

Теорема 1. Сложившаяся игровая ситуация (x*i(hi), x*2(h2)), где x*i(#i) : ©i ^Xi, x*2(ft) : ©2 ^Хг, определяет равновесие Байеса - Нэша в байесовой игре (4), если выполнены следующие условия:

1) функции распределения P(hi | (h), P(h | di) непрерывны по hi, (2 (т.е. представления игроков о типах друг друга непрерывны по соответствующим типам);

2) пространства типов ©i, ©2 - не пустые, выпуклые и компактные подмножества евклидова пространства;

3) пространства действий Xi, Х2 - не пустые, выпуклые и компактные подмножества евклидова пространства;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4) целевые функции игроков fi(xi, хг, hi, h), f2(xi, Х2, hi, (h) являются непрерывными по xi, x2, hi, h;

5) Vh и измеримой функции x-i (h-) функция ожидаемой полезности E[e\(fi(xi(9i), x-i(h-i), h, h-i)) унимодальна по xi (i = {i, 2});

6) выполняется равностепенная непрерывность семейства допустимых стратегий-функций х. (di) е Xi.

Доказательство теоремы приводится в Приложении и основывается на установлении существования неподвижной точки отображения функционального пространства в себя.

5. Численный алгоритм нахождения равновесия Байеса - Нэша в задачах с асимметричной информированностью участников

Приведем алгоритм нахождения ситуации равновесия Байеса - Нэша в байесовой игре с асимметричной информированностью участников. Рассмотрим подход к нахождению равновесия Байеса - Нэша, сводящийся к решению системы интегральных уравнений Фредгольма 2-го рода следующего вида:

\ (0! )-4 | Х2 (02 ) К (0!, 02 ) й02 = у (0! ) ,

(5) 1

Х2 (02 ) - Л | Х (0 ) К2 (0 ,02 )= у2 (02 ),

01

где Х10), Х2(02) - искомые стратегии-функции первого и второго игроков соответственно;

К (0, 02 ) , К2 (01, 02) - ядра интегральных уравнений; у (0), у2 (02) - правые части интегральных уравнений; Л , Л - константы.

Запишем решение исходной задачи (4) в виде следующей системы интегральных уравнений:

-ау _ъу рЛв2)(1в2=_Чив1 _Чы ¡в2Р1{в2)М2,

Чи е, Чп Чи е,

(Х2 - е)2 + | (Х - с)2 Р2 (0: ) " -02 - ^ 0 0 Р2 (0 ) .

Данная система нелинейных интегральных уравнений сводится к системе интегральных уравнений Фредгольма 2-го рода вида (5) при выполнении следующих условий:

1) п = т = I = к = 2;

2) л =-—,Л ;

Ч11 522

3) дп Ф 0, 522 Ф 0;

0

4) У 0 -^\в2рх{в2)dв2,

Чи ql 1 02

с У 0

у2 {02 ) = -^02 - ^ 0 Р2 {01)^;

^22 ^22 01

5) ВД = А(02), ^(О = Р20) •

Численное решение представленной задачи будем рассматривать для общего случая, где ядра интегральных уравнений зависят от параметров 01, 02. Такая ситуация возможна, если случайные величины 01, 02 имеют совместную плотность распределения. Предлагаемое решение также в полной мере применимо и для случая независимых плотностей распределения.

Проведем замену системы интегральных уравнений конечномерной системой алгебраических уравнений. Применяя для численного решения квадратурную формулу, представим систему интегральных уравнений (5) в следующем виде [17]:

(6)

* ^ ) - ££ 00-0 Х2 {^ К {^ , ^ ) = У1 {^ ) + 1 = 1' ^

х2 {'у) - £0-0X {^ {, ) = У2 ) + V, 1 = 1т,

1 П

01 -01 1 П

где V - ошибка, связанная с заменой интеграла конечной суммой, ^ и - соответствующие значения разбиений случайных непрерывных параметров в узлах сетки (исследование задачи будем проводить в предположении, что

01 = 02, 01 =02 ).

Для решения системы уравнений (6) составим матрицу коэффициентов её левой части:

Г Е Л2 Л ^ Е /

где Е - единичная матрица соответствующей размерности,

(7) Л =

A1 =

-К (^+1,51

-Kl (^, 51)

-к, к,*

\ (

Л2 =

- К2 (t1, ^+1

-К2 (^ , +1

-•Мм»)

~К2 К/'5»

Таким образом, система (6) имеет матричную форму записи следующего вида:

(8)

ГЕ Л

V Х1 У

МО

>"2 (О

>2 ('„)

Решением рассматриваемого уравнения (8) является набор значений функций Х1(0, Х2(0, полученных в узлах сетки. Введем

следующие обозначения: хх = (х,1,..., х"), х2 =^х12,...,х"У

Интерполирование стратегий-функций х^) и Х2(0 будем проводить нахождением полиномов некоторой степени с использованием многочленов Лагранжа:

п

< ^) = М' (t),

(9)

г =0

п

'(t ) = ! х2/2 (t).

г =0

В выражениях (9) /ДО, /2г(0 - базисные полиномы, хДО, (?) являются приближенными с некоторой точностью решениями системы (5).

Х

2

Определим базисные полиномы следующим образом:

п

11 (* )= п

Х1 - х} Х1 "Х0 Х1 -ХГ' Х1 -хГ Х1 -х;

X - х} X х; --г1 х; -хГ х; -х;

Х2 - Х2 _ Х2 — х2 Х2 — х2 Х2 — х2 Х2 — х2

Х2 - х2 Х2 — х2 х2 — х2 х2 — х2 х2 — х2

12 (* ) = П

Для определения погрешности численного решения уравнения (9) вычисляется функция невязки: (10) Я (*) = Ха(г)-д$ К (*, 5 ) Ха( 5 ) Ж - у (?) ,

где

1 (*)

Ха (*) =

VХ2 (*)у

(,

Ха (^) =

1 ( ^ )

Л

3 (* )=

У2 (*)

К(*, 5) =

Х2 (5)/ К (*, 5)

0

0

К2 (5)

Абсолютная величина невязки определяется следующим образом:

Яа = тах | Ха (*) - 5\К (*, 5)Ха (5)Ж - у (?) |.

0 в

Рассмотрим основные этапы программной реализации алгоритма решения задачи вида (5).

1. Инициализация входных параметров. В алгоритме задается число разбиений исходных интервалов, границы интегрирования, функции ядер, правая часть системы (5), интервалы для вывода графиков, параметры интерполяции.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2. Построение расчётной сетки.

3. Вычисление элементов матрицы коэффициентов (7). Заполнение матрицы коэффициентов системы уравнений (8) на основе выражений (9).

4. Решение уравнения (8).

5. Интерполяция решений. Для решений X (*) и Х2 ) уравнения (8) строится интерполяционный полином заданной степени.

в

6. Вычисление невязки. По формуле (10) вычисляется функция невязки для полученных полиномов, определяющая порядок точности проводимых вычислений.

7. Вывод результата.

Уточним, что представленный алгоритм допустим для систем интегральных уравнений с несингулярными ядрами.

Для демонстрации применения рассмотренного численного метода к нахождению ситуации равновесия Байеса - Нэша в предложенных задачах приведем расчетный пример описанного алгоритма с несингулярными ядрами интегральных уравнений, зависящими и от параметра 01, и от параметра 02:

Рассмотрение данного расчетного примера возможно, если случайные величины 0, в имеют экспоненциальные на интервале плотности распределения. Предположим, что множество непрерывных случайных параметров определено на интервале [0, 1]. Пусть правая часть первого уравнения системы (5) является функцией, зависящей от параметра 0, и имеет вид: 2 - ei/З. Правая часть второго уравнения системы (5) является функцией, зависящей от параметра вг, и имеет вид: 12/5 - вг.

Интерполирование проведем с использованием многочленов Лагранжа 4-й степени. Результат, полученный в ходе реализации представленного алгоритма в программной среде математического моделирования Maple, проиллюстрируем с помощью графиков (см. рис. 1 и 2).

(1 + 0 )

Рис. 1. Реализация алгоритма нахождения равновесия Байеса Нэша в игре с асимметричной информацией. Окно вывода результата (число разбиений исходного интервала п = 15)

Рис. 2. Реализация алгоритма нахождения равновесия Байеса Нэша в игре с асимметричной информацией. Окно вывода результата (число разбиений исходного интервала п = 40)

В верхней части рис. 1 и 2 представлены полученные интерполяционные полиномы, определяющие численное решение системы интегральных уравнений (5), их вид также

представлен на графике 1. В рассматриваемой теоретико-игровой интерпретации данные полиномы определяют стратегии игроков в виде функциональных зависимостей. На графиках 2 и 3 представлена величина погрешности применяемого численного метода в виде функций невязок, определяющих точность проводимых вычислений для различного исходного числа узлов разностной сетки. Анализ приведенных зависимостей показывает, что при изменении числа разбиений исходного интервала с 15 до 40, абсолютная величина невязки уменьшается для Х1а(0 с 0,00064 до 0,000081, для Х2а(0 с 0,00025 до 0,000042. Таким образом, рассмотренный пример также иллюстрирует, что предложенный численный метод применим для нахождения равновесных ситуаций в исследуемых задачах.

6. Пример конкурентного взаимодействия двух предприятий в условиях асимметрии информированности

Рассмотрим в качестве примера модель дуополии Курно [30] в виде байесовой игры (с конкретными целевыми функциями, стратегиями, типами), для которой сначала выпишем интегральные уравнения, затем получим их численное решение и проинтерпретируем его в терминах исходной задачи.

В исследуемой модели каждый из двух конкурирующих друг с другом производителей, производящих однотипный товар, пытается максимизировать свою прибыль, которая зависит от его собственных действий, от действий конкурента и от некоторых параметров рассматриваемой системы. При этом каждый производитель покрывает своей продукцией некоторую часть рыночного спроса при единой цене. Оптимальное решение будет определяться выбором плана выпуска продукции каждым предприятием в зависимости от действий конкурента и от ожидаемых значений случайных параметров, определяющих себестоимость производимой продукции, при асимметричной информированности предприятий о точных значениях этих параметров.

Введем описание того, при каких условиях взаимодействия предприятий возникают подобные задачи с асимметрией информированности участников. Для построения торговых стратегий и планирования продаж дилерам необходимо знать оценочную стоимость либо количество производимой продукции задолго до выпуска нового вида товара. Поэтому у предприятий возникает необходимость сообщать дилерам, реализующим производимый товар, стоимость продукции либо объем производимой продукции до момента начала выпуска несмотря на то, что в системе может присутствовать множество неопределенных (случайных) параметров, оказывающих влияние на себестоимость продукции. Производитель в некоторых случаях может так и не узнать точные значения всех параметров, влияющих на определение конечной стоимости продукции, но эти значения могут быть известны конкуренту. В рассматриваемой модели каждый производитель на момент начала выпуска будет информирован о себестоимости своей продукции, но не будет информирован о себестоимости однотипной продукции конкурента. Асимметрично информированные производители в ходе определения своих оптимальных стратегий могут проводить усреднение по всем случайным параметрам, но также могут воспользоваться доступной им информацией, выбирая стратегии в виде функциональных зависимостей от возможных значений случайных параметров. В ряде случаев это приносит существенное увеличение прибыли каждого участника, а также увеличение общей отраслевой прибыли.

На приведенном примере рассмотрим также эффективность применения стратегий-функций (от параметров, значения которых станут известны производителям на момент реализации решения) по сравнению со стратегиями, полученными в виде числовых значений при усреднении ожидаемых полезностей производителей по случайным параметрам.

Модель Курно представим в виде байесовой игры (в соответствии с изложенной в разделе 2 формулировкой) со следующими функциями ожидаемой полезности:

a x^ %2

X -t

_ a xi X2 p

U2 ~ X2 — в2 X2 , b

где a, b - положительные константы;

xi, X2 - стратегии игроков (количество производимых единиц продукции);

di, 02 - типы игроков (стоимость производства единицы продукции).

Участники взаимодействия стремятся максимизировать свои функции ожидаемой полезности:

щ (x, X ,в) — max,

xi

w2(x,X,0) — max.

x2

В модели стоимость производства единицы продукции является не постоянной величиной, а может изменяться в зависимости от множества факторов, таких как технологии производства, уровень заработной платы персонала, стоимость сырья, комплектующих и т.д.

Найдем стратегии, полученные в виде числовых значений при усреднении функций ожидаемой полезности по непрерывным случайным параметрам (случай I). Трактовать данную ситуацию взаимодействия будем таким образом, что на момент начала производства предприятие либо не будет иметь точной информации о себестоимости продукции, либо использование стратегий-функций для определения плана производства по каким-либо причинам недопустимо. Функции ожидаемой полезности в данном случае имеют вид:

J a X X2 x-0XidPi(0) -

h

\ _ _

J0 X X2 X2 -02 Х2йР2{в2) -

max,

■ max.

b

X

X

2

— " " — "

°1 ,О1 _ , О2,О2

Предположим, что случайные величины О, О распределены равномерно на интервалах

соответственно, т.е. рг (О) = =——, Р2 (О) = — • Выполне-

О1 " °1 О2 - О2 ние условий оптимальности первого порядка приводит к необходимости решения системы уравнений:

^ 2Х|

(11)

ь

О

О

-/Оа(О¥О = о,

а Х1 2*2--/О2р2(в2уе2 = 0.

ь

Пусть случайные параметры имеют следующие множества допустимых значений: О, О е [1,28; 3,01], константы а = 9500, Ь = 350. Определяя решение системы уравнений (11), получаем оптимальные стратегии производителей: x\ = X2 = 2916,42. Ожидаемые прибыли равны: щ = щ = 24301,39. Суммарная общая прибыль следующая: и = щ + и2 = 48602,35.

Рассмотрим случай, где предприятиям на момент начала выпуска может стать доступна некоторая дополнительная информация о существенных параметрах системы (случай II). В частности, на момент реализации решения производителям будет известна себестоимость производства собственной продукции. При этом первый производитель не информирован и не будет информирован о точном значении параметра О2 (себестоимость единицы продукции конкурента), а второй производитель не информирован и не будет информирован о точном значении параметра О. Функции ожидаемых полезностей производителей зависят как от выбора собственной стратегии, так и от выбора стратегии конкурентом. Рассматривая описанный случай взаимодействия, запишем функции ожидаемой полезности следующим образом:

2

в- eJ a X(e) X2(02) x (в ) - в x (в )dP (в )dR (в) - max,

в J b X1(01)

] j a —^j)-X2 (02)X2 (02)-в2x2(в2)dPl(вl)dP2(в2) -max.

b X, (в )

в в b 2 2

Введем условия асимметрии информированности

производителей:

i5x (в )

двг 3X2(02)

= 0, = 0.

В соответствии с изложенным в разделе 4 методом решения, нахождение ситуации равновесия Байеса — Нэша сводится к решению системы интегральных уравнений:

) Щё- dв2 -Г ^+е ^^ ЪШ {е2^е2 = о,

в2 а Ь V ь ):е2 02 Ь

е Щ)dе -V^^+021] р(еме —] ^р(ещ = 0.

е а 1ъ I ь )е_1 I ь

Принимая во внимание свойства плотности распределения:

е Р(е)dе1 = 1, {Р2(е2^е2 = 1,

получаем следующую систему интегральных уравнений:

1 е2 а—ье

Х- (е) + -{ Х2(в2)р2(в2^в2 =■ '

J 2 ^ 2 2 ^ 2 ^ 2 ^^

1 в1 a —Ь0

x2(02) + - J Xl(вl)A(вl)dвl = —-в!.

^ А 2

Применяя численный метод решения, рассмотренный в разделе 5, получаем решение системы интегральных уравнений, определяющее оптимальные стратегии-функции предприятий:

—2

-

Х1(О) = 3291,79 - 175,00О, Х2(62) = 3291,79 - 175,0062. Ожидаемые прибыли в данном случае равны: щ = щ = 24323,21, и = их + щ = 48646,42.

Для наглядного сравнения полученных результатов приведем таблицу 1.

Таблица 1. Значения ожидаемых полезностей предприятий

Принцип нахождения стратегий "х('), ^(0 и (•)

I 24301,39 48602,78

II 24323,21 48646,42

Таким образом, если при взаимодействии предприятия с заказчиком допустимо представление плана производства в виде стратегий-функций (используя информированность о значениях себестоимости продукции), то производитель имеет возможность получать дополнительную прибыль. Реализация данной ситуации также позволяет увеличить возможную общую отраслевую прибыль по сравнению с реализацией решения, получаемого в виде числовых значений при усреднении функций ожидаемой полезности по случайным параметрам системы.

7. Заключение

В работе рассмотрен подход к формализации асимметрии информированности участников социальных и экономических процессов и его применение в байесовых играх для нахождения ситуаций равновесия. Исследованы случаи сведения задач принятия решений с вероятностной неопределенностью к решению систем интегральных уравнений. Рассмотрены численные методы и программная реализация решения байесовой игры в условиях асимметрии информированности игроков. На основе изложенных методов проведено исследование взаимодействия асимметрично информированных игроков на примере конкуренции двух предприятия, производящих однотипный товар.

Представленный подход к асимметрии информированности участников игрового взаимодействия и рассмотренные методы решения игр с неполной информацией, на наш взгляд, расширяют прикладную область байесовых игр, а также являются важным инструментом для обоснования выбора правил рационального взаимодействия участников для достаточно широкого класса конфликтных ситуаций. Предложенные методы применимы при решении прикладных задач проектирования оптимальных экономических механизмов, задач теории управления, теории аукционов и других смежных дисциплин.

Перспективным для исследования задач принятия решений с асимметрией информированности представляется подробный анализ и выработка методов нахождения Парето-оптимальных стратегий игроков, исследование методов нахождения совершенного равновесия Байеса - Нэша для сигнальных игр с континуальными пространствами типов, разработка программного инструментария поддержки принятия решений в условиях асимметрии информированности игроков, а также исследование зависимости решения байесовых игр от конечных иерархий представлений игроков.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

8. Приложение

Доказательство теоремы 1. Определим соответствующие вспомогательные отображения. Лучший отклик игрока 1 на сложившуюся информационную обстановку запишем в виде:

г; (б>;, х_г) - отображение, определяющее возможные оптимальные действия хг, зависящие от в1 , х_Л) е Х1 ) .

С = С х С2 - обозначим топологическое произведение пространств непрерывно дифференцируемых функций, где Хх еС15 Х2еС2, ХххХ2 еХеС.

По условию постановки игры (4) типы игроков распределены на пространстве © е Я2, конкретные значения

возможных действий игроков являются элементами пространств Х е Я, Х2 е Я. Рассматривается несингулярный случай, поэтому функции ожидаемой полезности вида (3) являются непрерывными на всей области определения. Таким образом, пункты 2-4 рассматриваемой теоремы для задачи (4) выполняются. Пункт 1 теоремы выполняется, так как представления 7-го игрока о типах других игроков непрерывны по конкретному частному информационному параметру, известному 7-му игроку. Информационные параметры, определяющие типы игроков, являются независимыми случайными величинами. Предполагается, что представления игроков о типах друг друга непрерывны по соответствующим типам.

Условия 2, 4 теоремы означают, что Ув1 е 0г и Ух ; е X_г. нахождение решения выражения (4) включает оптимизацию непрерывной функции по не пустому, выпуклому, компактному пространству, а условия 1 и 3 предполагают, что целевые функции непрерывны по параметрам 07 (7 = {1, 2}).

Для выполнения условия 5 требуется, чтобы целевая функция была унимодальна по всем переменным. Так как Х1 выпуклое, то оптимальное действие единственно \/xi е X1 и Ух_г еХ_г. Таким образом, \/х_г еХ_г лучший отклик игрока 7-непрерывная функция, зависящая от и решение выражения (4) - непрерывная функция zi .): 0. .

Представим г^х ,)'■ X ( Х1 в виде zj ): Хч Ci . Следовательно, неподвижная точка оператора z(x} :С —> С в (4)

определяет ситуацию равновесия Байеса - Нэша.

Теорема Шаудера о неподвижной точке [19] гласит:

оператор г(х}\Т —>Т имеет неподвижную точку, если:

1) Т - не пустое, замкнутое, ограниченное, выпуклое подмножество банахова пространства;

2) г(ху.Т —>Т - компактный оператор.

Выполнение условия 1 теоремы Шаудера вытекает из свойств пространства С .

Рассмотрим подробнее пункт 2 теоремы Шаудера. По определению оператор компактен, если он непрерывен и отображает ограниченные множества в относительно компактные множества. По теореме Арцела - Асколн множество ХсС относительно компактно тогда и только тогда, когда для семейства функций х(6?)еХ выполняется равномерная ограниченность и равностепенная непрерывность.

Так как рассматривается оператор, действующий из одного банахова пространства в другое, то достаточно доказать, что ^(х) вполне непрерывный оператор. Применение условий асимметрии информированности (2) сводит задачу (4) к рассмотрению оператора вида:

х (е) = { к (е ,е1) х (е ме,

где

'X в- (в-,в2) 0 | fJf^

V f2 J

X (в И x^) •K (в в)

о K (в-,в2)

В силу условий 1, 4 теоремы K(0i, в) - непрерывное на квадрате |в<в, в2 <в| ядро. x(0) - ограниченное множество функций из Свв в], II X 11= sup I x(j ) |< k.

в, G©i

Покажем, что данный оператор вполне непрерывен. Докажем равностепенную непрерывность семейства функций x(0). В силу равномерной непрерывности ядра K(0i, в) Уе > 0 найдется такое 5 = 5(e) > 0, что

I K (в-Д) — K (в-0,в2)|^-=е

k (в—в)

в

При |0 -0О|<5 и любых 0е[0,0], где 01, 0° -фиксированные значения параметра 01. Поэтому как только 101 -0О| < 5, так сразу для всех функций х(0)

| X(0/) - X(0°) |< 11 К(0/,0)) - К(0°,0) | X(0Щ < е.

0;

Это и означает равностепенную непрерывность семейства функций х(0).

Теперь покажем, что функции

X (0) = { К (0,0.) X (0 )А0

0;

равномерно ограничены.

Так как по условию постановки теоремы Х7 и 07 компактны, то по теореме Вейерштрасса любая непрерывная вещественная функция на компактном пространстве ограниченна и достигает своих наибольших и наименьших значений. Действительно, для любых 0,02е[0,0] |х(0 )|< Икф-0) , где

М = тах | К(0,0 )|.

а <0,02

По определению оператор является вполне непрерывным, если он отображает всякое ограниченное множество банахова пространства в относительно компактное множество банахова пространства. Следовательно, по теореме Арцела-Асколи, множество ХсС относительно компактно. То есть оператор - компактный оператор.

Так как мы показали, что г(х}\С —>С - компактный и непрерывный оператор и V/ е N С является замкнутым, ограниченным и выпуклым пространством из произведения пространств С, то по теореме Шаудера, неподвижная точка в ^(х): С —> С существует. Что и требовалось доказать.

Литература

1. АЛГАЗИН Г.И., АЛГАЗИНА Д.Г. Моделирование сетевого взаимодействия на конкурентных рынках // Управление большими системами. - 2013. - №43. - С. 172-216.

2. БЕЛЯЕВА М.А., БУРЕШ О.В., ШАТАЛОВА Т.Н. Разработка интегрированной системы поддержки принятия решений по управлению проектами в условиях неопределенности // Вестник Оренбургского государственного университета. - 2011. - №13(132). - С. 43-48.

3. БУРКОВ ВН., ЕНАЛЕЕВ А.К., НОВИКОВ ДА. Механизмы стимулирования в вероятностных моделях социально-экономических систем // Автоматика и телемеханика. - 1993. - №11. - С. 3-30.

4. БУРКОВ В Н., КОРГИН Н А., НОВИКОВ Д А. Введение в теорию управления организационными системами. - М.: Либроком, 2009. - 264 с.

5. ГОРЕЛИК В.А., ГОРЕЛОВ М.А., КОНОНЕНКО А.Ф.

Анализ конфликтных ситуаций в системах управления. - М.: Радио и связь, 1991. - 288 с.

6. ГУБКО М.В., НОВИКОВ Д А. Теория игр в управлении организационными системами. - М.: Синтег, 2002. - 148 с.

7. ЖАРИКОВ А.В. Равновесие Нэша в игре двух лиц для вариантов информированности игроков // Известия Алтайского государственного университета. - 2007. - №1/2(73). - С. 55-59.

8. КОРГИН Н.А., НОВИКОВ Д.А. Задача стимулирования в условиях внутренней неопределенности о типах агентов, описываемых распределением Парето // Системы управления и информационные технологии. - 2006. - №4(26). - С. 66-69.

9. МАКСИМОВ А.В. Расчет двухканальной системы в условиях несовпадающей информированности // Класс управления, использующий принцип противоречия, его проявления в живых системах и возможности применения в технике: Тезисы докладов научно-практической конференции. Иркутск: СЭИ СО РАН, 1984. - С. 75-77.

10. МАКСИМОВ А.В., ОСКОРБИН Н.М. Многопользовательские информационные системы: основы

теории и методы исследования: монография. - Барнаул: Изд-во Алт. ун-та, 2005. - 250 с.

11. МАМЧЕНКО О.П., ОСКОРБИН Н.М. Моделирование иерархических систем: учебник для вузов. - Барнаул: Изд-во Алт. ун-та, 2007. - 317 с.

12. НОВИКОВ Д.А. Задача стимулирования Парето-агента // Автоматика и телемеханика. - 2007. - №1. - С. 137-146.

13. НОВИКОВ Д.А. Теория управления организационными системами. 3-е изд. - М.: Издательство физико-математической литературы, 2012. - 604 с.

14. НОВИКОВ Д А., ПЕТРАКОВ С.Н. Курс теории активных систем. - М.:Синтег, 1999. - 108 с.

15. НОВИКОВ ДА., ЧХАРТИШВИЛИ А.Г. Рефлексивные игры. - М.: Синтег, 2003. - 149 с.

16. НОВИКОВ Д А., ЧХАРТИШВИЛИ А.Г. Рефлексия и управление: математические модели. - М.: Издательство физико-математической литературы, 2013. - 412 с.

17. ПОЛЯНИН А.Д., МАНЖИРОВ А.В. Справочник по интегральным уравнениям. - М.: ФИЗМАТЛИТ, 2003. - 384 с.

18. ФЕДЯНИН Д.Н., ЧХАРТИШВИЛИ А.Г. Модель информационного управления в активных сетевых структурах при неполной информированности центра // Проблемы управления. - 2012. - №6. - С. 13-18.

19. ХАТСОН В., ПИМ ДЖ. Приложения функционального анализа и теории операторов. - М.: Мир, 1983. - 432 с.

20. ЧХАРТИШВИЛИ А.Г. Рефлексивная игра «аккордная оплата труда» // Управление большими системами. - 2004. -№6. - С. 143-149.

21. ЧХАРТИШВИЛИ А.Г. Теоретико-игровое моделирование информационного управления // Управление большими системами. - 2006. - №12-13. - С. 161-171.

22. BERGE C. Topological spaces. - New York: Macmillan Co., 1963. - 91 p.

23. BOLTON P., FAURE-GRIMAUD A. Satisfying contracts // Review of Economic Studies. - 2010. - Vol. 77(3). - P. 937-971.

24. HAN Z., NIYATO D., SAAD W. et al. Game theory in wireless and communication Networks: Theory, models, and application. -Cambridge: University Press, 2012. - 554 p.

25. HARSANYI J.C. Games with incomplete information played by "Bayesian" players // Management Science. - Part I: 1967. -Vol. 14, No. 3. - P. 159-182; Part II: 1968. - Vol. 14, No. 5. -P. 320-334; Part III: 1968. - Vol. 14, No. 7. - P. 486-502.

26. HOLMSTROM B., MILGROM P. Multi task principal-agent analyses: incentive contracts, asset ownership, and job design // Journal of Law, Economics, and Organization. - 1991. - №7. -P.24-52.

27. LELAND H.E., PYLE D.H. Informational asymmetries, financial structure, and financial intermediation // The Journal of Finance. - 1977. - Vol. 32, №2. - P. 371-387.

28. MYERSON R.B. Probability Models for Economic Decisions. -CA.: Duxbury Press, 2005. - 354 p.

29. NEEMAN Z., PAVLOV G. The value of information in a principal-agent model with moral hazard: The ex post contracting case // Games and Economic Behavior. - 2012. - Vol. 74, Iss. 1. -P. 352-365.

30. RASMUSEN E. Games and information. An introduction to game theory. Fourth edition. - Oxford: Blackwell Publishers, 2006. - 484 p.

31. SPENCE M. Signaling in retrospect and the informational structure of markets // The American Economic Review. - 2002. -Vol. 92, №3. - P. 434-459.

32. TIROLE J. The theory of industrial organization. - MA.: MIT Press, 1988. - 479 p.

33. WU H., PARLAR M. Games with incomplete information: A simplified exposition with inventory management applications // International Journal of Production Economics. - 2011. - Vol. 133, Iss. 2. - P. 562-577.

OPTIMAL STRATEGIES OF PLAYERS UNDER ASYMMETRIC INFORMATION

Gennady Algazin, Altai State University, Barnaul, Doctor of Science, professor ([email protected]).

Eugeniy Matyunin, MEM LLC, Barnaul, chief engineer ([email protected]).

Abstract: Optimal decisions of players under asymmetric information and probabilistic uncertainty are studied using the concept of the Bayesian Nash equilibrium. Calculation of the Bayesian Nash equilibrium for the class of games considered is reduced to solving a system of integral equations. We suggest numerical methods and provide the algorithm to find the solution in such games.

Keywords: asymmetric information, probabilistic uncertainty, Bayesian games, Bayesian Nash equilibrium, calculus of variations, numerical calculation.

Статья представлена к публикации членом редакционной коллегии А.Г. Чхартишвили

Поступила в редакцию 10.06.2015.

Опубликована 30.11.2015.

i Надоели баннеры? Вы всегда можете отключить рекламу.