УДК 5l9.863
Г.И. Алгазин
Информационная рефлексия и информационное равновесие в базовых теоретико-игровых моделях конкурентного рынка
G.I. Algazin
Information Reflection and Information Equilibrium in the Basic Game-Theoretic Models of Competitive Market
Рассмотрены подходы теории рефлексивных игр к изучению моделей взаимодействия агентов на конкурентном рынке. Полученные в работе выводы свидетельствуют о существенности влияния структур взаимной информированности агентов на их выбор рациональных действий в условиях конкуренции. Ключевые слова рефлексивные игры, информационная рефлексия, информационное равновесие, конкурентный рынок, торговое посредничество, франчайзинг.
В базовых моделях многоагентного конкурентного рынка и проведенных ранее на их основе исследованиях авторы исходили из наиболее распространенной на сегодняшний день классической концепции решения некооперативных игр — равновесия Курно-Нэша [1-5]. Равновесие Курно-Нэша — это ситуация, когда каждый агент выбирает наилучшую для себя стратегию при условии, что другие агенты не меняют свои стратегии. Эта концепция существенно опирается на то обстоятельство, что условия игры (правила, возможности — допустимые множества, интересы — целевые функции участников) являются общим знанием.
Напомним описание двух базовых прикладных моделей многоагентной сети «центр — агент — рынок».
Модель «франчайзер — франчайзи — рынок» [1, 3]. Рассматривается рынок однородного товара, состоящего из франчайзера и п фирм-франчайзи. Франчайзи реализует товар (услугу) потребителю по цене р в объеме д.. Величина выручки (дохода) рд распределяется между двумя сторонами. Часть выручки крд. получает франчайзер, а другую ее часть (1 — к) pqi получает фирма-франчайзи; k — коэффициент (параметр), определяющий сервисную плату (роялти), которую франчайзер устанавливает для франчайзи в обмен за права на бизнес (0 < к < 1). Предполагается, что только франчайзи этой сети обладают эксклюзивными правами на данный бизнес в рамках определенной территории.
Формально интересы сторон можно записать в виде целевых установок на максимизацию их прибыли:
— для головной фирмы-франчайзера (центра):
I(p, Q, к) = кр(2 ^ (1)
к
к є [0,1];
Approaches of the reflexive games theory to the study on the models of interaction between agents in a competitive market are discussed. The conclusions obtained in the work shows the significant impact of mutual informed agents’ structures in their choice to act rationally in competition.
Key words: reflexive games, information reflection, information equilibrium, competitive market, trade mediation,
franchising.
— для фирмы-франчайзи (агента):
П (Р, q, k) = (1 - k)pqt - ^ (q) ^ max,
_ _ q (2)
qi e [0, q i ], i = 1, n.
Здесь qt — предельно возможный объем активности агента.
Франшизный взнос не включен авторами в базисную модель, а учитывается при необходимости. Значения параметров k и q. являются основным предметом согласования условий договора франшизы. Интересы участников проявляются в том, чтобы отстоять желаемые для себя значения этих параметров и, соответственно, получить выгодные условия договора.
Модель «производитель — посредник — рынок» [2]. Рассматривается рынок однородного товара, состоящего из одного его производителя и n торговых посредников. Посредник продает потребителю товар по цене р, покупая его у производителя по цене (1 — k) р. Таким образом, величина kp есть разница между ценой спроса и ценой предложения на этом рынке. Эта разница и формирует доход посредника. В модели значение параметра k определяется фирмой-производителем.
Интересы сторон представляются в виде целевых установок на максимизацию их прибыли. Эта модель включает:
— задачу фирмы-производителя (центра):
I(Р, Q, k) = (1 - к)pQ -ф{Q) ^ max,
Q,k
Q e [0, Q], (3)
k e [0,1];
— задачу посредника i (агента):
П! (p, qt, к) = kpqt - p (qt) ^ max, i = 1, n. (4)
q,
Здесь Q — предельно возможный объем активности производителя.
Как в той, так и в другой модели полагается, что цена продукции и затраты субъектов определяются следующими выражениями:
P(Q) = a - b^ p(Q) = c0Q + d0, (5)
p (qi) = cqi + di, i = \n.
Здесь цена продукции — линейная функция общего объема выпуска агентами; a — спрос на продукцию; b — снижение цены при увеличении на единицу общего выпуска; издержки фирм ф и ф. являются также линейными функциями, а с0 и с. — предельные переменные издержки; d0 и d — постоянные издержки фирм, они не будут оказывать влияния на решение задач оптимизации участников.
В рассматриваемых ниже моделях конкурентного рынка не все параметры игры являются общим знанием. Полагается, что прибыль агентов зависит не только от их собственных стратегий — решений по объемам выпуска продукции (услуг), но и от спроса на нее потребителей, величина которого не является общим знанием. У каждого агента имеются вполне определенные представления о величине спроса; о том, каковы представления (также вполне определенные) остальных агентов и т. д. В этой ситуации каждый агент рынка должен смоделировать стратегии других агентов, чтобы выбором собственной стратегии максимизировать свою прибыль, учитывая в ней стратегии других агентов, которые оказываются рациональными с точки зрения рассматриваемого агента по имеющимся у него представлениям о других агентах. Считается также, что агенты не кооперируются друг с другом. Такого рода модели относятся к классу рефлексивных игр.
Приведем ряд основных сопутствующих понятий теории рефлексивных игр согласно работе [6].
«Рефлексивной является игра, в которой информированность игроков не является общим знанием. С точки зрения теории игр и рефлексивных моделей принятия решений целесообразно разделять информационную и стратегическую рефлексию.
Информационная рефлексия — процесс и результат размышлений игрока о том, каковы значения неопределенных параметров, что об этих значениях знают и думают его оппоненты (другие игроки). При этом собственно «игровая» компонента отсутствует, так как никаких решений игрок не принимает.
Стратегическая рефлексия — процесс и результат размышлений игрока о том, какие принципы принятия решений используют его оппоненты (другие игроки) в рамках информированности, которую он им приписывает в результате информационной рефлексии».
Некоторые новые результаты по стратегической рефлексии на приведенных выше моделях приведены в работе [3].
В качестве концепции решений рефлексивной игры предложено информационное равновесие, являющееся обобщением равновесия Нэша в некооперативных играх [6-8]. В ней не обязательно предположение о наличии среди агентов общего знания, каждый агент осуществляет информационную рефлексию — при принятии решений использует не только свою информацию о существенных параметрах, но и свои представления о представлениях других агентов об этих параметрах и т. д.
Набор действий назван информационным равновесием, если выполнены следующие условия:
1) в рефлексивной игре участвует конечное число агентов;
2) одинаково информированные агенты выбирают одинаковые действия;
3) выполнена гипотеза рационального поведения агентов — каждый из них стремится выбором собственного действия максимизировать свою целевую функцию, подставляя в нее действия других агентов, которые являются рациональными с точки зрения рассматриваемого агента в рамках имеющихся у него представлений о других агентах.
В работе ограничимся рассмотрением точечной структуры информированности агентов о параметре спроса, компоненты которой состоят лишь из элементов некоторого множества. Более общим случаем является, например, интервальная, вероятностная или нечеткая информированность [8-9].
Далее для определенности выберем базовую модель «франчайзер — франчайзи — рынок». Для этой модели одна из возможных задач информационной рефлексии, в которой принимается во внимание влияние взаимной информированности агентов при принятии решений об объемах выпуска продукции (услуг) на конкурентных рынках, может состоять в следующем.
Пусть имеется два типа агентов: 1) агенты, неадекватно информированные о величине спроса а, т. е. они оценивают спрос как а1а{а1 ф 1). Согласно работе [6] агентов с а1 > 1 будем называть «оптимистами», так как их ожидания превосходят реальный спрос, а с а < 1, соответственно, «пессимистами»; 2) агенты, адекватно информированные о величине спроса а (а = 1). Для иллюстративного и расчетного примера возьмем структуры информированности агентов, основываясь на работе [8]. Более сложные структуры информированности можно найти в специальной литературе по рефлексивным играм, например [7]. В качестве концепции решений рефлексивной игры используем информационное равновесие.
дП.
Согласно условию = 0, определяющего оптимальный выпуск .-го агента, мы имеем
2Ь
1 - к - <2ч_ 2
где в-. =Х .„
д' — 400 --
= 400 -^-
2
' + <
д' — 300-^-
2
+
д — 500 —
д — 500---------
ч
д' — 300-^-
рованы, причем оба они адекватно информированы
о третьем агенте.
Для этой ситуации система уравнений примет вид
д — 500 —
Далее для нахождения информационного равновесия будем строить систему из уравнений типа (6).
Пусть имеется три агента. Положим, что а — 1; Ь — 0,001; k — 0,5; с1 — с2 — с3 — 0,1. Рассмотрим следующие ситуации, различающиеся структурами информированности.
Ситуация 1. Первый и второй агенты являются адекватными, а третий агент — «пессимист» и а3 — 0,8. Причем полагаем, что все агенты одинаково взаимно информированы.
Для нахождения информационного равновесия в данной ситуации строим и решаем систему уравнений:
д — 500 —-
2
' +<
д' — 300 -^-
* 3
д
д' — 300 -^
д’ — 300 —
2
Здесь д' и д' — объем активности (выпуска) первого агента и второго агента, соответственно, в преставлении третьего агента. Решение системы дает д* — д1 — 150.
Равновесные действия агентов:
• • 850
д — д ——,
1 2 3
2
В состоянии информационного равновесия агенты выберут действия: д, — д 2 — 250, д3 — 5°.
Ситуация 2. Первый и второй агенты являются «оптимистами», причем а1 — а2 — 1,2; а третий агент — «пессимист» и а3 — 0,8. Полагаем также, что все агенты одинаково взаимно информированы.
Тогда
Ситуация 4. Все агенты — оптимисты. Первый и второй взаимно информированы, второй и третий также взаимно информированы. По представлениям первого агента, третий считает всех троих одинаково информированными пессимистами. По представлениям третьего агента, и первый агент считает всех троих одинаково информированными пессимистами.
Для нахождения информационного равновесия составим соответствующую систему уравнений
д — 500 —
2
Получим следующие решения последней системы уравнений: д\ — д'г — 350, д’г — -50. Это означает, что в данной рефлексивной игре информационное равновесие не существует.
Ситуация 3. Первый и второй агенты являются «оптимистами», причем для них а1 — а2 — 1,2; а третий агент — «пессимист» и а3 — 0,8. Третий агент считает всех трех агентов одинаково информированными «пессимистами», поэтому он полагает, что а —а2 — 0,8. Первые два агента одинаково информи-
д — 500 —-± 2
д — 500 -
д' — 300-^
* 31
д
д' — 300-^
д' — 300-^-----^.
, 132 2 Здесь д — представление первого агента
0 представлении третьего агента об объеме активности (выпуска) второго агента. Решение системы дает д' —150 и д' — д' —150.
1 132 -*31 32
Равновесное решение: д2 — д2 — 350, д2 —150. Ситуация 5. Классическая ситуация по Курно-Нэшу, когда все агенты адекватно информированы друг о друге.
с
а.а -
2
2
Имеем
q = 400 -
2 3
= 400-^
2
+
q' = 400--------
2
+q
Откуда классическое равновесие дает решение
д\ — д\ — д’г — 200.
Анализ рассмотренных ситуаций в рефлексивных играх свидетельствует о существенности влияния структур взаимной информированности агентов на их выбор рациональных действий в условиях конкуренции.
ч
2
Библиографический список
1. Алгазин Г. И., Алгазина Д. Г. Моделирование многоагентных франчайзинговых систем. — Барнаул, 2009.
2. Алгазин Г И., Алгазина Ю. Г. Моделирование поведения экономических агентов в системе «производитель — посредник — конкурентный рынок» // Управление большими системами. — М., 2011. — Вып. 32.
3. Алгазин Г И., Алгазина Д. Г. Моделирование сетевого взаимодействия на конкурентных рынках // Управление большими системами: электронный сб. науч. тр. Ин-та проблем управления им. В. А. Трапезникова РАН: интернет-конференция по проблемам теории и практики управления. — 2011. — URL: http://ubs.mtas.ru/forum/index. php?PAGE_NAME=read&FГО=6&TГО=668
4. Понькина Е. В., Маничева А. С. Некоторые вопросы математического моделирования рассредоточенного рынка зерна // Известия АлтГУ — 2011. — № 1 (69).
5. Понькина Е. В., Лобова С. В., Боговиз A. В. Проблемы математического моделирования экономических кластеров как системы взаимосвязанных целей участников // Вестник НГУ. Сер.: Социально-экономические пауки. — Новосибирск, 2011. — Т. 11, вып. 4.
6. Новиков Д. A. Модели стратегической рефлексии // Aвтоматика и телемеханика. — 2012. — № 1.
7. Новиков Д. A., Чхартишвили A. Г. Рефлексивные игры. — М., 2003.
Чхартишвили A. Г. Информационное равновесие: точечные структуры информированности // Aвтоматика и телемеханика. — 2003. — № 10.
Тарап Т. A., Шемаев В. Н. Математическое моделирование рефлексивного управления // System Research & Information Technologies. — 2005. — № 3.