УДК 519.83 ББК 22.18
ТЕОРЕТИКО-ИГРОВЫЕ МОДЕЛИ ИНФОРМАЦИОННОГО ПРОТИВОБОРСТВА В СОЦИАЛЬНЫХ СЕТЯХ
1 2 3
Губанов Д. А. , Калашников А. О. , Новиков Д. А.
(Учреждение Российской академии наук Институт проблем управления им. В.А. Трапезникова РАН, Москва)
Рассмотрен ряд моделей, иллюстрирующих возможность и целесообразность использования аппарата теории игр для описания процесса и результата информационного противоборства в социальных сетях.
Ключевые слова: социальная сеть, теория игр, информационное противоборство.
1. Введение
Настоящая работа посвящена построению и исследованию теоретико-игровых моделей информационного противоборства, в которых игроки, оказывая воздействия на элементы социальной сети, заинтересованы в тех или иных ее состояниях. С одной стороны, на сегодняшний день разработан ряд моделей управляемой динамики агентов в социальных сетях (см. обзор в [6]). С другой стороны, почти отсутствуют модели, в которых управляющие воздействия осуществляют различные субъекты. Поэтому возникает вполне естественное желание «надстроить» над моделью социальной сети теоретико-игровую модель взаимодействия управляющих субъектов.
1 Дмитрий Алексеевич Губанов, к.т.н., с.н.с. ([email protected]).
2 Андрей Олегович Калашников, к.т.н., докторант.
3 Дмитрий Александрович Новиков, д.т.н., проф., член-корр. РАН, зам. директора ([email protected]).
Демонстрации возможности этого симбиоза (точнее - сведения задач анализа информационного противоборства в социальных сетях к тем или иным хрестоматийным задачам теории игр) и посвящена настоящая работа, изложение материала которой имеет следующую структуру. Во втором разделе описывается модель социальной сети [6], в третьем - модель информационного управления, в четвертом - теоретико-игровая модель информационного противоборства. Пятый, шестой, седьмой и восьмой разделы содержат различные иллюстративные примеры, в которых равновесием игры являются: равновесие в доминантных стратегиях, равновесие Нэша, «контрактное равновесие» (которое эффективно по Парето), равновесие Шта-кельберга, информационное равновесие, равновесие в безопасных стратегиях.
2. Модель социальной сети
Рассмотрим социальную сеть, состоящую из п агентов. Мнение /-го агента в момент времени t - действительное число xti , / е N = {1, 2, ..., п}, t = 0, 1, 2, ... . Информационное влияние
агентов друг на друга будем в рамках традиции марковских моделей [6] отражать неотрицательной стохастической по строкам матрицей доверия А = \\а/}\\, где а/}- - степень доверия /-го агента /-му агенту, /, / е N. Будем считать, что вектор
х0 = (х/)/ е N начальных мнений агентов задан, и в каждом периоде /-ый агент изменяет свое мнение с учетом мнений тех агентов, которым он доверяет, включая доверие к собственному мнению, следующим образом:
Пусть взаимодействие агентов продолжается достаточно долго для того, чтобы можно было воспользоваться следующей оценкой вектора их итоговых («равновесных») мнений (условия сходимости можно найти в [1, 6]):
(1)
(2) х = х0.
где А¥ = [ ііш (А)].
В ходе дальнейшего изложения будем считать, что каждый агент хоть сколько-нибудь доверяет всем остальным агентам, то есть а// > 0, /, / е N. В [1, 6] доказано, что в рамках этого предположения:
- все строки матрицы А¥ одинаковы (обозначим г}- = а¥ > 0,
/, / е Щ, а элементы этой матрицы можно интерпретировать как влиятельность агентов;
- итоговые мнения всех агентов одинаковы (обозначим
то есть выражение (2) примет вид (отметим, что качественно схожий результат получается в моделях социальных сетей, в которых доверие определяется репутацией агентов [5]):
3. Информационное управление
Информационное управление в социальных сетях [6] заключается, в том числе, в целенаправленном воздействии на начальные мнения агентов с целью обеспечить требуемые (для субъекта, осуществляющего управление) значения их итоговых мнений.
Пусть имеются два игрока, каждый из которых может влиять на начальные мнения некоторых агентов. Обозначим Е с N
- множество агентов, чьи мнения формируются первым игроком (агенты влияния первого игрока), S с N - множество агентов, чьи мнения формируются вторым игроком (агенты влияния второго игрока), Е п S = 0. Предположим, что информационное управление является унифицированным [6], то есть у всех агентов из множества Е формируется начальное мнение и е и, а у всех агентов из множества S формируется начальное мнение
V е V, где и и V- отрезки
X = хг, і є И, X є ЭТ1),
Обозначим Гр := ^ г/ , rs := ^ г , X 0 := ^ гкх0к , тогда
/еР ;е5 kеN\(Ри5)
выражение (3) примет вид:
(4) Х(и, V) = гР и + г5 V + X0,
то есть итоговое мнение членов социальной сети будет линейно зависеть от управлений и и V, входящих соответственно с весами гР > 0 и г5 > 0, где гР + г5 < 1, которые определяются суммарной влиятельностью агентов влияния.
В качестве отступления отметим, что отличным от рассматриваемого случая является ситуация, когда агенты влияния не меняют своих мнений: а// = 0, / Ф /, / е Р S (см. также модели влияния СМИ в [6]).
4. Информационное противоборство
Имея зависимость (4) итогового мнения агентов от управляющих воздействий, можно формулировать теоретико-игровую модель взаимодействия игроков, осуществляющих эти воздействия. Для этого необходимо определить их целевые функции. Предположим, что целевая функция первого (второго) игрока /р(и, V) = Нр(Х(и, V)) - Ср(и) (/¡(и, V) = И$(Х(и, V)) - е^)) определяется разностью между его «доходом», зависящим от итогового мнения агентов, и затратами на осуществление управления.
Совокупность Г = {/(и, V), /¡(и, V), и е и, V е V} целевых функций и множеств допустимых действий двух игроков задают семейство игр, различия между которыми порождаются конкретизацией информированности игроков и порядка функционирования (см. [7, 12]).
Если описание игры Г и выражение (4) являются общим знанием среди игроков, которые выбирают свои действия однократно, одновременно и независимо, то получаем игру в нормальной форме, для которой можно искать и исследовать равновесия Нэша [7], их эффективность по Парето и т.д. Фиксировав последовательность выбора игроками своих действий, получим ту или иную иерархическую игру [2]. Отказавшись от гипотезы об общем знании, получим рефлексивную
игру [12] и т.п. - ряд частных случаев рассматривается ниже (подробно обсуждать содержательные интерпретации, за редким исключением, мы не будем в силу прозрачности последних; см. также примеры в [3, 4]).
5. «Антагонистическая» игра
В качестве «статус-кво» выберем нулевое значение мнений агентов (Х 0 = 0) и будем считать, что первый игрок заинтересован в максимизации итогового мнения (Нр(Х) = X), а второй - в минимизации (Нр(Х) = - X), причем «ресурсы управления» у игроков одинаковы (и = V = [ё; П], й < -1 < 1 < П), как и функции затрат (ер(и) = и2 / 2, с5^) = V2 / 2).
Целевые функции игроков
(5)/р(и, V) = гР и + г5 V - и2 / 2 и
(6)/(и, V) = - гР и - г5 V - V2 / 2.
сепарабельны по соответствующим действиям, значит (см. [7]),
при одновременном независимом выборе игроками действий
существует равновесие в доминантных стратегиях - РДС / й ё\ й й
(и , V ), где и = Гр, V = - г$.
Одной из точек Парето [11] является вектор (ир, ^), максимизирующий сумму целевых функций игроков, где ир = 0, vр = 0.
РДС не эффективно по Парето:
Мий, Vй) + /¡(иё, Vй) = - [(гр)2 + Г)2] /2 < /р(ир, ^) + /(ир, /) = 0, а точка Парето неустойчива относительно индивидуальных отклонений игроков.
Определим стратегию наказания для первого (второго) игрока как такое его действие, которое является наихудшим для оппонента: ир = П, Vр = ё. В рассматриваемой модели доминантные стратегии игроков являются гарантирующими. Вычислим гарантированные выигрыши игроков:
/рМГР = /р(ий, V) = (Гр)2 /2 + г5 ё, /МГР = /¡(ир, Vй) = Г)2 /2 - Гр П.
Если существует третья сторона, обладающая правом контролировать выполнение игроками взятых на них обязательств
[14], то, при заключении контрактов следующего вида («пакт о ненападении»):
Г 0, V = 0 Л Г 0, и = 0
(7) ф) = \ , у(и) = <
ир, V Ф 0'
и Ф 0
игрокам будет выгодно их выполнять, если имеет место
(8)
(ГЕ )2 + 2г5й < 0, , (Г )2 < 2^.
что приведет к устойчивой реализации точки Парето. Аналогичного результата можно добиться, используя стратегии наказания в повторяющихся играх [15]. Анализ условия (8) свидетельствует, что «контрактное равновесие» реализуемо, если влиятельности агентов влияния первого и второго игроков различаются не слишком сильно (на рис. 1 заштрихована область 0АВ, удовлетворяющая условию (8) при й = - 1, D = 1).
Рис. 1. Область значений «весов» агентов влияния, при которых существует «контрактное» равновесие
6. Игра с «непротивоположными» интересами
Рассмотрим игру в нормальной форме, отличающуюся от описанной в предыдущем разделе только функциями «дохода» игроков, а именно выберем Ир(Х) = X - 2 X2, И$(Х) = X - X2 (первый игрок хотел бы добиться итогового мнения XF = 0.25, а второй - мнения XS = 0.5).
Целевые функции игроков
(9) /р(и, V) = (гР и + г5 V) - 2 (гР и + г5 V)2 - и2 / 2 и
(10) /(и, V) = (гР и + г5 V) - (гР и + г5 V)2 - V2 / 2
уже не сепарабельны по соответствующим действиям, поэтому найдем равновесие Нэша:
(1.) * = гР — 2гР (г5) * = г + 2г5 (гР )
(11) и = 2 2 , V = 2 2 .
1 7 4(гр )2 + 2(г )2 +1 4(гр )2 + 2(г5 )2 +1
На рис. 2 представлено параметрическое множество равновесий Нэша (при гР = 0.1 и г5 е [0; 0.9]).
и*
Рис. 2. Множество равновесий Нэша в примере раздела 6
На Рис. 3 представлены графики зависимости равновесных действий игроков от долей агентов влияния или, что в данном
случае эквивалентно, от суммарных репутаций агентов влияния г5 и гР. График слева характеризует общий вид зависимости, а справа - на интервалах допустимых значений для г$ и гР. В частности, можно заметить, что чем больше суммарная репутация агентов влияния второго игрока, тем меньше равновесное управляющее воздействие первого игрока и больше равновесное управляющее воздействие второго игрока, то есть первый игрок стремится достичь меньшего мнения, а второй игрок - большего.
Рис. 3. Трехмерные графики и* и V*
Теперь рассмотрим иерархическую игру типа Гь в которой игроки имеют целевые функции (9) и (10), и первый игрок обладает правом первого хода.
Рассмотрим ход второго игрока. На этом этапе он уже знает действие и первого игрока и максимизирует свой выигрыш,
*/ ч г„ — 2г„гРи Л ,
выбирая действие: V (и) = —------^— . Множество выбора вто-
2( г ) +1
рого игрока состоит из единственного действия. Гарантирующая стратегия первого игрока в игре Г1 и его стратегия в равновесии Штакельберга [2, 7]:
* Гр 2гр (г8)
и =
4(Гр )2 + 4(г5 У + 4(г5 )2 +1 ^ = 2(г5 )3 - (2(Гр )2 + 1)г5
4(гр у + 4(г, У + 4(г, У +1
7. Рефлексивная игра
Рассмотрим целевые функции, отличающиеся от описанных в предыдущем разделе только функциями затрат игроков: ср(и) = и2 / (2 дР), с5^) = V2 / (2 д5), где дР = 1 и д5 = 1/2 - «эффективности» игроков. Предположим, что каждый игрок знает свою эффективность, первый игрок считает, что общим знанием является д, = 1, второй игрок информирован об этом и знает истинную эффективность первого игрока. Граф такой рефлексивной игры [12] имеет вид: 2 — 1 ^ 12.
Тогда первый игрок в соответствии с выражением (11) вы* гР — 2гР (г, )2
берет и =---------------------. Исходя из этого, второй агент
Р 4(гр )2 + 2(г, )2 +1 Р
выберет свой наилучший ответ
* 0.5г, (1 + 2(гр )2)(1 + 2(г, )2) ^
V =--------------------------------. При этом в сети установится
(1 + (г, )2)(4(гр )2 + 2(г, )2 +1) р У
(гР )2 + (г8 )4 + 0.5(г, )2
следующее итоговое мнение: X =
(1 + (г, )2)(4(гр У + 2(г, У +1)’ которое в общем случае будет отличаться от ожидаемого пер-
я_ (Гр )2 + (Г )2
вым игроком X =---------------------, то есть информационное
Р 4(гр )2 + 2(г, )2 + Г
равновесие не является стабильным [13]. Для заданного выше графа рефлексивной игры информационное равновесие будет стабильным только в двух случаях: либо представление первого игрока об эффективности второго истинно, либо суммарная репутация агентов влияния второго игрока равна нулю (однако ранее предполагалось, что значение репутации больше нуля).
8. Равновесие в безопасных стратегиях
\ир > 0, х > X
Рассмотрим игру, в которой Нр(Х(и, V)) = < ,
[ 0, X < X
\и, > 0, X < X
Н^и, V)) = \ л , ср(и) = и, с^) = V, и = V = [Л; Б],
[ 0, X > X
Л < -1 < 1 < Б, причем кР > Б, к„ > |Л|. Содержательно, первый игрок заинтересован в принятии некоторого решения (для чего
необходимо, чтобы мнение членов сети превысило порог XX), второй игрок заинтересован в блокировании этого решения.
Пусть для определенности гР Б + г, Л + X0 > XX . В рассматриваемой игре не существует равновесия Нэша, но существует равновесие в безопасных стратегиях (РБС) [8] (см. также конкурсные модели в [9, 10]), которое имеет вид:
((X - г, Л - X0) / гР + е; 0), где е - произвольно малая строго положительная константа. Содержательно РБС таково, что первый игрок обеспечивает принятие нужного ему решения, причем второй игрок, даже если выберет максимально возможные (максимальные по абсолютной величине) действия, все равно не сможет изменить результат.
9. Заключение
В настоящей работе рассмотрен ряд достаточно частных примеров, демонстрирующих возможность использования аппарата теории игр для описания процесса и результата информационного противоборства в социальных сетях. Описанная модель, несмотря на свою простоту, демонстрирует многообразие возможных теоретико-игровых постановок (равновесие в доминантных стратегиях, равновесие Нэша, «контрактное равновесие», иерархические игры типа Г! или Штакельберга, рефлексивные игры, равновесие в безопасных стратегиях). В целом же, та или иная конкретная модель информационного противобор-
ства, естественно, должна формулироваться с учетом, во-первых, специфики решаемой практической задачи, а, во-вторых, возможности идентификации моделируемой системы -параметров социальной сети, возможных действий игроков, их предпочтений и информированности.
В качестве перспективных направлений дальнейших исследований выделим разработку и изучение теоретико-игровых моделей информационного противоборства в социальных сетях в условиях:
- последовательного выбора игроками своих действий с учетом наблюдаемой динамики состояния сети (игры «защита-нападение» с описанием динамики мнений (распространения информационной эпидемии или вирусов в сети);
- многократного выбора игроками своих действий при неполной информации о действиях оппонентов и состоянии социальной сети.
Литература
1. ГАНТМАХЕР Ф.Р. Теория матриц. 4-е изд. - М.: Наука,
1988.
2. ГОРЕЛИК В.А., ГОРЕЛОВ М.А., КОНОНЕНКО А.Ф. Анализ
конфликтных ситуаций в системах управления. - М.: Радио и связь, 1991.
3. ГУБАНОВ Д. А., НОВИКОВ Д. А. Модели распределенного
контроля в социальных сетях // Системы управления и информационные технологии. 2009. № 3.1 (37). С. 124-129.
4. ГУБАНОВ Д А., НОВИКОВ Д А., ЧХАРТИШВИЛИ А.Г. Модели информационного влияния и информационного управления в социальных сетях // Проблемы управления. 2009. № 5. С. 28-35.
5. ГУБАНОВ ДА., НОВИКОВ ДА., ЧХАРТИШВИЛИ А.Г. Модели репутации и информационного управления в социальных сетях // Математическая теория игр и ее приложения. 2009. Том 1. Выпуск 2. С. 14-37.
6. ГУБАНОВ ДА., НОВИКОВ ДА., ЧХАРТИШВИЛИ А.Г.
Социальные сети: модели информационного влияния, управ-
ления и противоборства. - М.: Издательство физикоматематической литературы, 2010.
7. ГУБКО М.В., НОВИКОВ Д.А. Теория игр в управлении орга-
низационными системами. - М.: Синтег, 2002.
8. ИСКАКОВ М.Б. Равновесие в безопасных стратегиях //
Автоматика и Телемеханика. 2005. № 3. С. 128 - 142.
9. ИВАЩЕНКО А.А., НОВИКОВ Д А. Модели и методы орга-
низационного управления инновационным развитием фирмы. - М.: Ленанд, 2006.
10.ИСКАКОВ М.Б. Модели и методы управления привлечением вкладов в банковскую сберегательную систему. - М.: ИПУ РАН, 2006.
11.МУЛЕН Э. Кооперативное принятие решений: аксиомы и модели. - М.: Мир, 1991.
12.НОВИКОВ Д.А., ЧХАРТИШВИЛИ А.Г. Рефлексивные игры.
- М.: Синтег, 2003.
13.ЧХАРТИШВИЛИ А.Г. Теоретико-игровые модели информационного управления. - М.: ПМСОФТ, 2005.
14.MAS-COLLEL A., WHINSTON M.D., GREEN JR. Microeconomic Theory. - N.Y.: Oxford Univ. Press, 1995.
15.MYERSON R.B. Game Theory: Analysis of Conflict. - London: Harvard Univ. Press, 1991.
GAME-THEORETIC MODELS OF INFORMATION CONFRONTATION IN SOCIAL NETWORKS
Dmitry Gubanov, Institute of Control Sciences of RAS, Moscow, Candidate of Sc. (Dmitry.a. g@gmail .com).
Andrew Kalashnikov, Institute of Control Sciences of RAS, Moscow, Candidate of Sc., Doctoral candidate.
Dmitry Novikov, Institute of Control Sciences of RAS, Moscow, Doctor of Sc., Professor, Deputy director ([email protected]).
Abstract: A number of models have been considered in order to illustrate the possibility and appropriateness of using the apparatus
of the game theory to describe the process and the outcome of information confrontation in social networks.
Keywords: social networking, game theory, informational confrontation.
Статья представлена к публикации членом редакционной коллегии А. Г. Чхартишвили
Уважаемые читатели! Обращаем Ваше внимание на выпущенный в 2010 году Институтом проблем управления им. В.А. Трапезникова РАН тематический сборник статей «Сетевые модели в управлении». Подробная информация о Сборнике доступна на сайте www.mtas.ru.