о
бзоры
УДК 519.876.2
МОДЕЛИ КОНФОРМНОГО ПОВЕДЕНИЯ. Ч. 2. Математические модели
В.В. Бреер
Рассмотрены математические модели конформного поведения, получившие развитие, начиная с работ Грановеттера и Шеллинга. Подробно рассмотрены современные математические модели конформности, которые исследуются методами теории вероятностей, теории игр и статистической физики. Перечислены возможные приложения математических моделей в соответствии с введенной классификацией.
Ключевые слова: конформное поведение, социальное взаимодействие, модель критической массы, пороговая модель, социофизическая модель, управление толпой.
ВВЕДЕНИЕ
История применения теоретико-игровых моделей для описания коллективного, в том числе конформного, поведения развивается на протяжении десятилетий и насчитывает множество работ. Как
было описано в первой части1 настоящего обзора, Шеллинг и Грановеттер стали родоначальниками двух направлений исследования моделей конформного поведения. В дальнейшем их развитии можно выделить следующие примеры моделей.
В работе [1], в частности, сделана попытка обобщить пороговые модели Грановеттера [2] и модель ограниченного окружения Шеллинга [3] — в отличие от этих моделей, приводится общая формулировка теоретико-игровой модели (в рамках игры в нормальной форме) конформного поведения. В рамках этой общей модели, кроме исследования собственно конформного поведения, удалось получить результаты для ряда ее содержательно интерпретируемых вариаций и исследовать свойства соответствующих равновесий Нэша.
В работе М. Чуе [4] делается попытка связать два подхода к изучению коллективного поведения: исследование социальной структуры, т. е. матрицы влияния агентов друг на друга, с одной стороны, и исследование стимулов индивидуального участия,
1 Бреер В.В. Модели конформного поведения. Ч. 1. От философии к математическим моделям // Проблемы управления. - 2014. - № 1.
т. е. целевых функций агентов в зависимости от поведения их окружения.
В модели стадного поведения (herd behavior) используется теоретико-игровой аппарат. Стадное поведение проявляется в том, что при определенных условиях агенты начинают действовать согласованно одинаковым образом. Одним из первых примеров теоретико-игрового подхода к явлению стадного поведения служит «конкурс красоты» Дж. М. Кейнса. В своей работе [5, гл. 12] он приводит пример стадного поведения, которого придерживаются игроки на бирже. Сначала автор рассматривает простой опыт, называемый конкурсом красоты (beauty contest). Испытуемым (мужчинам) дается задание выбрать шесть самых хорошеньких лиц из сотни женских фотографий. Приз присуждается тому, чей выбор наиболее близко соответствует среднему вкусу всех участников состязания. Таким образом, каждый из агентов должен выбрать не те лица, которые нравятся ему лично, а те, которые, как он полагает, скорее всего, удовлетворяют вкусам других. Более опытные игроки переходят на другой уровень рефлексии — они пытаются предугадать, каково будет среднее мнение относительно того, каково будет среднее мнение. И так далее в сторону увеличения уровня рефлексии (см. обзор подобных моделей в работах [6, 7]).
Авторы работы [8] рассматривают модель информационных каскадов (informational cascades), которая иллюстрирует не только конформное взаимодействие между агентами, но и такие быстрые, существующие короткое время, явления, как вре-
менные увлечения толпы, мода, резкие подъемы и спады разного рода экономических и социальных активностей. В работе [9] перечисляются многие проявления социальных и экономических ситуаций, которые можно интерпретировать как стадное поведение. Задачи управления стадным поведением (управления толпой) формулируются и решаются, в частности, в работе [10].
Последнюю группу моделей, описываемых в настоящем обзоре, составляют модели, основанные на методах статистической физики. В них используется идеология перехода от описания исследуемой системы в терминах микросостояний к описанию в терминах макросостояний небольшим количеством параметров, имеющих смысл температуры, свободной энергии, энтропии и других термодинамических функций. Подробно рассматриваются модели ограниченно рациональных агентов [11—14], основанные на максимизации некой функции, которая, следуя аналогии со статистической физикой, может быть содержательно интерпретируема как лагранжиан сети агентов. Развитием этих моделей для явлений с зависимыми агентами можно считать стохастическую модель социальной сети (см., например, статью [15]).
Основные известные приложения математических моделей конформного поведения систематизируются в § 2.
1. РАЗВИТИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ КОНФОРМНОГО ПОВЕДЕНИЯ
2
Модель 4 (общая теоретико-игровая пороговая модель конформного коллективного поведения [1]).
Состав модели. Рассмотрим множество агентов N = {1, 2, ..., и}, каждый из которых имеет две альтернативные возможности — действовать или бездействовать. Выбор агента / обозначим через х1 е {0; 1}, где х1 = 1 означает, что агент действует, а х1 = 0 — бездействует. Состояние системы, определяемое как вектор действий всех агентов, обозначим через х е {0; 1}". Вектор действий агентов, внешних по отношению к /-му агенту, обозначим
через х_1 = (х1, х2, ..., х1 - 1, х1 + 1, ..., хп) е {0; 1}" - 1 и будем называть обстановкой для /-го агента.
Целевые функции. Поведение агента / определяется его стремлением к максимизации целевой функции вида:
и(х) = и-(х-, х -) = а/х-)х, + Ь.(х_.)(1 - х), (1)
где а.{') и Ь;(*) — функции социального давления, действующего на агента, зависящие от обстановки, при условии выбора агентом действия или бездействия соответственно. Если агент / выбирает действие х. = 1 (бездействие х. = 0), то слагаемое аг(-) (Ьг(*)) функции (1), которое остается зависимым от обстановки, отражает роль социального давления, принуждающего агента действовать или бездействовать соответственно. Агент, действуя рационально, делает выбор, максимизирующий целевую функцию (1).
Основные параметры. Введем частичную упорядоченность ({0, 1}" 1, >) обстановок для любого агента /: х-1) > х-2) тогда и только тогда, когда
V/ ф /: х1) > х)2).
Обозначим множество агентов-конформистов через N = {и1, и2, ..., ис}, а множество агентов-антиконформистов через N = {и1, и2, ..., иа}. Будем считать, что множество всех агентов делится только на эти два типа, т. е. N = N и Na, N п Na = 0
и, соответственно, справедливо с + а = и.
Поведение агента / е N будем называть конформным, если его функция социального давления а( •), которая численно равна полезности при действии, не убывает, а функция Ь;(*), которая численно равна полезности при бездействии, не возрастает в множестве
({0, 1}" 1, >). Поведение агента / е N будем называть антиконформным, если его зависимость от социального давления аг(*), наоборот, не возрастает, а функция Ь(-) не убывает в множестве ({0, 1}" - 1, >).
В случае, когда одна из функций социального давления аг(*) или Ь( •) равна константе 0 < ©г < 1, поведение агента называется пороговым, (модель — пороговой), а величина ©г — порогом агента /. Содержательно: отсутствие зависимости от обстановки означает, что это внутренняя характеристика агента, влияющая на его поведение в соответствии с выражением (1).
Функционирование. Для общего случая порогового поведения справедливо
Утверждение 1. Для того чтобы ситуация х* была равновесием Нэша необходимо и достаточно, чтобы вектор х* являлся решением системы двойных неравенств
0. 1 а(х_) - х. 1 0. - 1, / е N. ♦
В частях 1 и 2 настоящего обзора принята сквозная нумерация моделей.
Индексный символ c обозначает конформность (conformity), а a — антиконформность (anticonformity). Одновременно эти символы обозначают количество агентов соответствующего
Это утверждение дает возможность характеризовать равновесие Нэша с помощью системы неравенств. Для общей пороговой модели, в случае, когда все агенты являются конформистами, можно установить факт совпадения одного из равновесий Нэша, а именно, состояния со всеми действующими агентами, с оптимальным по Парето состоянием.
Из общей модели порогового поведения путем конкретизации вида социального давления выводятся другие модели конформного и антиконформного поведения.
Так можно построить теоретико-игровую модель со взаимным влиянием агентов. Определим социальное давление через влияние действующих агентов друг на друга следующим образом. Если агент j е N действует, то его влияние (dominance) на агента-конформиста i е Nc обозначим через d.. е (0, 1]. При этом влияние действующего агента j е N на антиконформиста i е Na равно нулю. Если же агент j е N бездействует, то его влияние на антиконформиста i е N равно d.. е (0, 1], а на аген-a j
та-конформиста i е Nc это влияние равно нулю.
На основаниии этих предположений запишем социальное давление для конформиста i е Nc в виде взвешенной суммы a.(x ) = У d..x, т. е. чис-
ii у j
j:j *1
ленно равной сумме влияний окружающих агентов. В целях нормировки всегда можно считать,
что У й.. = 1, и социальное давление, действую-
]'■] * I
щее на любого агента, находится в пределах [0; 1], т. е. 0 < У йц т 1. Для антиконформиста / е Ла
] ■} * I
запишем в виде а.(х_) = 1 — У й.х. = У й..(1 — х.).
» » ...уу ...у }
}■■} *1 }■■} *1
Детализируем модели поведения конформистов и антиконформистов, исходя из данного определения социального давления.
Пусть конформист / е Лс обладает порогом конформности пг Определим его поведение с помощью целевой функции
Щ (хр х-) = Г У йщху - П/) ХР I е Лс.
Г }■} * I 7
Пусть антиконформист / е Ла обладает порогом антиконформности п. Определим его поведение с помощью целевой функции
Щ (хр х-) = Г у 1 - х.) - п /)хр I е Ла.
Г }■} * / 7
Применяя усреднение к степеням влияния агентов, можно получить теоретико-игровую модель с репутацией агентов.
Репутацией г. агента у е N будем называть среднюю степень влияния агента у на остальных агентов г. = 11 У й... Будем считать, что любой агент
} и ■ V п I■■' *V
влияет хотя бы на одного другого агента, т. е. все агенты имеют ненулевые репутации. В силу нормировки у йу = 1 суммарная репутация всех аген-
}■} * I
тов У г = 1 У У йу = 1
V е П V е Ыг. / * у }
Предположим, что конформист / е Лс учитывает не степень влияния отдельного агента непосредственно на себя, а репутацию этого агента. Порог агента / е N обозначим через 9г- : 0 < 9г- < 1 — г. Нормировка порогов выбрана таким образом, что если действует все его окружение, то конформист заведомо будет действовать, а антиконформист — бездействовать. В данном случае порог и социальное давление, в отличие от случая взаимодействия со взаимным влиянием, имеют другую природу. А именно, агенты испытывают влияние репутации не только от своих «непосредственных»
соседей (й.. > 0), но ото всех агентов. Влияние в не-
и
котором смысле усредняется.
В модели с репутацией социальное давление
для конформиста определим как а.(х ) = У г.х, а
^ ^ - } }
} *'
целевую функцию конформиста запишем в виде
Vе (хР х-) = Г У Г.х - ег) хР I е Лс.
Г} * / 7
Проводя аналогичные рассуждения для антиконформиста (/ е Ла), определим его целевую функцию как
va (хр х-) = Г У Г}(1 - х.) - е/) хр / е Ла.
Г} * / 7
Соотношения между рассматриваемыми в работе [1] моделями (аг(-) и Ь(-) — слагаемые общей модели, определенной соотношением (1)) могут быть представлены в виде табл. 1.
Рассмотрим частный случай, когда все агенты — конформисты, Nс = Л, с одинаковыми репутаци-ми, V/ е Лс : г. = 1/п. Таких агентов назовем однородными. Для них критерий равновесий Нэша можно выразить в виде алгебраического уравнения, имеющего аналогией равновесие Грановетте-ра [2]. Для этого введем функцию распределения
Рс(у) = 1 У х{е, < у}.
п с
/ е N
Справедливо
Утверждение 2. Ситуация x * = x *(p) : x* = = x(9j < p}, Vi e N является равновесием Нэша тогда и только тогда, когда p e [0, 1] есть решение уравнения F(p) = p. ♦
Основные результаты. Для общей пороговой модели (1) исследованы условия существования и единственности равновесия Нэша. Найдены условия эффективности по Парето равновесия Нэша. Для модели со взаимным влиянием агентов найдена характеризация равновесия Нэша в виде системы неравенств. Для модели с репутацией найдены условия существования равновесия Нэша, зависящие от суммарной репутации действующих агентов. Частным случаем модели с репутацией служит модель анонимного взаимодействия однородных агентов, которая формализует в виде игры в нормальной форме пороговое поведение, описываемое в работах Грановеттера [2] и Шеллинга [3]. Оказывается, что равновесие, исследуемое в работе [2], совпадает с равновесием Нэша рассматриваемой модели. Аналогичный вопрос об эквивалентности некоторого типа равновесия с равновесием Нэша возникает в эволюционных играх. Более того, уравнение динамики, использованное в работе [2], является частным случаем уравнения динамики репликаторов [16, 17].
Модель 5 (модель структуры и стратегии в коллективном поведении). Состав модели. Так же, как и в модели [2], социальная группа состоит из n агентов. Любой агент может либо «действовать» (обозначение этого состояния r — revolt), либо «бездействовать» (обозначение состояния s — stay). Агент связан со своими соседями. Каждый из агентов имеет свой порог, но, в отличие от модели [2], здесь используется понятие локального знания, а именно, считается, что агент знает пороги только своих соседей (см. определение «соседей» далее).
Целевые функции, информированность, страте-
всех агентов а = (ар а2, ..., ап), то целевая функция агента I
и(вр ау, а2, ап) =
' 0, если а{ = л,
1, если а{ = г и #{у е Щ|ау- = г} > 9г-, -г, если а{ = г и #{у е Щй] = г} < 9г-,
где —г < —(п + 1)п. Эта большая отрицательная полезность — штраф за действие, если число действующих участников ниже порога агента.
Состоянием считается вектор возможных порогов агентов, т. е. множество всех состояний
можно записать в виде © = {1, 2, ..., п + 1}п. Информированность агента I представляет собой вероятностное распределение на множестве всех состояний. Считается, что пороги независимы и равномерно распределены. Таким образом, вероятность распределения возможных состояний п : © ^ [0, 1] может быть записана в виде п(9) = = 1/(п + 1)п.
Ограниченное знание агента I состоит в том, что ему полностью известна информация только о его соседях Б(г) = {у е Щ|у ^ /} (стрелка означает, что у является соседом /), т. е. он знает пороги соседей и наличие связей между соседями. Отношение «^» рефлексивно, т. е. всегда выполнено I ^ I. Таким образом, если фактическое состояние есть 9 е ©, то агент I знает, что состояние находится во множестве р(9) = {(9в(гГ : е
е {1, 2, ..., п + 1}п #В(г)} (используется обозначение
9ад = (9А . ад). Наб°р множеств р = {рг(9)}0 е 0 образует разбиение множества состояний ©. В представлении агента все неизвестные ему варианты обстановки, составленные из возможных порогов других агентов, равновероятны (равномерно распределены).
Стратегия агента I есть функция от его знания
гии. Если задан порог 9. агента I и вектор действий состояния : © ^ {г, л}, измеримая относительно
Таблица 1
Соотношения между функциями полезности в различных пороговых моделях
Поведение Модель
Пороговая Со взаимным влиянием С репутацией
Х- = 0 x = 1 x = 0 x = 1 x = 0 xi = 1
Конформное Антиконформное t 1 1 a(x_) = ^ dijXj j:j * i a,'(x_,) = X dj (1 - Xj) j:j * i b ,(•) - n, b ,(•) - n, a;(x-,) = X rjxj j:j * i a (x-,) = X rj (1 - xj) j:j * i b b - -
Рис. 1. Связи типа «квадрат» и «воздушный змей»
разбиения Множество всех стратегий агента обозначим через F.
Если заданы стратегии агентов (/j, f2, ..., fn), то математическое ожидание целевой функции агента i
EUf f2, ..., fn) = I n(9)u(9 , fj(9), f2(9), ..., fn(9)).
«Ев
Равновесие. Равновесием Байеса—Нэша называется такой вектор стратегий (fj, f2, ..., fn), если для любых i е N и g. е Fвыполнено неравенство
EUf fv ..., fn) l EUf ..., f _ j, g, f + j, ..., fn).
Из множества равновесий можно выделить фокальное равновесие (fj, f2*, ..., f^) с наибольшим возможным действием, т. е. если (fj, f2, ..., fn) есть
равновесие, то f (9) = r ^ f * (9) = r. Считается, что агенты из всего множества равновесий будут выбирать именно это.
Основные результаты модели
• Иллюстрируется, что действие игрока зависит не только от порога, знания связей и порогов других игроков, но и от знания о том, что знают его соседи. Так, например, в рамках модели, состоящей из четырех агентов, сравниваются две конфигурации связей — квадрат и воздушный змей (рис. 1). У всех агентов порог равен трем. В случае «квадрата» знания каждого агента не хватает для принятия решения действовать. Поэтому в этом случае не действует никто. В случае «воздушного змея» для трех агентов достаточно информации о том, что три из них будут действовать. Поэтому в этом случае будут действовать все три агента. Равновесие в случае «квадрата» иллюстрирует эффект так называемого «плюралистического невежества» (pluralistic ignorance), когда никто не верит во что-то, хотя думает, что остальные в это верят. Считается (см., например, работы [18, 19]), что в Советском Союзе и странах Восточной Европы перед его распадом только ограниченное число лиц знало, насколько велика неудовлетворенность населения существующим режимом. От-
крытие этой информации привело к переходу в другое положение равновесия.
• Исследуется динамический эффект распространения информации. Считается, что со временем агент узнает все больше и больше о соседях своих соседей. Введем множество агентов, о которых знает агент i в момент времени t, B(i, t) = {i e N|d(i, j) < t}, где d(i, j) — длина минимального пути между агентами i и j. В своей работе М. Чуе провел имитацию сети из 30 агентов. Среднее число действующих агентов не увеличивается на первых четырех шагах, затем в течение следующих трех шагов резко увеличивается до 30 и далее уже переходит в режим насыщения. Сначала начинают действо -вать агенты только с малыми порогами, но в конце начинают действовать как агенты с малыми, так и с большими порогами, что противоречит интуитивным предпосылкам, состоящим в том, что к концу процесса все агенты с малыми порогами уже действуют. Это объясняется тем, что на принятие решения агентами с малыми порогами оказывает их положение в сети, которое является случайной величиной в процессе имитации. Поэтому у агентов с малыми порогами больший разброс в моментах начала действия.
Указанный феномен иллюстрирует, что независимые факторы (как то положение в сети и уровень порога) не всегда оказывают одинаковое влияние на поведение агента.
• Делается вывод, что для агентов с малыми порогами играют роль сильные связи, а для агентов с большими порогами — слабые (в смысле работы [20]). Условно говоря, сильные связи — это связи среди друзей, а слабые — среди дальних знакомых и знакомых их знакомых. Гипотеза о том, что два человека в мире соединены в среднем шестью-семью рукопожатиями, относится к слабым связям. Большая роль сильных связей для агентов с низкими порогами объясняется тем, что для этих агентов достаточно нескольких друзей для принятия решения о действии, тогда как для агентов с большими порогами необходимо наличие многих знакомых.
• Чуе исследует неустойчивость социального взаимодействия (особенно эффектов домино, лавинного эффекта и т. п.), происходящую из-за недостаточности информационных связей. Простая модель Грановеттера [2] представляют собой частный случай модели Чуе.
Другие направления исследования моделей с критической массой состоят в изучении моделей домино-эффекта (cascades), вирусного маркетинга (viral marketing) и распространения слухов (word-of-mouth) [8, 21, 22].
Модель 6 (информационных каскадов [8]). Информационный каскад возникает, когда для агента, наблюдающего за поведением своих предшественников, выгодно повторять это поведение, не обращая внимания на имеющуюся у него собственную информацию. Агент включает в оценку своего выигрыша поведение всех агентов, предшествующих ему в очереди. Авторы модели исследуют:
• вероятность появления каскада;
• вероятность появления так называемого неправильного каскада, т. е. каскада, агенты которого приняли объективно неправильное решение. Например, это отказ в публикации хорошей статьи, рецензенты которой ориентировались на мнение первых ошибочно написанных рецензий;
• как изменяется мода;
• насколько эффективно информационное воздействие на агентов, т. е. в какой степени информационное воздействие может разрушить каскад.
Состав и функционирование модели. Рассматривается последовательность агентов, которые принимают решение следовать или не следовать какому-то поведению. Каждый агент знает поведение тех агентов, которые действуют раньше него. У всех агентов одинаковые затраты на согласие быть активным, которые равны 1/2. Выигрыш от активности — это случайная величина, принимающая с равной вероятностью два значения — ноль или единицу. Агенты различаются только своим положением в последовательности. Каждый агент получает независимый сигнал о размере выигрыша. Этот индивидуальный сигнал принимает два значения H и L, причем сигнал H наблюдается с вероятность p > 1/2, при условии, что выигрыш равен единице, а сигнал L с вероятностью 1 — p < 1/2, при условии, что выигрыш равен нулю. Агенты действуют так, чтобы максимизировать математическое ожидание своего выигрыша. Если агент индифферентен к выбору, то считается, что он делает выбор с вероятностью 1/2.
Основные результаты. Основным эффектом в описываемой модели являются так называемые информационные каскады. При участии в каскаде агент игнорирует собственные предпочтения, подражая предшествующим агентам, поведение которых включено в его оценку полезности участия. Могут возникать верхне-направленные каскады (up^ascade), когда все агенты, начиная с некоторого, принимают данное поведение, и нижне-на-правленные каскады (down-cascade), когда агенты отвергают данное поведение, а также отсутствие каскадов. Каскад, возникнув на каком-то шаге, не заканчивается.
0,5 0,6 0,7 0,8 0,9 р
Рис. 2. Вероятности возникновения правильного и неправильного каскадов
Исходя из правил принятия агентом решения, вероятности возникновения верхне-направленно-го каскада, отсутствия каскада и возникновения нижне-направленного каскада для четного числа п агентов соответственно равны [1 — (р — р2)п/2/2],
(р - р2)п/2, [1 - (р - р2)п/2/2].
Возникновение каскада зависит от того, насколько вероятность р близка к 1/2. Если эта вероятность равна 1/2, то сигнал становится неинформативным, и вероятность каскада минимальна.
Авторы работы [8] оценивают вероятности возникновения правильного (когда агенты, следующие каскаду, оказываются в выигрыше) и неправильного каскадов для четного числа агентов, которые равны соответственно:
р(р + 1 ) [ 1 - (р -р2)т/2] 2 (1 - р + р2)
(р - 2)(р - 1)[ 1 - (р -р2)"/2]
и-з-.
2 (1 - р + р2)
Зависимость этих вероятностей от р можно сравнить графически (рис. 2). Видно, что вероятность возникновения неправильного каскада достаточно существенна, даже при высокой вероятности правильного сигнала. Авторы работы [8] доказывают, что при некоторых предположениях при стремлении числа агентов к бесконечности вероятность наступления каскада стремится к единице.
Модель 7 (стадного поведения). В работе [9] перечисляются проявления социальных и экономи-
ческих ситуаций, которые можно интерпретировать как стадное поведение:
• посещение магазинов или ресторанов, поступление в учебные заведения, исходя из их популярности;
• принятие решений, связанных с уровнем рождаемости (сколько иметь детей, использовать ли противозачаточные средства и т. д.), сильно влияет поведение других людей в данном регионе [23];
• принятие инновационных технологий;
• поведение при голосовании;
• исследователи разных университетов одновременно приступают к работе над проблемами, которые считаются популярными.
Автор работы [9] сформулировал определение стадного поведения таким образом: «Каждый делает то, что делает другой, даже если индивидуальная информация подсказывает, что нужно делать что-то совсем другое».
Состав модели. Рассматривается множество из N агентов, каждый из которых максимизирует свою нейтральную к риску целевую функцию, которая определена на пространстве активов (assets). Активы индексированы на отрезке [0; 1], где i-й актив обозначается a(i). Доход, полученный n-м агентом от вложений в i-й актив, составляет z(i) е R. Предполагается, что существует единственный индекс i *, такой что z(i) = 0 при i ^ i* и z(i) = z при i = i*, причем z > 0.
Основные параметры. С вероятностью а каждый агент получает сигнал о том, что правильный актив i* есть i' = i'(j), j е N. Вероятность того, что этот сигнал правильный, равна р. Модель рассматривается с учетом предположений:
— если агент не получает сигнала и все предыдущие агенты выбрали i = 0, то этот агент выбирает i = 0;
— если у агента нет предпочтения между своим сигналом и выбором предыдущих агентов, то он следует своему сигналу;
— если у агента нет предпочтения, за каким из предыдущих агентов повторить выбор, он выбирает того, который выбрал актив с наибольшим значением i.
Функционирование. Первый агент совершает выбор актива случайно. Следующий агент делает выбор, и он знает о выборе первого агента, но не знает, получал ли при этом первый агент сигнал. Последующие агенты делают выбор аналогично, на основании истории прошедших выборов и сигналов, поступивших им с вероятностью а. Выигравшие определяются в конце игры. Предполагается, что правила игры и рациональность игроков по Байесу являются общим знанием.
Основные результаты. Получено условие существования и единственности равновесия Нэша,
описанное в виде оптимального правила поведения каждого агента.
1. Первый агент (k = 1) следует полученному им сигналу или, если сигнала нет, то выбирает i = 0.
2. Агент k (k > 1), получивший сигнал, следует этому сигналу тогда и только тогда, когда выполнены условия а или b:
а) сигнал агента совпадает с выбором предыдущих;
б) никакого выбора, отличающегося от i = 0, не было совершено более чем одним агентом.
3. Предположим, что k-й агент получил сигнал. Если любой выбор (среди уже осуществленных), отличающийся от максимального i, осуществлен более чем одним агентом, k-й агент сделает этот выбор, если его сигнал не совпадает с одним из других осуществленных выборов. В этом случае он выберет последний вариант.
4. Предположим, что k-й агент получил сигнал. Если любой выбор с максимальным i (среди уже осуществленных) сделан более чем одним агентом и никаких других выборов (кроме i = 0) не было осуществлено более чем одним агентом, k-й агент сделает этот выбор, если его сигнал не совпадает с одним из других осуществленных выборов. В этом случае он выберет последний вариант.
5. Предположим, что k-й агент не получил сигнал. Тогда он выберет i = 0, если все предыдущие сделают именно этот выбор. Иначе он выберет вариант с максимальным i.
Оптимальный выбор k-го агента (k > 2) можно записать в виде табл. 2, события описаны во второй и третьей строках, а вариант выбора — в последней.
Это оптимальное правило выбора приводит к стадному поведению в смысле указанного ранее определения. Вероятность того, что никто из агентов не выбирает правильного актива, равна
(1 - a(1 - ß))-1(1 - a)(1 - ß). (2)
Эта вероятность убывает по обеим переменным a и ß. Когда вероятность ß мала, вероятность (2) стремится к единице, т. е. выбрать правильный актив маловероятно. В связи с этим возникает вопрос об общественной полезности стадного поведения в рамках данной модели. В статье [9] утверждается, что при построенном автором алгоритме подражания предыдущим агентам суммарное число выигрышей (по всем агентам) ниже, чем при независимом поиске, при котором число выигрышей N+ = Naß, где N — общее число агентов.
Модель 8 (управления толпой) [10]. Состав модели. Имеется множество N = {1, 2, ..., n} агентов, каждый из которых выбирает одно из двух решений — «1» (действовать, например, принимать участие в беспорядках) или «0» (бездействовать). Агент i е N характеризуется, прежде всего, своим
влиянием на другого агента t.. 1 0 — тем «весом»,
и
с которым к его мнению прислушивается или его
( п
действия учитывает другой агент ]
IЪ = 11, да
и * 1
лее — своим решением х. е {0; 1}, и, наконец, — своим порогом, величиной 0; е [0; 1], определяющим, будет ли агент действовать при той или иной обстановке (векторе х— решений всех остальных агентов). Формально, действие х11-го агента определим как наилучший ответ на сложившуюся обстановку:
X = БЯ.(Х-1) =
1, если IЦ >ег,
и * 1
0, если IЦ <01.
(3)
и * 1
Функционирование. По аналогии с работой [24] рассматривается модель динамики коллективного поведения: в начальный момент времени все агенты бездействуют, далее в каждый из последующих моментов времени агенты одновременно и независимо действуют в соответствии с процедурой (3). Будем считать, что всегда есть «зачинщики» с порогом 0,. > 0.
Обозначим О, = {/ е N10. = 0}, О = 0
к + 1
и
и^ I е N I Ц >0г \, к = 1, 2, ..., п - 1.
^ 1 е йк _ 1, ] * 1 J
Очевидно О0 с 01 с ... с 0п _ 1 с 0п = N. Обозначим через Т = {?..} матрицу влияний агентов, че-
11
рез 0 = (01, 02, ..., 0п) — вектор их порогов. Вычислим показатель
д(Т, 0) = шт{к = 0, п - 1 |0к + 1 = 0к
Равновесие коллективного поведения х* (РКП) определяется как
X* (Т, 0) =
1, если I е 0
0, если I е N\ 0д{г>0),
I е N.
Для любых матриц влияния Т и порогов агентов 0 РКП существует, единственно и является одним из равновесий Нэша для игры с наилучшим ответом (3).
Управление. Для анонимного случая (когда влияния агентов одинаковы — такие агенты, в большинстве своем и составляют толпу), в качестве порогов можно выбрать целые числа т1, т2, ..., т , приняв т. = [п0;], где скобки означают целую часть, которые образуют вектор порогов т. Упорядочим агентов в порядке неубывания порогов: т1 < т2 < ... < тп и, считая т0 = 0, тп + 1 > п, определим число р(т) е {0, ..., п}:
р(т) = шт{к е N и {0}|тк < к, тк + 1 > к}.
Тогда структура РКП имеет вид: х* = 1,
I = 1, р(т); х* = 0, I = р(т) + 1, п , т. е. действовать будут первые р(т) агентов (в случае р(т) = 0 считаем, что все агенты бездействуют).
Пусть задача субъекта (центра), осуществляющего управление толпой, состоит в обеспечении числа действующих агентов, равным заданному числу К * > 0, т. е. в реализации нового РКП со значением К*, не превышающим значения р(т) старого РКП. Содержательно: уменьшить количество действующих в РКП агентов, т. е. центр, управляя значениями порогов, должен перевести положение РКП в точку К *. Задача управления за-
Оптимальный выбор к-го агента (к > 2)
Таблица 2
События
Сигнал не получен Получен сигнал /к
Все остальные агенты выбрали сигнал г = 0 Все варианты выбраны, кроме г = 0, который выбран одним агентом Только один вариант, отличающийся от г = 0, был выбран более чем одним агентом Два варианта, отличающихся от г = 0, были выбраны более чем одним агентом Другой агент выбрал г = гк Никакой другой агент не выбрал г = гк, и никакой другой выбор, отличный от г = 0, не был сделан более чем одним агентом Никакой другой агент не выбрал г = гк, и другой выбор, отличный от г = 0, был сделан более чем одним агентом Никакой другой агент не выбрал г = гк и два других выбора, отличных от г = 0, были сделаны более чем одним агентом
Выбор г = 0 Выбор наибольшего из выбранных ранее вариантов Выбор этого варианта Выбор наименьшего из двух вариантов Выбор г = гк Выбор г = гк Выбор этого варианта Выбор наименьшего из двух вариантов
F, G
/ /
/
/ /
/
/
/ /
/ / /
t / /
/ /
/ /
/ /
/ / к р( т)
Рис. 3. Вид начальной (/■) и измененной (С) функций распределения порогов
ключается в минимизации затрат на управление: C(m, m0) ^ min .
m e {n|p(n) = K*}
Пусть g — неубывающая функция от неотрицательного аргумента, который равен модулю разности между начальным и конечным уровнями порога управляемого агента. Будем считать, что затраты на управление порогом одного агента равны
ci(m, m0) = g(|m; — m01). По смыслу затрат g(0) = 0. Полные затраты будут равны сумме индивидуальных затрат:
n n
C(m, m0) = £ ci(mp m0) = £ g(|m; - m01).
i = 1 i = 1
Для иллюстрации принципа управления порогами предположим, что функция распределения порогов F(-) — неубывающая, определенная на множестве неотрицательных чисел, непрерывная слева и имеющая предел справа в каждой точке. Равновесием в данном случае, согласно модели [2], служит минимальная точка пересечения функции распределения порогов с биссектрисой. Эскиз графика этой функции распределения изображен на рис. 3; функция распределения порогов G (•), полученная в результате управления, изображена жирной линией.
В работе [10] показано, что минимальные затраты центра на управление
к *
J g(K* - t)dF(t).
F-1(K*)
Далее рассмотрим модели, основанные на методах статистической физики. Концепция, согласно которой многие законы природы имеют статистическое происхождение, настолько прочно укоренилась в современной физике, что статистическая физика стала самостоятельной и «универсальной» дисциплиной. В настоящее время ее аппарат успешно применяется в смежных науках, таких как биология, медицина, теория информации и компьютерные науки. Эти успехи побудили специалистов по статистической физике предпринять попытки построения моделей в такой далекой от физики области, как социология (см. обзор [25—27]). Применению моделей из статистической физики в социологии посвящены работы [28—35]. Как уже отмечалось в таких моделях от микросостояний переходят к макросостояниям, описываемых небольшим числом термодинамических параметров и функций.
Модель 9 (ограниченно рациональных агентов) [11—14]. В указанных работах авторы рассматривают так называемых ограниченно рациональных агентов. Проводятся аналогии между многошаговой теоретико-игровой моделью со смешанными стратегиями и задачей о максимизации некоторого лагранжиана, соответствующего свободной энергии в статистической физике.
В классической теории игр каждый игрок полностью рационален и способен выработать оптимальную для себя стратегию, максимизируя свою целевую функцию или ее математическое ожидание, и это служит основным препятствием применения теории игр к реальным ситуациям. В рассматриваемой модели подобная рациональность ограничена: авторы проводят аналогию с физикой, вводя в рассмотрение наблюдателя, который обладает тем или иным знанием о стратегиях агентов.
Состав модели. Пусть N — множество игроков, каждый из которых выбирает свою стратегию хг независимо от других с вероятностью д(х). У каждого игрока есть целевая функция g(x), где х — вектор стратегий всех игроков. Обозначим через д-г(х-г) = П #/Х/) совместное распределение стра-
] * I
тегий игроков, отличных от игрока /. Поведение игрока / определяется выбором распределения дг таким образом, чтобы максимизировать математическое ожидание его целевой функции:
= Щ 4М№х¥х.
1
Равновесие Нэша в смешанных стратегиях тогда можно записать в следующем виде:
V/, дг = а^тах |Ц д^х^х^х.
?< 1 * г
Функционирование. Будем считать для простоты, что множество игроков конечно. Ограниченность знания состоит в следующем: игроки действуют независимо, известны значения математического ожидания целевых функций {в,}. Принцип максимизации энтропии (MaxEnt Principle) утверждает, что оптимальная оценка распределения q определяется минимумом лагранжиана
L(q) = £ P,[Eq(g) - в,] - S(q),
i
где S(q) = — £ qilnqi — энтропия мультипликатив-
i
ной меры q = П q,. Решая задачу минимизации,
i
можно получить соотношения для смешанных стратегий:
qfa) х e , i e N,
где G = £ в,g.. Эти распределения в статистичес-
i
кой физике называются больцмановскими.
Если начальное знание состоит в том, что наблюдателю известны стратегии всех игроков, кроме i-го, лагранжиан примет вид
ад = рДЗД — в,] — ад,
(4)
а соответствующее его минимуму распределение Больцмана
qB (х) х e
-eiEq (g,\xi)
(5)
По теореме Брауэра о неподвижной точке для каждого набора {в1}1 е м существует хотя бы одно мультипликативное распределение, построенное по распределениям Больцмана (5).
Параметры модели. Первое слагаемое лагранжиана (4) минимизируется абсолютно рациональным агентом, тогда как второе минимизируется абсолютно иррациональным агентом. Таким образом, параметр р; характеризует баланс между рациональностью и иррациональностью агентов. Так, при р; < х минимум лагранжианов (4) для всех I е N соответствует равновесию Нэша в чистых стратегиях. В этом случае распределения будут представлять собой дельта-функции.
В случае р; < х распределения Больцмана (5) будут самосогласованным множеством смешанных стратегий, что при определенном правиле принятия решения игроком совпадает с равновесием Нэша в смешанных стратегиях.
Возможны и другие интерпретации модели. Например, если априорным знанием является значение энтропии каждого игрока, т. е. степени его неуверенности в принятии решения, то
соответствующий лагранжиан будет иметь вид а1[^(^1) — стг] — Е^), где {стг} соответствуют значениям энтропии игроков.
Другой альтернативной интерпретацией является оценка общей стратегии всех игроков х с точки зрения стороннего наблюдателя. Определим функцию коллективного благосостояния в виде
(Т(х) = I р;gi(x), тогда, если известно ее значение,
1
распределение Больцмана (5) будет равновесием Нэша в смешанных стратегиях.
Модель 10 (стохастическая модель социальной сети) [15] является представителем моделей с большим количеством агентов (см., например, работу [36]). Предположим, что поведение агентов социальной сети определяется их зависимостью от административного (внешнего по отношению к сети — и) и социального факторов (взаимодействие между агентами — 1). Эта зависимость приводит к тому, что поведение агентов в социальной сети уже не будет описываться мультипликативными распределениями типа (1). В данном случае характеристики социальной сети в целом могут быть описаны некоторым вероятностным распределением Р{-}, которое необходимо найти.
Состав модели. Пусть множество допустимых действий Хг = {1, 2, ..., г} для каждого агента сети состоит из конечного числа г вариантов. Действие агента I обозначим через ю; е Хг. Состояние
социальной сети обозначим через (ю(п)) е 0."г = = (ю1, Ю2, ..., Юп).
Полезность социальной сети для каждого из ее членов зависит от действий всех агентов этой сети, т. е. от состояния всей сети. Пусть полезность социальной сети в состоянии ю(п) для агента I определяется функцией его индивидуальной полезности И'ш (ю(п)), которая также зависит и от факторов влияния и и 1. Тогда полезность всей сети в целом для ее членов можно определить через сумму индивидуальных полезностей:
H>(n)) = £ Kt (ю(п)).
(6)
, = i
Определим математическое ожидание полезности по некоторому вероятностному распределению Р, которое характеризует социальную сеть в целом:
(п)л р;„(п)1
EHut(P) = £ H>(n))P{
ю
®(n) е п.
В статистической физике эта величина соответствует средней энергии системы. В теории информации она соответствует штрафной функции, отражающей риск.
Произвольность поведения социальной сети оценим с помощью энтропии
sn(P) = - £ P(«(n))in№w)].
Jnh
(7)
Можно показать, что Sn(P) < ^п(Пп) = п 1п(г), где Sn(Пn) — значение энтропии для так называемой вырожденной социальной сети, которая описана в предыдущей модели. Таким образом, произвольность поведения невырожденной социальной сети уменьшается по сравнению с вырожденной социальной сетью. Это происходит в силу зависимости поведения агентов от административного фактора (управления) и и от социального фактора t. Зависимость агентов от этих факторов определим через относительную энтропию меры Р по мере Рп:
!П(Р) = £ P{®(n)}ln
J") . о
Р[(Й
( n).
П n {®(П)}
Будем считать, что ценность социальной сети для ее агентов уменьшается с уменьшением свободы их действий, т. е. увеличением зависимости от внешних факторов. Таким образом, окончательную ценность социальной сети можно выразить выражением:
G(P) = EH IP) - vIn(P)
(8)
где параметр V > 0 введен для приведения величины 1П(Р) к размерности ценности. Кроме того, его можно содержательно интерпретировать как цену автономности агентов в социальной сети. В статистической механике и теории информации параметр V называется температурой.
В выражении (8) из ценности, которую приобрели агенты от социального и административного факторов, вычитается ценность, которую они по-
теряли в связи с уменьшением индивидуальной свободы (зависимостью). «Остаток», т. е. функцию Б, будем называть потенциальной ценностью социальной сети. В статистической механике термодинамический потенциал Р = —Б называется свободной энергией Гельмгольца.
Равновесное распределение. Взаимодействие агентов в рамках сети должно приводить к увеличению ее ценности, в противном случае эта сеть распадается. Будем считать, что равновесное распределение Р{ •} соответствует максимальной потенциальной ценности социальной сети (8).
Формально говоря, необходимо найти такое распределение Рв, для которого потенциальная ценность сети максимальна на симплексе вероятностных мер М = \р е м(тп): £ Р{ю(п)} = 1}:
Св = агвшах [ЕНи((С) - v/п(C)]. (9)
М
Решая вариационную задачу (9) методом неопределенных множителей Лагранжа, получим искомую меру:
П _ I (п), _ г7-\Ны((а,{'П)п , (п)> /1ПЧ
Ро = К } = я е П„К }, (10)
где
z = Z(v) = £
ш е Пп
e nn{®
(n)
(11)
Следуя терминологии статистической физики, величину (11) называют статистической суммой, а величину (10) — распределением Гиббса. Соответствие между понятиями величин в статистической физике, теории информации и социальных сетях приведено в табл. 3.
®(П) е П
n
n
n
Таблица 3
Соответствие основных понятий различных дисциплин, описывающих большие системы
Статистическая физика [37] Теория информации [38] Социальные сети [15]
Частица Фазовое пространство Координаты точки в фазовом пространстве Координаты N частиц в фазовом пространстве Энергия частицы Средняя энергия системы Энтропия Свободная энергия Гельмгольца Температура Передаваемый символ Пространство значений символа Значение символа Значения последовательности из N символов Функция штрафа символа Риск Количество информации Условная свободная энергия Дифференциальная ценность информации Агент социальной сети Множество допустимых действий агента Действие агента Пространство состояний социальной сети, определяемое действиями N агентов Полезность социальной сети для агента Ценность сети Зависимость агентов от внешних факторов Потенциальная ценность сети Цена автономности агентов сети
Основные результаты. Полезность всей социальной сети для состояния ю(п) определим, как и в выражении (6), через сумму индивидуальных по-лезностей агентов:
н, >(л)) = 2П х ^+u х
ю„
i, j = 1
i = 1
где символы 1 и и обозначают величины социального и административного факторов соответственно. Социальный фактор характеризует степень взаимодействия между агентами, а административный — воздействия со стороны некоторого центра.
Математическое ожидание действия социальной сети назовем средним действием сети, которое определим как
M„(v, u) = Z 2 " X X
ю/е
Hut«*{n))/v
i = 1 ®(n) enn
Для большого числа агентов (бесконечная социальная сеть) определим среднее действие как
m(v, u) = lim - M (v, u).
nn n
Можно показать [39, II.7.2 b], что справедливо равенство:
m(v, u)
-
г nfv,«(x) ,
I е dx -1
г nfv, и(x) ,
\xe dx,
(12)
где fv, u(x) = (x2 + "x - i
1 + x
1 - x
ln(1 - x)
ln(1 + x). Согласно выражению (12) сред-
2
нее действие социальной сети определяется теми точками x, в которых функция fv u(x) достигает своего максимума. Точки максимума этой функции должны удовлетворять уравнению
dfM- = 0 или t- x + u = I' (x) = 1 ln I±*. dx v v pW 2 1 - x
Рассмотрим графическое решение этого уравнения с различными параметрами v, u, t (рис. 4—6).
При условии, что коэффициент социального влияния меньше цены автономности агентов социальной сети: t < v, наклон прямой (t/v)x + u/v будет меньше 1, и эта прямая будет пересекать график ip (x) один раз, так как производная функции
IP (x) в точке 0 равна 1 (см. рис. 4). Точка пересечения x(v, u) будет точкой минимума функции fv
Рис. 4. Среднее действие при большой автономности
v, u
Рис. 5. Среднее действие при малой автономности и малом положительном управлении
В данном случае не происходит «фазового перехода», и среднее действие социальной сети непрерывно зависит от управления и.
Если справедливо обратное неравенство 1 > V, то при достаточно малых и « 0 будут существовать две точки экстремума, как показано на рис. 5 и 6.
n
1
Таблица 4
Возможные приложения математических моделей конформного поведения
Класс моделей Возможные приложения
Модели пространственного соседства Сегрегация населения [3, 40]. Развитие модели Шеллинга на базе аппарата клеточных автоматов [41]
Модели ограниченного окружения Принятие новых технологий [42]. Миграция населения [43, 44]. Марковская модель выбора места жительства [45]
Пороговые модели Институциональная экономика [46]. Влияние социальных структур на экономическое развитие [47]. Принятие новых технологий [48]. Эффект Веблена в потребительском спросе [49]. Критическая масса агентов в сети телекоммуникаций [50]. Обучение [51]. Развитие электронных рынков [52]. Мировая политэкономия [53]. Маркетинг «из уст в уста» (womma word of mouth marketing) [54]. Факторы влияния на общественное мнение [55]. Динамика доверия в online-аукционах [56]. Поведение на выборах [57, 58]. Выбор между двумя малознакомыми ресторанами [9]. Протесты и революции — критическое изменение порогов агентов [59, 60]. Модели репутационных и информационных влияний, распространение инноваций [61]. Пороговые модели возникновения общественно значимых проблем общества [62]
Теоретико-игровые пороговые модели конформного коллективного поведения Принятие новых технологий [63]. Принятие решения об участии в политическом событии [64]. Социальные нормы в поведении домохозяек [65] и в области соцобеспечения [66]. Локальные взаимодействия при очистке леса [67]
Модели структуры и стратегии в коллективном поведении Принятие новых технологий [68, 69] Занятость и безработица [70]. Рациональный выбор в сообществах [71]. Принятие решения об участии в политическом событии [72]. Революционные ситуации и «цветные революции» на Ближнем Востоке (1980—2010 гг.) [73]; революция в Иране (1977 г.) [74]. Причины разрушения социальных сетей в Интернете [75]. Распространение информации в социальных сетях [76]
Модели информационных каскадов Бизнес-циклы Кейнса, формирование картелей на олигопольном рынке [77]. Принятие новых технологий [78]. Занятость и безработица [79]. Модели обучения [51]
Модели стадного поведения Принятие новых технологий [80, 81]. Стадное поведение на рынке музыкальных произведений в Интернете [82]. Изучение поведения толпы [83]. Поведение толпы на концертах и других представлениях [84]
Управления стадным поведением Цикличность в моде [85]
Модели ограниченно рациональных агентов Рациональный выбор в сообществах [47, 86, 87]
Стохастические модели социальных сетей Принятие новых технологий [88]. Формирование рынка [89]. Социальные нормы и социальные взаимодействия в Индии [90]. Поведение агентов на финансовых рынках [91]. Модели обучения [92]. Эффекты конформизма, влияющие на уровень рождаемости [93]
Прочие модели критической массы Принятие новых технологий [31]. Эффекты Веблена в потребительском спросе [94]. Предсказание уровня преступности [95]. Эффекты конформизма, влияющие на рождаемость [96]. Обзор для неспециалистов по агентным моделям в общественных науках [9]
14 | CONTROL SCIENCES № 2 • 2014
—= 2; —= -0,1
X
1 1+x V - — n-
2 1-
У = t —хч U
1 -с 0
Г
Рис. 6. Среднее действие при малой автономности и малом отрицательном управлении
При u > 0 точкой минимума функции f u будет правая точка x(v, u) (см. рис. 5), а при u < 0 — левая x(v, u) (см. рис. 6).
Таким образом, если агенты ценят фактор социальной зависимости выше, чем цену автономности, центр может этим воспользоваться и с минимальными затратами на управление u повлиять на социальную сеть так сильно, что подавляющее большинство агентов будет выбирать действие, желательное центру.
Можно строго показать [39, IV.4.1 а], что эти точки x(v, u) будут предельными значениями в выражении (12), причем при t > v и малом u (u ^ ±0) значение предела будет зависеть от того, с какой стороны u приближается к нулю:
m(v, ±) = lim m(v, u) = lim lim 11 Mn(v, u) =
u^±0 u^±0 un
= x(v, ±) * 0.
Таким образом, в бесконечной социальной сети среднее действие сети m(v, ±) оказывается ненулевым при бесконечно малом управлении u. Этот эффект делает большую (бесконечную) социальную сеть более ценной в смысле управления u.
Мы рассмотрели несколько классов моделей конформного поведения, описав для каждого из них типовую модель и обсудив известные и возможные ее расширения. В заключение рассмотрим содержательные интерпретации возможных приложений рассматриваемых математических моделей.
2. ВОЗМОЖНЫЕ ПРИЛОЖЕНИЯ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ КОНФОРМНОГО ПОВЕДЕНИЯ
Математические модели социального взаимодействия (в том числе и конформного поведения) имеют множество приложений. В табл. 4 приведены некоторые из известных приложений, описанных в настоящем обзоре классов моделей конформного поведения, и даны ссылки на прикладные работы, в которых используются соответствующие результаты.
ЗАКЛЮЧЕНИЕ
В обзоре сделана попытка изложить методы изучения явления конформного поведения с точки зрения многих наук: философии, психологии, культурологии, социальной психологии и математики. Большая часть работы посвящена математическим моделям, в которых используются методы теории игр, динамических систем, теории вероятностей, статистики и статистической физики. Предложена одна из возможных классификаций математических моделей, которая не претендует на универсальность в силу многогранности применяемых математических методов и широты приложений к существующим социальным процессам.
Приведены известные приложения рассмотренных примеров математических моделей конформного поведения. Каждый из классов моделей является не только объектом перспективных теоретических исследований, но и может с соответствующей адаптацией использоваться для моделирования различных (не только перечисленных, но и, возможно, других) социальных явлений и процессов.
ЛИТЕРАТУРА
1. Бреер В.В. Теоретико-игровые модели конформного поведения // Автоматика и телемеханика. — 2012. — № 10. — С. 111—126.
2. Granovetter M. Threshold Models of Collective Behavior // The American Journal of Sociology. — 1987. — Vol. 83, N 6. — P. 1420—1443.
3. Schelling T. Dynamic models of segregation // Journal of Mathematical Sociology. — 1971. — Vol. 1. — Р. 143—186.
4. Chwe M. Structure and Strategy in Collective Action // American Journal of Sociology. — 1999. — Vol. 105, N 1. — Р. 128—157.
5. Keynes J.M. The General Theory of Employment, Interest and Money. — London: Macmillan, 1936.
6. Новиков Д.А., Чхартишвили А.Г. Рефлексия и управление: математические модели. — М.: Физматлит, 2012. — 420 с.
7. Новиков Д.А. Модели стратегической рефлексии // Автоматика и телемеханика. — 2012. — № 1. — С. 3—23.
8. Bikhchandani S., Hirshleifer D, Welch I. A Theory of Fads,
Fashion, Custom, and Cultural Change as Informational Cas-
cades // Journal of Political Economy. — 1992. — Vol. 100,
iss. 5. — P. 992—1026.
9. Banerjee A. A Simple Model of Herd Behavior // The Quarterly Journal of Economics. - 1992. - Vol. 107, N 3. - P. 797-817.
10. Бреер В.В., Новиков Д.А. Модели управления толпой // Проблемы управления. — 2012. — № 2. — С. 38—44.
11. Wolpert D.H. Finding Bounded Rational Equilibria, Part I: In-terative Focusing // Proc. of the Eleventh International Symposium on Dynamic Games and Applications, Tucson Arizona, December 18—21, 2004.
12. Wolpert D.H, Bieniawski, S.R. Product Distributions for Distributed Optimization // International Conf. on Complex Systems / Y. Bar-Yam (Ed.), Perseus books, 2004.
13. Wolpert D.H, Strauss C.E.M, Rajnarayan D.G. Advances in Distributed Optimization Using Probability Collectives // Advances in Complex Systems. — 2006. — Vol. 9, N 4. — Р. 383—436.
14. Wolpert D.H, Bieniawski, S.R, Rajnarayan D.G. Probability Collectives in Optimization, Working Papers of Santa Fe University paper, #11-08-033, Aug. 24, 2011.
15. Бреер В.В. Стохастические модели социальных сетей // Управление большими системами. — 2009. — № 27. — С. 169—204.
16. Васин А.А. Эволюционные и повторяющиеся игры: Учебное пособие. — М.: Российская экономическая школа, 2005. — 74 с.
17. Young H.P. The Evolution of Conventions // Econometrica. — 1993. — Vol. 61, N 1. — Р. 57—84.
18. Kuran T. Preference Falsification, Policy Continuity and Collective Conservatism // The Economic Journal. — 1987. — Vol. 97, N 387. — P. 642—665.
19. Kuran T. Sparks and Prairie Fires: A Theory of Unanticipated Political Revolution // Public Choice. — 1989. — Vol. 61, N 1. — P. 41—74.
20. Granovetter M. The Strength of Weak Ties // The American Journal of Sociology. — 1973. — Vol. 78, iss. 6. — Р. 1360—1380.
21. Goldenberg J., Libai B., Muller E. Talk of the network: A complex systems look at the underlying process of word-of-mouth // Marketing Letters. — 2001. — Vol. 12, iss. 3. — P. 211—223.
22. Leskovec J, Adamic L. A., and Huberman B.A. The dynamics of viral marketing // ACM Transactions on the Web. — 2007. — Vol. 1, N 1.
23. Cwatkins S. From Local to National Communities: The Transformation of Demographic Regions in Western Europe 1870—1960 // Population and Development Review. — 1990. — Vol. XVI. — P. 241—272.
24. Бреер В.В. Теоретико-игровая модель неанонимного порогового конформного поведения // Управление большими системами. — 2010. — № 31. — С. 162—176.
25. Словохотов Ю.Л. Физика и социофизика. Ч. 1. Физические основы социальных явлений. Влияние солнечной активности на процессы в обществе. Движение в системе «живых частиц» // Проблемы управления. — 2012. — № 1. — С. 2—20.
26. Словохотов Ю.Л. Физика и социофизика. Ч. 2. Сети социальных взаимодействий. Эконофизика // Проблемы управления. — 2012. — № 2. — С. 2—31.
27. Словохотов Ю.Л. Физика и социофизика. Ч. 3. Квазифизическое моделирование в социологии и политологии. Некоторые модели лингвистики, демографии и математической истории // Проблемы управления. — 2012. — № 3. — С. 2—34.
28. Blume L., Durlauf S. Equilibrium Concepts for Social Interaction Models // International Game Theory Review. — 2003. Vol. 5, N 3. — P. 193—209.
29. Brock W, Durlauf S. A Formal Model of Theory Choice in Science // Economic Theory. — 1999. — ^l. 14, iss. 1.
30. Brock W, Durlauf S. Discrete Choice with Social Interactions // Review of Economic Studies. — 2001. — Vol. 68, N 2. — P. 235—260.
31. Deffuant G, Huet S., Amblard F. An Individual-Based Model of Innovation Diffusion Mixing Social Value and Individual
Benefit // American Journal of Sociology. — Vol. 110, N 4. — P. 1041—1069.
32. Durlauf S.N. Non-ergodic economic growth // Rev. Econ. Stud. — 1993. — Vol. 60. P. 349—366.
33. Durlauf S.N. Statistical Mechanics Approaches to Socioeconomic Behavior. — NBER Working Paper No. t0203, 1996.
34. Roth C. Empiricism for descriptive social network models. — URL: http://camille.roth.free.fr/travaux/roth-empiricism-so-cialnetwork.pdf (дата обращения 12.11.2013).
35. Santis E., Marinelli C. A Class of Stochastic Games with Infinitely Many Interacting Agents Related to Glauber Dynamics on Random Graphs. — URL: http://arxiv.org/abs/math/0505608 (дата обращения 12.11.2013).
36. Newman M.E.J. The structure and function of complex networks // SIAM Review. — 2003. — Vol. 45, N 2. — Р. 167—256.
37. Румер Ю.Б., Рывкин М.Ш. Термодинамика, статистическая физика и кинетика. — М.: Наука, 1972.
38. Стратонович Р.Л. Теория информации. — М.: Сов. радио, 1975.
39. Ellis R. Entropy, Large Deviations and Stochastical Mechanics. — N.-Y.: Springer, 1985.
40. Schelling T. A process of residential segregation: Neighborhood tipping, in Racial Discrimination / in: A. Pascal (Ed.), Economic Life, Lexington, MA: Lexington Books. — 1972. — Р. 157—184.
41. Benito J.M., Hernandez P. Schelling's Dynamic Models of Segregation: A cellular automata approach (2004). — URL: http:// citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.87.1841 (дата обращения 8.11.2013).
42. Goldenberg J, Libai B., Muller E. The Chilling Effects of Network Externalities // International Journal of Research in Marketing. — 2010. — Vol. 27, iss. 1. — P. 81—92.
43. Elrick T. Migration Decision Making and Social Networks. The State of the art, Feb 2005 / EU Marie Curie Excellence Grant Project «KNOWING».
44. Fagiolo G, Valente M, Vriend N. Dynamic Models of Segregation in Small-World Networks. — Queen Mary, University of London, School of Economics and Finance in series Working Papers. — 2007. — N 589.
45. Tuljapurkar S., Bruch E.E., Mare R.D. Neighborhoods and Individual Preferences: A Markovian Model / On-Line Working Paper Series, California Center for Population Research, UC Los Angeles. — 2008.
46. Granovetter M.. Economic Institutions as Social Constructions: A Framework for Analysis // Acta Sociologica. — 1992. — Vol. 35, N 1. — P. 3—11.
47. Granovetter M. Coase Encounters and Formal Models: Taking Gibbons Seriously // Administrative Science Quarterly. — 1999. — Vol. 44, N 1. — P. 158—162.
48. Kempe D, Kleinberg J, Tardos E. Influential Nodes in a Diffusion Model for Social Networks. Automata, Languages and Programming In Automata // Languages and Programming. — 2005. — Vol. 3580. — P. 1127—1138.
49. Morioka K. Market Share Dynamics Based on the Emergence and Collapse of Brand Values: Simulations Focusing on Communications between Consumers. — URL: http://EconPa-pers.repec.org/RePEc:kei:dpaper:2008-028 (дата обращения 12.11.2013).
50. Allen D. New Telecommunications Services. Network Externalities and Critical Mass // Telecommunication Policy. — 1988. — Sept.
51. Macy M. Learning Theory and the Logic of Critical Mass // American Sociological Review. — 1990. — Vol. 55, N 6. — Р. 809—826.
52. Somasundaram R. Operationalizing Critical Mass As The Dependent Variable For Researching The Diffusion Of eMarket-places — Its Implications / 17th Bled eCommerce Conference, Bled, Slovenia, June 21—23, 2004.
53. Simmons B.A, Elkins Z. The Globalization of Liberalization: Policy Diffusion in the International Political Economy // The
American Political Science Review. — 2004. — Vol. 98, N 1. — Р. 171—189.
54. Watts D.J. Challenging the Influentials Hypothesis // WOMMA Measuring Word of Mouth. — 2007. — Vol. 3. — P. 201—211.
55. Watts D.J., Dodds P.S. Influentials, Networks, and Public Opinion Formation // Journal of Consumer Research. — 2007. — Vol. 34, N 4.
56. Chang Q., Craig V., Seung-hun H. Break the Trust Threshold: Customer Ratings and Trust Building on eBay Auctions. AMCIS. 2006. Proceedings.
57. Bartha E., Wolszczak-Derlacz J. Why do People Choose to be Silent? Simulating Electoral Behavior. — EUI Working Paper MWP. N 2008/26.
58. Simon H.A. Bandwagon and Underdog Effects and the Possibility of Election Predictions // The Public Opinion Quarterly. — 1954. — Vol. 18, N 3. — Р. 245—253.
59. Chien-Chung Yin. Equilibria of Collective Action in Different Distributions of Protest Thresholds // Public Choice. — 1998. — Vol. 97, N 4. — P. 535—567.
60. Rolfe M. Social networks and threshold models of collective behavior / Preprint, University of Chicago, 2004.
61. Rosenkopf L, Abrahamson E. Modeling Reputational and Informational Influences in Threshold Models of Bandwagon Innovation Diffusion // Computational and Mathematical Organization Theory. — 1999. — Vol. 5, iss 4. — P. 361—384.
62. Wood B.D., Doan A. The Politics of Problem Definition: Applying and Testing Threshold Models // American Journal of Political Science. — 2003. — Vol. 47, N 4. — Р. 640—653.
63. Hehenkamp B., Kaarboe O.M. Imitators and Optimizers in a Changing Environment. — University of Dortmund, Department of Economics, series Discussion Papers in Economics. — 2003. — N 02_01.
64. Chwe M. Communication and Coordination in Social Networks // Review of Economic Studies. — 2000. — Vol. 67, N 1. — Р. 1—16.
65. Lindbeck A. Incentives and Social Norms in Household Behavior. — Stockholm University, Institute for International Economic Studies, Seminar papers 622, 1997.
66. Lindbeck A., Nuberg S., Weibull W. Social Norms and Economic Incentives in the Welfare State. — The Research Institute of Industrial Economics, Working paper 476, 1997.
67. Robalino J.A., Pfaff A.S.P. Spatial Interactions in Forest Clearing: Deforestation and Fragmentation in Costa Rica. — URL: http://www.ucl.ac.uk/bioecon/6th_2004/Robalino.pdf (дата обращения 12.11.2013).
68. Raynaud D. Why Do Diffusion Data not Fit the Logistic Model? A Note on Network Discreteness, Heterogeneity & Anisot-ropy. From Sociology to Computing in Social Networks: Theory, Foundations and Applications / N. Memon and R. Alhajj (Ed.) — 2010. — Р. 81—96.
69. Valente T. Network Models and Methods for Studying the Diffusion of Innovations // Models and methods in social network analysis / Eds: P. Carrington, J. Scott, S. Wasserman. — N.-Y.: Cambridg University Press, 2005. — P. 98—116.
70. Granovetter M. The Strength of Weak Ties // A Network Theory Revisited. Sociological Theory. — 1983. — Vol. 1. — Р. 201—233.
71. Hedstrom P. Contagious Collectivities: On the Spatial Diffusion of Swedish Trade Unions 1890—1940 // The American Journal of Sociology. — 1994. — Vol. 99, N 5.
72. Myers D, Oliver P. Formal Models in Studying Collective Action and Social Movements / in the book «Social Movement Research» by B. Klandermans, S. Staggenborg, 2002.
73. Hassanpour N. Dynamic Models of Mobilization in Political Networks. — Southern Illinois University Carbondale, Conference Proceedings, 2010.
74. Rasler K. Concessions, Repression, and Political Protest in the Iranian Revolution. American Sociological Review. — 1996. — Vol. 61, N 1. — Р. 132—152.
75. Centola D. Failure in Complex Social Networks // Journal of Mathematical Sociology. — 2008. — Vol. 33, iss. 1. — P. 64—68.
76. Kitsak M., Gallos L., Havlin S., Liljeros F, Muchnik L., Stanley H.E., Makse H.A. Identifying influential spreaders in complex networks. arXiv:1001.5285v1 [physics.soc-ph] 28 Jan. 2010.
77. Akerlof G.A. A Theory of Social Custom, of Which Unemployment May Be One Consequence // The Quarterly Journal of Economics. — 1980. — Vol. 94, N 4. — P. 749—775.
78. Ellison G, Fudemberg D. Rules of thumb for social learning // J. Polit. Economy. — 1993. — Vol. 101. — Р. 612—644.
79. Conley T.G., Topa G. Dynamic Properties of Local Interaction Models. — FRBNY Working Paper, 2003.
80. Choi J.P. Herd Behavior, the «Penguin Effect» and the Suppression of Informational Diffusion: An Analysis of Informational Externalities and Payoff Interdependency // The RAND Journal of Economics. — 1997. — Vol. 28, N 3. — P. 407—425.
81. Conlisk J. Costly Optimizers versus Cheap Imitators // Journal of Econ. Behavior and Organization. — 1980. — Vol. 1, iss. 3. — P. 275—293.
82. Borghesi C, Bouchaud J-P. Of Songs and Men: a Model for Multiple Choice with Herding (2006). — URL: http://arxiv. org/abs/physics/0606224 (дата обращения 8.11.2013).
83. Berk R. A Gaming Approach to Crowd Behavior // American Sociological Review. — 1974. — Vol. 39, No. 3. — P. 355—373.
84. Clayman S.E. Booing: The Anatomy of a Disaffiliative Response // American Sociological Review. — 1993. — Vol. 58, N 1. — Р. 110—130.
85. Caulkins J.P. Hartl R.F., Kort P.M., Feichtinger G. Explaining fashion cycles: Imitators chasing innovators in product space // Journal of Economic Dynamics and Control. — 2007. — Vol. 31, iss. 5. — P. 1535—1556.
86. Bisin A., Horst U, Ozgur O. Rational expectations equilibria of economies with local interactions // Journal of Economic Theory. — 2006. — Vol. 127. — P. 74—116.
87. Kipperber g G. Discrete Choices with Social Interactions: An Application to Consumer Recycling // Annual Conference of the American Agricultural Economics Association. August 1—4, 2004, Denver-Colorado, United States.
88. Schipper C. Imitators and Optimizers in Cournot Oligopoly // Journal of Economic Dynamics and Control. — 2009. — Vol. 33, iss. 12. — Р. 1981—1990.
89. Weisbuch G, Kirman A., Herreiner D. Market Organization and Trading Relationships / Universite Aix-Marseille III in its series G.R.E.Q.A.M. number 98a32. — 1998.
90. Krishnan P. Cultural Norms, Social Interactions and the Fertility Transition in India // Royal Economic Society Annual Conference 2002, number 117.
91. Matos J.A. Information Flow, Social Interactions and the Fluctuations of Prices in Financial Markets. — Econometric Society 2004 Latin American Meetings 114, Econometric Society.
92. Kearns M. Wortman J. Learning from Collective Behavior. — URL: http://citeseerx.ist.psu.edu/viewdoc/summary?doi= 10.1.1.110.5231 (дата обращения 12.11.2013).
93. Michard Q., Bouchaud J.-P. Theory of collective opinion shifts: from smooth trends to abrupt swings. — arXiv:cond-mat/0504079v1 [cond-mat.stat-mech] 4 Apr 2005.
94. Leibenstein H. Bandwagon, Snob, and Veblen Effects in the Theory of Consumers' Demand. The Quarterly Journal of Economics. — 1950. — Vol. 64, N 2. — Р. 183—207.
95. Lafree G. Declining violent crime rates in the 1990s: Predicting Crime Booms and Busts // Annual Review of Sociology. — 1999. — Vol. 25. — P. 145—168.
96. Nechyba T. Social Approval, Values, and AFDC: A Reexami-nation of the Illegitimacy Debate // The Journal of Political Economy. — 2001. — Vol. 109, N 3. — Р. 637—672.
Статья представлена к публикации членом редколлегии
чл.-корр. РАНД.А. Новиковым.
Бреер Владимир Валентинович — бизнес-аналитик,
ЗАО «Авиахэлп Групп», г. Москва, И [email protected].