НАУЧНАЯ ЖИЗНЬ
Роберт Ауман и Томас Шеллинг -Нобелевские лауреаты по экономике 2005 г.
Алескеров Ф.Т.
Говоря об игре, люди часто думают о шахматах, картах и подобных играх. В этих играх интересы игроков противоположны, т.е. выигрыш одного игрока приводит к проигрышу другого.
Однако есть игры, в которых игроки могут иметь как противоположные, так и общие интересы.
Именно такие игры рассматривал в своих работах один из Нобелевских лауреатов 2005 г. Томас Шеллинг. В одном из его красочных примеров рассматриваются два грузовика, груженые динамитом, которые несутся друг навстречу другу по узкой дороге. Противоположность интересов (надо скорее проехать) приводит к тому, что дорогу уступать никто не хочет; общность же интересов состоит в том, что если оба откажутся уступить дорогу, то конец игры будет очень уж громким...
Здесь можно вспомнить также известный детский стишок о двух барашках.
Оказывается, что такие игры имеют прямое отношение к анализу гонки вооружений и многим другим аспектам реальной жизни.
Для иллюстрации работ Т. Шеллинга рассмотрим следующую игру. Пусть две страны имеют претензии на некоторую спорную территорию между ними. Каждая страна располагает двумя стратегиями: объявить мобилизацию (М) или отказаться от претензий на спорную территорию (О).
Если обе страны объявляют мобилизацию, это с высокой вероятностью приводит к войне. Для этого случая будем условно считать, что выигрыш каждой страны равен нулю1).
Если обе страны отказываются от мобилизации, то выигрыш их также одинаков и равен Ь > 0.
Наконец, если одна страна мобилизует армию, а другая нет, то агрессор может занять спорную территорию.
Можно считать, что выигрыш агрессора в этом случае равен а, а выигрыш другой страны равен с, причем а > Ь > с > 0.
Рассмотрим так называемую платежную матрицу этой игры2). В этой матрице в строках стоят стратегии первой страны, в столбцах - стратегии второй страны, а в пересечении строк и столбцов - два числа. Первое из них равно выигрышу первой страны, если она выбирает соответствующую стратегию, второе число равно выигрышу второй страны при выборе соответствующей стратегии.
1) Можно было бы считать, что эта величина для обеих стран одинакова и отрицательна.
2) Кстати, такое представление игры ввел Т. Шеллинг.
Страна 2
Св Я Объявить мобилизацию (М) Отказаться от попытки захвата (О)
св а Объявить мобилизацию (М) (0,0) (а,с)
О Отказаться от попытки захватить спорную территорию (О) (с,а) (Ь,Ь)
Рассмотрим следующую пару стратегий: первая страна объявляет мобилизацию, вторая отказывается от претензий на спорную территорию. Тогда выигрыш первой страны равен а, второй страны - равен с.
Есть ли смысл каждой стране менять свою стратегию?
Если первая страна откажется от мобилизации, а другая страна не изменит свою стратегию, то ее выигрыш будет Ь, и так как Ь < а, то смена стратегии первой стране не выгодна. Аналогично, если вторая страна сменит свою стратегию на мобилизацию, то ее выигрыш составит ноль, а 0 < с, т.е. и ей нет смысла менять стратегию.
Такой набор стратегий (первая страна объявляет мобилизацию, вторая отказывается от претензий), которую каждой из сторон не выгодно менять, называется равновесием Нэша.
Аналогично, равновесием Нэша будет симметричная пара стратегий, т.е. набор (первая страна отказывается от претензий, вторая страна объявляет мобилизацию).
Является ли набор (первая страна отказывается от претензий, вторая страна отказывается от претензий) с выигрышами (Ь,Ь) равновесием Нэша? Нет, так как одному из участников выгодно сменить стратегию. Действительно, если первый из участников сменит стратегию на мобилизацию (при условии, что второй сохранит прежнюю стратегию), то его выигрыш составит а > Ь.
Аналогично, если второй сменит стратегию, а первый сохранит прежнюю, то выигрыш второго составит а > Ь.
Заметим, однако, если оба меняют стратегию, то каждый получит выигрыш, равный нулю, а 0 < Ь. Эту ситуацию мы подробнее обсудим ниже. Если же оба выбирают стратегию мобилизации, то выигрыш каждого равен нулю. Очевидно, что каждому из участников выгодно отказаться от этой стратегии.
Таким образом, в этой игре есть два равновесия Нэша (в чистых стратегиях). Смешанные стратегии выбираются с помощью вероятностного механизма, т.е. каждая страна выбирает с вероятностью р мобилизацию и с вероятностью (1 - р) -отказ от претензий. Тогда набор стратегий с соответствующими вероятностями составляет равновесие Нэша в смешанных стратегиях.
Представим себе, что выигрыши при выборе странами соответствующих стратегий, неодинаковы и, например, таковы, как это показано в платежной матрице.
Страна 2
М О
Св Я се р Е- а М (0,0) (а1,С2)
О (сьа2) (Ь,Ь)
Предположим теперь, что а^ намного больше, чем Ь, которое, в свою очередь, незначительно больше, чем сь т.е. выигрыш первой страны при мобилизации намного больше, чем выигрыш в ситуации, когда обе страны отказываются от претензий (равный Ь), и, наконец, эта последняя величина с незначительно больше, чем С1, т.е. чем выигрыш в ситуации, когда первая страна отказывается от претензий, а вторая мобилизуется.
Очевидно, что в этом случае равновесие Нэша (первая страна мобилизуется, вторая воздерживается от голосования) имеет больше шансов на реализацию, чем набор стратегий (первая страна отказывается от претензий, вторая мобилизуется). Особенно больше шансов для реализации пары (М, О), если для второго участника имеет место, что а,2 ненамного больше Ь, которое ненамного больше С2.
Оба эти набора являются равновесиями Нэша, но первое было названо Т. Шеллингом фокальным.
Например, такая ситуация возникает в случае следующей платежной ма трицы.
Страна 2
Страна 1 М О
М (0,0) (50,4)
О (3, 7) (5,5)
Поскольку точные значения выигрышей могут быть сторонам неизвестны, отсутствуют точные правила координации действий игроками. Это привело Т . Шеллинга к анализу смешанного равновесия. Поскольку каждая страна не уверена в действиях другой, будем считать, что она оценивает вероятность другой страны объявить мобилизацию величиной р. Тогда вероятность того, что они не объявят мобилизацию, равна (1 - р) и ожидаемый выигрыш первой страны равен (1 - р)а.
Ожидаемый выигрыш, если первая страна откажется от претензий, равен
р • с + (1 -р) Ъ.
Приравнивая эти значения, получим значение вероятности р для равновесия в смешанных стратегиях.
Значение вероятности р определяет состояние, когда игроку безразлично, объявить ли мобилизацию или отказаться от претензий. Заметим, что с ростом с значение вероятности р уменьшается, т.е. риск войны становится меньше не только при уменьшении выигрыша победителя, но и при увеличении проигрыша побежденного.
Здесь возникает серия интересных проблем, связанных с угрозами и контругрозами и доверием оппонентов к этим действиям.
Т. Шеллинг впервые объяснил, как страны приходят к мирному сосуществованию - через угрозу применения силы3).
3) В 1993 г. Т. Шеллинг был удостоен премии Национальной академии наук США за работы, связанные с «предотвращением ядерной войны».
Еще один вывод, к которому пришел Т. Шеллинг, рассматривая эту задачу, состоит в том, что сама агрессия и противостояние ей осуществляются малыми шагами - страны как бы проверяют намерения друг друга, чтобы иметь возможность отступить. При этом обязательства и намерения каждой стороны должны восприниматься другой стороной как вызывающие доверие.
Отсюда почти сразу следует, что, скажем, в ядерном конфликте, чтобы быть уверенным в адекватном ответе, надо, прежде всего, хорошо защищать шахты, где базируются ракеты, а не города.
С другой стороны, понятно, что угроза силы, хотя и является (и являлась) сдерживающим фактором в отношениях между супердержавами, но баланс сил является очень хрупким и зависит от таких факторов, как развитие технологии. Именно поэтому, добавим от себя, СССР и США уделяли столько внимания развитию военных технологий и немедленно старались применить эти технологии.
Результаты Т. Шеллинга были развиты Р. Зелтеном (на так называемые подыгровые равновесия) и Д. Харсаньи (на игры с неполной информацией). Они оба и Дж. Нэш получили Нобелевскую премию в 1994 г.
Работы Т. Шеллинга имеют значительные приложения, в частности в теории фирмы на рынке несовершенной конкуренции, при принятии решений по монетарной политике государств, в частном производстве общественных благ. Кроме того, координация типа упомянутой выше наблюдается в биологических системах.
Говорить о вкладе Р. Аумана очень трудно, не прибегая к математике. Как отмечается в решении комитета по Нобелевским премиям, Р. Ауман сделал очень много для формирования современного облика теории игр. На мой взгляд, именно Р. Ауман поднял теорию игр до ее современного математического уровня.
Для того чтобы объяснить его результаты, начнем с рассмотрения известной дилеммы заключенного. Представим себе, что полиция арестовала двух человек, которых подозревают в совершении серьезного преступления. Если это удастся доказать, то оба будут осуждены на 10 лет заключения. Если же доказать их участие в серьезном преступлении не удастся, то они будут осуждены на 3 года каждый за мелкое правонарушение, скажем за незаконное хранение оружия. Если кто-то из подозреваемых будет сотрудничать со следствием и признается в совершении преступления, то он получит срок в 2 года, а его непризнавшийся сообщник получит «на полную катушку» - 15 лет.
Платежная матрица этой игры имеет следующий вид.
2 игрок
Признаться Не признаваться
о а Признаться (10,10) (2,15)
и Не признаваться (15,2) (3,3)
Предположим, что оба подозреваемых находятся в разных камерах. Очевидно, что наиболее выгодная стратегия для каждого - не признаваться. Однако каждый, думая, что другой начнет давать признательные показания, делает то же, и это приводит к тому, что оба получают по 10 лет тюрьмы.
Иначе говоря, не кооперативное (по отношению к партнеру) поведение оказывается единственным равновесием в этой игре, причем невыгодным для обоих партнеров.
А что будет, если эта игра - дилемма заключенного - играется несколько раз? Будет ли так же выгодно каждому преступнику продолжать некооперативное поведение? Блестящий ответ на эти вопросы был дан Р. Ауманом и его учениками и последователями в теории повторяющихся игр.
Приложения этих игр очень разнообразны. Этими моделями описываются ценовые и торговые войны, гонка вооружений. Этими моделями было описано функционирование различных институтов, от союза предпринимателей до мафии.
Особое значение имело приложение теории повторяющихся игр к гонке вооружений. Описание этой проблемы потребовало разработки теории повторяющихся игр с неполной информацией. Начала этой теории были заложены в 60-е гг. ХХ в. Р. Ауманом и его коллегами, в частности М. Машлером.
Здесь очень важную роль играет то, как партнеры должны раскрывать информацию, которой они обладают, чтобы «не прогадать».
Важность повторяющихся игр состоит в том, что результаты нашего поведения в каком-то туре игры могут влиять на будущие туры этой же игры. Например, если мы постоянно заключаем контракты с какой-то фирмой, то, может быть, в какой-то момент ей выгодно нарушить контракт, но, тем самым, она теряет постоянного клиента в будущем, что может быть невыгодно ей стратегически. Кстати, именно это соображение часто определяет поведение серьезных фирм на рынке.
В 1964-1965 гг. Агентство по контролю над вооружениями и разоружением США начало исследовательскую работу для подготовки к переговорам по разоружению 1965 г. в Женеве между СССР и США. Среди участников этой работы были такие выдающиеся ученые, как сам Р. Ауман, Г. Кун, Ж. Дебре (лауреат Нобелевской премии по экономике 1983 г.), Г. Скарф, Р. Зелтен, Д. Харсаньи, М. Машлер, Р. Стернс и др. Именно там впервые обсуждались основания теории повторяющихся игр с неполной информацией.
Р. Ауманом введен в теорию игр ряд новых концепций равновесия, которые уже стали классическими. Одна из этих концепций - строгое равновесие - возникает при наличии нескольких игроков и состоит в том, что не только каждому игроку в отдельности невыгодно придерживаться некооперативного поведения, но и коалициям таких игроков. Очевидно, что это прямое обобщение понятия равновесия Нэша.
Огромным приложением этого направления теории игр стало исследование реализуемости игровыми схемами процедур голосования.
Другое обобщение равновесия Нэша - так называемое коррелированное равновесие, при котором стратегии игроков могут быть статистически зависимы. Оказалось, что это понятие связывает концепции равновесия в некооперативных играх с байесовским подходом в теории решений.
Другой важнейший вклад Р. Аумана в экономику состоит в исследовании так называемых неатомических игр - игр с бесконечным числом участников, но таких, что каждый игрок не играет заметной роли в процессе и результате игры. Примером таких игр может служить большая экономика без крупных корпораций или выборы, где каждый отдельно взятый избиратель почти не влияет на результат.
Все эти результаты Р. Аумана оказались востребованными в компьютерных науках, психологии и даже генетике. Кроме того, Р. Ауман известен своими блестящими теоретико-игровыми интерпретациями Талмуда и Торы.
Еще один замечательный вклад был сделан Р. Ауманом и его соавторами в политическую экономию. Я имею в виду его работы по производству общественных благ.
Р. Ауманом создан Центр по исследованию рациональности в Иерусалимском университете, в котором работает он сам и его замечательные ученики -выдающиеся ученые: Б. Пелег, С. Харт, Д. Шмайдлер, Ш. Замир, А. Нейман и др.
Центр по рациональности сотрудничает с другими ключевыми научными учреждениями по экономике, в частности с Центром по исследованию операций и эконометрике (CORE) в Бельгии4^.
Основные работы Р. Аумана и Т. Шеллинга
1. Aumann R.J. Acceptable Points in General Cooperative n-Person Games // Contributions to the Theory of Games IV / R.D. Luce, A.W. Tucker (eds.) Annals of Mathematics Study 40. Р. 287-324. Princeton NJ: Princeton University Press, 1959.
2. Aumann R.J. Markets with a Continuum of Traders // Econometrica. 1964. № 32. Р. 39-50.
3. Aumann R.J. Existence of Competitive Equilibria in Markets with a Continuum of Traders // Econometrica. 1966. № 34. Р. 3-27.
4. Aumann R.J. Subjectivity and Correlation in Randomized Strategies // Journal of Mathematical Economics. 1974. № 1. Р. 67-96.
5. Aumann R.J. Survey of Repeated Games // Essays in Came Theory and Mathematical Economics in Honor of Oskar Morgenstern. Wissenschaftsverlag (Mannheim), 1981. Р. 11-42.
6. Aumann R.J. Correlated Equilibrium as an Extension of Bayesian Rationality // Econometrica. 1987. № 55. Р. 1-18.
7. Aumann R.J., Kurz M. Power and Taxes // Econometrica. 1977. № 45. Р. 1137-1161.
8. Aumann R.J., Kurz M., Neyman A. Voting for Public Goods // Review of Economic Studies. 1983. Р. 677-694.
9. Aumann R.J., Maschler M. Game theoretic aspects of gradual disarmament; Repeated games with incomplete information: A survey of recent results; Repeated games of incomplete information, the zero-sum extensive case: Reports ST-80, 116 and 143, Princeton NJ: Mathematica, 1966, 1967, 1968.
10. Aumann R.J., Maschler M. (with the collaboration of R. Stearns) Repeated Games with Incomplete Information. MIT Press, 1995.
11. Aumann R.J., Shapley L. Value of Non-Atomic Games, Princeton University Press, Princeton NJ. (русский перевод: Ауман Р., Шепли Л. Значения для неатомических игр. М.: Мир, 1977.)
12. Aumann R.J., Shapley L. Long-Term Competition: A Game-Theoretic Analysis Hebrew University, 1976 [Mimeo.] (Reprinted in N. Megiddo (ed.) Essaus in Game Theory in Honor of Michael Maschler. Berlin: Springer Verlag, 1994. Р. 1-15.)
13. Aumann R.J., Sorin S. Cooperation and Bounded Recall // Games and Economic Behavior, 1989. № 1. Р. 5-39.
14. Schelling T.C. The Strategy of Conflict. Cambridge MA: Harvard University Press, 1960.
4) 20 октября 2005 г. нынешний директор CORE профессор Ш. Вебер выступил с докладом «Языковое ущемление в лингвистически разнородных сообществах: случай Европейского союза» на общемосковском семинаре в ГУ ВШЭ «Математические методы анализа решений в экономике, бизнесе и политике».
15. Schelling T.C. Arms and Influence. New Haven: Yale University Press, 1966.
16. Schelling T.C. Micromotives and Macrobehavior. Cambridge MA: Harvard University Press, 1978.
17. Schelling T.C. Choice and Consequence. Cambridge MA: Harvard University Press, 1984.
Schelling T.C., Halperin M.H. Strategy and Arms Control. N.Y.: Twentieth Cen-try Fund, 1961.