Теоретико-игровые модели проведения конкурсов

Мазалов Владимир Викторович; Токарева Юлия Сергеевна

УДК 519.832.2 ББК 22.18

ТЕОРЕТИКО-ИГРОВЫЕ МОДЕЛИ ПРОВЕДЕНИЯ КОНКУРСОВ 1 2

Мазалов В.В.3,

(Учреждение Российской академии наук Институт прикладных математических исследований Карельского научного центра РАН, Петрозаводск)

Токарева Ю.С.4 (Забайкальский государственный гуманитарно-педагогический университет им. Н.Г. Чернышевского, Чита)

Рассматривается бескоалиционная игра п лиц с ненулевой суммой, связанная с проведением конкурсов. Игроки представляют на конкурс проекты, которые характеризуются набором параметров. Арбитр или арбитражный комитет выбирает один из проектов, используя некоторую стохастическую процедуру с распределением вероятностей, которое известно участникам конкурса. При этом победитель конкурса получает выигрыш, зависящий от параметров проекта. В работе представлена теоретико-игровая модель данной задачи и найдено равновесие в двух и трехмерных моделях.

Ключевые слова: теоретико-игровая модель конкурса, игра п лиц, диаграмма Вороного, арбитражная процедура, равновесие по Нэшу.

1 Работа поддержана грантами РФФИ (проект 10-01-00089-а), АВЦП «Развитие научного потенциала высшей школы» и ОМН РАН.

2 Текст приводится в соответствии с изданием «Математическая теория игр и ее приложения. - 2010. - Т. 2. № 2. - С. 66-78».

3 Владимир Викторович Мазалов, доктор физико-математических наук, профессор ([email protected]).

4 Юлия Сергеевна Токарева, кандидат физико-математических наук ([email protected]).

Введение

Рассматривается бескоалиционная игра п лиц с ненулевой суммой, связанная с проведением конкурсов. Игрок г € N = {1, 2,..., п} представляет на конкурс проект, который характеризуется набором параметров хг = (х\,..., хгт). Например, проект может включать описание его стоимости, времени выполнения, числа работников и т.д. Арбитр или арбитражный комитет рассматривает поступившие предложения, выбирает один из проектов, используя стохастическую процедуру с распределением вероятностей, которое известно участникам конкурса. При этом победитель конкурса к получает выигрыш Н& (хк), зависящий от параметров его проекта. В работе для выбора проекта используется многомерная арбитражная процедура, которая выбирает ближайший к решению арбитра проект.

Этот подход широко применяется в одномерных игровых задачах двух лиц с нулевой суммой, которые интерпретируются как решение спора о зарплате между работником и работодателем. В работах [1-5] получены равновесия в таких играх с участием одного арбитра, и в работах [6-7] с участием арбитражного комитета.

В данной работе представлена многомерная теоретикоигровая модель п лиц с ненулевой суммой, в которой предложения игроков представляют собой набор параметров. Для ряда двухмерных и трехмерных задач найдены оптимальные решения и проведено их сравнение с решениями известных одномерных моделей.

1. Теоретико-игровая модель проведения конкурса

Рассмотрим следующую бескоалиционную игру п лиц с ненулевой суммой. Игроки {1,2,...,п} представляют на конкурс проекты, которые характеризуются векторами {х1,..., хп} из некоторого допустимого множества 5 в пространстве Кт. Арбитр рассматривает поступившие предложения и выбирает один из проектов, используя следующую стохастическую процедуру. 274

В пространстве Кт моделируется случайный вектор а с некоторым распределением вероятностей ^(х1,..., хт), которое известно участникам конкурса. Будем называть вектор а решением арбитра. Победителем становится проект хк, который ближе всего находится к точке а. Победитель конкурса игрок к получает выигрыш Нк (хк), зависящий от параметров проекта. Можно также думать о векторе а, как о наборе решений экспертов, где каждая компонента представляет собой решение отдельного эксперта. При этом, эксперты могут быть независимыми, или принимать коррелированные решения.

Заметим, что решение арбитра является случайным. Для представленного набора проектов {х1,...,хп} множество Б С Кт разобьется на п подмножеств Б1,...,Бп, таких что если а € Б к, то решением арбитра будет выбор проекта с номером к (см. рис. 1). Данное разбиение называется диаграммой Вороного. Его можно построить, используя процедуру Форчуна [8].

Таким образом, выигрыш игрока к в данной игре можно определить как среднее значение его выигрыша при попадании решения арбитра в множество Бк, т. е.

Ищется равновесие по Нэшу в данной игре, т. е. такой профиль х* = (х1,..., хп), для которого

Для упрощения выкладок остановимся на двухмерном случае, когда проект представлен двумя параметрами. Предположим, что игроки представили на конкурс свои проекты хг = (хг, Уг),г = 1, . . . , п, а два независимых арбитра оценивают их. Пусть решение арбитров моделируется случайным вектором на плоскости с плотностью распределения /(х,у) = д(х)д(у).

Рассмотрим для определенности игрока 1. Множество Б1, соответствующее принятию его проекта представляет собой многоугольник со сторонами 1г1,... ,1гк, где ^ это отрезок прямой

(1) Нк (х1,...,хп)

Нк (хк )^(^хі,.. .,<кхп) = Нк (хк )^(Бк ),к = 1 ,...,п.

Нк(х*\\ук) < Нк(х*), Уук, к = 1,...,п.

Рис. 1. Диаграмма Вороного на множестве проектов

линии, проходящий перпендикулярно отрезку [х1 ,х- ] через его середину (см. рис. 1).

Нетрудно найти, что уравнение границы имеет вид

2 \ „,2 ^2 „,2 х

(2) х(х1 - х-) + у(у1 - у-) =

или

х1 + у2 - х2 - у2

з) + у(уі - уз ) =-------------------------2—

2222 ( , Х1 - X- х2 + у2 - Х2 - У,'

У = - (х) =------х +----;---------.

У - У1 - У- 2(у1 - у-)

Пусть х., 3 = 1,..., к абсциссы вершин многоугольника $1. Для удобства перенумеруем их таким образом, чтобы

хг0 ^ х*1 ^ XІ2 ^ ... ^ х*к ^ х*к+1 ,

где Xi0 = -то, х^+1 = то,

Для всех внутренних точек (х, у) £ $1 выполняется условие, что (х) имеет тот же знак, что и (х1), или I. (х)/. (х1) > 0,

3 = 1,...,к.

Тогда меру д($1) можно представить как

Х; . , к+1 .+1

= ^2 / д(х)^ g(y)dy.

-=0 xij к. (х)и. (Х1 )>0-=1,...,к

Аналогичное представление можно получить для любой области Si,i = 1,..., п.

2. Двухмерная модель двух лиц c нормальным распределением

Рассмотрим, например, модель конкурса для двух лиц с нулевой суммой, в которой проекты представлены двумя параметрами. Например, можно представить спор о разделе имущества, которое состоит из движимого х и недвижимого имущества у. Игрок I хочет максимизировать сумму х + у, а второй - минимизировать. Предположим, что для определения победителя в споре арбитр использует процедуру с нормальным распределением /(х у) = 2П ехр{-(х2 + у2)/2}.

Игроки вносят свои предложения (х1, у1) и (х2, у2). Плоскость решений арбитра разобьется на два множества $1 и $2, которые разбиваются прямой, проходящей через середину отрезка, соединяющего точки (х1, у1) и (х2, у2) (см. рис. 2). Уравнение такой прямой

= _ х1 - х2 + х 1 - х2 + у2 - у2 у у1 - у2х 2(у1 - у2) .

Таким образом, выигрыш игрока I в данной игре имеет вид

(3) Н (х1, у1; х2, у2) = (х1 + у^^О = (х1 + у^-

I.!./'х-у)'{-хт^х .1^1^ . 0|'!хг/у.

где I{А}-индикатор множества А

Пользуясь симметрией задачи, можно предположить, что оптимальные стратегии будут предписывать одинаковые значения параметров. Пусть х2 = у2 = -а. Тогда из (3)

Н (хі,уі) =

= (хі+уі) I І /(х,у)1 {-Хі + ах+(Хі2+Уі+ 2а ) ^ 0}^х^у.

уі + а 2(уі + а)

Рис. 2. Конкурс двух проектов на плоскости

Наилучший ответ первого игрока найдем из условия

дН дН я— = 0,«Г = 0. дх1 ду1

Находим

... дН д^($1) л

(4) = ^($1) + (х1 + у1) я = ^($1) + (х1 + у1 )■

£ 1 х - х1 , 1, 2 , х1 + а х2 + у2 - 2а2 2.

. ехр{ — — (х2 + (-::^^х + 1 У1—)2)}dx.

7д 2п у1 + а 2 у1 + а 2(у1 + а)

Приравняем (4) нулю и потребуем, чтобы решение уравнения достигалось в точке х1 = у1 = а. Это приводит к нахождению оптимального значения параметра а. Заметим, что при этом из симметрии следует, что ^($1) = 1/2. Тогда

откуда

/* 1 ,1. і о.^ —х + a 7

Л 2Пехр{—2(х + х),^“йх = 0'

/■^ 1 2 1 (—х + а)—е х ^х = -,

У—оо 2п 2

и наконец получаем оптимальное значение а

а = урк.

Нетрудно проверить, что выполняются достаточные условия достижения максимума функции Н(х, у) в точке (а, а).

Таким образом, оптимальные стратегии игроков в данной игре это предложения (-у7^, - у7^) и (у7^, у7^) соответственно. Отметим отличие от оптимального решения для одномерной арбитражной процедуры [7], где равновесие имеет вид

3. Эффект корреляции на оптимальное решение

Выше мы рассмотрели модель конкурса, где проекты оцениваются по двум критериям, и решения арбитра моделировались независимыми нормальными случайными величинами. Рассмотрим эту же задачу в предположении, что решения арбитра являются зависимыми. Это соответствует случаю, когда по каждому из критериев приглашается отдельный эксперт, и при этом решения экспертов являются коррелированными.

Предположим, что для определения победителя используется процедура с нормальным распределением /(х, у) = 2п/1-г2 ехр{-2(1—2)(х2 + у2 - 2гху)}, здесь г : г < 1 коэффициент корреляции.

Также, как в предыдущей модели воспользуемся симметрией. Предположим, что второй игрок использует стратегию (-а, -а) и будем искать наилучший ответ первого игрока в виде (х1 = у1 = а). Дифференцируя функцию выигрыша (3) с новым распределением, и подставляя значения х1 = у1 = а приходим к условию

Мы видим, что зависимость между решениями арбитра позволяет увеличивать оптимальные значения предложений игроков.

/_

■го

—го

откуда

а = л/ п(1 + г).

4. Модель конкурса для трех лиц с ненулевой суммой

Рассмотрим теперь конкурс проектов трех лиц, в котором игрок I заинтересован максимизировать сумму х + у, игрок II заинтересован напротив минимизировать х, а игрок III минимизировать у. Пусть арбитр представлен нормальным распределением на плоскости f (х, у) = д(х)д(у), где д(х) = ^ ехр{-х2/2}.

Воспользуемся опять симметрией задачи. Оптимальные стратегии должны иметь вид для игрока I: (с, с), для игрока II: (-а, 0), для игрока III : (0, -а).

Чтобы найти значения параметров а и с, поступим следующим образом. Предположим, что игроки II и III представили на конкурс проекты соответственно (-а, 0) и (0, -а). Пусть игрок

I, представил на конкурс проект (х1,у1), где х1,у1 ^ 0. Тогда плоскость проектов разобьется на три множества (см. рис. 3), разделяемые прямыми у = х и

х1 + а х2 + у2 - а2

12 : у =---------х + 1 1-------

у1 2у1

и

х1 х21 + у12 - а2

13 : у =----------------х +-;--г—.

у1 + а 2(у 1 + а)

Все три прямые пересекаются в одной точке х = у = хо, где

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

х21 + у12 - а2

хо -

2(жі + уі + а)'

Нас в первую очередь интересует область £і с границами и І3. Запишем выигрыш первого игрока

(5) #і(жі,ш) = (жі + Уі)-

/Хо гго гго гго

д(ж)^ж / д(у)^у + д(ж)гіж / д(у)^у],

-го ^и о Х0 ОУ

Рис. 3. Конкурс трех проектов на плоскости

где

жі + а ж? + у? — а2

и =-----ж +--------,

У і 2уі

222 ж1 жі + у? — а2

V =-----ж + 1 1

У1 + а 2(У1 + а)

Упрощая (5), приходим к выражению

(6) Яі(жі,уі)=(жі+уі)

/Х0 /*ГО

д(ж)С(и)йж — д(ж)С^)^ж

-ГО <УХ0

где С(х) функция нормального распределения. Максимум функции (6) достигается при XI = У1 = с и является функцией от а.

Теперь зафиксируем стратегию первого игрока (с, с), с > 0 и предположим, что игрок III выбрал стратегию (0, —Ь). Пусть игрок II выбрал стратегию (—а, 0) и будем искать его наилучший ответ на стратегии игроков I и III. Плоскость проектов разобьется на три области (см. рис. 4). Нас интересуют границы области £2:

с + а 2 с2 — а2

11 : У =--------х + —----------

с 2с

и

а Ь2 — а2

1з : У = т х —

Ь 2Ь

Рис. 4. Конкурс трех проектов на плоскости

Точка пересечения областей имеет абсциссу ' 2с2 — а2 а2 — Ь2 \ 1

г =

2с 2Ь ) а/Ь + 1 + а/с’

тогда выигрыш игрока II равен

(7) Я?(а) = а

д(ж)^ж / д(у)^у

/VI

= а[ / (^^2) — С^)) /(ж)^ж

«/ —ОО

где

а Ь2 — а2

"1 = Ьх —-—Г,

с + а 2с2 — а2

^2 =---------X +------ ------.

с 2с

Из соображений симметрии минимум выражения (7) должен достигаться при а = Ь. Из этих двух задач оптимизации можно найти оптимальные значения параметров а и с. Численное моделирование приводит к следующему набору приближенных значений для оптимальных параметров

а = Ь и 1,7148,

с и 1,3736.

При этом, выигрыши игроков в равновесии

Н1 и 0,920, Я2 = Яз и 0,570, и вероятности попадания в соответствующие области равны

^(51) и 0,335, ^(52) = М^з) и 0,332.

5. Проведение конкурса с участием арбитражного комитета

Предположим теперь, что решение о принятии проекта принимает не один арбитр, а несколько. При этом, каждый арбитр руководствуется тем же самым распределением вероятностей. Рассмотрим арбитражный комитет, состоящий из 2т — 1 членов. Чтобы проект был принят, необходимо чтобы за него проголосовали больше половины членов арбитражного комитета. Тогда выигрыш игрока г определяется следующим образом

Яі(жг) = Л,г(ж>

где ^ = ^(£г),г = 1,...,П.

Например, если число членов арбитражного комитета равно трем, то выигрыш игрока г определяется следующим образом:

Яг = Л-г(хг) (3^2(1—^г)+^3) = Л-г(хг) (3^2 — 2^3) , г = 1,... ,п.

Равновесие в данном случае находится таким же образом как и в случае одного арбитра. Рассмотрим, например, модель конкурса с двумя участниками, рассмотренную в разделе 3. Функция выигрыша примет вид

т— 1

Я(х1,У1; х2,У2) = (х1 + У1) £ С2т+—к1^т+кДт—1—к,

к=0

где ^ = ^(51), ~р, = 1 — ^. Предполагая, что второй игрок использует стратегию х2 = У2 = —а, найдем наилучший ответ первого игрока. Для этого вычислим

дН т—1

(8) = Е С^—>т+кдт—1—к + (х1 + У1)

Е С2т+—к1^т+к—1дт—2—к ((т+Л)^ — (т — 1 — ВД д^д(^ = 0. к=0 1 Из симметрии задачи следует, что в равновесии ^ = ^(51) = 1/2 и х1 = у1 = а. Подставив в (8), получим

1+2„ (2 )2т—2 Е +1) *^ =

' ' к=0 1

1 (1)2т—2 с 1 1

= 2 + тС2т—Л ^) JR2пехР{—2(х2+х2)}(х — а)йх = 0,

откуда находим оптимальное значение а

22т—2

а = — 7^

тС2т—1

При больших т согласно локальной предельной теореме

(-1 \ 2т — 2 / 1 \ 2т—2 1

2) =(2т — 1)Ст——12^2) и 2^2т72^.

Тогда при т — ж

Видим, что увеличение членов арбитражного комитета приводит к уменьшению разброса оптимальных значений предложений игроков.

6. Заключение

В работе предложена новая теоретико-игровая модель проведения конкурсов с использованием арбитражных процедур. Эта схема легко может быть реализована в компьютерной среде.

Для решения какой-то практической задачи (например, строительство дома) объявляется конкурс. В начале конкурса создается конкурсная комиссия. Эксперты (арбитры) оценивают данную задачу по каждому из параметров. Формируется распределение вероятностей, соответствующее мнению экспертов.

После этого игроки вносят свои предложения на конкурс. Комиссия сразу же может отбросить проекты, значения которых доминируются другими проектами. После этого наступает фаза выбора победителя. Решения арбитра или нескольких арбитров моделируются случайными величинами в пространстве проектов. Ближайший к решению арбитра проект объявляется победителем. В случае арбитражного комитета проводится голосование.

Литература

1. МАЗАЛОВ В.В., МЕНЧЕР А.Э., ТОКАРЕВА Ю.С. О равновесии в модели переговоров с арбитром // Известия РАН. Теория и системы управления. - 2009. - № 5. - C. 77-83.

2. МАЗАЛОВ В.В. Математическая теория игр и приложения. - Санкт-Петербург-Москва-Краснодар: Лань, 2009. -446 с.

3. DE BERG M., VAN KREVELD M., OVERMARS M., SCHWARZKOPF O. Computational Geometry. - Springer, 2000.

4. FARBER H. An analysis of final-offer arbitration // Journal of conflict resolution. - 1980. - Vol. 24. - P. 683-705.

5. GIBBONS R. A Primer in Game Theory. - Prentice Hall, 1992.

6. KILGOUR M. Game-theoretic properties of final-offer arbitration // Group Decision and Negot. - 1994. - Vol. 3. -P. 285-301.

7. MAZALOV V., MENTCHER A. AND TOKAREVA J. On a discrete arbitration procedure // Scientiae Mathematicae Japonicae. - 2006. - Vol. 63(3). - P. 325-330.

8. MAZALOV V., TOKAREVA J. Bargaining model on the plane // Algorithmic and computational theory in algebra and languages. - 2008. - P. 42-49.

GAME-THEORETIC MODELS OF TENDER DESIGN

Vladimir V. Mazalov, Institute of Applied Mathematical Research Karelian Research Center of Russian Academy of Sciences, Doctor of Science, professor ([email protected]).

Julia S. Tokareva, Zabaikalsky State Humanitarian Pedagogical University named after N.Tchernishevsky, Cand.Sc. ([email protected]).

Abstract: We consider a n-person non-zero-sum game related

to design of a tender. Players present some projects, which are characterized by a vector of parameters. Arbitrator or some juri chooses one of the projects using a stochastic procedure with a certain distribution function, which is known to players. The winner receives a payoff, which depends on the parameters of the project. The game-theoretic model of a tender is presented and equilibrium in two and three-dimensional models is derived.

Keywords: game-theoretic model of tender, n-person game, Voronoi diagram, arbitration procedure, Nash equilibrium.

Статья представлена к публикации членом редакционной коллегии М. В. Губко

Теоретико-игровые модели проведения конкурсов Текст научной статьи по специальности «Математика»

Похожие темы научных работ по математике , автор научной работы — Мазалов Владимир Викторович, Токарева Юлия Сергеевна

Текст научной работы на тему «Теоретико-игровые модели проведения конкурсов»