Модель наилучшего выбора с неполной информацией

Коновальчикова Елена Николаевна

УДК 519.83 ББК 22.18

МОДЕЛЬ НАИЛУЧШЕГО ВЫБОРА С НЕПОЛНОЙ ИНФОРМАЦИЕЙ1

Коновальчикова Е. Н.2

(Забайкальский государственный университет, г. Чита)

Представлено два подхода к построению теоретико-игровой модели двух лиц наилучшего выбора с неполной информацией: c приоритетом первого игрока и равноправными игроками. Рассматривается последовательность независимых одинаково распределенных случайных величин (хг,уг), г = 1 ...,п, которые представляют собой качество поступающих объектов. При этом первая компонента известна игрокам, а вторая скрыта. Игроки делают выбор объекта, основываясь на известной характеристике объекта. Выигрывает тот из игроков, у которого суммарное значение компонент качества больше, чем у другого. Найдены оптимальные стратегии в пороговом виде и сделано сравнение пороговых стратегий в обоих подходах.

Ключевые слова: игра наилучшего выбора, неполная информация, пороговые стратегии.

Введение

В данной работе рассматривается теоретико-игровая модель наилучшего выбора с неполной информацией. Впервые задача наилучшего выбора, известная как «задача о секретаре», была решена в работе [1] в 1961 году. По-другому эту задачу называют задачей выбора наилучшего объекта. В минимаксном ва-

1 Автор признателен проф. В.В. Мазалову за постановку задачи и полезное обсуждение результатов.

2 Елена Николаевна Коновальчикова, старший преподаватель ([email protected]).

рианте задача наилучшего выбора впервые была исследована в работе [10].

Теоретико-игровым моделям наилучшего выбора были посвящены работы [8,9, 11, 15,16]. При этом можно выделить два подхода к моделированию игровых задач наилучшего выбора. В первом подходе игроки наблюдают за одной и той же последовательностью предложений х\, Х2,..., хп, из которой они хотят выбрать наибольшее из предложений либо предложение со значением большим, чем у других игроков. Во втором подходе у каждого из игроков собственная последовательность наблюдений. Цель та же самая: выбрать объект с большим значением, чем у других игроков (см. обзор в книге [2]).

Задачи наилучшего выбора также характеризуются степенью информированности о качествах наблюдаемых объектов. Если в классической задаче о секретаре объекты были линейно упорядочены, но само качество не было определено, то в моделях с полной информацией качество объектов рассматривается как случайная величина с известным законом распределения вероятностей [10,13]. Кроме этого, информация в задачах наилучшего выбора может быть частичной, когда сам закон распределения случайных величин известен, но неизвестны его параметры [6], а также информация может быть неполной, когда точное значение случайной величины неизвестно [7,17].

В вышеприведенных постановках объекты (или секретари) были всегда согласны с принимающей стороной. Возможны и другие постановки. Например, задачи о секретаре с возможностью отказа от претендента были рассмотрены в [17]. Кроме того, сами претенденты могут выбирать из предложений. Такие задачи называются задачами взаимного выбора [5,12,14].

В данной работе рассматривается игра двух лиц, которые заинтересованы выбрать объект лучше, чем у противника, при этом информация об объекте раскрывается не полностью. Таким образом, остается риск принять не самого лучшего кандидата. Сделано сравнение решений для двух сценариев: когда один из игроков имеет приоритет и когда оба игрока имеют равные права.

Управление большими системами. Выпуск 54 1. Постановка задачи

Существует ряд задач наилучшего выбора, в которых информация об объекте является неполной. В данной работе мы считаем, что часть информации игрокам поступает в явном виде, а часть информации скрыта от игроков. Например, в задачах покупки недвижимости цена за объект известна, а затраты на эксплуатацию нет. Подобные задачи возникают при приеме на работу сотрудника, который обладает определенными профессиональными навыками в одной сфере и неопределенными в другой. При этом иерархия игроков может рассматриваться как их репутация либо служебная субординация. Кроме того, задачи выбора с неполной информацией возникают при проведении конкурсов. Например, данная задача возникает в популярном телевизионном шоу «Голос», в котором несколько экспертов выбирают участника для вокального соперничества, основываясь только на его вокальных данных.

В данной работе мы рассмотрим два подхода к построению теоретико-игровой модели наилучшего выбора с неполной информацией — игру с приоритетом первого игрока и игру с равноправными игроками. Первый подход соответствует случаю, когда есть иерархия у игроков, делающих выбор (начальник, заместитель и т.д.), либо игроки различаются своей репутацией, и конкурсанты при выборе отдают свое предпочтение одному из них. Вторая модель соответствует случаю, когда игроки, делающие выбор, имеют одинаковый социальный статус и одинаковую репутацию. Рассмотрим вначале многошаговую игру Гп с приоритетом первого игрока. Предположим, что экспертная комиссия состоит из двух экспертов I и II, которые являются игроками в данной игре. Эксперты просматривают последовательность конкурсантов, качество которых определяется двумя параметрами х и у, первый из которых соответствует профессиональным навыкам претендента в одной сфере, а второй — профессиональным навыкам в другой. Например, в качестве параметра х можно рассматривать знание иностранного языка, а в качестве парамет-

ра у — умение пользоваться компьютером. При этом каждый из экспертов заинтересован максимизировать сумму параметров, характеризующих качество выбранного конкурсанта.

Пусть решение о принятии или отказе вначале делает первый эксперт, а в случае отказа — ход переходит ко второму, и каждый из экспертов может выбрать только одного конкурсанта. Параметры качества конкурсантов представляют собой последовательность независимых равномерно распределенных на множестве [0,1] х [0,1] случайных величин (хг, уг), г = 1..., п.

На первом шаге первый эксперт наблюдает параметр х1 из набора данных (х1,у1) первого конкурсанта. Он может выбрать конкурсанта и выйти из игры. В этом случае второму эксперту становится известно значение параметра у1 и вместе с ним значение Ш1 = Х1 + уь Второй эксперт выбирает из оставшихся какого-то конкурсанта (хг,уг) и объявляется победителем, если хг + уг > х1 + у1. Иначе победителем становится первый эксперт. Если первый эксперт отклонил первого конкурсанта, решение принимает второй эксперт. Он может выбрать этого конкурсанта и выйти из игры. Тогда первому эксперту становится известно значение у1, и его целью является выбрать из оставшихся конкурсантов такого участника г, г = 2,..., п, у которого хг + уг > х1 + у1. Если же второй эксперт также отклоняет первого претендента, то игра переходит на второй шаг к игре Гп-1 и описанная процедура повторяется. В данной игре победителем является тот из экспертов, у которого сумма параметров качества выбранного конкурсанта больше, чем у другого. Описанная выше модель является моделью наилучшего выбора с приоритетом первого игрока.

Также мы будем рассматривать модель наилучшего выбора с равноправными игроками. Пусть Т'п — многошаговая игра с равноправными игроками. Аналогично предыдущей модели члены экспертной комиссии, состоящей из двух экспертов I и II, являются игроками. Целью экспертов является набор команды наилучших конкурсантов. Пусть в команду каждого эксперта требуется один участник конкурса. Так же, как и выше, каче-

ство конкурсантов состоит из двух параметров х и у, которые представляют собой последовательность независимых равномерно распределенных на множества [0,1] х [0,1] случайных величин

(Хг,Уг ),% = 1 ...,П.

Допустим, что эксперты одновременно просматривают последовательность конкурсантов и делают предложение независимо друг от друга, а конкурсанты выбирают экспертов с одинаковой вероятностью. На первом шаге оба эксперта наблюдают параметр Х1 из набора (х1 ,у1) первого конкурсанта и решают, выбирать его или нет. Если первого конкурсанта выбрал только один из экспертов, то этот эксперт выходит из игры. В этом случае скрытый параметр качества у1 становится известным обоим игрокам. Если оба эксперта выбрали конкурсанта, то конкурсант с вероятностью 1/2 выбирает каждого из экспертов. Оставшийся в игре эксперт стремится выбрать такого конкурсанта г,г = 2,..., п, у которого Хi + yi > х1 + у1. В случае, когда оба эксперта отказали первому конкурсанту, игра переходит на следующий шаг и описанная процедура повторяется. В данной игре побеждает тот из экспертов, у которого сумма параметров качества выбранного конкурсанта больше, чем у другого.

Будем искать оптимальные стратегии в классе пороговых стратегий вида: если параметр качества данного конкурсанта xi больше некоторого значения щ, эксперт принимает конкурсанта, иначе отказывает ему. Оптимальность пороговых стратегий следует из общей теории оптимальной остановки [3,4]. Далее находятся оптимальные стратегии игроков в моделях наилучшего выбора с приоритетом первого игрока и с равноправными игроками для числа претендентов п = 2 и п = 3.

2. Игры с приоритетом первого игрока

2.1. ИГРА Г 2

Предположим, что п = 2, т.е. в конкурсе на должность участвуют два претендента. На первом шаге первый эксперт получает наблюдение х1. Его стратегию выбора опишем с помощью порогового значения и. Если Х1 ^ и, то он выбирает первого конкур-118

санта и выходит из игры. В противном случае данного конкурсанта вынужден выбрать второй эксперт, и тогда первый эксперт выбирает второго конкурсанта. Заметим, что значение игры Г2 зависит от пороговой стратегии игрока, имеющего преимущество при выборе, в данном случае от пороговой стратегии первого эксперта.

Оптимальное значение и можно найти из следующих соображений. Пусть Ж1 = и - наблюдаемое значение на первом шаге, при котором выигрыш первого эксперта в случае выбора конкурсанта равен выигрышу в случае отказа от него. Если первый эксперт выбирает данного конкурсанта, то его выигрыш равен

На(и) = 1 ■ Р{и + У1 ^ Х2 + У2> — 1 ' Р{Х2 + У2 ^ и + У1} =

= 2 ■ Р{и + У1 ^ Х2 + У2}- 1,

а в случае отказа от конкурсанта — то же самое значение, но с обратным знаком, т.е. Нг(и) = — На(и).

Оптимальное значение и1 находится из уравнения На(и) = Нг(и), или

2 ■ Р{и + У1 ^ Х2 + У2} — 1 = 0, которое можно представить в виде

1-й 1

/(У1±и>!^ + / (1 — е-М) = 1.

0 1-й

Отсюда следует, что оптимальное значение и1 = 1/2 и выигрыш первого эксперта равен

1

2

И = J [1 ■ Р {Ж1 + У1 < Х2 + У2} — 1 ■ Р {Х1 + У1 ^ Х2 + У2 }] + 0

1

+ У [1 ■ Р{Х1 + У1 ^ Х2 + У2} — 1 ■ Р{Х1 + У1 < Х2 + У2}] ¿Х =

1 2

= -2 •

1 — Х1

(У1 + Х1)2

¿У1 +

+ , (1 - (2 - + *!»' | ^

1—Х1

2

^Ж1 +

+2

1 I. о

2

1—Х1

(У1 + Х1)2

¿У1 +

+

1 - Р-^»!, Лш

и 0,354.

1—Х1

Это и есть значение игры Г2.

Таким образом, при выборе из двух конкурсантов игрок, имеющий преимущество, должен устанавливать требования к конкурсантам среднего уровня. Второй же игрок никаких требований к конкурсантам не предъявляет.

2.2. ИГРА Г3

Пусть в конкурсе на должность участвуют три претендента, т.е. п = 3. На первом шаге первый эксперт наблюдает значение жь Он может принять этого претендента или отказать ему. Опять предположим, что его решение основывается на пороговом значении ^2: если Ж1 ^ И2, он принимает конкурсанта, иначе отказывает ему. Аналогично действует второй эксперт, устанавливая порог выбора конкурсантов -и2. Предположим, что -и2 < и2, поскольку первый эксперт имеет преимущество в выборе.

Допустим, что наблюдаемое значение первого конкурсанта Ж1 ^ г>2. В этом случае первый эксперт отвергает конкурсанта, а второй решает, выбрать первого конкурсанта или нет. Если второй эксперт отказывает первому конкурсанту, то игра Г3 переходит к игре Г2, значение которой уже известно и равно Яь

2

1

2

1

Оптимальное значение г>2 можно найти из условия равенства выигрыша второго эксперта при выборе и отказе первому конкурсанту. Пусть Ж1 = г2 и второй эксперт выбирает первого конкурсанта. Тогда у первого эксперта появляется возможность выбора из двух оставшихся конкурсантов, при этом становится известно значение т1 = г2 + у1. В этом случае целью первого эксперта становится получение конкурсанта, у которого Хг + уг ^ т1, поэтому на втором шаге первый эксперт устанавливает новый порог з = з(ш1): если х2 ^ з, то он принимает данного конкурсанта, в противном случае отказывает ему. Найдем оптимальное значение порога з.

Допустим, что т1 < 1, тогда возможны два варианта установления порогового значения: з ^ Ш1 и з > шь

Выигрыш первого эксперта, если он установит порог з < ш1, имееет вид

8 1 Н(1) = J(2 ■ Р{Х3 + уз ^ Ш1}- 1) ^Х2 + J(2 ■ Р{Х2 + У2 ^ Ш1}-

8 Ш1 1

-1) ¿Х2=1(1 — ш2) ¿Х2 +/и - 2 ■ <т1 -Х2) +/ ^=

0 8 т1

= 1 — — з2 + зш1 (2 — ш1).

Максимум функции выигрыша первого игрока при фиксиро-

2

шт

ванном значении Ш1 достигается в точке з = Ш1--— и равен

3 ш1 1 — ш? + —1. 1 4

Если же первый эксперт устанавливает порог выбора з = Ш1, то его выигрыш равен

т.1

н(1) = у (2 ■ Р{Хз + Уз ^ Ш1} — 1) ¿Х2+

1

+ У (2 ■ Р{Х2 + У2 ^ Ш1} - 1) =

т1

т.1

= У (1 — т2) + У 1 ■ ¿ж2 = 1 — ш^.

Ш1

Сравнивая значения выигрышей первого игрока при исполь-

й б Ш1 зовании им пороговых стратегий выбора в = Ш1 и § = Ш1--—,

получаем, что

4

3 3 Ш]

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1 — ш1 < 1 — ш1 + —1. 1 1 4

Таким образом, оптимальный порог выбора при в ^ Ш1 име-

2

шт

ет вид в = ш1--—.

Теперь пусть первый эксперт устанавливает порог в > Ш1, тогда он получает выигрыш вида

Н(1) = J(2 ■ Р{хз + У3 ^ Ш1} — 1) ^2+

1

+ У (2 ■ Р{х2 + у2 ^ ш1} — 1) = (1 — ш1)в + 1 — в = 1 — вш2.

Но выигрыш первого эксперта, полученный им при использовании порога в > Ш1, оказался меньше, чем выигрыш при ис-

2

Ш!

пользовании пороговых стратегий в = Ш1 и в = Ш1--—, т.е.

2 3 3 Ш)

1 — вш2 < 1 — ш3 < 1 — Ш1 + .

Следовательно, оптимальный порог выбора конкурсанта

ш1

ым экспертом при ш1 < 1 равен в = ш1--—.

Пусть Ш1 ^ 1. Заметим, что пороговое значение в ^ 1.

1

Допустим, что на втором шаге первый эксперт получает наблюдение Х2 = в. Оптимальное значение порога в найдем из условия равенства выигрышей при выборе и отказе от конкурсанта. Если первый эксперт отказывает второму конкурсанту, то он выбирает третьего конкурсанта и получает выигрыш, равный

Н^(в) = 1 ■ Р{Х3 + У3 ^ Ш1} — 1 ■ Р{Х3 + У3 < Ш1} =

= (2 — Ш1)2 — 1.

Если он принимает второго конкурсанта, то получает выигрыш, равный

нга)(в) = 1 ■ Р{в + У2 ^ Ш1} — 1 ■ Р{в + У2 < Ш1} =

{1 — 2 ■ (ш1 — в), в ^ ш1 — 1, —1, в < ш1 — 1.

При в ^ Ш1 — 1 выигрыш нГа)(в) ^ —1, поэтому оптимальный порог является решением уравнения

(2 — Ш1 )2 — 1 = 1 — 2 ■ (Ш1 — в).

2

Отсюда находим пороговое значение в = 1 — ш1 +——.

Следовательно, оптимальный порог для выбора в имеет вид:

ш1

в = ш1--—, при Ш1 < 1

и

2

_ ш1

в = 1 — ш1 + —, при Ш1 ^ 1.

Таким образом, выигрыш второго эксперта в случае выбора им первого конкурсанта с параметром х = г>2 имеет вид

1-^2 Г 8

н(//)(г2) = I У [1 — 2 ■ Р{х3 + У3 ^ Ш1}] ^Х2+ 0 |_0

1

+ [1 - 2 ■ Р{Х2 + У2 ^ Ш1}| +

8

1 Г 8

+

1-^2 1.0 1

8

При отказе же игра переходит в стадию Г2, и выигрыш второго эксперта равен —Н1, таким образом, решая уравнение = — Н1, получаем оптимальное значение для порога ■и2 ^ 0,402.

Теперь перейдем к нахождению оптимального порога и2 для первого эксперта на первом шаге. При выборе конкурсанта с качеством Ж1 = и>2 выигрыш первого эксперта вычисляется аналогично формуле (1): Н7)(«2) = Я11 ^ (^2).

При отказе второй эксперт обязательно сделает предложение данному конкурсанту (поскольку и2 больше порога -и2), поэтому выигрышем первого эксперта будет — Н^11 ^(и2). Таким образом, оптимальное значения порога и2 находится из уравнения

1-«2 Г 8

оо 1

+ / [2 ■ Р{Ж2 + У2 ^ т-1} — 1] ^Ж2

8

1 Г 8

1- 2 о

1

+ У [2 ■ Р {Х2 + У2 ^ Ш1} 1]

= 0,

решая которое получаем и2 ^ 0,637.

Выигрыш первого эксперта находится по следующей формуле:

Ь2 «2 Г 1—Х1 Г 8

н(1) =у Н1 + 1 У У [2 ■ Р{Х3 + У3 ^ Ш1} — 1] ^2+

0 ^2 0 ш

1

+ У [2 ■ Р{Х2 + У2 ^ Ш1} 1]

¿У1 +

1 —Х1

1 8

+ I У [2 ■ Р {Х3 + У3 ^ Ш1} 1] ^Ж2+

0

1

^ [2 ■ Р{Х2 + У2 ^ Ш1} 1]

1 Г 1—х1 Г 8

+ / / / [1 — 2 ' Р{Х3 + У3 ^ Ш1}] ^Ж2+

«2 0 |_0 1

^ [1 — 2 ■ Р{Х2 + У2 ^ Ш1}]

¿У1 +

1—х1

1 8

+ У У [1 — 2 ■ Р{Х3 + У3 ^ Ш1}] ^Ж2+

1

+ У [1 — 2 ■ Р{Х2 + У2 ^ Ш1}]

^ж1 = Н1 ■ г2+

«2 Г 1—Х1 Ш1

+ I У (1 - Ш?) ■ 1 ^ У [2 ■ (1 - (Ш1 - Х2)) - 1] +

^2

Ш1

1 1 + у1 ■ ЙЖ2 + I [((2 - Ш1)2 - 1) ■ 1+

1 —Х1

1

^ У (2 ■ (1 - (Ш1 - Х2)) - 1)

1 Г 1—Х1 Ш1

+ У У (ш2 - 1) ■ 1 ^(1 - 2 ■ (1 - (Ш1 - Х2))) ^Ж2 +

«2 1-0

Ш1

+ У(-1) ■ ^2 ЙУ1 + У [(1 - (2 - Ш1)2) ■ 1+

1 —Х1

1

+ У(1 - 2 ■ (1 - (Ш1 - Х2)))

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

.

Подставляя уже известные пороговые значения первого и второго эксперта, получаем выигрыш Н(1) ~ 0,237. Это и есть значение игры Г3.

Заметим, что при выборе из трех конкурсантов требования игроков к ним увеличиваются. Так, при просмотре первого конкурсанта игрок с приоритетом увеличивает порог выбора до и>2 = 0,637. Аналогично игрок без приоритета увеличивает требования к первому конкурсанту, устанавливая порог выбора ^2 = 0,402.

3. Игры с равноправными игроками

3.1. ИГРА Г2.

Пусть в игре участвуют два конкурсанта, т.е. п = 2. На первом шаге эксперты одновременно наблюдают параметр х1 первого конкурсанта. Стратегию выбора обоих экспертов опишем с 126

1

помощью пороговых значении и и V для первого и второго экспертов соответственно. Если Ж1 ^ и, то первый эксперт выбирает первого конкурсанта и выходит из игры. Аналогично действует и второй эксперт, т.е. при Ж1 ^ V он выбирает конкурсанта и выходит из игры. Предположим, что и ^ V.

Тогда конкурсанта с параметром качества ж1 < V отвергнут оба эксперта, с параметром качества V ^ ж1 < и примет только второй экперт, если же ж1 ^ и, предложение конкурсанту сделают оба эксперта, после чего конкурсант с одинаковой вероятностью выбирает одного из них.

Таким образом, выигрыш первого эксперта равен

Н(и, V) = У 0 ■ ^Ж1 + J [Р{Ж2 + У2 ^ Ж1 + У1}-

1

-Р{Ж2 + У2 < Ж1 + Ух}] ^Ж1 + У

2 ' [Р{Ж1 + У1 ^ Ж2 + У2}-

-Р{Ж1 + У1 < Ж2 + У2}] + 1 ' [Р{Ж1 + У1 ^ Ж2 + У2}--Р{Ж1 + У1 > Ж2 + У2}]] ¿Ж1 =

1—Х1

2 ■ I 1 - +

+

1—Х1

2 " - (Ж2+ У1))2 - 1] ^

^Ж1 =

2 2 2ж 1

--Ж1 - Ж1 +--1

3 1 1 3

^Ж1 =

и4 и3 и2 2и V4 V3 V2 2v

"6 - У - У + У - У + У + У - У'

V

и

1

и

Функция Н(и, V) является вогнутой по и и выпуклой по V. Это гарантирует существование и единственность ситуации равновесия в данной игре. Из симметрии задачи следует, что оптимальные пороги обоих экспертов и* и V* равны и находятся из уравнения

2и3 2 2

--и - и + - = 0,

3 3 '

решение которого имеет вид и* = V* = ^.

Таким образом, оба эксперта при выборе конкурсантов используют одинаковую стратегию с порогом 1/2. Следовательно, отбор пройдет тот конкурсант, оцениваемый параметр качества которого будет выше среднего.

3.2. ИГРА Г'3.

Рассмотрим игру, в которой участвуют три конкурсанта, т.е. п = 3. Аналогично предыдущему случаю стратегии выбора обоих экспертов опишем с помощью пороговых значений.

На первом шаге оба эксперта одновременно наблюдают параметр Х1 первого конкурсанта. Допустим, что первый эксперт устанавливает порог выбора и2: если х1 ^ и2, то он выбирает первого конкурсанта и выходит из игры. Аналогично второй эксперт устанавливает порог выбора v2. Предположим, что и2 ^ v2.

В процессе выбора возможны следующие ситуации. Конкурсант с параметром качества Х1 не удовлетворяет требованиям ни одного из экспертов, т.е. х1 < v2. В этом случае игра Г'3 переходит к стадии Г^, в которой оба эксперта устанавливают равные

пороги выбора и1 = V! = ^ и получают выигрыш равный нулю.

Возможна ситуация, когда первого конкурсанта выбирает только второй эксперт, т.е. V2 ^ Х1 < и2. В этом случае первый эксперт получает возможность выбора из двух оставшихся конкурсантов при известном значении Х1 + у1 = Ш1. Целью первого эксперта становится выбор конкурсанта г, удовлетворяющего условию хг + у > ш1 . Для этого он устанавливает новый порог

выбора в = в(ш1), имеющий вид

2

в = т1--— при т1 < 1

_ шт

в = 1 - ш1 + при ш1 ^ 1.

Заметим, что нахождение данного порога аналогично случаю игры с приоритетом первого игрока Гз, рассмотренной выше. Таким образом, выигрыш первого эксперта будет иметь вид

V2 и,2 Г 1 —Х1 Г 8

Н(и2^) = у0- У У [2 ■ Р{Жз + Уз ^ Ш1} 1] ^Ж2 +

V2

1

+ У [2 ■ Р{Ж2 + У2 ^ Ш1} 1] ^Ж2

¿У1 +

1—Х1

1 8

+ У У [2 ■ Р {Жз + Уз ^ Ш1} 1] ^Ж2+

1

+ У [2 ■ Р{Ж2 + У2 ^ Ш1} - 1] ^Ж2

¿У1

^ж1 +10 ■ ^ж1 =

и2

и2 Г 1—Х1 Г т.1

У У (1 - ш1) ■ в + У [1 - 2 ■ (Ш1 - Ж2)] ЙЖ2 +

V2 0 1

+ У 1 ■ ^Ж2

Ш1

1

1 1

У 1 ■ ¿Ж2 ¿У1 + I [((2 - Ш1)2 - 1) ■ в+

1—Х1

+ У [1 - 2 ■ (Ш1 - Ж2)] ¿Ж2

¿У1

^Ж1 =

и

1

и

«2

Ь2

и

Ж1 Х1 о 3x1 4 Т + "6 - х2 - 3x1 + 5

^Ж1 =

= +__2__2 _

20 24 3

3и2

4и2

8 + 5

__2__2 +__2 +

20 24 3

3^2

8

4^2

Т"'

Функция Н(и2 ,^2) является вогнутой по У>2 и выпуклой по ^2, поэтому в данной игре существует единственная ситуация равновесия. Из симметрии задачи следует, что оптимальные пороги и2 и г>2 обоих экспертов равны и находятся из уравнения

■о и2 2 3и2 4

— + — - и2--2 + - = 0.

4 6 2 4 5

Решая данное уравнение, получаем оптимальные пороги для обоих игроков, которые имеют вид и2 = г| ~ 0,637.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Таким образом, в игре с равноправными игроками Г1 оптимальная стратегия обоих экспертов при выборе на первом шаге пороги имеет вид и2 = г2 ^ 0,637, а на втором шаге она равна ■1 = г1 = 0,5. Отметим, что с увеличением числа конкурсантов требования к ним повышаются.

Заключение

При исследовании теоретико-игровых моделей наилучшего выбора, в которых часть информации об объекте представлена в явном виде, а часть скрыта от игроков, были найдены оптимальные пороговые стратегии игроков при выборе из двух и трех претендентов. Рассмотрены две модели наилучшего выбора: модель с приоритетом первого игрока и модель с равноправными игроками, и проведено сравнение оптимальных стратегий игроков в обеих моделях. Было выявлено, что с увеличением числа конкурсантов требования игроков к ним повышаются.

В первой модели от стратегии игрока, имеющего преимущество в выборе, зависит значение игры и стратегия второго игрока, поэтому требования к конкурсанту у второго игрока ниже, чем у

первого. Оптимальные пороговые стратегии у равноправных игроков одинаковы и совпадают с пороговыми стратегиями игрока с приоритетом в игре Г2 и Г3.

Литература

1. ДЫНКИН Е.Б. Оптимальный выбор момента остановки марковского процесса // Докл. АН СССР. - 1963. - Т. 150, №2. - С. 238-240.

2. МАЗАЛОВ В.В. Математическая теория игр и приложения. - Санкт-Петербург-Москва-Краснодар: Изд-во «Лань», 2010. - 446 с.

3. МАЗАЛОВ В.В., ВИННИЧЕНКО С.В. Моменты остановки и управляемые случайные блуждания. - Новосибирск: Наука, 1992. - 104 с.

4. РОББИНС Г., СИГМУНД Д., ЧАО И. Теория оптимальных правил остановки. - M: Наука, 1977. - 168 с.

5. ALPERN S., REYNIERS D. Strategic mating common preferences // J. Theoretical Biology. - 2005. - Vol. 237. -P. 337-354.

6. ANO K. On a partial information multiple selection problem // Games Theory and Application. - 1998. - Vol. 4. -P. 1-10.

7. ENNS E. Selecting the maximum of a sequence with imperfect information // J. American Statistical Association. - 1975. -Vol. 70, №351. - P. 640-643.

8. ENNS E.S., FERENSTEIN E.Z. The horse game // J. Oper. Res. Soc. Japan. - 1985. - Vol. 28. - P. 51-62.

9. FUSHIMI M. The secretary problem in a competitive situation // J. Oper. Res. Soc. Japan. - 1981. - Vol. 24. -P. 350-358.

10. GILBERT J., MOSTELLER F. Recognizing the maximum of a sequence // J. Amer. Statist. Ass. - 1966. - Vol. 61. - P. 35-73.

11. KURANO M., NAKAGAMI J., YASUDA M. Multi-variate stopping problem with a majority rule // J. Oper. Res. Soc. Japan. - 1980. - Vol. 23. - P. 205-223.

12. MCNAMARA J., COLLINS E. The job search problem as an employer-candidate game // J. Oper. Res. Soc. Japan. -1990. - Vol. 28. - P. 815-827.

13. MAZALOV V.V. Game related to optimal stopping of two sequences of independent random variables having different distributions // Mathematica Japonica. - 1996. - Vol. 43, №1. - P. 121-128.

14. MAZALOV V.V., FALKO A.A. Nash equilibrium in two-sided mate choice problem // International Game Theory Review. - 2008. - Vol. 10, № 4. - P. 421-435.

15. SAKAGUCHI M. Non-zero-sum games related to the secretary problem // J. Oper. Res. Soc. Japan. -- 1980. — Vol. 23, №3. — P. 287-293.

16. SAKAGUCHI M. Non-zero-sum best-choce games where two stops are required // Scientiae Mathematicae Japonicae. — 2003. — Vol. 58, №1. — P. 137-176.

17. SMITH M. A secretary problem with uncertain employment // J. Appl. Probab. -- 1975. — Vol. 12, №3. — P. 620-624.

MODEL OF THE BEST CHOICE UNDER INCOMPLETE INFORMATION

Elena Konovalchikova, Transbaikal State University, Chita, senior lecturer ([email protected]).

Abstract: We suggest two approaches to the construction of a two-person game of the best choice under incomplete information with the priority of the first player and equal player weights. We consider a sequence of independent identically distributed random variables ), i = 1 ...,n, which represent the quality of incoming objects. The first component is announced to players and the second component is hidden. Each player chooses an object based on the information available. A player wins when the sum of quality components of the object she chooses exceeds that of the object chosen by her opponent. Optimal threshold strategies are derived and compared for both approaches.

Keywords: game of the best choice, incomplete information, threshold strategy.

Статья представлена к публикации членом редакционной коллегии В.В. Мазаловым

Поступила в редакцию 04.02.2015. Дата опубликования 31.03.2015.

Модель наилучшего выбора с неполной информацией Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Коновальчикова Елена Николаевна

Похожие темы научных работ по математике , автор научной работы — Коновальчикова Елена Николаевна

Model of the best choice under incomplete information

Текст научной работы на тему «Модель наилучшего выбора с неполной информацией»