© Башлаева И.А., Штельмах Т.В., 2014
ПРИКЛАДНАЯ МАТЕМАТИКА
УДК 519.6 ББК 22.18
НЕКОТОРЫЕ ВОПРОСЫ СЛОЖНОСТИ РЕШЕНИЯ ЦИКЛИЧЕСКИХ ИГР НА ГРАФАХ1
Башлаева Ирина Александровна
Аспирант кафедры фундаментальной информатики и оптимального управления Волгоградского государственного университета [email protected], [email protected]
просп. Университетский, 100, 400062 г. Волгоград, Российская Федерация
Штельмах Татьяна Владимировна
Ассистент кафедры компьютерных наук и экспериментальной математики
Волгоградского государственного университета
просп. Университетский, 100, 400062 г. Волгоград, Российская Федерация
Аннотация. В работе дано уточнение верхней оценки сложности алгоритма потенциальных преобразований для решения циклических игр на графах. Оценка близка к нижней оценке сложности алгоритма потенциальных преобразований. Получено сведение задачи об оптимальном уклонении к решению циклических игр с временной функцией на ребрах на ориентированных графах.
Ключевые слова: циклические игры с полной информацией, позиционные игры, стационарные равновесия по Нэшу, гарантированная временная сложность, алгоритм потенциальных преобразований.
1. Постановка задачи. Общие определения
В работе рассматриваются циклические игры с полной информацией на графах и проводится анализ сложности алгоритма потенциальных преобразований данного алгоритма решения таких игр [1].
В цитируемой работе доказана его конечность. Из доказательства следует верхняя оценка битовой сложности 0(п2 \og(nM)/(п)). В работе [1] I(п) — число линейных
итераций вспомогательного алгоритма. Непосредственная оценка, вытекающая из конструкции алгоритма числа итераций, есть I(п) = 0(2п 1о§(га)). Число применений вспомогательного алгоритма полиномиально от размера исходной задачи, а число итераций вспомогательного алгоритма экспоненциально от размера задачи. В работе проведен анализ экспоненциальной оценки I(п) числа итераций вспомогательного алгоритма. Дана верхняя оценка сложности от размера исходной задачи I(п) = 0(2п). Известны примеры с достижимой экспоненциальной сложностью I(п) = П(2га/2-1) вспомогательного алгоритма.
Таким образом, общая оценка сложности алгоритма потенциальных преобразований 0(т\og(nM)2п). У данного алгоритма есть и псевдополиномиальная оценка 0(Mn2m[log(nM)]) его работы.
Хотя теоретическая оценка сложности данного алгоритма экспоненциальна, но на практике число итераций алгоритма не превосходит более чем в несколько раз числа вершин в графе игровой сети. Во многом данный алгоритм близок к симплекс-методу решения задачи линейного программирования.
Представленные циклические игры имеют важные применения к вопросам корректности параллельных распределенных систем. Анализ параллельных программ, использующих общую память или анализ корректности управляющих схем на логических элементах [3], сводим к анализу соответствующей циклической игры. Практические задачи параллельных распределенных систем имеют большую размерность, поэтому эффективность алгоритмов решения важна в практике циклических игр.
(М — максимальная по модулю стоимость перехода игровой сети, а п — число вершин в графе переходов, т — число ребер). В данной работе представлена близкая к оптимальной оценке сложности данного алгоритма и дано решение одного из открытых вопросов, представленных в работе [2]. В цитируемой работе вводятся в рассмотрение игры об оптимальном уклонении веса траектории от нуля, и с помощью введенных игр решаются циклические игры с средним выигрышем по траектории. То есть построено полиномиальное сведение циклических игр к играм на оптимальное уклонение, и представлен алгоритм решения игр на уклонение. Поставлен вопрос о полиномиальной эквивалентности циклических игр и игр на оптимальное уклонение. В работе [5] получено соответствующее неравномерное сведение по Тьюрингу. В данной работе получено независимое решение этого вопроса. Представлено равномерное сведение к циклическим играм с временной функцией на ребрах, и далее получено сведение к стандартным циклическим играм с тривиальной единичной временной функцией на ребрах.
Пусть С = (V; Е) — ориентированный граф. А и В — выделенные подмножества вершин: А и В = V, А П В = 0. с : V ^ Z — целочисленная весовая функция, определенная на ребрах графа. Ориентированное ребро с началом в вершине и и концом в вершине V обозначим (и, у). Далее Е (у1,У2) обозначает ребра с началами в вершинах У1 и концами в вершинах V2; Е(V]) обозначает ребра с началами в вершинах VI; V(у1) — множество концевых вершин ребер с началами в вершинах У1. Предполагаем беступиковость графа, то есть множество Е(ь) не пусто для каждой вершины V € V.
Вершины В (А) называют вершинами первого (второго) игроков. Рассматривается следующая позиционная антагонистическая игра двух лиц. Имеется фишка, которая в начальный момент располагается в некоторой вершине € V. Игроки шаг за шагом передвигают фишку по ребрам графа по следующему правилу.
Если в текущий момент времени фишка находится в позиции V € В (у € А), тогда первый (второй) игрок выбирает некоторое ребро (у,и) € Е(ь) и передвигает ее в
следующую вершину и. Игра длится до тех пор, пока не будет пройден первый цикл, и
платеж первого игрока второму составит c(ei)+-+c(et), где е1,... ,et — все ребра цикла.
Первый игрок минимизирует платеж, а второй максимизирует. Оказывается, оптимальные (равновесные по Нэшу) стратегии игроков достигаются на множестве стационарных стратегий, то есть таких стратегий, у которых очередной переход из текущего состояния u(t) не зависит ни от всей предшествующей траектории, ни от момента времени t. Таким образом, стационарная стратегия первого, второго игроков есть отображения вида:
sb : и ^ V(и) для и Е В;
: и ^ V(и) для и Е А.
В работе [1] доказана справедливость следующего равновесного условия: найдется пара стационарных стратегий ^ и s'2 первого и второго игроков соответственно, что для любой вершины v0 справедливо следующее:
max (s1, s2, г>0) = min c(s1,s'2,v0) = (v0),
S 2 «1
где c(s1,s2,v0) — величина среднего цикла, который будет получен согласно стратегиям si,s2 игроков из начальной вершины v0; c(v0) называют ценой игры в позиции v0. Максимум (минимум) берется по всем, не обязательно стационарным, стратегиям игроков.
В [1] дано конструктивное доказательство сформулированного равновесного условия и предложен метод потенциальных преобразований нахождения оптимальных стационарных стратегий ^1,^2.
Для решения данной задачи используется вспомогательный алгоритм, определяющий Уу Е V и для произвольного рационального р знак цены (то есть либо c(v) > р, либо c(v) < р). Далее, используя дихотомию, можно определить все цены вершин с точностью ^2 (две различные величины средних циклов отличаются, по крайней мере, на ). Найденные при этом стационарные стратегии будут требуемыми. Таким образом, общее число применений вспомогательного алгоритма есть 0(пlog Мп).
Алгоритм потенциальных преобразований Гурвича — Карзанова — Хачияна, описанный в [1], использует тот факт, что если d(u,v) = c(u,v) + е(и) — e(v), где е — некоторая функция, определенная на множестве вершин графа, то стоимости всех циклов в графе относительно весовых функций с и d совпадают. Коротко дадим формальное описание алгоритма и результатов его корректности из [1].
2. Метод потенциалов
Пусть
, , \maxuev(v) c(v,u), если v Е А,
ext(c,v) = i ()
I mmuev(v) c(v,u), если v Е B,
M = max lc(u,v)l,
(u,v)G E
—M < p < M — некоторое рациональное число,
УЕХТ(с, у) = {и € V(у): с(у,и) = ехЬ(с,у)}, п = IVI,
V- = {у € V: ехЬ(с, у) < р},
V + = {у € V: ехЬ(с, у) > р},
Vo = {у € V: ехЬ(с, у) = р}.
В результате работы алгоритма будет построена новая весовая функция ё(и, у) = = с(и,у) + е(и) — е(у) и найдено разбиение V на непересекающиеся подмножества V' и V" (возможно, либо V' = 0, либо V” = 0), такие, что
(a) ехЬ(ё,у) < р,Уу € V' и ехЬ(ё,у) > р,Уу € V" ;
(b) VEXT(с',у) П V' = 0, Уу € V'; VEXT(с', у) П V" = 0, Уу € V";
(c) Е(V' П А, V") = 0,Е(V П В, V') = 0
Тогда нетрудно заметить, что Уу € V': с(у) < р и Уу € V": с(у) > р.
В дальнейшем будем предполагать целочисленность р, так как поиск для произвольного рационального р = ^ легко сводится к поиску требуемого потенциального преобразования для стоимостной функции ё = г • с и целого числа р' = д.
Алгоритм состоит из итераций. Структура одной итерации такова.
Строим «помеченное множество» Ь = UjQj, где Qo = V-, а
Qj+1 = {у € ^ \ [Ук=1 Як: либо V € В и VEXT(с, у) П Qj = 0, либо у € А и VEXT(с, у) С ук=о Як}.
Содержательно это означает следующее. Сначала помечаем множество вершин с экстремумом меньше р (то есть V-). Затем помечаем те вершины минимизирующего игрока с экстремумом, равным р, из которых есть переход по экстремальной дуге в уже помеченное множество, и те вершины максимизирующего игрока с экстремумом, равным р, из которых все экстремальные дуги ведут в помеченное множество. Помеченное множество Ь удобно представлять в виде «слоев» (Qj в описании, приведенном выше).
Отметим, что Ь = 0 тогда и только тогда, когда V- = 0. Однако в случае V- = 0 можно сразу заключить, что Уу € V : с(у) > р (требуемое разбиение: V' = 0^" = V). Аналогично можно заметить, что если V+ = 0, то Уу € V : с(у) < р.
Далее производим потенциальное преобразование вида: ё(и, у) = с(и,у) + 8(и) —
— 8(у), где 8(у) = 8, если у € I, а в противном случае 8(у) = 0. Величина 8 > 0 выбирается максимальной, не нарушающей условие монотонности: Уу € V: 1ехЬ(ё,у) —
— р1 < 1ехЬ(с,у) — р1, а кроме того сохраняются «знаки» экстремумов, то есть если ехЬ(с,у) < р, то ехЬ(ё,у) < р, а если ехЬ(с,у) > р, то ехЬ(ё,у) > р. Отметим, что в частности это означает, что множества V- и V+ могут только сокращаться.
Для определения 8 нужно просмотреть множества: Е1 = Е(В П Ь,Ь) (цены всех таких дуг больше р по построению Ь), Е2 = Е(А П Ь,Ь) (цены всех таких дуг меньше р), V1 = {у € V+ П А: VEXT'(у) С Ь}, здесь для вершины V € А П V+ VEXT'(у) = = {'ш € V : с(у,т) > р. Также V2 = {у € V- П В: VEXT'(у) С Ь} для вершины
V € В П V- VEXT'(у) = {ш € V : с(у, •щ) < р}.
Если все эти множества пусты, то (Ь,Ь) — искомое разбиение. В противном случае полагаем 8 = ш1п{ш1пеее1 (с(е) — р), штееЕ2 (р — с(е)), (ехЪ(у) — р), шт^еу2 (р —
— ехЬ(у))}.
Основные утверждения о корректности из [1]:
(1) Выполняется условие монотонности: Уу € V: 1ехЬ(ё,у) — р1 < 1ехЬ(с,у) — р|, а кроме того, сохраняются «знаки» экстремумов, то есть если ехЬ(с,у) < р, то ехЬ(ё,у) <
< р, а если ех1(с, у) > р, то ехЬ(с', у) > р.
(2) На двух идущих подряд итерациях помеченные множества Ь,Ь' различны.
(3) Рассмотрим следующую последовательность множеств на двух подряд идущих итерациях
Яо = V- и V +,д1 п в,д1 п А,д2 п в^2 п а ...
Тогда эти последовательности различны. И первое различие в нечетном слое обусловлено сокращением соответствующего множества, первое изменение в четном слое обусловлено расширением соответствующего множества. То есть числовая последовательность
^, —^1 П ВI, ^1 П А1, —^2 П В1, ^2 П А1 ...
на итерациях вспомогательного алгоритма лексикографически убывает (из этого следует, что число итераций вспомогательного алгоритма не более (2п)п).
Утверждение 1. Остановка вспомогательного алгоритма произойдет не более чем через 2п итераций.
Доказательство. Не теряя общности, будем предполагать, что циклов среднего веса р в игровой сети нет. Поэтому множество V0/Ь разбивается аналогичным образом:
О! = Ц , где до = V+, а
Я^+1 = {у € У0 \ ^к=1 Як : либо V € А и УЕХТ(с, у) П = 0, либо V €
€ В и УЕХТ(с,у) С ик=о <Эк'}.
Выполнены аналогичные условия лексического уменьшения:
(2) На двух идущих подряд итерациях помеченные множества (^’ различны.
(3) Рассмотрим следующую последовательность множеств на двух подряд идущих итерациях
0!^ = V + и V-, ^1 п А^\ п в, $2 п А,д'2 п в...
Тогда эти последовательности различны. И первое различие в нечетном слое обусловлено сокращением соответствующего множества, первое изменение в четном слое обусловлено расширением соответствующего множества. То есть числовая последовательность
ш, —1Я[ П ^, ^1П вI, —^2 П ^, П вI... также лексикографически убывает.
Достаточно показать, что друг за другом идущих итераций, на которых последовательность множеств (3) не меняется до слоя Qt П А,1 = 0,... включительно, не более 2к, где к — число остальных вершин множества V0. (Вершины не меняющихся слоев назовем стационарными, остальные вершины множества V0 — динамическими; ряд таких, идущих друг за другом итераций, будем называть стационарной последовательностью для слоя £). Это доказывается индукцией по числу динамических вершин.
Достаточно показать это утверждение для стационарной последовательности нулевого слоя. То есть что не более чем через 2\у°\ итераций числовая последовательность (3) достигнет своего лексикографически наименьшего варианта:
Я0,Я1 = Ц)в, Яы =0...
То есть максимальное число итераций, при которых множества У+,У- фиксированы, не более 21У |. Докажем это индукцией по числу вершин в множестве к = IV0!.
Начальный шаг индукции к = 0, поэтому V0 — пусто, по лексикографическому убыванию числовой последовательности на следующей итерации в множестве V0 появится хотя бы одна вершина.
Пусть утверждение справедливо для начальной итерации с V0 = к — 1,к > 1. Тогда длина стационарной последовательности не более 2к-1. Рассмотрим начальную итерацию с V0 = к. Стационарную последовательность Н для нулевого слоя разделим на две части Н1,Н2, первая длина не более 2к-1, и вторая — остаток.
Можно предполагать, что на первом этапе Н1 черные вершины в первом слое отсутствуют Q1B = 0. Действительно, если на некоторой итерации первого этапа возникает вершина в множестве Q1B, то это означает, что будет фиксирована еще одна вершина в множестве Q1B. Множество Q1B может только расширяться, поэтому лексическое уменьшение последовательности множеств 3 может быть связано с изменениями только остальной нефиксированной части QA1,Q2,..., но число вершин в этой части не больше к — 1, поэтому длина второго этапа по предположению индукции также не более 2к-1.
Возможны два случая. 1. Существует белая вершина, которая на первом этапе присутствует в первом слое постоянно уа € Q1. Но тогда эту белую вершину можно также отнести в множество V-. Поэтому последовательность множеств 3 по предположению индукции не более чем через 2к-1 итераций получит наименьший лексикографический вариант
Я0 ,Яв1 = 0, Яа1 = У^2 = V0, Q2A = 0, . . .
Поэтому на начальной итерации второго этапа будет зафиксирована вершина множества V0 — либо белая вершина, которая получит экстремальное ребро в множество
V+, либо появится черная вершина с экстремальным ребром в множестве V-. Поэтому второй этап будет проходить с дополнительной фиксированной вершиной. По предположению индукции он не может длиться более 2к-1 итераций.
2. На некоторой итерации первого этапа множество Q1 становится пустым, поэтому Ь = V-. Следовательно на очередной итерации появится черная вершина в множестве Q1. Эта вершина становится фиксированной на втором этапе. По предположению индукции второй этап также не может проходить более чем 2^у°1-1 итераций.
М.И. Тарасовым доказано утверждение о том, что множества Ь во вспомогательном алгоритме не повторяются. Таким образом, общее число итераций вспомогательного алгоритма не более 2п. Такая оценка сложности не улучшаема. Построены достижимые примеры задач.
Так как число этапов дихотомического применения вспомогательного алгоритма не более log(M * п2), а сложность итерации линейна ОаЕI), то сложность алгоритма ГКХ 0(2^^Е^^(^|)+log(M)]). У данного алгоритма есть и псевдополиномиальная оценка I2^^^(^|)+log(M)]) его работы.
3. Терминальные позиционные игры
Рассмотрим следующую динамическую игру, которая определяется ориентированным графом с множеством вершин V и множеством ориентированных ребер Е. Вершины разбиты на множества хода к игроков V = У1 ,...,Ук. Ход заключается в передвижении фишки из текущей вершины по одному из исходящих ребер в очередную вершину. Некоторые вершины терминальные. В такой терминальной вершине игрок может остановить игру, и платежи определяются вектором р1(у), ...Рг(у), ...рк (у), где Рг(у),г = 1,...,к платеж г-го игрока в вершине V. Заметим, что если в игре возникает цикл, то игроки получают бесконечные положительные платежи. Цель каждого игрока — минимизация своего платежа.
Утверждение 2. Если граф игры симметрический и переключательный (каждый игрок не может ходить подряд более одного раза), то для любой начальной вершины существует равновесие в стационарных стратегиях.
Доказательство. Рассмотрим кратчайший кооперативный путь из начальной вершины в ближайшую остановочную. В такой ближайшей остановочной вершине игру останавливает соответствующий игрок. Рассмотрим окрестность полученного пути. В этой окрестности рассмотрим переходы в вершину пути, ближайшую к начальной (такой переход существует в силу симметричности графа игры). В остальных вершинах стратегии игроков произвольные. Представленная ситуация является набором равновесных стационарных стратегий для рассматриваемой начальной вершины. Уклонение от своей стратегии дает цикл, так как новый игрок (игра переключательная) возвращает игру на пройденную траекторию.
4. Игры на оптимальное уклонение суммарного веса траектории
Здесь рассматривается вопрос, поставленный в работе [2], о соотношении циклических игр на средний выигрыш по циклу и игр на оптимальное уклонение веса траектории. Положительный ответ на этот вопрос получен в работе [5]. В этой работе получено неравномерное сведение по Тьюрингу игр на оптимальное уклонение веса траектории к циклическим играм. Мы представляем более сильное, равномерное сведение к циклическим играм с временной функцией на ребрах. В свою очередь последние игры сводятся по Тьюрингу к циклическим играм с тривиальной единичной временной функцией. Основные определения можно найти в работе [2]. Рассмотрим следующую игру, которая определяется игровой сетью (С : V; А, В; с : Е ^ Z; и € V). Игра происходит по ребрам данной сети, в вершинах А переход совершает игрок А, в вершинах В переход совершает игрок В.
Рассмотрим общую стратегию максимизирующего игрока А, что для некоторого р выполнено уп + р > 0 без разницы, какую стратегию выбрал минимизирующий игрок В для всех п. Здесь уп — суммарный вес начала бесконечной траектории игры из первых п первых ребер согласно выбранным стратегиям. Инфинум по всем стратегиям игрока А таких р называется потенциалом игрока А и обозначается а(и) (если р не существует, то а(и) = +го). Аналогично определяется потенциал Ь(и) минимизирующего игрока В.
Рассмотрим общую стратегию минимизирующего игрока В, что для некоторого р выполнено —уп + р > 0 без разницы, какую стратегию выбрал максимизирующий игрок
А для всех п. Здесь уп — суммарный вес начала бесконечной траектории игры из первых п первых ребер согласно выбранным стратегиям. Инфинум по всем стратегиям игрока В таких р называется потенциалом игрока В и обозначается Ь(и) (если р не существует, то Ь(и) = +го).
Примечание 1.
Собственно потенциал — это цена игры на бесконечности, где игрок А максимизирует, а В минимизирует минимальное отрицательное уклонение веса траектории от нуля. Цель игрока А — минимизировать уклонение, а В — максимизировать. Данную игру обозначим Р.
Примечание 2.
Если в обычной игре h(u) > 0, то потенциал а(и) > 0, в противном случае h(u) <
< 0, тогда а(и) = +го.
Утверждение 3. Поиск потенциала а(и) (аналогично Ь(и)) полиномиально сводим к решению циклической игры на средний выигрыш по циклу.
Доказательство. Не теряя общности, будем считать, что в игровой сети циклов веса ноль нет. Рассматриваем бесконечную игру из начальной вершины и, в которой выигрывает игрок А. Поэтому цена циклической игры h(u) > 0 и а(и) > 0 конечен.
Основное утверждение [2].
Теорема 1. Следующая система равенств имеет точно одно решение. Это решение соответствует системе потенциалов игрока А и В соответственно.
1) а(и) = minveout(v) max(0, a(v) — w), если вершина и Е А.
2) а(и) = maxvEout(v) max(0, a(v) — w), если вершина и Е В.
3) Ъ(и) = minv<zout(v) max(0, b(v) + w), если вершина и Е В.
4) Ъ(и) = maxv^0utiyv) max(0, b(v) + w), если вершина и Е А.
Точно одно из чисел а(и),Ь(и) конечно.
Из доказательства основной теоремы [2, с. 67] следует, что решение игры достигается на стационарных стратегиях.
Более точно достижимые стационарные стратегии sa,Sb для экстремальных равенств в 1), 2) дают следующее. Пусть f — вес текущей траектории. Если игрок А придерживается стационарной стратегии sa, то величина f — a(v) не уменьшается на протяжении всей игры, независимо от стратегии В.
Если игрок В придерживается стационарной стратегии sb, то величина f — a(v) не увеличивается до тех пор, пока не встретится вершина а(и) = 0, независимо от стратегии игрока А. Поэтому при стационарной стратегии sb положительный цикл до момента, когда встретится вершина а(и) = 0, не возможен.
Вначале сведем игру Р к циклической игре с заданной временной функцией на вершинах.
Вершины А растягиваем в ребра с нулевым весом и единичным временем. То есть вершину v Е А заменяем ребром ww' : w Е B,w' Е А с нулевым весом и единичным временем; ребра, входившие в вершину v, теперь направляем в вершину w, а выходившие из вершины v теперь направляем из вершины w', вес не меняем, время остается то же — единичное. Из вершины w добавляем ребро в начальную вершину и с нулевым весом и временем t = const (большое положительное число). Для вершин V Е В также добавляем ребро в начальную вершину и с нулевым весом и временем t = const (большое положительное число).
Рассмотрим оптимальные стационарные стратегии в игре на уклонение sa,sb и построим следующие стационарные стратегии s'a,s'b в циклической игре для преобразованной игровой сети. Если a(v) > 0,v Е В, то стационарное ребро не меняем, если a(v) = 0,v Е В, то переход в начальную вершину и по добавленному ребру. Если a(v) > 0,v Е А, то в вершине добавленной w Е В переходим в добавленную вершину w', а в вершине w' Е А стационарный переход не меняем. Если a(v) = 0,v Е А, то в вершине добавленной w Е В переходим в начальную вершину и, а в вершине w' Е А стационарный переход не меняем.
Стратегия sa гарантирует коридор \—а(и), +го], который траектория никогда не покинет, стратегия sb гарантирует, что траектория когда-то получит вес —а(и) или меньший. Рассмотрим стратегию s'a против любой стратегии игрока В в игре Р'. Стратегия sa гарантирует цикл не хуже —a(u)/(t + г), где а(и) — потенциал вершины, и, г — число ребер в оптимальной по отклонению траектории (при большом t имеем —a(u)/(t + г) приблизительно равным —a(u)/t). Действительно, начальные отрицательные циклы не допускаются при оптимальной стационарной стратегии игрока А, а из новых циклов минимален будет следующий: от начальной вершины рассматриваем путь с весом —а(и), а из конечной вершины этого пути переходим в начальную вершину и с нулевым весом и временем движения t = const.
Наоборот, рассмотрим стационарную стратегию s'b против любой стратегии первого игрока в Р' (стратегия sb позволяет достичь отклонения —а(и)), и в этот момент игра игроком В переводится в начальную вершину. Средний вес полученного цикла приблизительно равен —a(u)/t. Начальные циклы отрицательного веса игроку А не выгодны, так как t — большое, новые циклы больше старых по средней величине. Время t нужно выбрать из двух условий.
1. Минимальный новый цикл должен быть больше максимального отрицательного старого цикла —c\Vl/t > —1/\V| (с = maxe |c(e)|).
2. Усреднение не должно менять порядка весов траекторий. Если f — вес траектории Тп, а г — вес траектории Тт и f < г, то f/(t + 2п) < r/(t + 2т). Поэтому (t + 2т)f < r(t + 2п); t(r — f) > 2mf — 2rn; t > (2mf — 2rn)/(r — f).
l2mf — 2rn/(r — f)| < (2lVlc\Vl2/1 = 4lV|2c. То есть t = 4lV|2c. Таким образом, если цена игры Р' в вершине и равна с(и), то потенциал а(и) приближенно равен c(u)t (по приближению можно восстановить точное значение).
Теперь циклическая игра с временной функцией сводима к обычной циклической игре с единичной функцией на ребрах стандартной дихотомической процедурой.
Пусть нам нужно определить: верно ли, что цена игры р' с временной функцией в вершине и удовлетворяет неравенству р' > h. Вычитаем из веса каждого ребра е Е Е величину h * t(e), то есть преобразованная весовая функция удовлетворяет равенству d(е) = с(е) — ht(e) для каждого ребра е Е Е. Цена циклической игры с единичной временной функцией и преобразованной весовой функцией d больше нуля в вершине и Е V, d(и) > 0, тогда и только тогда, когда в циклической игре с временной функцией на ребрах в начальной вершине и цена игры удовлетворяет неравенству а(и) > h.
В силу равносильных условий: ё(е1) + ... + ё(ек) = с(е1) + ... + С(ек) — 11Н1 — ... —
— ^Нк > 0 тогда и только тогда, когда (ё(е1) + ... + ё(ек))/(Ь1 + ... + 1к) > Н.
Сведение полиномиально Ь = О (с * ро1\У I), ё = 0(с2 * ро1\У I).
Полученные оценки показывают, что алгоритм потенциальных преобразований является одним из самых быстрых среди известных детерминированных алгоритмов вычисления цен игры и оптимальных стационарных стратегий.
ПРИМЕЧАНИЕ
1 Работа И.А. Башлаевой поддержана РФФИ (грант № 14-01-97002-р_поволжье_а).
СПИСОК ЛИТЕРАТУРЫ
1. Гурвич, В. А. Циклические игры и нахождение минимаксных средних циклов в ориентированных графах / В. А. Гурвич, А. В. Карзанов, Л. Г. Хачиян // ЖВМ МФ. — 1988. — Т. 28, № 9. — C. 1407-1417.
2. Карзанов, А. В. О минимальных по среднему весу разрезах и циклах ориентированного графа / А. В. Карзанов // Качественные и приближенные методы исследования операторных уравнений. — 1985. — C. 72-83.
3. Кларк, Э. М. Верификация моделей программ / Э. М. Кларк, О. Грамберг-мл., Д. Пелед. — М. : Изд-во Моск. центра непрерыв. мат. образования, 2002. — 416 с.
4. Bouyer, P. Infinite runs in weighted timed automata with energy constraints. In : Proc of FORMATS: formal modeling and analysis of timed systems / P. Bouyer, U. Fahrenberg, K. G. Larsen, N. Markey, J. Srba // LNCS. — 2008. — Issue 5215. — P. 33-47.
5. Lifshits, Y. M. Potential theory for mean payoff games / Y. M. Lifshits, D. S. Pavlov // Записки научных семинаров ЛОМИ. — 2006. — Т. 340. — C. 61-75.
REFERENCES
1. Gurvich V.A., Karzanov A.V., Khachiyan L.G. Tsiklicheskie igry i nakhozhdenie minimaksnykh srednikh tsiklov v orientirovannykh grafakh [Cyclic games and find the minimax of secondary cycles in oriented graphs]. ZhVM MF [Journal of Computational Mathematics and Mathematical Physics], 1988, vol. 28, no. 9, pp. 1407-1417.
2. Karzanov A.V. O minimalnykh po srednemu vesu razrezakh i tsiklakh orientirovannogo grafa [About average weight minimum sections and cycles of oriented graph]. Kachеstvеnnyе
i priblizhеnnyе mеtody isshdovaniya opеratornykh uravmniy [Qualitative research methods and approximate operator equations], 1985, pp. 72-83.
3. Klark E.M., Gramberg-ml. O., Peled D. Vеrifikatsiya modеlеy programm [Program models verification]. Moscow, Izd-vo Mosk. tsentra nepreryv. mat. obrazovaniya Publ., 2002. 416 p.
4. Bouyer P., Fahrenberg U., Larsen K.G., Markey N., Srba J. Infinite runs in weighted timed automata with energy constraints. In : Proc of FORMATS: formal modeling and analysis of timed systems. LNCS, 2008, issue 5215, pp. 33-47.
5. Lifshits Y.M., Pavlov D.S. Potential theory for mean payoff games. Zapiski nauchnykh sеminarov LOMI [Notes of scientific seminars LBMI], 2006, vol. 340, pp. 61-75.
SOME ISSUES OF COMPLEXITY OF CYCLIC GAMES SOLUTION ON GRAPHS
Bash^va Irina Ateksandrovna
Postgraduate Student, Department of Fundamental Informatics and Optimal Control Volgograd State University [email protected], [email protected]
Prosp. Universitetsky, 100, 400062 Volgograd, Russian Federation
Shtеlmakh Tatyana Vladimirovna
Assistant, Department of Computer Sciences and Experimental Mathematics
Volgograd State University
Prosp. Universitetsky, 100, 400062 Volgograd, Russian Federation
Abstract. The article specifies the top estimate of complexity of potential transformations algorithm for solving cyclic games on graphs. This estimate is close to the lower estimate. The authors obtained the data on optimal deviation to solving cyclic games with temporary function on the oriented graphs. The finiteness of the algorithm results in high level of complexity. The article contains the analysis of exponential estimate of algorithm’s iterations.
Key words: full data cyclic games, positional games, stationary Nash equilibrium, guaranteed time complexity, algorithm of potential transformations.