Научная статья на тему 'Задача маршрутизации с разделяемым трафиком и неполной информацией'

Задача маршрутизации с разделяемым трафиком и неполной информацией Текст научной статьи по специальности «Математика»

CC BY
187
38
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОПТИМАЛЬНАЯ МАРШРУТИЗАЦИЯ / РАЗДЕЛЯЕМЫЙ ТРАФИК / НЕПОЛНАЯ ИНФОРМАЦИЯ / РАВНОВЕСИЕ ПО ВАРДРОПУ / OPTIMAL ROUTING / SPLITTABLE TRAFFIC / INCOMPLETE INFORMATION / WARDROP EQUILIBRIUM

Аннотация научной статьи по математике, автор научной работы — Чуйко Юлия Васильевна

Работа посвящена исследованию равновесий в байесовской игре оптимальной маршрутизации, в которой игроки действуют эгоистично, стараясь минимизировать ожидаемую задержку своего трафика. Подобная схема для задачи с неделимым трафиком была представлена в работе [1], здесь предлагается ее модификация для модели сети параллельных каналов, где трафик произвольно разделяемый. Рассматриваются два вида равновесия: равновесие по Вардропу, которое всегда существует и может быть найдено с использованием потенциала, и его частный случай байесовское равновесие по Вардропу, структура которого представляется более понятной игроку, однако его существование в данный момент является открытым вопросом.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

We investigate the equilibria in Bayesian routing game in network with selfish users behavior where each user chooses his route trying to minimize the expected delay of the traffic he sends. This scheme is based on [1] and modified for model with parallel links where users traffic is splittable. Our interest are equilibria: Wardrop Equilibrium, that always exists and can be found using potential function, and its special case Bayesian Wardrop Equilibrium, that can be more easily understood by users, but its existence is an open question.

Текст научной работы на тему «Задача маршрутизации с разделяемым трафиком и неполной информацией»

УДК 519.711.7 ББК 22.18

ЗАДАЧА МАРШРУТИЗАЦИИ С РАЗДЕЛЯЕМЫМ ТРАФИКОМ И НЕПОЛНОЙ ИНФОРМАЦИЕЙ 1 2

Чуйко Ю. В. 3

(Учреждение Российской академии наук Институт прикладных математических исследований Карельского научного центра РАН, Петрозаводск)

Работа посвящена исследованию равновесий в байесовской игре оптимальной маршрутизации, в которой игроки действуют эгоистично, стараясь минимизировать ожидаемую задержку своего трафика. Подобная схема для задачи с неделимым трафиком была представлена в работе [1], здесь предлагается ее модификация для модели сети параллельных каналов, где трафик произвольно разделяемый. Рассматриваются два вида равновесия: равновесие по Вардропу, которое всегда существует и может быть найдено с использованием потенциала, и его частный случай - байесовское равновесие по Вардропу, структура которого представляется более понятной игроку, однако его существование в данный момент является открытым вопросом.

Ключевые слова: оптимальная маршрутизация, разделяемый трафик, неполная информация, равновесие по Вардропу.

1 Работа поддержана отделением математических наук РАН по программе «Математические и алгоритмические проблемы новых информационных систем»

2 Текст приводится в соответствии с изданием «Математическая теория игр и ее приложения. - 2009. - Т. 1. №3».

3 Юлия Васильевна Чуйко, кандидат физико-математических наук, ([email protected]).

1. Модель

Рассмотрим игру Г = {п, т, /, Т,р, w) с п игроками, т параллельными каналами, функциями задержки трафика /^(х) = а^х, зависящими от мощностей каналов, определенных для каждого игрока. Для каждого игрока определен набор типов отправляемого трафика Т и задано совместное распределение р{Ь1,..., £п) этих типов. Трафик каждого типа £ для игрока г характеризуется своим объемом Wi(t). В данной модели каждый игрок г знает только тип ti своего трафика, который он собирается отправить, и не знает, какой трафик посылают остальные игроки. Однако, используя известное ему совместное распределение типов трафика, он может найти условное распределение типов трафика, отправляемого остальными игроками, когда сам он посылает трафик типа £^: р(£1,..., £^1,^+1,..., tn\ti =

£) = р(*1 * *„), где р(г,£) = £ р(£ь...,£п) -веро-

(Ь1,...,Ьп)еТ :и=Ь

ятность, что игрок г отправляет трафик типа £.

Профилями стратегий в данной игре являются х = {х*е}^[п\,4ет;,ее[т\ где х^ - трафик типа £ игрока г, который он отправляет по каналу е. Компоненты профиля стратегий должны быть неотрицательными и такими, что х^ = Wi(t). X -

е£[ш\

множество допустимых профилей х в игре Г.

Ожидаемая загрузка канала е может быть найдена как 5е(х,р) = ^ р(£1,..., £п) ^ х^е, и ожидаемые затраты,

(*1,...,*„)еТ ^[п\

как

РО^х,р) = тах /е(6е(х,р)). е€[т\:34€Т;:ж?е>0

Каждый игрок г знает тип трафика, который он посылает. Его целью может быть оптимизация затрат для каждого посылаемого им типа трафика в отдельности. В этом

165

случае рассматривается условная функция ожидаемых затрат, зависящая от условной ожидаемой загрузки каналов сети, которая для каждого канала е имеет вид 5е(х, (p\ti =

t)) = 5е i(x, (p|ti = t)) + xte, где ёе i(x, (p|ti = t)) =

£ p(tl, ... ,ti-l,ti+l,. . . ,tn|ti = t) E xtie -это

условная ожидаемая загрузка канала трафиком всех игроков, кроме i.

Таким образом, условные ожидаемые затраты для игрока i, посылающего трафик типа t, имеют вид

V(i,t)(x,p) = max fie(Se(x, (p|ti = t))) и его байе-

ве[т]:ж?е>0

совские ожидаемые затраты определим как BPCi(x,p) =

P(i,t)v(i,t)(x,p). Заметим, что каждое слагемое в данной

teT

сумме не зависит от типов трафика других игроков, кроме i.

Найдем, как связаны между собой ожидаемая загрузка канала и условная ожидаемая загрузка канала.

5e(x,p)= Е p(tl,...,tn) £ xtie

(tl,...,tn)eT ie[n\

= E E p(tl,...,tn) E xtie

teTfc (tl,...,tn)eT:tfc =t i€[n\

= E p(k,t) E p(tl,...,tk-l,tk+l,...,tn|tk = t)

(tl,...,tn)GT :ti=t

i€[n\\{i}

t€Tk

(tl,...,tn)GT :tk =t

Заметим, что

E p(t1, . . . , tk-1, tk+1, . . . , tn|tk = t) =

(tl,...,tn)GT :tfc =t

Ep(tl,...,t,...,tn) _ p(tl ,...,tn) _ і

p(k,t) p(k,t)

(tl,...,tn)GT :tfc =t (tl,...,tn)GT :tfc=t

Тогда

£е(х,р) = Е р(М)-■ I Е р(£ъ ..., £к-ъ £к+1

\(*1,...,*п)еТ :*к =

= Е р(ММе(х, (р\4 = £)).

4€Тк

Найдем общую ожидаемую загрузку сети как суммарную загрузку каналов 5е(х,р)

Е £е(х,р) = Е Е р(£1,...,£п) Е х-ге

е€[т\ е€[т\ (*1,...,*„)€Т ^[п\

= Е р(£1,...,£п) Е Е х*^е

(*1,...,*п)еТ ^[п\ е€[т\

= Е р(£1, ... ,£п) Е Wi(ti) =: Ш.

(£1,...,£п)€Т ^[п\

То есть данная величина является постоянной, обозначим ее Ш.

Еще одно полезное свойство такого вида загрузки 5е(х,р) -вид ее частной производной.

,..., £п|£& = £) Е -ч

i€[n\\{k}

х^ге I х^е

х /> I х к

5е(х,р) = Е р(ММе(х, (р\£к = £))

^ £ р(к, £) (£е к(х, (р\£к = £)) + хке) = р(к, £)

\^^Тк

2. Равновесия

Определение 1. Профиль х в игре Г называется равновесием по Вардропу, если для каждого игрока г е [и], любых каналов е, д е [т], таких, что х*е > 0, выполнено Ы^е(х,р)) <

/«?(й? (х,р)).

Данная форма определения эквивалентна РС^(х,р) ^

РС(х',р), где х - равновесие по Вардропу и х' - профиль, получаемый из х, когда кто-то из игроков отклоняется от своей стратегии в х. Равновесие по Вардропу достигается, когда каждый игрок старается минимизировать свои ожидаемые затраты на всех каналах, которые он с ненулевой вероятностью будет использовать хотя бы для одного из возможных типов своего трафика.

Определение 2. Профиль х в игре Г называется байесовским равновесием по Вардропу, если для каждого игрока г е [п], его трафика типа £ е Т и каналов е, д е [т], таких, что х*е > 0, выполняется ^(^(х, (р\^ = £))) ^ /^(£д(х, (р\^ = £))).

Данная форма определения эквивалентна ВРС^(х,р) ^ ВРС(х',р), где х - байесовское равновесие по Вардропу и х' - профиль, получаемый из х, когда кто-то из игроков отклоняется от своей стратегии в х. Байесовское равновесие по Вардропу достигается, когда игроки стараются минимизировать свои байесовские ожидаемые затраты, оптимизируя для себя отправку каждого конкретного типа трафика.

Предложение 1. Если х - байесовское равновесие по Вардропу в игре Г, то ВРС^(х,р) ^ РС^(х,р).

Доказательство. Пусть х - байесовское равновесие по Вардропу. Тогда для всех г е [п], £ е е е [т], таких что х*е > 0,

168

®ie$e(x, (p|tk = t)) = Лі, иначе aie^e(x, (p|tk = t)) ^ Лt.

BPCi(x,p) =

= E p(i,t) max aie^e(x, (p|tk = t)) = £ p(i,t^*.

teTi e€[m\:x?e>0 teT

PCi(x,p) =

= max 5e(x,p)

e€[m\:3r eTi:xTe>0

= max p(i,t)aie^e(x, (p|tk = t))

e€[m\:3reTi:xTe>0 teTi

= г if8? Te n( Е P(i,t)Лt + Е p(i,t) (Лt + Ate)

eeM:3reTi:xT >0 yteTi:xie>0 teTi:xie=0

^ max ( = BPCi(x,p).

ee[m\:3reTi:x[e>n teTi /

Определение 3. Профиль x в игре Г - нормальный, если для каждого игрока i є [n] и каждого канала e є [m] справедливо: если хотя бы для одного типа трафика t є Ti выполняется xte > О, то x[e > О для всех т є Ti.

Данное определение означает, что в нормальном профиле игрок использует один и тот же набор каналов для всех типов своего трафика.

Определение 4. Байесовское равновесие по Вардропу x в игре Г называется нормальным байесовским равновесием по Вардропу, если x - нормальный профиль в игре Г.

Теорема 1. В игре Г любое нормальное байесовское равновесие по Вардропу является частным случаем равновесия по Вардропу, однако могут существовать равновесия по Вардропу, не являющиеся нормальными байесовскими.

Доказательство. Покажем, что нормальное байесовское

равновесие по Вардропу является частным случаем равновесия по Вардропу. Если x - байесовское равновесие по Вардропу, то из xie > О следует aie^e(x, (p|ti = t)) ^ aiq(x, (p|ti = t)), где e, q є [m]. Если x - нормальное байесовское равновесие по Вардропу, то из xte > О следует x[e > О для всех т є Ti. Таким

169

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

образом, в нормальном байесовском равновесии по Вардропу из

х*е > 0 мы имеем а^£е(х, (р\^ = т)) ^ ^(х, (р\^ = т)) для

всех т е Т, и, следовательно, а^£е(х,р) ^ (х,р).

Пусть теперь х - некоторое равновесие по Вардропу и байесовское равновесие по Вардропу в игре с 2 каналами (быстрым и медленным), 2 игроками, у каждого из которых есть 2 типа трафика для отправки (большого объема и маленького). а11 = а21 = 1,&12 = а22 = 1000. У игроков следующие множества типов трафика: Т = {1, 2}, Т2 = {3, 4}, где их объемы w(1) = 1^(2) = 1000, w(3) = 1^(4) = 1000. Совместное распределение выбора типов трафика такое, что р(1, 4) + р(2, 3) = 1. Стратегией в равновесии по Вардропу является использование игроками различных каналов, причем для трафика большого объема выбирается наиболее быстрый канал. Очевидно, что такой профиль стратегий не является нормальным байесовским равновесием по Вардропу.

Теорема 2. В игре Г с двумя игроками, у каждого из которых два типа трафика, и двумя каналами, где совместное распределение типов трафика такое, что р(1,4) + р(2, 3) = 1, любое байесовское равноесие по Вардропу - случай равновесия по Вардропу.

Доказательство. Пусть х - такое байесовское равновесие

по Вардропу, которое не является нормальным (если оно нормальное, то очевидно удовлетворяет определению равновесия по Вардропу). Таким образом, хотя бы один из игроков использует разные наборы каналов для разных типов трафика. Пусть это первый игрок, использующий канал 1 для трафика типа 1 и канал

2 для трафика типа 2. Следовательно, для первого игрока

аи6і(ж, (р|іі = 1)) = аи(-ші(1)+ ж^) ^

^ аі2^2(ж, (р|іі = 1)) = аі2ж|2, ац6і(ж, (р|іі = 2)) = аиж^ ^

^ аі2^2(ж, (р|іі = 2)) = аі2(-ші(2) + ж:]2),

и для второго игрока

Й21^1(х, (р\£2 = 4)) = a2l(wl(1)+ х^1) ^ ^ Й22^2(х, (р\£2 = 4)) = а22х|2, а21^1(х, (р\£2 = 3)) = а21х31 ^ ^ Й22^2(х, (р\£2 = 3)) = а22^1(2) + х]2).

Заметим, что все части данных неравенств положительны. Обозначая А = а11, В = а12, С = а21, Б = а22, а = w1(1) + х^1, Ь = х22, с = х21, d = w1(2) + х22 и применяя Лемму 1 получим, что данные неравенства выполняются как равенства.

Лемма 1. Для любых положительных А, В, С, Б и а, Ь, с, d

из

следует

Аа = ВЬ Са = БЬ

Ас = В^ Сс = Б^.

Доказательство. Из первого и второго левых неравенств

имеем І ^ А ^ ^ -Из оставшихся получаем | ^ ^ ^ ^, что доказывает лемму.

Более того, следующая теорема демонстрирует, что даже в общем случае игры Г байесовское равновесие по Вардропу является равновесием по Вардропу.

Теорема 3. Любое байесовское равновесие по Вардропу в игре Г является случаем равновесия по Вардропу.

Доказательство. Пусть ж является байесовским равновесием по Вардропу. Тогда для всех і є [п], і Є Т, є Є [т], таких, что ж*е > 0, аіе^в(ж, (р|4 = і)) = А*, иначе а*е£е(ж, (р|4 = і)) ^ А*.

171

Предположим, что х не равновесие по Вардропу. Тогда существует хотя бы один игрок г, который может, отклонившись от стратегии в х, уменьшить свои ожидаемые затраты РСДх,р).

РСі(ж,р) =

= тах аіе^е(х,р)

еЄ[т]:Зт €Т.:жТе>0

= тах £ Р(і,і)аге6е(ж, (р|^ = £))

еЄ[т]:ЗтеТ4:ж[е>0 ієу.

= ^[ ]чтах те Л Е р(і,і)А* + Е р(і,і) (А* + А?)) .

еЄ[т]:ЗтЄТі:Ж;р>0 \ >о *еТ.^=0 )

Игрок г не может уменьшить загрузку каналов с задержкой трафика, большей А*, так как он не использует данные каналы для трафика типа £. Добавление небольшую часть трафика с канала е с задержкой А* на некоторый канал д в любом случае ведет к увеличению ожидаемых затрат за счет увеличения загрузки канала д. На нем либо уже есть загрузка А*, если он используется для трафика £ в х, либо добавление на него трафика типа £ вовлекает в ожидаемые затраты новый канал с загрузкой ^ А*. Таким образом, для игрока г нет возможности отклониться, уменьшив свои ожидаемые затраты, и, следовательно, х является равновесием по Вардропу.

3. Существование равновесия по Вардропу

Рассмотрим функцию

Ф(х) = ЕЕ Е р(г,£)х*е 1п^е) + ^ 6е(х,р)1п(6е(х,р)),

^[п\ *€Тг е€[т\ е€[т\

которая является вероятностной модификацией функции потенциала в работе [2]. Она выпуклая как сумма выпуклых функций, следовательно, для нее существует минимум на выпуклом множестве X.

172

Теорема 4. Если в игре Г существует равновесие по Вар-

Доказательство.

= р(г, £) ь^е) + р(г, £) 1п(£е(х, р)) + р(г, £) = р(г, £)(1п^е^е(х,р)) +1).

В равновесии по Вардропу из х*е > 0 следует а^£е(х,р) ^ а^(х,р) и тогда

р(г, £)(1п^е£е(х,р)) + 1) ^ р(г,£)(1п(а^(х,р)) + 1)

и, следовательно,

Тогда из Леммы в работе [2] Ф(х) =

шш Ф(у).

у - профиль стратегий в г

Теорема 5. Если профиль х в игре Г обеспечивает минимум функции Ф(х), то х является равновесием по Вардропу.

Доказательство. Из условий Куна-Таккера следует, что х обеспечивает минимум функции Ф(х) тогда и только тогда, когда существует такое значение А, что для г е [п], £ е Т, е е [т] и

дропу х, то Ф(х)

ш1п Ф(у).

у - профиль стратегий в г

д Ф(х) д Ф(х)

дх*е ^ дх*9 .

выполняется:

если х*е > 0, то дХе Дх, А) = 0,

если х*е = 0, то дхеДх, А) ^ 0.

№-1'

Следовательно, обозначив а* = Ар(м) ), получаем

а^£е(х,р) = а* если х*е > 0 и а^£е(х,р) ^ а* если х*е = 0

Поскольку а^5е(х,р) не зависит от типа трафика игрока, то а* равны для всех тех типов трафика игрока г, для каждых двух из которых существует хотя бы один канал, используемый для обоих типов; обозначим их как а^ Для остальных типов трафика

т их аТ ^ аi.

С другой стороны трафик типа т отправляется по некоторому каналу д, где хТ9 > 0. Если х*9 > 0, то а^£9(х,р) = а[ = а* = аi. Если х*9 = 0, то а^£9(х,р) = аТ ^ а* = аi. Таким образом,

аТ = а* = аi.

Следовательно, для всех г е [п], е е [т], таких что каждый игрок г использует канал е для отправки хотя бы одного типа своего трафика, имеем а^5е(х,р) = а^ где аi - некоторые константы.

Заметим, что минимум функции Ф(х) на X существует, отсюда следует справедливость следующей теоремы.

Теорема 6. В игре Г всегда существует равновесие по Вардропу.

Заметим, что равновесие по Вардропу в игре Г может быть не единственным и некоторые равновесия могут быть байесовскими. Это иллюстрируется следующими примерами.

Пример 1. Данный пример демонстрирует ситуацию, когда равновесие по Вардропу также является байесовским. Рассмотрим игру с двумя игроками и двумя каналами с а11 = а21 = 1, а12 = а22 = 2. Множества типов трафика игроков определены как Т1 = {1, 2}, Т2 = {3, 4}, где w(1) = 1^(2) = 25^(3) = 1^(4) = 50. Совместное распределение типов трафика такое, что р(1, 4) = р(2, 3) = 1/2.

174

Стратегии в равновесии по Вардропу:

x11 x 1 = 0 x12 x1 =1

x21 x 1 = 16 3 2 12 x = 8 3

x31 x2 = 1 x32 x2 =0

x41 x2 = 34 x42 x2 = 16.

Условные ожидаемые загрузки и ожидаемые загрузки равны для обоих каналов, Ф(ж) ~ 124,939. •

Пример 2. Данный пример демонстрирует равновесие по Вардропу, которое не является байесовским. Рассмотрим игру из предыдущего примера. Следующий профиль также является равновесием по Вардропу:

x11 x1 =1 x12 x1 =0

x121 x1 = 25 2 12 x =0

x31 x2 =1 x32 x2 =0

x41 x2 = 24 3 x42 x2 = 25 3

Ожидаемые загрузки равны для обоих каналов, Ф(ж) ~ 124,939, но условные ожидаемые загрузки не соответствуют байесовскому равновесию по Вардропу. Например, для игрока 1:

ац^(ж, (р|^1 = 1)) = ж}1 + ж^1 = 253 «12$2(ж, (р^1 = 1)) = ж^2 + ж22 = 513 а11^1(ж, (р|^1 = 2)) = ж21 + ж21 = 26 а12$2(ж, (р|^1 = 2)) = ж22 + ж:]2 = 0.

Литература

1. GAIRING M., MONIEN B., TIEMANN K. Selfish Routing with Incomplete information // Theory Comput Syst. - 2008. -P. 91-130.

2. GAIRING M., MONIEN B., TIEMANN K. Routing (Un-) Splittable Flow in Games with Player-Specific Linear Latency Functions / Proceedings of the 33rd International Colloquium on Automata, Languages and Programming (ICALP 2006), LNCS 4051. - 2006. - P. 501-512.

ROUTING PROBLEM WITH SPLITABLE TRAFFIC AND INCOMPLETE INFORMATION

Julia Chuiko, Institute of Applied Mathematical Research Karelian Research Center of RAS, Petrozavodsk Cand.Sc. ([email protected]).

Abstract: We investigate the equilibria in Bayesian routing game in network with selfish users’ behavior where each user chooses his route trying to minimize the expected delay of the traffic he sends. This scheme is based on [1] and modified for model with parallel links where user’s traffic is splittable. Our interest are equilibria: Wardrop Equilibrium, that always exists and can be found using potential function, and its special case Bayesian Wardrop Equilibrium, that can be more easily understood by users, but its existence is an open question.

Keywords: optimal routing, splittable traffic, incomplete information, Wardrop equilibrium.

i Надоели баннеры? Вы всегда можете отключить рекламу.