ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013 Управление, вычислительная техника и информатика № 3(24)
УДК 519.21
А.В. Зорин ОПТИМИЗАЦИЯ ПАРАМЕТРОВ УПРАВЛЕНИЯ КОНФЛИКТНЫМИ ПОТОКАМИ В КЛАССЕ ЦИКЛИЧЕСКИХ АЛГОРИТМОВ1
Рассматривается процесс управления с потерями конфликтными потоками в классе циклических алгоритмов с динамическим выбором длительностей состояний прибора. Качество функционирования системы оценивается по скорости роста средней стоимости пребывания всех требований в системе. Построена математическая модель системы в виде управляемой цепи Маркова с доходами. С помощью вычислительных экспериментов изучаются свойства оптимального управления.
Ключевые слова: конфликтные входные потоки, управляющая система массового обслуживания, управляемая цепь Маркова с доходами.
Входные потоки многих реальных систем массового обслуживания являются конфликтными. На содержательном уровне конфликтность означает, что требования различных потоков не могут обслуживаться одновременно и что путем сложения входных потоков нельзя существенно уменьшить их число. Для управления конфликтными потоками в настоящее время используется много разнообразных алгоритмов: циклические, пороговые, циклические с продлениями, с динамическими приоритетами и т.д. [1 - 11]. С целью разрешения конфликтности в процесс функционирования обслуживающего устройства вводятся этапы переналадок, во время которых требования не обслуживаются.
Для управления конфликтными транспортными потоками на регулируемых перекрестках во многих странах мира используются целые компьютеризированные комплексы, включающие в себя детекторы, видеонаблюдение, и т.д., Такой комплекс способен как осуществлять мониторинг текущей ситуации на дорогах (моменты прибытия машин к стоп-линиям, число ожидающих переезда машин по каждой полосе, и т.д.), так и выбирать один из нескольких возможных алгоритмов управления, наиболее подходящий к текущей дорожной ситуации. С теоретической точки зрения важно уметь генерировать такие алгоритмы в ходе теоретического решения некоторых оптимизационных модельных задач. В работе [1] постановка и решение этой задачи искались в классе алгоритмов с динамическими приоритетами. Экономический критерий задавал среднее время пребывания всех требований в системе за один такт.
В некоторых реальных системах массового обслуживания важно, чтобы поведение управляющего устройства было предсказуемым с точки зрения требований. Например, участники дорожного движения ожидают, что светофор предоставляет возможность проезда последовательно каждому из потоков и отклонения от такой последовательности может быть воспринято как поломка светофора и, вследствие этого, стать причиной дорожно-транспортных происшествий. Следовательно,
1 Работа была выполнена в рамках госбюджетных НИР ННГУ «Математические моделирование и создание новых методов анализа эволюционных систем и систем оптимизации» (№ государственной регистрации НИР 01201252499) и проекта РФФИ № 12-01-90409 «Моделирование и анализ систем управления взаимодействующими транспортными потоками высокой интенсивности».
представляет интерес изучения циклических алгоритмов с переменными длительностями обслуживаний и переналадок. В качестве экономического критерия естественно рассматривать среднее время пребывания всех требований в системе за один цикл.
1. Постановка задачи
Пусть в систему массового обслуживания с потерями поступают т < ю конфликтных входных потоков П1, П2, ..., Пт. В течение промежутка времени А,
0 < А <ю, с вероятностью X у поступает одно требование потока Пу, а с вероятностью
1 - Xу требование не поступает,у = 1, 2, ..., т. Непосредственно момент поступления требования не наблюдается. Требования потока Пу помещаются в накопитель
О у конечной емкости Ыу < ю. Обслуживающее устройство имеет 2т состояний Г(1), Г(2), ., Г(2т). В состоянии Г(2у - 1) обслуживаются только требования потока Пу, что и означает конфликтность потоков; в состоянии Г(2у) требования не обслуживаются и осуществляется переналадка. За промежуток времени А в состоянии Г(2у - 1) завершается обслуживание одного требования из очереди О у с вероятностью р у и обслуженное требование покидает систему, причем момент окончания обслуживания тоже не наблюдается непосредственно либо с вероятностью 1 - р у обслуживание не завершается. Обслуживающее устройство сменяет состояния по циклическому за-
кону: Г(1) ^ Г(2) ^ ^ ... ^ Г(2т) ^ Г(1) ^ ... . Обслуживающее устройство может функционировать в одном из п режимов. В режиме г, г = 1,2,...,п, длительность пребывания прибора в состоянии Г(5), 5 = 1, 2, ..., 2т, не случайна и равна Т,г А. Промежуток времени, в течение которого обслуживающее устройство последова-
<2)
<Ъп)
41)
тельно проходит через все состояния от Г(1) до П"'"' включительно, называется циклом. Режим выбирается в начале цикла, то есть в момент времени 0 и в момент смены состояния с Г(2т) на Г(1). Правило выбора нового режима определяется отображением и() целочисленной решеткиX = {0, 1, ., N1} х {0, 1, ., N2} х ... х {0, 1, ., ^т} во множестве {1, 2, ., п}. Если длины очередей описываются вектором (хь Х2, ., Хт) е X, то выбирается режим с номером г = и(х). Таким образом, в данной задаче возможно лишь конечное число различных управлений. Определим потери системы за промежуток времени А как суммарное время пребывания в системе всех требований на этом промежутке. Требуется выбрать такое управление, которое минимизирует предельную скорость роста суммарных потерь за I >> 1 промежутков при неограниченном времени функционирования системы (т.е. при I ^ ю). Другие задачи оптимизации при циклическом управлении рассматривались, например, в [4,
8, 9, 12].
Приведенное выше формализованное описание управляемой системы массового обслуживания может быть проиллюстрировано следующим примером. Рассмотрим регулируемое светофором пересечение транспортных магистралей, изображенное на рис. 1. В этом частном случае т = 2. Входные потоки П1, П2 автомобилей являются конфликтными. Для разрешения конфликтности в режиме переналадки используется желтый свет светофора. Также естественно предположить, что перед стоп-линиями имеется лишь конечное число мест ожидания.
42m)
STOP
Рис. 1. Перекресток автомагистралей, управляемый светофором
2. Построение математической модели
Будем наблюдать систему в дискретные моменты времени 0, А, 2А, .... Пусть случайная величина ку задает число требований в накопителе О у в момент I А, случайная величина у - число требований потока Пу, поступивших за промежуток времени (I А, (I + 1) А], случайная величина у - виртуальное число обслуженных требований из накопителя О у за промежуток времени (I А, (I + 1) А] в предположении наличия достаточного числа ожидающих требований в очереди, а случайный элемент Г,- е {Г(1), Г(2), ..., Г(2т)} - состояние обслуживающего устройства на промежутке ((I - 1) А, I А]. Введем также случайные вектор К = (к1,„ к2,„ ..., кт1). Из постановки задачи на содержательном уровне следует, что динамика формирование очереди О у из потока П у на интервале времени (I А, (I + 1) А] задается следующим рекуррентным соотношением: у + 1 = шт{^, тах{0, у + у - у }}.
Обозначим Тг) = Т1г + Т2г + ... + Т2тг. Пусть т(0) = 0 и т(I + 1) = т(/') + Тг) при и(кх(1)) = г. Тогда имеет место равенство Г; = Г(5), если для целого 9 имеют место неравенства
т(9) + Т1,г + Т2,г + ... + Т5-1,г </ < т(9) + Т1,г + Т2,г + . + Т5г .
Более того, случайные элементы Гт(1), I = 0, 1, ..., совпадают. Входные потоки и потоки насыщения удобно задавать с помощью свойств условных распределений точечных процессов {(I А, П/,;); I = 0, 1, ...} и маркированных точечных процессов {(I А, у, vI); I = 0, 1, .} с меткой vI = Г требований на интервале (I А, (I + 1) А]. Случайная величина 'у принимает значение 5 е {0, 1} с вероятностью Х/(1 - Ху)1-5; величины п^о, Пл, ••• независимы. Случайная величина у принимает значение 5 е {0, 1} с вероятностью р/(1 - Ру) 1-5 если Г = Г(2у - 1), а в остальных случаях у = 0.
Теорема. При заданном распределении вектора к0 последовательность
{км; I = 0, 1, ...} (1)
является однородной цепью Маркова
Сделаем следующие обозначения:
р( у) =1 Рк,1 ~ 1
1 -Ху +Ху Ру
(!-^)(!-в.) + Х, в (1 -Ху) ву X у (1 -в у )
1 - в у + Ху в у
0
при к = I = 0, при к = I = 1, 2 при к -1 = I = 0,1,. при к +1 = I = 1, 2,. при к = I = ,
при к ФI и к ФI ± 1;
N/ -1,
., N-I .., N.,
=1
Здесь величина рку есть вероятность выполнения равенства у + 1 = I при условии куу = к и Г = Г(2у - 1), а величина дк1') есть вероятность выполнения равенства
1 -Ху при к = I = 0,1,..., Nj -1,
X у при к +1 = I = 1,2,..
1 при к = I = N у,
0 при к ФI и к ФI -1.
Куу + 1
= I при условии куу = к и Г Ф Г(2у 1). Пусть, например, к = I = 0 и Г = Г1
(2у - 1)
тогда равенство 0 = шт{Мт, тах{0, гу - у }} может иметь место в одном из двух случаев: либо Гу = 0, либо у = у = 1. Соответствующая вероятность есть
где запись (•)*,/ обозначает элемент к-й строки и 1-го столбца указанной в скобках матрицы. Из вида переходных вероятностей (2) следует, что состояния цепи Маркова (1) принадлежат единственному эргодическому классу при любом управлении.
Пусть случайная величина у измеряет время пребывания всех требований в очереди Оу на промежутке времени (I А, (I + 1) А]. Математическое ожидание времени пребывания всех требований в системе за промежуток времени (т(!), т(I + 1)], заключающий в себе один цикл работы обслуживающего устройства, и при условии кт(1) = х определяется выражением
С экономической точки зрения время ожидания представляет потери управляемой системы массового обслуживания. Поскольку моменты поступления требований и моменты окончания обслуживания требований непосредственно не наблюдаются, будем считать их равномерно распределенными в соответствующих интервалах. Поэтому ниже речь будет идти, на самом деле, об оценках для соответствующих экономических показателей обслуживания. Итак, для вычисления величин г^х), х е X, обозначим
системе требованиями из очереди Оу и поступившим требованием из потока Пу за промежуток времени вида ( А, (I + 1) А] при условии, что за этот промежуток число требований в очереди сменилось с к на I и очередь Оу не обслуживалась.
1 - Ху + Хуву. Остальные случаи доказываются аналогично. Обозначим через Р(), матрицы чисел . Пусть Р(у)(а), $3)(а) суть а-е степени матриц Р(у) и
соответственно, а = 0, 1, ... . Тогда переходная вероятность цепи Маркова (1)
для х е X, и(х) = г и V = (^1, ^2, ., wm) е X имеет вид
у=1
т Т(г)-1
2і (х)=Е Е Е(^},т(о 1{с°: к<з) =х}) > г=м(х)-
}=1 t=0
к Д при к = I = 1, 2,..., N у,
gk1¡ (А) = • к Д + Д/2 при к + 1 = I = 1, 2,..., N у,
0 при к ФI, к ФI -1 или к = I = 0;
Xув у А /4(1-X у + X у ру) при к = I = 0,
к А
кк]}(Д) = | к Д + Д/2
при к = I = 1, 2, ., N у, при к + 1 = I = 1, 2,..., N у, при к -1 = 1 = 0,1, ., N у -1, при к ФI, к ФI ± 1.
к Д-Д/2 0
Здесь величина g(k1j(k) есть математические ожидание времени, проведенного в
Величина h^’i (Д) есть математические ожидание времени, проведенного в системе требованиями из очереди O, и поступившим требованием из потока И,- за промежуток времени вида (i A, (i + 1) А] при условии, что за этот промежуток число требований в очереди сменилось с к на i и очередь O, обслуживалась. Пусть
?r) = {1, 2, ..., 7<г)}, j = {T, + 7ji,r + ... +T2m,r +1, T2hr + 7ji,r + ... + T2m,r + 2, • • •, T2j-,r + T2j,r + T2j+1r + + . +T2mr}. Определим последовательно
Hij,r)(0) = 0,
Nj
H 1 ,r) (i) = X (( (Д)+нк1 ,r) (i -1))
к=0
при i e t'r) \ Tj,r),
Nj
H1 ,r) (i) = X Pj (j (Д) + Hj) (i -1))
к=0
при i e Tj,r). Тогда, в силу марковского свойства,
m
z, (x) = XH(x]:r)(T(r)), u(x) = r. (3)
1=1 j
Рекуррентные соотношения (2) и (3) задают марковскую цепь с доходами [13]. Известно [13], что потери за in шагов имеют асимптотическое выражение
a(x) + g i + o(1),
где o(1) 0 при i ^ да, константа a(x) зависит от начального состояния x e X.
Величина g не зависит от начального состояния и называется предельными одношаговыми потерями. Для отыскания оптимальной функции переключения м(-) естественно воспользоваться алгоритмом Ховарда [13].
3. Результаты численных экспериментов
Для проведения численных экспериментов использовался язык высокого уровня Octave [14]. Была написана программа, реализующая алгоритм Ховарда. В экспериментах изучался случай двух конфликтных входных потоков (т = 2) и тремя режимами (d = 3). Были выбраны следующие значения числовых параметров: Х1 = 0,1, X2 = 0,05, р1 = 0,6, р2 = 0,65, Tu = 6, T21 = T41 = 4, T3,i = 10, Tu = 10, T22 = T42 = 4, T32 = 6, T13 = T3,3 = 8, T2,3 = T4,3 = 4. При таком выборе длительностей состояний прибора общая длина цикла 24 остается постоянной, а среднее число поступивших требований за цикл по каждому потоку не превосходит среднего числа требований потока насыщения: X, T < р, T2j-1r . Оптимальные правила выбора управления при переменных размерах (N1 = N2 = 10, N1 = N2 = 20, N1 = N2 = 40) накопителей представлены на рис. 2 и 3. Кружок белого цвета означает выбор при данных длинах очередей первого режима, кружок черного цвета -второго режима, треугольник серого цвета - третьего режима. Хотя интенсивности входных потоков различаются в два раза, границы смены режимов на всех трех рисунках близки к линейным и проходят вблизи биссектрисы первого квадранта. Кроме того, третий режим рекомендуется включать, только если длины очередей практически равны. Целевая функция (предельная скорость роста потерь) в указанных трех случаях оказалась приближенно равна 27,842. Интересно, что если отказаться от третьего режима (d = 2), то значение целевой функции ока-
зывается равным 27,899. Однако использование только третьего режима (С = 1) дает предельные потери в размере 31,717, что на 13,7 % хуже оптимального. Можно заключить о достаточности двух режимов обслуживания при данных интенсивностях входных потоков и интенсивностях обслуживания.
*2
фооооооо оооооооо оооооооо ооооооо оооооо ооооо оооо
ООО
оо
0
*1
Рис. 2. Вид оптимального управления при емкостях накопителей N = N = 10 (слева), N1 = N = 20 (справа). Остальные параметры указаны в тексте
Рис. 3. Вид оптимального управления при Рис. 4. Вид оптимального управления при
емкостях накопителей = А2 = 40 (осталь- емкостях накопителей N = А2 = 40, интен-
ные параметры указаны в тексте) сивных входных потоках и двух режимах с
оптимальными длительностями (остальные параметры указаны в тексте)
Естественно поставить задачу о выборе оптимальных параметров режимов Т1Ь ..., Тт,ё . Рассмотрим случай двух режимов (ё = 2). Пусть входные потоки характеризуются параметрами Х1 = 0,2, Х2 = 0,15, длительность цикла Тг) = Т постоянна, а длительности переналадок равны между собой, Т2,1 = Т4,1 = Т2,2 = Т4,2. Пусть, далее, в первом меньше времени отдается на обслуживание первого потока, а во втором режиме - на обслуживание второго потока (неравенства нестрогие). Тогда перебором значений Т1,1 в диапазоне от 1 до Т - 2Т12 и значений Т32 в диапазоне
от 1 до Т - 2Т22 можно установить такие, при которых величина g принимает наименьшее значение. В частности, при ^ = 0,1, Х2 = 0,05, указанных выше значениях интенсивностей обслуживания, при длине цикла Т = 24 и длительностях переналадки Т21 = Т41 = Т22 = Т42 = 4 оптимальными оказываются значения Т1,1 = 7, Т3д = 9, Т12 = 11, Т32 = 5. Вид оптимальной функции переключения в этом случае приведен на рис. 4, а значение g = 144,35. Замечательно, что в первом режиме среднее число поступивших за цикл требований из первого потока Х1 Т = 4,8 больше среднего числа требований потока насыщения р 1Т11 = 4,2, а во втором режиме аналогичная ситуация имеет место для второго потока:
Х2 Т = 3,6 > р 2Т32 = 3,25, то есть очереди оказываются перегруженными. Тем не менее эта комбинация режимов является квазиоптимальной. Первый режим выбирается, когда длина первой очереди мала по сравнению с длиной второй очереди, а второй режим выбирается, когда мало число требований во второй очереди. С другой стороны, поведение оптимального правила переключения в правом верхнем углу рис. 4 является результатом влияния границ: заполненность одной очереди становится дополнительным источником контроля. Наконец, стоит отметить, что рис. 4 отличается от рис. 2 и 3 существенно отличной от линейной формой границы, что часто наблюдалось нами при высокоинтенсивных входных потоках.
Заключение
В данной работе была построена математическая модель и разработаны программные средства оптимизации режимов обслуживания конфликтных потоков в классе циклических алгоритмов. Основной результат работы состоит в демонстрации того, что наличие нескольких наборов параметров циклического алгоритма обслуживания может снизить среднее время пребывания требований конфликтных потоков в системе за цикл.
ЛИТЕРАТУРА
1. Неймарк Ю.И., Федоткин М.А., Преображенская А.М. Работа автомата с обратной связью, управляющего уличным движением на перекрестке // Изв. АН СССР. Сер. Техническая кибернетика. 1968. № 5. С. 129-141.
2. Кувыкина Е.В., Федоткин М.А. Изучение предельных свойств процесса управления конфликтными потоками Бартлетта в классе однородных алгоритмов с ориентацией и переналадками // Тез. докл. VII Белорусской зимней школы-семинара «Сети связи и сети ЭВМ как модели массового обслуживания». Минск: БГУ, 1991. С. 80, 81.
3. Кувыкина Е.В. Исследование систем управления конфликтными потоками Бартлетта в классе однородных алгоритмов с упреждением. Горький: ГГУ, 1990. 56 с. Деп. в ВИНИТИ, № 2972-В90.
4. Куделин А.Н., Федоткин М.А. Управление конфликтными потоками в случайной среде по информации о наличии очереди. Нижегородский государственный университет им. Н.И. Лобачевского. Н. Новгород, 1996, 22 с. Деп. в ВИНИТИ, № 1717-В96.
5. Куделин А.Н., Федоткин М.А. Предельные теоремы для систем управления потоками в случайной среде в классе алгоритмов с упреждением. Нижегородский государственный университет им. Н.И. Лобачевского. Н. Новгород, 1996. 40 с. Деп. в ВИНИТИ, № 2593-В96.
6. Литвак Н.В., Федоткин М.А. Вероятностная модель адаптивного управления конфликтными потоками // Автоматика и телемеханика. 2000. № 5. С. 67-76.
7. Пройдакова Е.В., Федоткин М.А. Управление выходными потоками в системе с циклическим обслуживанием и переналадками // Автоматика и телемеханика. 2008. № 4. С. 96-106.
8. Федоткин М.А., Федоткин А.М. Анализ и оптимизация выходных процессов при циклическом управлении конфликтными транспортными потоками Гнеденко - Коваленко // Автоматика и телемеханика. 2009. № 12. C. 92-108.
9. Голышева Н.М. Построение и исследование математической модели управления потоками в классе алгоритмов с дообслуживанием // Вестник Нижегородского университета им. Н.И. Лобачевского. 2010. № 6. C. 164-171.
10. Голышева Н.М. Оптимальное управление периодическими потоками Пуассона в случае произвольного количества потоков // Вестник Нижегородского университета им. Н.И. Лобачевского. № 1. 2011. C. 188-192.
11. Zorine A. Study of Queues' sizes in tandem intersections under cyclic control in random environment // Modern Probabilistic Methods for Analysis of Telecommunication Networks. Communications in Computer and Information Science. 2013. V. 356. P 206-215.
12. Зорин А.В. О среднем времени пребывания требований при циклическом управлении с фиксированным ритмом // Материалы XI Международного семинара «Дискретная математика и ее приложения», посвященного 80-летию со дня рождения академика О.Б. Лупанова (Москва, МГУ, 18-23 июня 2012 г.) / под ред. О.М. Касим-Заде. М.: Издательство механико-математического факультета МГУ. 2012. С. 122-125.
13. Ховард Р. Динамическое программирование и марковские процессы. М.: Сов. радио, 1964. 190 c.
14. Eaton J.W., Bateman D., Hauberg S. GNU Octave Manual Version 3. Network theory, Ltd, 2008. (http://www.octave.org/)
Зорин Андрей Владимирович Нижегородский государственный университет им. Н.И. Лобачевского
E-mail: [email protected] Поступила в редакцию 7 марта 2013 г.
Zorine Andrei V. (N.I. Lobachevsky State University of Nizhni Novgorod). Optimization of conflicting flows control parameters in the class of cyclic algorithms.
Keywords: conflicting input flows, queueing control system, controlled Markov chain with incomes
A loss queueing control system is considered. The input flows of the system are conflicting. We assume that one customer arrives from the j-th flow with probability X j during a fixed-length time slot A and with probability 1 - X j no customer arrives from this flow. When the j-th queue is served, during a time slot A either one customer from the queue leaves the system with probability p j or with probability 1 - p j the service is not finished. The control is conducted in a class of cyclic algorithms with dynamical choice of durations regime based on the queues lengths at the beginning of a cycle. After each service period a re-adjustment period takes place. Both the service period durations and the readjustment period durations are assumed multiples of A.. Arrival instants and exit instants are not directly observed. The control performance metric is the mean growth rate of time losses from customers sojourn. A mathematical model is constructed as a controlled Markov chain with incomes. A well-known Howard's algorithm is used to select the optimal switching scheme for the cycle regimes. An optimization problem the for cycle parameters is solved numerically.