ИНФОРМАТИКА, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И УПРАВЛЕНИЕ
УДК 519.2:004.421.5:004.7 В. Н. ЗАДОРОЖНЫЙ
Т. Р. ЗАХАРЕНКОВА
Омский государственный технический университет
МЕТОДЫ ПЛАНИРОВАНИЯ ИМИТАЦИОННЫХ ЭКСПЕРИМЕНТОВ ПРИ МОДЕЛИРОВАНИИ ФРАКТАЛЬНЫХ ОЧЕРЕДЕЙ_
Рассматриваются проблемы корректной организации имитационных экспериментов при расчете фрактальных очередей. Фрактальные системы с очередями описываются асимптотически степенными законами распределения интервалов поступления и времени обслуживания заявок и являются адекватными математическими моделями сетевых устройств телекоммуникационных систем с фрактальным трафиком. Выявляются особенности расчета фрактальных очередей. Разрабатываются рекомендации по организации последовательных и многократных «параллельных» прогонов модели. Выводятся формулы для контроля точности получаемых результатов. Ключевые слова: моделирование, генераторы случайных чисел, системы с очередями, распределения с тяжелыми хвостами.
1. Введение. При описании и анализе фракталь- тальными системами мы называем такие системы
ного (самоподобного) трафика применяются такие класса С1|С1|л|ш [3], в которых интервалы поступле-
математические понятия, как самоподобный слу- ния заявок и/или время их обслуживания описыва-
чайный процесс, долговременная зависимость, рас- ются распределениями с тяжелыми хвостами (РТХ). пределения с тяжелыми хвостами (РТХ) [1, 2]. При При этом мы полагаем, что РТХ определяется такой
проектировании сетевых устройств на системном функцией распределения вероятностей (ф.р.),
уровне наиболее подходящими математическими мо- которая имеет асимптотически степенной хвост, ко-
делями являются системы с очередями [3, 4]. Фрак- нечное математическое ожидание (м. о.) и бесконеч-
ную дисперсию. Коэффициент р загрузки рассматриваемых систем не превосходит единицы:
р = 4< 1,
пт
где х — среднее время обслуживания заявки, т — среднее время между приходами заявок, п — число каналов в системе.
Такие соотношения параметров РТХ наиболее актуальны в приложениях теории фрактальных очередей к проектированию сетевых устройств телекоммуникационных систем. Системы С1|С1|п|т, задаваемые ф.р. с экспоненциальными хвостами, будем называть классическими системами.
Типичными представителями фрактальных систем с очередями являются системы Ра/М/п/т, М/ Ра/п/т и Ра/Ра/п/т. Здесь символом Ра обозна-чено распределение Парето (РП). Если размер т буфера конечный, то требуется при данном т определить вероятность Р потери заявки (прямая задача) или найти наименьший размер т, гарантирующий, что вероятность потери будет не больше Р (обратная задача). При т = ¥ интерес представляет средняя длина очереди Ь или среднее время ожидания Ш. Сокращенно РП с параметрами К, а будем обозначать как Ра(К, а). Его ф.р. -Р^) имеет вид
F (t) = 1 "|f
a> 0, K > 0,
t > K,
(1)
2. Построение доверительных интервалов в зависимых испытаниях. В общем случае при моделировании очередей для расчета оценки X м.о. X («показателя») используется выборка Х1, ..., Хм зависимых реализаций с.в. X на выходе имитационной модели. Оценка X рассчитывается как выборочное среднее:
• л N
X=N S V
(2)
Корреляции между реализациями Х1, ..., усредняемой с. в. X можно связать с дисперсией Б(Х) оценки X следующим образом:
D(X) = Di N S X- 1 = N2
М(ЕЧ - m2|sx.
N
<~\ N-1 N
+—SS rS
Nti J1 "
= N (1 + 2^n ),
(3)
где ст2 — дисперсия выборочного значения X,- (не зависит от I, так как мы рассматриваем стационар -ную последовательность реализаций X1, ..., X«);
M(X1X,) - мй, )M(X,)
Г" = согг(Х;-, x J)
M(XiХ,) - м2(Х)
VD(X, )D(X j )
— коэффициент корреляции эле-
где a — параметр формы, K — наименьшее значение случайной величины (с. в.) и, одновременно, масштабный параметр. Типичный для фрактального трафика диапазон значений a определяется неравенством 1<a<2. Из (1) нетрудно найти, что при таких a РП имеет конечное м.о., равное aK/(a - 1), и бесконечную дисперсию.
Поскольку исследование фрактальных систем с очередями аналитическими методами затруднено, для их расчета широко используется имитационное моделирование (ИМ). В [5] перечислены следующие основные проблемы ИМ фрактальных очередей:
1) проблема корректной реализации РТХ, выявленная в [6];
2) проблема медленной сходимости оценок;
3) проблема длительных переходных процессов в фрактальных системах;
4) проблема больших затрат времени на ИМ фрактальных систем.
Эффективное решение первой проблемы, найденное в работах [7, 8], состоит в достаточно простом предварительном преобразовании равномерно распределенной базовой с.в. (БСВ), используемой для реализации всех прочих с.в. Это преобразование (метод ARAND) обеспечивает сохранение количества значащих цифр БСВ при любом выпадающем значении БСВ, сколь бы близком к нулю оно ни оказалось. Тем самым обеспечивается достаточно точная реализация РТХ, осуществляемая методом обратного преобразования хвоста распределения.
Оставшиеся три проблемы остаются актуальными и требуют тщательного планирования имитационных экспериментов с фрактальными очередями. В статье выявляется ряд принципиальных отличий планирования таких экспериментов от планирования экспериментов с классическими очередями и выводятся математические соотношения, позволяющие корректно определять длительность (объем) экспериментов для достижения заданной точности результатов.
ментов X,, X, (зависит только от расстояния 5=|/ — между элементами X,, X,);
1 N-1 N
= N 2 2 г/ — «коэффициент последействия»
« >1 ¡=1+1
(выражает степень «прямого» влияния реализованных элементов выборки X1, X« на элементы ее продолжения).
Обозначая г, через г(в), где в = / — ¡|, выражение коэффициента Я« можно записать в виде
1 N-1 N 1 N-1
Я« = ^ 2 2 г, = ^ 2 N - (4)
1у,=1 ¡=1+1 1у в=1
где г(в) — коэффициент корреляции пары элементов выборки, отстоящих друг от друга на в шагов; (N—5) — число таких пар в выборке.
Учитывая, что |г(в)|<1 и Б^) ^ 0 , из (3) нетрудно вывести, что коэффициент (1+2Я^ повышения дисперсии лежит в пределах от 0 до N. Как правило, показатель X при моделировании очередей имеет такой конкретный смысл (как, например, среднее время Ш ожидания заявки), что все коэффициенты корреляции г(в) оказываются положительными, и, соответственно, коэффициент повышения дисперсии 1 +2RN принимает значение, большее единицы. Поэтому, согласно (3), корреляции элементов выборки приводят к увеличению дисперсии Б^) = ^2 и расширению доверительного интервала (по сравнению с независимыми X,), построенного по правилу трех сигм:
X = X ± 3s:
(5)
где s x =VDi) =s^(1 + 2Rn ) /VN,
s — среднеквадратичное отклонение (с. к. о.) элементов X,- выборки,
2
1=1
1=1
2
s
a
2
s
Оценки коэффициентов корреляции r (w i ,w i +s )
0
50
100
MM/1 загрузка 0.75
150
0.1
0.01
0 Эксперимент — Аппроксиматтия
R = 0.999
Оценки коэффициентов корреляции r (w i ,w i +s )
0
500
0.1
n no-71 <-t -0.000
y = 0.98712e R2 = 0.99998
M/M/1 загрузка 0.99
1000 1500
2000
—1 s
Рис. 1. Корреляция величин wt и w+s в системе M/M/1 в зависимости от s
+ 2Rn ) — коэффициент расширения доверительного интервала.
Расчет доверительных интервалов (5) при больших объемах N выборок значительно упрощается благодаря тому, что асимптотика коэффициентов последействия RN при расчете классических и фрактальных очередей не отличается разнообразием: для классических очередей она определяется асимптотически экспоненциальным убыванием коэффициентов корреляции r(s) с ростом s, для фрактальных очередей — асимптотически степенным убыванием r(s). Это позволяет по выборкам умеренного объема находить приближенные аналитические выражения, пригодные для построения доверительных интервалов как функций от N и, соответственно, планировать при последовательном прогоне [9] модели такую длину выборки, которая обеспечивает необходимую точность результатов.
3. Доверительные интервалы в расчетах классических очередей. В качестве примера построения доверительных интервалов при моделировании классических очередей рассмотрим расчет стационарного среднего времени ожидания W заявок в системе M/M/1 с интенсивностью входящего потока 1=1 при коэффициентах загрузки р = 0,75 и р = 0,99. _
Статистическую оценку r(s) коэффициента корреляции r(s) между временем wt ожидания i-й заявки и временем W+ ожидания ( i + s)-ïï заявки можно рассчитать по стационарной выборке w1, ..., wN достаточно большого объема N, применяя формулу
r(s) - ae
(7)
• = M(w,w,+) - M2(w) ( D (w) '
(6)
где M(w, w,.+s ) :
1
N - s
N-s
Z wwt+
' M(w)
: - Z W:
Nti '
D(w) = M(w2) - M2(w), M(w2) = — £ w2.
N i=1
Оценки r(s) коэффициентов корреляции r(s) = =r(wi,wi+s), рассчитанные по формуле (6) при длине прогона модели N = 10 млн заявок, показаны в виде графиков на построенном средствами Excel рис. 1. Слева показана зависимость r(s) при коэффициенте загрузки р = 0,75, справа — при р = 0,99.
В общем случае в классических системах коэффициенты корреляции r(s) между двумя сдвинутыми на s шагов элементами выборки w1, ..., wN описываются выражением
Отклонения функции г(в) от экспоненты (7) быстро уменьшаются с ростом в и на практике ими можно пренебречь. Учитывая (4) и (7), коэффициент последействия Ян можно выразить следующим образом:
I N -1 I N-1
RN = N Z(N - s)r(s) - N Z (N - s)ae-
s=1
N-1
- a f (N - s)e" N
Nb
-b(N-1)
-- 1 1 + e~bI N - 1 --1^-e
b
b
b
(8)
Для прогонов длины N=100 тыс. заявок и более при тех а, Ь, что представлены на рис. 1, можно использовать последнее (предельное) выражение из (8). Соответственно, при р = 0,75 получаем Я^»22 и доверительный интервал
W = W ± 3s/(1 + 2Rn ) / Vn = W ± -N • 6,7 ,
(9)
где ш и ст — выборочные оценки м.о. и с.к.о. времени ожидания заявки в стационарном режиме. Аналогично для р = 0,75 по формуле (8) находим, что при больших N коэффициент Я^8000 и доверительный интервал имеет вид
w = w 130 .
4N
(10)
Выражения (9) и (10) доверительных интервалов подтверждаются дополнительными проверками.
4. Доверительные интервалы в расчете фрактальных очередей. При расчете фрактальных систем с очередями коэффициенты г(в) корреляции элементов X обрабатываемых выборок являются асимптотически степенными функциями от в. Это приводит к существенному отличию методов планирования экспериментов с фрактальными очередями по сравнению со случаем классических систем, где соответствующая асимптотика экспоненциальная. На рис. 2 показан график функции г(в), рассчитанной путем ИМ системы Ра/Ра/1 в стационарном режиме ее функционирования, наступающем после прохождения через систему 40 млн заявок. В качестве показателя X выступал индикатор у.. отказа г-й заявки у.е {0, 1}, среднее значение У которого в стационар-
1
1
s
bs
bs
bs
a
b
e
i =1
Оценки коэффициентов корреляции г (ф ,цч )
100
1000
Ра/Ра/1 загрузка 0.5
10000
у = 1.80х
2
Я2 = 1.00
0.1
Рис. 2. Асимптотика коэффициентов корреляции г (б) между индикаторами отказа 1-й и (1+я)-й заявок в системе Ра/Ра/1 при а1=о2=1,1, К,=1, К2=0,5 и размере буфера ш=100
ном режиме равно искомой вероятности Р потери заявки. Длительность переходного процесса (ПП) определялась посредством достаточно большого числа независимых прогонов модели.
В общем случае при расчете любых показателей типа вероятности отказа, среднего времени ожидания и т.д. функция г(в) имеет при расчете фрактальных очередей следующий вид:
г(в) = 08
(11)
где о и Ь — некоторые константы, определяемые с помощью пробных прогонов модели (о>0 и 0<Ь<1).
Используя точную формулу (4) и асимптотическое представление (11), для доверительных интервалов находим:
= N ^ - *)Ф) = ^ ^'^ " 5)05
N
0 N - 1)1-Ь - 0
~ — Г N - 8)08=
N 1
1-Ь
1 - Ь N 2 - Ь
0 1 ^ - 1)2-Ь + 1
N 2 - Ь
1 - Ь 2 - Ь
N1
(12)
Поэтому, в соответствии с (5), доверительный интервал запишется в виде
Х=Х ± 3а(1+2М/2 ~ X ± За- CN ^/2, (13)
где константа С = (20
1 - Ь 2 - Ь
Как видим, величина полуинтервала убывает здесь медленнее, чем N -1/2 (поскольку Ь<1). Например, при расчете вероятности Р потери заявки в системе, характеризуемой рис. 2, параметр Ь в (13) равен 0,15 (см. уравнение линии тренда на рис. 2), и, следовательно, величина полуинтервала убывает пропорционально N -0 075. Иными словами, чтобы уменьшить погрешность (полуинтервал) в 10 раз, длину прогона N нужно увеличивать в 101/0 075»1013 раз.
Принципиальной при любом Ь здесь является следующая особенность погрешностей оценок: скорость уменьшения погрешностей с ростом N всегда
меньше, чем cN -1/2. В случае же классических очередей, как мы видели в разделе 3 статьи, корреляция элементов выборок приводит лишь к масштабному увеличению полуинтервала, но скорость его уменьшения с ростом N всегда остается равной cN -1/2, как в случае независимых испытаний.
Кроме того, параллельные прогоны позволяют решать такие актуальные для моделирования фрактальных очередей задачи, как определение длительности ПП и распознавание отсутствия стационарного режима функционирования у моделируемой системы.
5. Распознавание отсутствия сходимости оценок к конечным значениям. Последовательные прогоны при моделировании фрактальных очередей не только неэкономичны, но и могут приводить к ошибочным заключениям, даже при весьма значительной длине выполняемых прогонов. Так, например, на рис. 3 представлен хвост эмпирического распределения времени ожидания заявок в системе Ра/Ра/1 с параметрами распределения (1) у интервалов поступления заявок a1 = 1,1, К1 = 1 и параметрами распределения времени обслуживания a2=1,1, К2 = 0,1. В этой системе t = 11, х = 1,1, ее коэффициент загрузки г = = 0,1«1. Эмпирическое распределение, хвост которого представлен на рисунке, получено в последовательном прогоне модели по значениям времени обслуживания 100 млн заявок. Спрямление графика при логарифмическом масштабе по обеим осям координат, высокий коэффициент достоверности и значительная длина выборки приводят к выводу, что хвост является асимптотически степенным и что параметр a= 1,188 хвоста (равный показателю степени аппроксимирующего равнения на рис. 3 найден с достаточно высокой точностью. И что, поскольку a>1, распределение имеет конечное м.о., т.е. среднее время ожидания в моделируемой системе конечно.
В действительности это не так. Выполнив и обработав несколько довольно коротких прогонов, можно получить наглядную информацию (рис. 3, справа) о том, что среднее время обслуживания заявок сходится к бесконечности. На этом рисунке показана зависимость от номера I заявки времени ее обслуживания, усредненного по л=10 тыс. независимых реализаций процесса. Стационарный режим в системе существует, но за конечное время не достигается. График роста среднего времени обслуживания заявки имеет характерные скачки, обусловленные тяжелыми хвостами распределений Парето, задающих систему. При этом рост средней величины элемента выборки с ростом его номера имеет характерную логарифмическую скорость (логарифмическая линия тренда — гладкая кривая на рисунке).
6. Об эффективности метода АЯАЧП. Использование параллельных прогонов не обеспечит получения адекватных результатов моделирования фрактальных очередей, если не учитывать проблему корректной реализации РТХ [6]. При этом ошибочные результаты ИМ могут быть получены не только при a• 1, когда хвосты РТХ особенно «тяжелы», но и при at 2, когда эти хвосты наиболее «легки». Как показано в [10] теоретическими средствами, ИМ системы М/Ра/1 при at 2 будет при использовании обычных ГСЧ приводить к принципиально ошибочным результатам расчета стационарного среднего времени ожидания. Для исключения подобных ошибок рекомендуется использовать ГСЧ, построенные методом АКАИБ, который предложен в [8]. На рис. 4 приведен пример результатов ИМ системы М/Ра/1, подтверждающих данную рекомендацию.
Ь
N-1
N-1
Ь
й=1
й=1
0
0
1
1
Хвост распределения времени ожидания
0.001 -|-1-1 t
100 ч 1000 10000
0.0001
Pa/Pa/1
0.00001
y = 0.281x
R2 = 0.997
0.000001
1 - F (t)
Рис. 3. Результаты обработки данных последовательного прогона (слева) и параллельных прогонов модели Ра/Ра/1 при а1=а2=1,1, К=1, К2=0,1
M/Pa/1:
Результаты "наивного"
3.9 3.6 моделирования
---
3.3
3
0 1000000 2000000 3000000 4000000
Рис. 4. Результаты ИМ системы M/Pa/1 при t = 4, K=1, a=2
На рис. 4 слева каждая оценка получена усреднением значений случайной величины ш, полученных при данном конкретном г в большом числе независимых прогонов модели. Таким же образом получены оценки, представленные кривой на графике справа. Но результаты на левом рисунке получены при использовании обычного ГСЧ, а результаты на рисунке справа получены при использовании ГСЧ, построенного методом АКАИБ. Мы видим, что зависимость от г не сходится ни к какому конечному значению, кривая на правом рисунке имеет характерные для не сходящейся оценки скачки, которые приводят к росту оценки приблизительно с логарифмической скоростью (масштаб по оси абсцисс на этом рисунке логарифмический). Поскольку коэффициент загрузки системы р = 0,5<1, то стационарный процесс существует, а поскольку оценка растет как Ьп(г), мы приходим к правильному заключению, что стационарное среднее время ожидания в этой системе существует и равно бесконечности. Этот вывод согласуется с точным анализом системы М/Ра/1.
7. Выводы. Предложенные в статье методы организации последовательных и параллельных прогонов моделей при расчете систем с очередями позволяют свести расчет классических и фрактальных очередей к последовательности операций, типичных для расчетной практики применения классических методов вычислительной математики. Разработанный метод
построения доверительных интервалов на основе экспоненциальных аппроксимаций (для классических очередей) и степенных аппроксимаций (для фрактальных очередей) коэффициентов корреляции элементов выборок позволяет выбирать длину и число прогонов таким образом, чтобы обеспечивать заданную точность результатов за минимальное время.
Библиографический список
1. Leland, W. E., Taqqu, M. S., Willinger W., Wilson, D.V. On the Self-Similar Nature of Ethernet Traffic. IEEE/ACM TRANSACTIONS ON NETWORKING, VOL. 2, № 1, February 1994. - P. 1-15.
2. Crovella, M. E., Taqqu, M., Bestavros, A. Heavy Tailed-Probability distributions in the World Wide Web. - 5(6): 835-846, December, 1997.
3. Kleinrock, L. Queueing Systems: V. II - Computer Applications. - New York : Wiley Interscience, 1976. - 576 p.
4. Zwart, A. P. Queueing Systems with Heavy Tails. Eindhoven University of Technology, 2001. - 227 p.
5. Задорожный, В. Н. Основная задача фрактальной теории массового обслуживания / В. Н. Задорожный // Омский научный вестник. Сер. Приборы, машины и технологии. -2013. - № 3 (123). - С. 9-13.
6. Задорожный, В. Н. Проблемы генерации случайных величин с фрактальными распределениями // В. Н. Задорожный, О. И. Кутузов // Омский научный вестник. Сер. Приборы, машины и технологии. - 2012. - № 3 (113) - С. 20-24.
7. Zadorozhnyi, V. N. Cascade Method of Realization of Heavy-Tailed Distributions in Data Network Modelling. 2015 International Siberian conference on control and communications SIBCON, sec. Control of the Large-Scale Systems, Russia, Omsk, May 21—23, 2015.
8. Задорожный, В. Н. Особенности моделирования систем массового обслуживания с тяжелыми хвостами распределений на GPSS World. Метод ARAND / В. Н. Задорожный // Омский научный вестник. Сер. Приборы, машины и технологии. — 2015. - № 3 (143). - С. 307-311.
9. Клейнен, Дж. Статистические методы в имитационном моделировании : пер. с англ. / Под ред. Ю. П. Адлера и В. Н. Ва-рыгина. — М. : Статистика, 1978. — Вып. 1. — 221 с.
10. Zadorozhnyi, V. N. Fractal Queues Simulation Peculiarities. In Communications in Computer and Information Science, 2015. — P. 413-432.
ЗАДОРОЖНЫЙ Владимир Николаевич, доктор технических наук, доцент (Россия), профессор кафедры «Автоматизированные системы обработки информации и управления».
Адрес для переписки: [email protected]
ЗАХАРЕНКОВА Татьяна Романовна, аспирантка кафедры «Автоматизированные системы обработки информации и управления».
Адрес для переписки: ZakharenkovaTatiana@gmail.
Статья поступила в редакцию 18.03.2016 г. © В. Н. Задорожный, Т. Р. Захаренкова
com
УДК 519.2:004.421.5:004.7
А. М. ПУРТОВ
Институт математики им. С. Л. Соболева СО РАН, Омский филиал
ИМИТАЦИЯ СИСТЕМ УПРАВЛЕНИЯ ПОТОКАМИ АВТОМОБИЛЕЙ НА ПЕРЕКРЕСТКЕ
Описана концептуальная модель перекрестка. Разработан новый алгоритм управления потоками автомобилей на перекрестке, основанный на использовании эталонных состояний. Концептуальная модель запрограммирована на О^'^ Сделан сравнительный анализ четырех алгоритмов управления светофорами на перекрестке. Приведены результаты имитационных экспериментов.
Ключевые слова: перекресток, очереди автомобилей, концептуальная модель, имитационное моделирование, система управления светофорами, результаты экспериментов.
Работа выполнена по базовой теме: «Математические методы распознавания образов и прогнозирования» (№ 034-2014-2017, номер госрегистрации 01201351843).
Введение. В крупных городах развитие сети дорог обычно отстает от темпов роста количества автомобилей. Поэтому все более актуальны задачи разработки, использования методов и средств анализа транспортных сетей, алгоритмов управления потоками автомобилей. В течение нескольких лет автором статьи разрабатывается совокупность методов для анализа задержек на маршрутах города, объединяемая названием GisAuto [1]. В GisAuto предложена следующая последовательность этапов.
1. Построение геоинформационной (ГИС) модели задержек на основных маршрутах города.
Задержки происходят на перекрестках, светофорах, пешеходных переходах.
2. Построение на ГИС-карте графов исследуемых маршрутов.
3. Сбор данных о задержках.
На этом этапе могут быть использованы экспертные, расчетные оценки, результаты наблюдений, имитационного моделирования.
4. Анализ задержек на маршрутах математическими методами (метод свертывания графов с целью получения коэффициентов чувствительности, методы визуальной и автоматической таксономии с целью классификации задержек).
5. Раскраска задержек (вершин графа) на ГИС-карте в зависимости от их значимости.
6. Визуальный анализ полученных результатов, выявление задержек, оказывающих наибольшее влияние на время прохождения исследуемых маршрутов.
7. Микроанализ проблемных участков (дополнительные наблюдения, имитационное моделирование).
Для поддержки этапов 3 и 7 была разработана имитационная модель перекрестка [2]. Позднее выяснилось, что эта модель может быть использована автономно, например, для сравнительного анализа алгоритмов управления автомобилями на перекрестке. Алгоритмы, апробированные на модели перекрестка, можно адаптировать для принятия решений в других областях деятельности. Такая ситуация встречается часто. Например, шахматы используются как модель для работ в областях искусственного интеллекта, психологии, методов принятия решений и др. В статье приведены результаты сравнительного анализа четырех алгоритмов для систем управления светофорами (СУС) на перекрестке.
По алгоритму СУС1, наиболее популярному, светофоры переключаются через заданный интервал времени.