ИНФОРМАТИКА, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И
ВЕСТН/КТОГУ 2310. № 4 (19)
УПРАВЛЕНИЕ
УДК 681.511.4
© Е. Л. Еремин, С. С. Охотников, Д. А. Теличенко, 2010
СИНТЕЗ РОБАСТНОГО КОНТРОЛЛЕРА ОЧЕРЕДИ AQM МАРШРУТИЗАТОРА
Еремин Е. Л. - д-р техн. наук, проф., проректор по научной работе и информатизации (ТОГУ), тел. (4212) 22-44-19, e-mail: [email protected]; Охотников С. С. - ст. преп. кафедры «Информационные и управляющие системы» (Амурский государственный университет), тел. (4162) 39-45-04, e-mail: [email protected]; Теличенко Д. А. - канд. техн. наук, доцент кафедры «Автоматизация производственных процессов и электротехники» (Амурский государственный университет), тел. (4162) 39-46-32, e-mail: [email protected]
На основе жидкостной модели TCP получена модель номинального объекта управления с запаздыванием - очереди AQM маршрутизатора. С использованием критерия гиперустойчивости В. М. Попова синтезирован робаст-ный алгоритм управления классом данных объектов в условиях априорной неопределенности.
Based on the fluid-flow TCP model the nominal time-delayed plant is presented. Using the Popov absolute criterion the robust control algorithm for class of uncertain objects is developed.
Ключевые слова: робастное управление, априорная неопределенность, запаздывание по управлению, критерий гиперустойчивости, управление сетевым затором, RED, AQM.
Введение
Широкое распространение приложений Интернет-телефонии, видеокон-ференцсвязи, распределенных вычислений вызывает неослабевающий интерес исследователей к проблеме мониторинга, управления и стабилизации параметров долгоживущих TCP потоков как задаче автоматического управления. [1]-[4]
Несмотря на дискретную природу процессов, происходящих в сетях с коммутацией пакетов, часть исследователей использует непрерывные модели, получившие название «жидкостных». В работах [5], [6], [9] на основе линеаризованных уравнений методами классической теории управления решаются в основном две задачи: 1) определение настроек RED (random early detection) [7], обеспечивающих в заданном диапазоне изменений сетевых параметров достаточные условия устойчивости долгоживущих TCP сессий; 2) синтез других законов управления очередью - PI, PID, FL-контроллера, и демонстрация преимуществ при глобальной замене ими алгоритма RED.
Решение первой задачи не всегда выполнимо в реальных условиях [4] в силу неточности линеаризованной модели. Практическая реализация реше-
ВЕСТНИКТОГУ 2010. № 4 (19)
ний второй задачи означает замену программного обеспечения (в том числе и закрытого) всех промежуточных маршрутизаторов сети, что возможно только в случае принятия предлагаемых механизмов в качестве промышленных стандартов.
Задачей данной работы является синтез робастного закона управления очередью локального маршрутизатора в условиях априорной неопределенности.
Модель объекта управления
На рис. 1 представлена простая, но несколько более реалистичная по сравнению с рассмотренными в [5], [6] схема прохождения N долгоживу-щих TCP сессий от источника S к локальным клиентам через две очереди: 1) очередь маршрутизатора провайдера qj(t) (пакетов) с дисциплиной обслуживания RED и 2) очередь локального маршрутизатора q2(t) (пакетов) с алгоритмом обслуживания, подлежащим определению.
Настройки RED маршрутизатора провайдера фиксированы, неизвестны и декларируют ограничение агрегированной пропускной способности очереди величиной C1 (пакетов в секунду). Также через RED маршрутизатор в сторону локальной сети поступает не поддерживающий ECN (explicit congestion notification) [8] трафик интенсивности F(t) (пакетов в секунду), который не маркируется, а частично удаляется механизмом RED. Полная его фильтрация осуществляется только на граничном маршрутизаторе локальной сети. После фильтрации не-ECN трафика ECN пакеты попадают в очередь q2 (t) , которая ограничивает отправляемый в локальную сеть трафик скоростью C2 < Cj пакетов в секунду.
Рис. 1. Прохождение N TCP / ECN сессий через две очереди
Система уравнений работы [6] для рассматриваемого случая записываются в виде:
dq2(t) = NW0 _C
dt dqj (t) dt
= N
R(t)
w (t)
R(t)
+ F(t)(1 _ pj(t)) _ C^
(1) (2)
СИНТЕЗ РОБАСТНОГО КОНТРОЛЛЕРА -
ОЧЕРЕДИ AQM МАРШРУТИЗАТОРА ВБСТНШОГУ. ZM № 4 (19)
^ = -auC1(q1(t) - qx(t)), (3)
dt
dW(t) _ 1 W(t)W(t - R(t))
[ A(t - R(t )) + p2(t - R(t )) -
dt R(t ) 2 R(t - R(t )) 1 2 (4)
- pi(t - R(t )) p2(t - R(t ))], здесь индекс при переменных и константах определяет принадлежность очереди.
Уравнение (1) идентично [6] и определяет динамику очереди 2. Уравнение (2) содержит дополнительный член, учитывающий баланс прибытия в очередь 1 и явного удаления не-ECN пакета. Уравнение (3) идентично работе [6] и описывает низкочастотный фильтр RED, где постоянная ссп > 0 является настроечным параметром очереди маршрутизатора. Уравнение (4) описывает динамику TCP сессий, Wi (t ) (пакетов) - ожидаемый размер окна TCP, R(t ) (секунд) - время возврата подтверждения выражается, как:
R(t) _ D + q1(t)/C1 + q2(t)/C2, D > 0, (5)
где D (секунд) - транспортная задержка, постоянная для всех сессий в силу их идентичности. Задержка передачи пакетов между двумя маршрутизаторами считается пренебрежимо малой по сравнению с D . В отличие от [6], вероятность p(t ) маркировки / удаления пакета зависит от двух независимых событий: маркировки / удаления в очереди 1 и / или очереди 2, и выражена через вероятности этих событий, как:
p(t) _ pi (t) + p2(t) -pi(t)p2(t). (6) Так как дисциплиной обслуживания первой очереди является RED, то:
(О ~i(t) < qi,
pi (t ) _
ki(qi(t)-q1) q1 <~i(t)<qi , ki _ pJiqi-q^ (7)
1 4i(t) ^ q ,
где p1, q q1 - настроечные параметры маршрутизатора, именующиеся
в терминах RED соответственно Pmax, MinTh, MaxTh [5].
Получим выражения для точки равновесия системы с тем, чтобы проанализировать область применимости линеаризованной модели. Аналогично [6]
определим [q2 (t), q1 (t), ~ (t), W (t )]T как вектор состояния, p2 (t) как вход и q2(t) как выход. Найдем равновесные значения параметров сети и вектора состояния, соответствующие постоянному значению выхода q20 путем приравнивания левых частей уравнений (1)-(4) нулю. С учетом (5)-(7) получаем:
Ао = 1 " (C1 " C2)/~10 = q1 + pW/k1, qW =
Ro = D + qw/C + q20 /C2, W0 = C2R0 /N, p0 = 2/W2, (8)
p20 = (p0 " p10)/(1 " Plo),
где ноль, приписанный к индексу, означает равновесное значение параметра либо переменной. Из полученных соотношений нетрудно получить выраже-
ВЕСТНИКТОГУ 2010. № 4 (19)
ние, связывающее диапазон допустимых N с остальными параметрами сети: N g [1, 0.5С2Rjp0 ]. Для типичных значений [6]: C2 = 103, R0 = 0.15, p0 = 0.1 получаем ограничение N g [1, 33]. Таким образом, применимость линеаризованной модели для практически важных случаев высоконагружен-ных каналов с низкой пропускной способностью лимитирована числом рассматриваемых TCP сессий. С другой стороны, зафиксировав малое N, мы не сможем использовать линеаризованную модель для часто встречающихся случаев значительных транспортных задержек.
Следующее практическое ограничение связано с диапазоном допустимых значений интенсивности не-ECN трафика. Действительно, мы ограничиваем выбор рабочей точки p10 в соответствии с первым соотношением (8), в которое входит априорно неопределенная величина F0. Пусть f0 = F0 / C1 - доля интенсивности не-ECN трафика, а с0 = 1 - C2 / C1 - доля полосы пропускания, предусмотренная для него. Очевидно, определяя область допустимых значений p10 g [0, Pj), где p1 « 0.1 - настройка RED по умолчанию [9], получаем f0 g с0[1, 0.9-1]. Последнее означает, что применимость линейной модели ограничена вариацией неизвестной величины f0 в пределах
± 5% от ожидаемой - условие на практике редко выполнимое.
Таким образом, в условиях априорной неопределенности возможность применения линеаризованной модели для случая двух и более маршрутизаторов весьма ограничена, что стимулирует использование более реалистичной модели, содержащей как линейную, так и нелинейную составляющие.
Приближенная модель объекта управления
Для упрощения системы (1)-(7) сделаем обычные [6], [9] допущения:
1. Режим функционирования RED для очереди 1 является «рабочим» и определяется вторым условием выражения (7);
2. Доля не-ECN трафика постоянна и C2 выбирается с учетом запаса пропускных способностей очередей 1 и 2: F(t) « F0, C1 > C2, C2 + F0 > C1;
3. Для последнего уравнения системы используется приближение постоянного запаздывания: 3(t - R(t)) « 3(t -г), 3 g {W, p1, p2} .
Выполним нелинейную неособую в силу (5) замену переменных системы
(1)-(4):
Х1 (t ) = q2 (t ), Х2 (t ) = q, (t ) - «2, X3 (t ) = A (t ) - «3, *4 (t ) = W (t ) / R(t ) - a4, (9) где a4 = C2/N, a3 = (C2 -C1 + F0)/F0, a2 = q1 + a3 /k1.
Учитывая (1)-(7) и сформулированные выше допущения, введем для краткости обозначения X = {x.} , xi = xi (t), i = 1..4, x = {Xj } ,
Xj = Xj (t -г), j = 3,4, выполнив замену u (t -г) = 1 - p2(t - г), после несложных преобразований получим:
СИНТЕЗ РОБАСТНОГО КОНТРОЛЛЕРА -
ОЧЕРЕДИ AQM МАРШРУТИЗАТОРА ВБСТНШОГУ. 2Ш № 4 (19)
dx1 dt
= ^ 4
йг
= - F0 х3 + Ых4.
йх3
йг
— k 1СС1 1 х 2 1 ^С] х з
йх
— - ^ х4 - ^ х4 + йг 2 4 2 4
^ а2 _
-^(1 - а3) + /( х, х) и (г -т) + у( х, х)
(10)
причем все нелинейные члены сосредоточены в четвертом уравнении.
Далее, аналогично [6], будем считать переменную х4 «медленной» по
сравнению с управлением и , что дает х4 « х4 и окончательную запись разомкнутой системы в пространстве состояний в виде: йх(г)
йг
А =
= Ах(г)+В(Ъ + /( х, х ))и(г - т)+в у (х), у(г) = С х(г)
о о
0
- F
1 п
о kl 1С1 1 С1
0 0 о
N N
о
- а 4
в = [о о о 1]т, Ст = [1 о о о],
а
у( х) =
1 ((1 1
Ъ = ^(1 - аз),
/ (х, х) = ^ ((1 - х3 - а3)(х4 + 2а4х4 ) - а4 х3
(11)
(12)
(13)
1 /- 2 2 \ х4 + а 4
--2(х2 + а2) + 4 4
Ых4 - F0 х3 + Ых 4
С1
С 2
(14)
(15)
R \хх, х2) R(x1, х2)
R( х1, х2) = D + (х2 + а2) / С1 + х1 / С2.
Отметим, что в приведенных уравнениях в силу допущения 2 коэффициенты а^ > 0, i = 2..3 . Также выполняется условие строгой положительности Ъ. В случае ограниченных нелинейностей, как это следует из постановки задачи, далее будем решать задачу слежения выхода априорно неопределенного нелинейного объекта с запаздыванием по управлению (11)-( 15) за эталонным сигналом.
Постановка и решение задачи
Без ограничения общности будем считать, что модель объекта управления задана уравнением (11), в котором матрица А записана во фробениусо-вой управляемой форме с последней вектор-строкой ат , а Ст = =[с1 с2 0 0], В = Ът = [о 0 0 1]т , Ъ = 1, /(х,х) </0,
|у(х)| <у0, строго положительные величины а4, т, /о, У0 полагаются известными. Также известны а[ >\tti|, i = 1..4 .
Решается задача слежения выхода объекта управления (11) за скалярным
выходом эталона ¿т (г) : = Атхт 0) + ЪтГ(4X ¿т 0) = £ хт 0) ,
йг
(16)
ВЕСТНИКТОГУ 2010. № 4 (19)
здесь r(t) - ограниченное скалярное задающее воздействие 0 < |r(t) | < r0, r0 известно. Гурвицева матрица Am с последней вектор-строкой a J и вектор
gT задаются таким образом, чтобы для передаточной функции эталонной модели выполнялось:
W (s) = gT (SE - Am) + bm = a0(s + ap)^1 = a0 (17)
- , ... „ . ч - . 4n _ , ( )
det(sE - Am ) (s + a0) s + a0 где s - комплексная частота, (•) + - присоединенная матрица, a0 > 0 . Для
компенсации запаздывания используется упредитель - компенсатор вида [13]:
= AmXk (t) + bm (u(t) - u(t - r)), Zk (t) = gTXk (t), (18)
at
где zk (t) - скалярный выход.
Для восстановления неизмеряемого вектора состояния объекта управления по его выходу аналогично [10] используется стационарный наблюдатель полного порядка вида:
= A*xH (t) + bmU(t) + My(t), (19)
at
Ун (t) = LXh (t), Ун (t) = g% (t), где xH (t) - измеряемый вектор состояния наблюдателя, нормированный, для согласования коэффициентов усиления передаточных функций эталонной модели и наблюдателя на нулевой частоте, величиной K = — gT A* -M; yH (t) - обобщенный скалярный выход наблюдателя, а вектор М выбирается таким образом, чтобы собственные значения матрицы A* = (Am - MLT) располагались существенно левее точки (-a0,0) на комплексной плоскости. Это обеспечивает быстрый темп стабилизации невязки между истинным и восстановленным векторами состояния и, следовательно, их асимптотическую близость. В этом случае цель управления может быть сформулирована относительно измеряемых выходов наблюдателя (19), эталона (16) и компенсатора (18):
limlzm (t) - yH (t) - zk (t)| <S2 = const, (20)
где S2 достаточно мала. Для реализации целевого условия требуется найти закон управления u(t), явный вид которого определяется только известными в постановке задачи числовыми значениями. В соответствии с методикой [14] синтез закона управления на основе критерия гиперустойчивости производится в четыре этапа.
Во-первых, получим эквивалентное описание модели, выделив ЛСЧ и нелинейную часть замкнутой системы управления. Запишем уравнения для ошибки слежения s (t) = xm (t) - xH (t) - xk (t) :
СИНТЕЗ РОБАСТНОГО КОНТРОЛЛЕРА -
ОЧЕРЕДИ AQM МАРШРУТИЗАТОРА ВЕСТНИКТОГу. 2MQ № 4 (19)
^ = AmS(t) + bmMt), at
Д(0 = r(t) - u(t) - /(x) - aTxH (t) - J?(x, x)u(t - r), (21)
~ v(t) = gTs(t) = gT (xm(t) - xh (t) - xk(t)), где a~T = aT -aTm , а ^(t) и v(t)- скалярное модифицированное управление и обобщенный выход. Из постановки задачи известны a0i >|с~г-1, i = 1..4.
Во-вторых, условие строгой положительной определенности ЛСЧ системы (21) выполняется в силу (17). В третьих, докажем выполнимость для нелинейной части системы (21) интегрального неравенства В. М. Попова (ИНП):
t
1(0, t) = - J fi(s)v (s)ds > -g02 = const, Vt > 0 . (22)
0
С учетом явного вида выражений (21), обозначив для краткости \ = v (t), запишем модифицированное ИНП вида:
t
1(0, t) = - J [fi(£)r (s) - Q2(\u(s) - Q3(£)r(s) - (23)
0
- Q4 (\)atxh (s) - Q5 (\)J(s)u(s - r)\ds > -g02, где Qi(\ ) - произвольные положительно либо неотрицательно определенные функции своего аргумента, причем во втором случае Qi(£) = 0 тогда, и только тогда, когда ) = 0, I = 1,..,5. В работе [10] показано, что из выполнения видоизмененного такими весовыми функциями ИНП (23) следует выполнение
оценки (22). Положим Q ()) = Q3 ()) = Q4 ()) = Q5 ()) = Q2 ()) = 1 и запишем (23) в виде:
t
1(0, t) = - J[r(s)\)\) ± Г0 )2 - u(s)£ - y(s)\)\) ± / )) - (24)
0
-aTxH (s)\)\) ±al\xH (s)|) - JJ(s)u(s - h)£\) ±J0 \u(s-r)|)\2]ds.
Опустив комбинации слагаемых, дающих неотрицательные величины, получим оценку:
t
1(0, t) > - J[-u(s) + \(Г0 + / +aT0\xH (s)| + J u(s -r)|)]\ds . (25)
0
Приравняв к нулю выражение в квадратных скобках, получим, с одной стороны, выполнения условий (23) и (22), а с другой стороны - явный вид закона управления:
u(t) = (Zm (t) - Ун (t) - Zk (t))(r, + /0 + aT0 \xh (t)| + J |u(t - r)|), (26) содержащий только известные и измеряемые величины.
В четвертых, покажем выполнимость целевого условия (20). Так как полученный закон управления обеспечивает выполнимость ИНП (22), а линейная стационарная часть эквивалентной системы (21), с учетом (17), устой-
ВЕСТНИКТОГУ 2010. № 4 (19)
чива, то исходная замкнутая система (21), (26) гиперустойчива, и для нее выполнимо условие (20). Что и требовалось показать.
Таким образом синтезирован робастный закон управления, использующий известные оценки априорно неопределенных параметров объекта управления.
Рис. 2. Стабилизация скорости передачи данных на локальном маршрутизаторе при увеличении интенсивности не-ECN трафика: 1 - с контроллером RED, 2 - с контроллером очереди (26)
3500
Рис. 3. Стабилизация скорости передачи данных на локальном маршрутизаторе при равномерном уменьшении доступной полосы пропускания: 1 - с контроллером очереди RED, 2 - с контроллером очереди (26)
Численное моделирование
Для проверки работоспособности полученного алгоритма было проведено моделирование в среде SIMULINK. Параметры сети и настройки RED были аналогичны тем, что использовались в работах [6], [9]. Во всех экспериментах очередь 1 обслуживалась контроллером RED, транспортная задержка составляла 0.24 секунды, количество долгоживущих TCP / ECN потоков N = 60 . В двух сериях экспериментов решалась задача стабилизации выхода системы (1)-(4) в случаях: 1) ступенчатого увеличения в два раза ин-
СИНТЕЗ РОБАСТНОГО КОНТРОЛЛЕРА ОЧЕРЕДИ AQM МАРШРУТИЗАТОРА
ВЕСТНИКТОУ 2310. № 4 (19)
тенсивности не-ECN трафика в момент времени t =100 сек.; 2) линейного во времени уменьшения полосы пропускания маршрутизатора провайдера. В первой серии управление локальной очередью осуществлялось контроллером RED вида (3), (7), во второй серии использовался закон (26).
Из представленных рисунков можно заключить, что синтезированный алгоритм управления обеспечивает лучшее, по сравнению с RED, качество управления очередью локального маршрутизатора при решении задач стабилизации в условиях неопределенности параметров сети.
Заключение
Рассмотрено решение задачи синтеза робастного закона управления нелинейным объектом с запаздыванием, модель которого описывает динамику долгоживущих TCP сессий, локальной очереди и очереди внешнего RED маршрутизатора в условиях априорной неопределенности. Основным отличием данного исследования от подобных работ [5]-[6], [9] является: 1) учет нелинейности модели, что значительно расширяет обоснованную область применимости полученного закона управления по сравнению с линейными моделями; 2) использование полученного алгоритма для управления и стабилизации сетевых параметров только в пределах локальной сети, что, тем не менее, может обеспечивать глобальную стабильность параметров транспортного протокола от источника до получателя; 3) одновременное решение задачи наблюдения за недоступными измерению параметрами удаленной сети, актуальной для мониторинга состояния сети и выявления различного рода сетевых аномалий.
Работа выполнена в рамках АВЦП «Развитие научного потенциала высшей школы (2009-2010 гг.)», проект 2.1.2/373.
Библиографические ссылки
1. Firoiu V., Borden M. A Study of Active Queue Management for Congestion Control // Proceedings of IEEE/INFOCOM, 2000.
2. Key P., McAuley D., Barham P., Laevens K. Congestion pricing for congestion avoidance // Microsoft Research report MSR-TR-99.
3. Geoff Huston, The Future for TCP // The Internet Protocol Journal, Vol. 3, No. 3, September 2000.
4. Kelly F. P. Models for a self-managed Internet // Phil. Trans. R. Soc. Lond. -2000. A358.
5. Misra V., Wei-Bo Gong, Towsley D. Fluid-based Analysis of a Network of AQM Routers Supporting TCP Flows with an Application to RED //Proceedings of ACM/SIGCOMM, 2000.
6. Hollot C.V., Misra V., Towsley D., Wei-Bo Gong. A control theoretic analysys of RED // IEEE INFOCOMM, 2001.
7. Floyd S., Jacobson V. Random Early Detection gateways for congestion avoidance // IEEE /ACM Transactions on Networking. - 1997. - Vol. 1, No. 4.
8. Kunniyur SSrikant R. A Time Scale Decomposition Approach to Adaptive ECN Marking // Proceedings of IEEE / INFOCOM, 2001.
9. Hollot C. V., Misra V., Towsley D., Wei-Bo Gong. Analysis and Design of Controllers for AQM Routers Supporting TCP Flows // IEEE Transactions on authomatic control. - 2002. - Vol. 47, No. 6.
ВЕСТНИКТОГУ 2010. № 4 (19)
10. Еремин Е. Л., Кван Н. В., Семичевская Н. П. Робастное управление нелинейным объектом со стационарным наблюдателем и быстродействующей эталонной моделью // Информатика и системы управления. - 2008. - № 4 (18). - С. 122-130.
11. Еремин Е. Л., Теличенко Д. А., Чепак Л. В. Адаптивная периодическая система для объекта с запаздыванием по управлению // Информатика и системы управления. - 2008. - № 1 (15). - С. 169-178.
12. Попов В. М. Гиперустойчивость автоматических систем / М.: Наука, 1970.
13. Еремин Е. Л., Теличенко Д. А., Чепак Л. В. Синтез адаптивных систем для скалярных объектов с запаздыванием по управлению / Благовещенск: Изд-во АмГУ, 2006.
14. Еремин Е. Л. Гиперустойчивость системы управления нелинейным объектом с запаздыванием // Автоматизация технологических процессов. - Фрунзе: Фрунз. политех. ин-т, 1987. - С. 89-95.
15. Еремин Е. Л., Охотников С. С., Теличенко Д. А. Робастная система со стационарным наблюдателем и быстродействующей эталонной моделью для нелинейных объектов с запаздыванием по управлению // Вестник Тихоокеанского государственного университета. 2010. - № 2 (17).