2005
НАУЧНЫЙ ВЕСТНИК МГТУ ГА серия Радиофизика и радиотехника
№ 87(5)
УДК 621.391
МЕТОДЫ ТЕОРИИ ПОСЛЕДОВАТЕЛЬНОГО ОЦЕНИВАНИЯ В ЗАДАЧАХ ИДЕНТИФИКАЦИИ ПАРАМЕТРОВ ДИСКРЕТНОЗНАЧНЫХ МАРКОВСКИХ МОДЕЛЕЙ
Д.М. Ненадович
Статья представлена доктором технических наук, профессором Шахтариным Б.И.
В статье представлены результаты разработки математической модели процесса функционирования телекоммуникационной системы в виде стохастических разностных уравнений состояния и наблюдения.
Предлагается алгоритм идентификации элементов матрицы одношаговых переходных вероятностей на основе методов теории последовательного оценивания.
Одной из характерных черт настоящего этапа научно-технического прогресса является резкое сокращение времени на разработку и внедрение новых информационных технологий. Большое количество разработчиков и производителей, активно функционирующих на рынке программно-аппаратных средств, создаваемых в интересах развития телекоммуникационных систем (ТКС), различие требований к номенклатуре и качеству предоставляемых услуг при ужесточающихся требованиях к увеличению степени взаимоувязанности ТКС глобального, регионального и локального значения делают актуальной задачу унификации алгоритмов управления функционированием ТКС.
Основной трудностью унификации алгоритмов управления ТКС на этапе математического моделирования процессов ее функционирования является сложность получения адекватных уравнений состояния и наблюдения. Широкое внедрение в ТКС цифровых средств обработки сигналов, коммутации, маршрутизации и т. д. в большинстве случаев приводит к «дискретизации» процессов, реально протекающих в ТКС, и влечет за собой необходимость «дискретизации» управляющих системой воздействий.
Первым примером практической реализации подхода к моделированию дискретных конечномерных процессов на основе марковской последовательности послужила работа [1]. В ней марковская последовательность с конечным числом состояний задавалась вектором вероятностей начального состояния и матрицей вероятностей перехода, в предположении о непрерывности времени течения процесса сформулированы уравнения состояния и наблюдения в виде системы дифференциалов, учет вводимых управлений произведен за счет изменения параметров вероятностно-временного механизма изменения состояния последовательности.
В работах [2,3] предпринята попытка корректного представления дискретных как по времени, так и по состояниям процессов, реально протекающих в ТКС, в виде стохастических разностных уравнений состояния и наблюдения.
Данный поход предполагает описание процесса функционирования ТКС в виде управляемой цепи Маркова с конечным числом (М) дискретных состояний (применительно к ТКС: количество пакетов информации, находящихся в системе обслуживания ТКС, количество свободных единиц ресурса и т.д.) и синтез следующих уравнений состояния и наблюдения [3]:
у, (к+1) - Ст. (к+1) 0у (к+1); 0у, (к+1)-ф1 (к+ 1,к,к)0у (к)+Г(к)Пу (к+1); (к+1) -Иу, (к,у, (к))0% (к +1)+<% (к + 1);
(1)
(2)
(3)
где Су. (к + 1) = [yi (0),...,у, (М)] - матрица-строка возможных значений состояния ТКС; 0у (к +1)- вектор вспомогательных индикаторов состояния ТКС (0у (к +1)= 1
при у,(к +1)= у,т(к +1); 0у (к +1)=0 в остальных случаях); Ну - М-мерная матрица наблюдения, содержащая известные функции наблюдения за процессом у, (к +1); ^ - вектор наблюдения за значением состояния ТКС; Ру (к+1)- вектор последовательностей шума возбуждения, являющийся ступенчатым мартингалом, компенсирующим нецелочисленную часть в уравнении
(2) (М кк)] =0, М |?Л (кт (к)]=1к); Г(к)= ёт§ \г^
2&в2Ртт / N } -матрица диффузий процесса изменения у, (к +1) , где: Т, ртт - период и интенсивность изменения состояния марковской цепи соответственно, ов, NP - ковариационная матрица и спектральная плотность мощности шума возбуждения соответственно; (йу - вектор непрерывнозначных гауссовских последовательностей шума наблюдения за процессом изменения у, (к +1) с М [<0у, (к)]=0, М [йу (к)Фу т (к)]=1, I
- единичная матрица; ^ - матрица одношаговых переходных вероятностей (ОПВ), учитывающая управляющие воздействия и(к) на вероятностно-временной механизм процесса изменения состояния сети у, (к +1) , характеризующего состояние ТКС.
При этом взаимосвязь индикаторов состояния ТКС определяется в соответствии с выражением:
т-1 М
0т (к) = 1 -10,(к) + 10, (к) , (4)
г-1 г=т+1
а уравнение состояния для любого т-го индикатора может быть представлено в виде:
М
0т (к + 1) = Ртт (к + 1 к, и) + £ (0, (к)(рт (к + 1 к, и) - РМт (к + 1 к, и)) + Гт (кК (к) (5)
,=0
где Рт (к +1, к,и) , т= 0,М - значения элементов матрицы ОПВ.
Необходимо отметить, что главным препятствием в реализации представленной модели в системе управления ТКС часто является отсутствие данных о значениях элементов матрицы ОПВ. Отсутствие необходимых данных приводит к необходимости реализации процедуры идентификации.
Алгоритм идентификации, предложенный в [4], позволяет решить задачу методами линейного программирования для частного случая двухмерной цепи Маркова. Рассмотрим возможность решения задачи методами последовательного оценивания с использованием положений теории систем массового обслуживания (СМО).
Представим ТКС в виде известной из теории СМО [5] модели сети типа М/М/и/К Под состоянием сети будем понимать количество информационных сообщений (ИС), находящихся на сетевом обслуживании (обрабатываемых, ожидающих в очереди). В этом случае множе-
ство возможных состояний процесса у, (процесса изменения количества ИС) будет иметь вид
М= { т }, т= 0,п + N. (6)
Далее, пользуясь методикой, изложенной в работе [5], найдем интенсивности перехода
процесса у (к) из одного состояния в другое:
а) 0 < т < и (выполняется одна фиктивная операция ожидания требования и т операций об-
служивания требований)
Рт1 = 1 при 1 = т + 1;
Рт1 = т т при 1 = т - 1; (7)
рт1 = 0 при |1 - т > 2 для 0 < т < и;
б) т = 0
Р01 = 1 при 1 = 1; Р01 = 0 при 1 > 2;
(8)
в) и < т < и + N
Рт1 = 1 при 1 = к +1;
рт1 = пт + (т - и) V при 1 = к - 1;
Рт1 = 0 при \т -1 > 2 ;
(9)
г) т = и + N
Рп^,1 = и т + Nv при I = и + N - 1;
р п=N ,1 = 0 при 1 < и + N - 1;
(10)
при начальном распределении вероятностей
Р(0; у;(0)) = 1 при т = 0 Р(0; у(0)) = 0 при т > 0 где 1, т , V - интенсивности поступления, обслуживания и потерь ИС соответственно.
Выразим матрицу ОПВ через интенсивности (Рт1, Ртт) перехода ТКС из состояния в состояние:
(рТ (к +1, к, и) = I + Т О1 (к +1, к, и);
М
где 0Т (к +1, k, и) = Рт1 (к +1, k, U), Ртт = - £ Рт1 .
(11)
Анализируя выражения (6) - (11), нетрудно видеть, что в рассматриваемом случае задача идентификации сводится к оценке значений 1, т, V.
В работе [6] показана эффективность реализации алгоритмов последовательного оценивания интенсивности процессов восстановления по наблюдениям за интервалами времени между событиями.
Рассмотрим задачу неусеченного последовательного оценивания интенсивности (например) обслуживания ИС т, по наблюдениям интервалов времени между событиями хп, и > 1, имеющими, в общем случае, гамма- распределения с плотностями
Роп ( Хп) = (т^”) хХп 1 ехр(-тХпХп) при Хп >0;
Г (Х )
п ( Хп) = 0 при Хп < 0;
где т,Хп >0; Г (•)- гамма функция (Мц(Хп) = 1/ т).
(12)
2=1
Тогда, в предположении о том, что априорное распределение m представляет собой гамма распределение с плотностью
ba
po(m) =^\ma~lexp(—bm) при m>0; (м)
Г (a)
Po = 0 при m < 0. (15)
и исходя из предположения о независимости наблюдений (xn), получаем, что апостериорное распределение m является (в общем случае) гамма-распределением с параметрами ~n =b + Xn, an =a+Xn:
~ an —1
Pn (ml Xn) = ” man—1exp(—~nm) при m>o; (16)
Г (a)
Pn(mlXn = o при m <0; (17)
n n
- где Xn = ^£x,, Xn = ££ .
i=1 i=1
В этом случае, выражение для оптимальной (в байесовском решении) оценки интенсивности обслуживания ИС m, для функции потерь вида
gn (m,mn)=m~p (m—m )2 + с (n), (18)
где (a + X > p > 0, n >1, С (n)- стоимость n-наблюдений), может быть представлено в виде:
fan (Xn)=(an — p)/~n . (19)
Основной проблемой реализации байесовской процедуры последовательного оценивания является нахождение оптимального правила остановки т°=т° (Xn), которое формально можно определить как [6]
t° (Sn) = min {n >1: R0n (Xxn) <M[Rn-n(X1n+1)|x{ ] }, (20)
где Rn - функция наименьшего апостериорного риска, удовлетворяющая следующему уравнению:
Rn (sn ) = min {R0 (Xn ),M[Rn+1 ([Xxn+1)|Xn ] }; (21)
Rn (sxn) - текущий апостериорный риск, определяемый из условия
Rn (s1n) = inf Rn (Xf, m )= mnf f gn Cm fin)p(m\ X1n )dm; (22)
mn€Jn mn€Un *
m
(здесь Jn - класс оценок, для которых MRn(Xxn)< ¥ ).
Вместе с тем, для выбранного типа модели СМО (М/М/n/N) было бы корректным рассмотрение экспоненциального распределения с плотностью:
Kn (m!Xn)=m exp(—Xnm). (23)
При этом выражения для априорного и апостериорного распределения принимают вид
Вс
Роп (Хп / т) =^т та 1 ехр(-тЬ); (24)
г(а)
/у-т а+п
ро(т/хп)=-гТп—г та+п—1ехр(—ВД; (25)
Г (а+п)
~ ~ п
где Тп = Тп +Ь, Тп = £ хх .
5=1
В этом случае нетрудно показать, что оценкой, минимизирующей (22) при квадратичной
функции потерь (18), является апостериорное среднее
т (~п) = (а + п)/Тп; (26)
а оптимальный момент остановки определяется выражением
т°м = тіп (Ы,тт[1<п<N1 Тп >Ап }; (27)
где Ап - порог, растущий с увеличением номера п. На (N-1) шаге
Аы-і = [(а+N—1)/а+N+1)сы ]1/2. (28)
Нахождение аналитических выражений для вычисления значений порога на каждом шаге при произвольных значениях а и N представляет собой достаточно сложную задачу [6], упростить которую в значительной степени можно в случае неусеченного последовательного оценивания и одинаковой стоимости всех шагов наблюдения.
Нетрудно показать, что, переходя к пределу выражения (28) N при С(п) = сп, опти-
мальная неусеченная процедура оценивания состоит в сравнении статистики Тп с постоянным порогом
А = (1/л/с ) - Ь (29)
и имеет вид
ип (Тп) = и» при Тп < А,
(30)
ип (Тп) = $п (Тп) при Тп > А.
Аналогичным образом могут быть получены оптимальные оценки параметров 1, V. Подставляя найденные значения в выражения (7) - (11), получаем значения элементов матрицы одношаговых вероятностей, определяющих вероятностно-временной механизм перехода ТКС из состояния в состояние при принятом управляющем воздействии и(к).
Открытыми остаются вопросы оптимизации (с учетом требований к допустимой погрешности управления): а) количества градаций переменных состояния; б) величины приращений переменных состояния; в) временного интервала дискретизации пространства состояний ТКС.
Однако, если известна допустимая погрешность значения критерия оптимальности А1 (к,у,,утр ,и) управляющего воздействия, соответствующая градация значения Ду, может быть определена (в общем случае) на основе функций чувствительности [8] из выражения:
M
Д1 (!, Уг , Утр ,и ) > , у,, Утр ,и)Ду , (31)
1=0
где р"(•) = д1] ( ) - коэффициент чувствительности 1- го порядка ]-й компоненты 1-го вектора дуг
состояний ТКС.
Зная допустимые градации Дуг, на основе теории экстраполяции случайных процессов [7] можно определить необходимые интервалы дискретизации
Дуг = Уг (!) - Уг (? )ехр(-1 г А! г), (32)
где I г - ширина спектра флуктуаций компонент вектора уг, У (!) - оценочное значение вектора уг на момент времени 1.
Кроме того, учитывая тип рассматриваемой нами модели системы массового обслуживания, интервал корреляции может быть определен из выражения [5]
К9 (!КОр) = 092е-(т+1)1, (33)
где о у 2= п1/и/(т + 1)2 - дисперсия процесса уг (т.е. на краях интервала корреляции значение функции корреляции будет стремиться к значению 1/е ).
Следует отметить, что при определении интервала дискретизации из выражений (31), (32) либо (33), с целью увеличения степени адекватности модели (1) - (3) значение интервала дискретизации необходимо выбирать много меньшим значения интервала корреляции
( Д!дискр << Д!кор X как правило Д!дискр » (0,01 ' 0,1 Д!кор ).
Таким образом, на основе реализации алгоритмов последовательного оценивания параметров процесса восстановления, может быть решена задача идентификации значений элементов матрицы одношаговых переходных вероятностей на этапе локальной стационарности. Ин-дентификация значений элементов матрицы ОПВ позволяет в значительной степени повысить степень адекватности математической модели процесса функционирования ТКС, представленной в виде стохастических разностных уравнений состояния и наблюдения.
Повышение степени адекватности математических моделей процессов изменения состояний ТКС позволит унифицировать алгоритмы управления функционированием современных мультисервисных, гетерогенных сетей на основе аппарата управляемых цепей Маркова.
ЛИТЕРАТУРА
1. Segall A. Optimal control of noise finit-stat Markov process. - IEEE. Trans. Automat. Contr., 1977, vol. 22, №2, p. 179-186.
2. Ненадович Д.М., Терентьев В.М. Аналитическое представление и пример реализации модели процесса изменения состояния управляемой информационной системы.// Ракетнокосмическая техника. Сер.3, Вып.4.- М,: ГОНТИ-6,1991.С. 82-89.
3. Ненадович Д.М. Унифицированная математическая модель процесса функционирова-
ния управляемой информационной системы.// Радиоэлектроника (Изв. высш. учеб. заведе-ний).1992. № 3.С. 64-67.
4. Ненадович Д.М., Терентьев В.М., Феоктистов С.В. Алгоритм идентификации переходных вероятностей управляемых дискретнозначных марковских последовательностей.// Радиоэлектроника (Изв. высш. учеб. заведений). 1991. № 11. С. 73-76.
5. Ивченко Г.И., Каштанов В.А., Коваленко И.Н. Теория массового обслуживания.- М.: Высшая школа, 1982.
6. Тартаковский А.Г. Последовательные методы в теории информационных систем. - М.: Радио и связь, 1991. Вып. 33.
7. Тихонов В.И., Кульман Н.К. Нелинейная фильтрация и квазикогерентный прием сигналов.
- М.: Советское радио, 1975.
8. Розенвассер Е.Н., Юсупов Р.М. Чувствительность систем управления. - М.: Наука, 1981.
METHODS THEORY OF SEQUENCES ESTIMATION IN TASKS OF IDENTIFICATION PARAMETERS
DISCRET-ZINE MARKOV'S PROCESSES
Nenadovich D.M.
Metods of theory afterimage estimate in the problems of indentification of parameters discrets Markovian models function poccesses of telecommunication systems.
Сведения об авторе
Ненадович Дмитрий Михайлович, 1961 г.р., окончил ЛВВИУС им. Ленсовета (1984), ВАС (1995), кандидат технических наук, старший научный сотрудник, автор более 40 научных работ, область научных интересов - управление телекоммуникационными системами.