ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2015 Управление, вычислительная техника и информатика № 3 (32)
ОБРАБОТКА ИНФОРМАЦИИ
УДК 519.21
DOI 10.17223/19988605/32/1
Д.В. Березин, Л.А. Нежельская
ОПТИМАЛЬНОЕ ОЦЕНИВАНИЕ СОСТОЯНИЙ МОДУЛИРОВАННОГО MAP-ПОТОКА СОБЫТИЙ ПРИ ЕГО НЕПОЛНОЙ НАБЛЮДАЕМОСТИ
Выведены явные выражения для апостериорных вероятностей состояний модулированного MAP-потока событий, учитывающие эффект непродлевающегося мертвого времени. Разработан алгоритм оптимального оценивания состояний модулированного MAP-потока событий. Проведены статистические эксперименты для установления качества оценивания, получены и проанализированы численные результаты.
Ключевые слова: модулированный MAP-поток событий; оптимальное оценивание состояний; метод максимума апостериорной вероятности; непродлевающееся мертвое время.
Интенсивное развитие компьютерной техники и информационных технологий послужило стимулом к созданию важной сферы приложений теории массового обслуживания - проектирования и создания информационно-вычислительных сетей, компьютерных сетей связи, спутниковых сетей, телекоммуникационных сетей и т.п. Интенсивность входящих потоков событий в системах и сетях массового обслуживания меняется со временем, как правило, случайно, что приводит к рассмотрению математических моделей дважды стохастических потоков событий. Дважды стохастические потоки можно разделить на два класса: к первому классу относятся потоки, интенсивность которых есть непрерывный случайный процесс [1]; ко второму классу относятся потоки с интенсивностью, представляющей собой кусочно-постоянный случайный процесс с конечным числом состояний [2-5]. Отметим, что MAP-потоки событий относятся ко второму классу дважды стохастических потоков и наиболее характерны для реальных телекоммуникационных сетей [6].
При исследовании потоков событий можно выделить два класса задач: 1) оценивание состояний потока событий [7-9]; 2) оценивание параметров потока [10-15].
В настоящей статье приведены аналитические и численные результаты оптимального оценивания состояний модулированного MAP-потока. Предлагается алгоритм оптимального оценивания состояний, когда решение о состоянии потока выносится по критерию максимума апостериорной вероятности, представляющей наиболее полную характеристику состояния потока, которую можно получить, располагая только выборкой наблюдений. Сам критерий минимизирует полную вероятность ошибки вынесения решения. Для получения численных результатов оценивания была построена имитационная модель потока, с помощью которой проведен ряд статистических экспериментов.
1. Постановка задачи
Рассматривается модулированный MAP-поток событий с интенсивностью, представляющей собой кусочно-постоянный стационарный случайный процесс A,(t) с двумя состояниями: X(t) = Xi и X(t) = X2 (X1 > X1 > 0). Длительность пребывания процесса X(t) в i-м состоянии, i = 1,2, определяется двумя случайными величинами: первая случайная величина распределена по экспоненциальному закону FJ(r> = 1 - e~а‘*, i = 1,2; в момент окончания i-го состояния процесс X(t) переходит с вероятностью единица из i-го состояния в j-е, i, j = 1,2 (i Ф j); вторая случайная величина распределена по экспоненциаль-
4
ному закону F/2) = 1 - e—kit, i = 1,2; в момент окончания /-го состояния процесс k(t) переходит с вероятностью P\ (kj | ki) в j-е состояние (/ Ф j) с наступлением события, либо с вероятностью P0 (kj | ki) переходит в j-е состояние (/ Ф j) без наступления события, либо с вероятностью P\ (ki | ki) остается в i-м состоянии с наступлением события (P\ (kj | ki) + P0 (kj | ki) + P\ (ki | ki) = 1, i, j = 1,2, i Ф j).
Первая и вторая случайные величины являются независимыми друг от друга. В сделанных предположениях k(t) — марковский процесс.
Блочная матрица инфинитезимальных характеристик процесса k(t) при этом примет вид
D =
(a! +k1) ^ +k1Po (k2 | k1)
а 2 +k 2P0 (k1 | k 2 ) — (a 2 + k2 )
k1P1 (k1 | k1) k1P1 (k 2 | k1) k 2 P1 (k1 | k 2 ) k 2 P1 (k 2 | k 2 )
= 1 Do | A||.
Элементами матрицы D1 являются интенсивности переходов процесса k(t) из состояния в состояние с наступлением события. Недиагональные элементы матрицы D0 — интенсивности переходов из состояния в состояние без наступления события. Диагональные элементы матрицы D0 — интенсивности выхода процесса k(t) из своих состояний, взятые с противоположным знаком. Отметим, что если P0 (k2 | k1) = P0 (k1 | k2) = 0, то имеет место модулированный синхронный поток событий [16].
После каждого зарегистрированного в момент времени tk события наступает время фиксированной длительности Tdead (мертвое время), в течение которого другие события исходного модулированного MAP-потока недоступны наблюдению. По окончании мертвого времени первое наступившее событие снова создает период мертвого времени длительности Tdead и т.д. Пример возникающей ситуации приведен на рис. 1, где 1 и 2 — состояния процесса k(t), tbt2... — моменты наступления событий в наблюдаемом потоке; пунктиром обозначены длительности мертвого времени; черными кружками обозначены события модулированного MAP-потока, недоступные наблюдению.
P1(k1|k1)
P1(k1|k1)
а1
к к l ;
а2 : 5
<г«ч ! А
f P1(k2|k2) ^ 1 P1(k2|k2) ; < ,г
Процесс k(t)
Модулированный МАР-йоток событий
| | ■
-----------------Q--------0-С>
I I
I I
Схема создания мертвого времени '
-ф" ■■■♦■О
Наблюдаемый потом событий
I
----------------6-------
-о
t4
1
2
t
t
t
Рис. 1. Формирование наблюдаемого потока событий
Так как процесс k(t) принципиально ненаблюдаем (скрытый марковский процесс), а наблюдаемыми являются только временные моменты наступления событий потока tbt2..., то необходимо по этим наблюдениям оценить состояние процесса k(t) (или модулированного MAP-потока) в момент окончания наблюдения.
Рассматривается стационарный режим функционирования потока событий, поэтому переходными процессами на интервале наблюдения (t0, t), где t0 — момент начала наблюдений, t — момент вынесения решения о состоянии процесса k(t), пренебрегаем. Тогда без потери общности можно положить t0 = 0. Для вынесения решения о состоянии процесса k(t) в момент времени t необходимо определить апосте-
5
риорные вероятности w(A,;| t) = w^ t1,.,tm,t), i = 1,2, того, что в момент времени t значение процесса X(t) = Xi (m — количество наблюденных событий за время t), при этом w(X1 t) + w(X2| t) = 1. Решение о состоянии процесса X(t) выносится путем сравнения вероятностей: если w^ t) > w(Xj| t), i, j = 1,2, i Ф j, то оценка состояния X (t) = Xi, иначе X (t) = Xj.
2. Алгоритм оптимального оценивания состояний модулированного MAP-потока событий
Рассмотрим интервал (tk, tk+1), k = 1,2,., между соседними событиями рассматриваемого потока. Момент вынесения решения t будет принадлежать этому интервалу. При этом для начального интервала (to, t1) момент t будет лежать между моментом начала наблюдения t0 и моментом наступления первого события потока. Значение длительности интервала (tk, tk+1) есть тк = tk+1 - tk, k = 1,2,. . С другой стороны, так как наблюдаемое в момент tk событие порождает период мертвого времени длительности T, то Tk = T + nk, где pk - значение длительности интервала между моментом окончания периода мертвого времени tk + Tdead и моментом tk+1, т.е. интервал (tk, tk+1) разбивается на два смежных: первый полуинтервал (tk, tk + Tdead], второй - интервал (tk + Tdead, tk+1). Подчеркнем, что условия нахождения апостериорной вероятности w(X1 t) на полуинтервале (tk, tk + Tdead] и интервале (tk + Tdead, tk+1) принципиально разные. Кроме того, для нахождения вероятности w(X1|t) необходимо точно знать значение Tdead либо, по крайней мере, предварительно осуществить оценку Tdead. В противном случае отсутствие такой информации делает попытку строгого нахождения вероятности w(X1| t) невозможной. Здесь предполагается, что значение Tdead известно точно.
2.1. Выражения для апостериорной вероятности при отсутствии мертвого времени
Рассмотрим ситуацию, когда T = 0, т.е. мертвое время отсутствует. Для вывода формул апостериорной вероятности w(X1| t) воспользуемся At-методом.
Лемма 1. На временных интервалах (t0, t1) и (tk, tk+1), k = 1,2,., апостериорная вероятность w(X1| t) удовлетворяет дифференциальному уравнению
W (X1 | t) = [X1 — X2 — X^Po (X2 | X1) + X2P0 (X1 | X2 )]w (X1 | t) —
-[a1 '
-aa
'X1 X 2 + 2X 2 P0 (X1 | X 2 )]w(X1 | t ) + a 2 + X 2 P0 (X1 | X 2 ) ;
(1)
t0 < t < t1 , tk < t < t
k+1
k = 1,2,
Лемма 2. Апостериорная вероятность w(X1| t) в момент tk, k = 1,2,., наступления события модулированного MAP-потока определяется формулой пересчета
X2P1(X1 \ X2) + [X1P1(X1 \ X1) —X2P1(X1 \ X2)]w(X1 \ tk — 0)_
w(X1| tk + 0) =
(2)
X2 [1 — P0 (X1 | X2 )] + [X1 — X2 — X1P0 (X2 | X1 ) + X2P0 (X1 | X2 )]w(X1 | tk — 0)
Замечание. В точке tk вероятность w(X1| t) претерпевает разрыв (имеет место конечный скачок). Вероятность w(X1| tk + 0) зависит от значения w(X1| tk — 0), где w(X1| tk — 0) — значение вероятности w(X1| t) в момент времени tk, когда w(X1| t), определяемая в (1), изменяется на интервале (tk—1, tk), соседнем с интервалом (tk, tk+1), k = 2,3,. . Таким образом, в значении w(X1| tk + 0) «сосредоточена» вся предыстория наблюдений за модулированным MAP-потоком, начиная от момента t0 = 0 до момента tk. В качестве начального значения w(X1| t0 + 0) = w(X1| t0 = 0) на полуинтервале [t0, t1) выбирается априорная финальная вероятность первого состояния процесса X(t) [7]:
_______a 2 + X2 [1 — P1(X2 \ X 2 )]____
n, =■
a1 +a 2 +X1[1 P1(X1 \ X1 )] + X2 [1 P1(X2 \ X 2 )] которая является решением дифференциального уравнения
nl(t \ t0 ) = (— a1 — a2 — X1[1 — P1 (X1 \ X1)] — X2 [1 — P1(X2 \ X2 )])n1 (t \ t0 ) + a2 + X2 [1 — P1(X2 \ X2 )]
при t ^<X> .
Леммы 1, 2 позволяют сформулировать следующую теорему.
(3)
6
Теорема. Поведение апостериорной вероятности w(Xi t) на временных интервалах (t0, ti) и
(tk, tk+1), k = i,2,..., определяется явными формулами
w(Xi11) =
Wi[w2 - w(( | tk + 0) W2[ - w(( | tk + 0) e"A(W-wi)(t~tk )
w-
- w((i \tk + 0) - [ - w( | tk + 0)] • e-Aw2-wi-tk)
- B -VB2 - 4AC - B WB2 - 4AC
w1 =---------------, w2 =-
2A
2A
A = Xi - X2 - XiP0 (X2 | X1) + X2P0 (Л,1 | X2 )ф 0, B = -a1 - a 2 - Xi + X2 - 2X2P0 (Л,11 X2)
для А = 0
w
(Xi 11) =
C =a 2 + X2P0 (Xi | X 2 ) ;
(C + B • w(X^tk ))• eB((-tk)-C
B
t0< t < ti, tk< t < tk+i, k = i,2,..w(Xi| tk + 0) определена формулой (2).
2.2. Выражение для апостериорной вероятности в условиях непродлевающегося мертвого времени
(4)
(5)
Возвратимся к ситуации, когда длительность мертвого времени Tdead ^ 0 (рис. i). Тогда вычисление вероятности w(Xi| t) по формуле (4) справедливо на интервале (tk + Tdead, tk+i). При этом начальное условие для w(Xi| t) привязывается к моменту времени tk + Tdead, т.е. в формуле (4) нужно заменить w(Xi| tk + 0) на w(Xi| tk + Tdead) и tk + Tdead < t < tk+1, k = i,2,. . Формула (2) остается без изменения, так как предназначена для вычисления w(Xi| t) в момент tk наступления события, которое порождает мертвое время. Рассмотрим полуинтервал (tk, tk + Tdead], k = i,2,... . На этом полуинтервале событие имеет место в граничной точке tk, на самом полуинтервале события отсутствуют.
Утверждение. Поведение апостериорной вероятности w(Xi| t) на временных полуинтервалах (tk, tk + Tdead], k = i,2,., определяется явной формулой
w(Xi 11) = ^i +[w(Xi | tk + 0)-^i ]e-B(t~tk}, (6)
B = -ai - a 2 -Xi + X2 - 2X2P0 (Xi | X2 ),
tk< t < tk + Tdead, k = i,2,.; w(Xi| tk + 0) определена формулой (2); ni определена в (3).
Полученные формулы позволяют сформулировать алгоритм расчета вероятности w(Xi| t) и алгоритм принятия решения о состоянии процесса A.(t) в любой момент времени t (алгоритм оптимального оценивания состояний модулированного MAP-потока):
1) вычисляется априорная вероятность л1 нахождения процесса в состоянии X1 в момент начала наблюдения t0 по формуле (3);
2) на промежутке (t0, t1) по формуле (4) или (5) в зависимости от значения коэффициента А вычисляется апостериорная вероятность w(X1| t), где в качестве w(X1| t0 + 0), t0 — момент наступления события, используется значение л1;
3) в момент наступления события tk апостериорная вероятность w(Xi| tk + 0) рассчитывается по формуле (2). Здесь в качестве w(Xi| tk - 0) используется значение, вычисленное по формуле (4) или (5) в момент времени tk, k = i,2,.;
4) на промежутке (tk, tk + Tdead] апостериорная вероятность w(Xi| t) вычисляется по формуле (6), где w(Xi| tk + 0) — значение, вычисленное на предыдущем шаге алгоритма по формуле (2);
5) на интервале (tk + Tdead, tk+i), k = i,2,..., значение w(Xi| t) рассчитывается по формуле (4) или (5), где в качестве w(Xi| tk + 0) используется значение w(Xi| tk + Tdead), вычисленное на шаге 4. Далее осуществляется переход на шаг 3. Шаги 3-5 повторяются до момента t окончания наблюдения за потоком.
Параллельно по ходу вычисления w(Xi| t) в любой момент времени выносится решение о состоянии процесса A.(t): если w(Xi| t) > w(X2| t), то оценка состояния X (t) = Xi, иначе X (t) = X2.
7
3. Результаты численных расчетов
Для получения численных результатов была построена имитационная модель модулированного MAP-потока событий с двумя состояниями и проведен статистический эксперимент. На первом этапе работы программы строится реализация потока. На втором этапе на основании полученной выборки моментов наступления событий в наблюдаемом потоке происходит оценивание состояний потока методом максимума апостериорной вероятности. На рис. 2 изображена реализация потока для А1 = 4, А.2 = 1, Т = 5, Tdead = 1, °1 = 0,1, 02 = 0,1, Р\ (А1 | Aj) = 0,6, Р\ (А2 I Ai) = 0,3, Ро (А2 I Ai) = 0,1,
Pi (А2 | А2) = 0,4, Р1 (А1 | A2) = 0,4, P0 (A1 | A2) = 0,2.
На рис. 3 приведено поведение апостериорной вероятности w(A1| t) для тех же значений параметров.
На рис. 4 изображено поведение оценки A (t) процесса A(t). Тонкая прямая линия проведена на тех временных участках, где поведение A(t) и A (t) не совпадает.
Рис. 4. Поведение 'A (t)
Чтобы установить частоту ошибочных решений о состоянии процесса A(t), были проведены статистические эксперименты, состоящие из следующих этапов:
1) для определенного набора параметров осуществляется моделирование потока (i-й опыт);
2) по формулам (2)-(6) рассчитывается апостериорная вероятность w(A1| t) и по методу максимума апостериорной вероятности выносится решение о значении процесса A(t) в любой момент времени t;
3) определяется значение di - суммарная протяженность интервалов времени, на которых поведение A(t) и A (t) не совпадает;
4) вычисляется доля ошибочных решений pi = Т, где Т - время моделирования;
5) шаги 1-4 повторяются N раз.
8
Результатом описанного алгоритма является выборка Д,...,рN долей ошибочных решений в N испытаниях, на основании которой вычисляется выборочное среднее р = — .N p. = Рош - оценка полной
Ni
2 1 N , ч 2
вероятности ошибки принятия решения Рош, и выборочная дисперсия S2 =-------2 (р1. - р) .
N -1.=1
В первом эксперименте устанавливается зависимость оценки Рош от значения параметра а1. Значения остальных параметров приведены в табл. 1. Результаты приведены в табл. 2.
Данные для первого эксперимента
Таблица 1
T = 100 7,1 = 10 а! = 0; 0,1;.; 1 Р1 (71 | 71) = 0,2 Р1 (72 | 71) = 0,7 Р0 (72 | 71) = 0,1
Tdead = 1 72 = 1 а2 = 1 Р1 (72 | 72) = 0,8 Р1 (71 | 72) = 0,1 Рс (71 | 7г) = 0,1
Результаты первого эксперимента
Таблица 2
а1 0 0,1 0, 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
Рош 0,025 0,037 0,049 0,059 0,071 0,079 0,090 0,094 0,104 0,112 0,121
S 2 X 10-4 0,63 0,72 0,81 0,93 0,89 1,37 1,26 1,51 1,83 1,92 2,04
Как видно, оценка Рош возрастает по мере роста а1. Это объясняется тем, что с ростом а1 переходы из первого состояния во второе происходят чаще, следовательно, событий в первом состоянии процесса 7(t) наступает меньше (в вероятностном смысле) и, как следствие, событий в наблюдаемом потоке наступает меньше. Тем самым уменьшается количество информации, так как алгоритм в качестве исходных данных располагает только выборкой моментов наступления событий. Таким образом, частота принятия ошибочных решений о состоянии потока увеличивается.
Во втором эксперименте устанавливается зависимость оценки Рош от значения параметра а2. Значения остальных параметров приведены в табл. 3. Результаты второго эксперимента продемонстрированы в табл. 4.
Данные для второго эксперимента
Таблица 3
T = 100 71 = 10 а1 = 1 Р1 (71 | 71) = 0,2 Р1 (72 | 71) = 0,7 Р0 (72 | 71) = 0,1
Tdead = 1 72 = 1 а2 = ; 0,1;.; 1 Р1 (72 | 72) = 0,8 Р1 (71 | 72) = 0,1 Ра (71 | 72) = 0,1
Результаты второго эксперимента
Таблица 4
а2 0 0,1 0, 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
Р ош 0,028 0,070 0,093 0,098 0,106 0,108 0,110 0,113 0,116 0,117 0,120
S 2 X 10-4 0,96 1,54 2,26 2,20 2,28 1,92 1,96 2,11 1,78 2,34 1,90
Как и в первом эксперименте, оценка Рош возрастает с ростом а2. На рис. 5 изображено поведение оценки Рош при изменении параметров а1 и а2.
Заметим, что Рош (а2) > Рош (а1) при равных значениях а1 и а2. Это объясняется набором вероятностей, определяющих поток, в частности значениями Р1 (72 | Д) = 0,7 и Р1 (72 | 72) = 0,8. Последние заданы таким образом, что процесс X(t) во втором состоянии проводит больше времени. Поскольку 71 = 10, а 72 = 1 (Д >> 72), то алгоритм с большой апостериорной вероятностью w(7^ tk + 0) выносит решение о том, что событие наступило в первом состоянии процесса 7(t), там самым совершая ошибку при оценке состояния.
9
3
О)
3"
О
0,14 л 0,12 -0,1 -0,08 -0,06 -0,04 -0,02 -0 -
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
а
Рис. 5. Зависимость оценки Рош от параметров а,-, i = 1,2. 1 - поведение Рош (а1); 2 - поведение Рош (а2)
В третьем эксперименте исследуется зависимость оценки Рош от отношения
А.1
. В табл. 5 при-
ведены исходные данные эксперимента, результаты эксперимента продемонстрированы в табл. 6.
2
Данные для третьего эксперимента
Таблица 5
T = 100 / = 10 а! = 0,5 Р1 (/ | /1) = 0,2 Р1 (/2 | /1) = 0,7 Р0 (/2 | /1) = 0,1
Tdead = 1 Ч/ = 4;...; 200 / ^ 2 а2 = 0,5 Р1 (/2 | /2) = 0,8 Р1 (/1 I /2) = 0,1 Р0 (/1 | /2) = 0,1
Результаты третьего эксперимента
Таблица 6
V / ^ 2 4 5 10 20 50 100 200
Рош 0,108 0,097 0,076 0,068 0,061 0,057 0,057
S 2 х 10-4 1,94 1,51 1,27 1,73 1,66 1,47 1,16
Результаты показывают, что оценивание тем лучше, чем больше отношение
К
. В этом случае
состояния процесса X(t) становятся различимы лучше и частота принятия ошибочных решений значительно уменьшается.
В четвертом эксперименте устанавливается зависимость оценки Рош от длительности мертвого времени Tdead. Данные для эксперимента приведены в табл. 7. Результаты продемонстрированы в табл. 8.
2
Данные для четвертого эксперимента
Таблица 7
T = 100 / = 5 а1 = 0,2 Р1 (/1 | /1) = 0,6 Р1 (/2 | /1) = 0,3 Р0 (/2 | /1) = 0,1
Tdead = 0; 1; — ; 6 / = 1 а2 = 0,2 Р1 (/2 | /2) = 0,1 Р1 (/1 | /2) = 0,7 Р0 (/1 | /2) = 0,2
Результаты четвертого эксперимента
Таблица 8
Tdead 0 1 2 3 4 5 6
Рош 0,232 0,260 0,276 0,280 0,284 0,288 0,291
S 2 х 10-3 0,49 1,01 0,97 1,33 1,34 1,22 1,45
10
Результаты свидетельствуют о том, что оценка Рош растет с увеличением значения Tdead, так как событий в наблюдаемом потоке наступает меньше, в результате чего уменьшается количество информации для алгоритма принятия решения о значении процесса X(t).
Заключение
В данной статье предложен алгоритм оптимального оценивания состояний модулированного MAP-потока при наличии непродлевающегося мертвого времени, приведены численные результаты ряда экспериментов по выявлению зависимости оценки Рош от изменения различных параметров потока. Результаты экспериментов показывают, что оценка Рош возрастает с увеличением параметров ai и а2, а с увеличением отношения Я1 к Х2 оценивание состояний процесса X(t) происходит значительно лучше.
ЛИТЕРАТУРА
1. Kingman J.F.C. On doubly stochastic Poisson process // Proc. of Cambridge Philosophical Society. 1964. V. 60, No. 4. P. 923-930.
2. Башарин Г.П., Кокотушкин В.А., Наумов В.А. О методе эквивалентных замен расчета фрагментов сетей связи // Изв. АН
СССР. Техн. кибернетика. 1979. № 6. С. 92-99.
3. Башарин Г.П., Кокотушкин В.А., Наумов В.А. О методе эквивалентных замен расчета фрагментов сетей связи // Изв. АН
СССР. Техн. кибернетика. 1980. № 1. С. 55-61.
4. NeutsM.F. A versatile Markov point process // Journal of Applied Probability. 1979. No. 16. Р. 764-779.
5. Lucantoni D.M. New results on the single server queue with a batch Marcovian arrival process // Communications in Statistics Sto-
chastic Models. 1991. No. 7. Р. 1-46.
6. Дудин А.Н., Клименок В.Н. Системы массового обслуживания с коррелированными потоками. Минск : Изд-во БГУ, 2000. 175 с.
7. Nezhel ’skaya L.A. Optimal state estimation in modulated MAP event flows with unextendable dead time // Communications in Com-
puters and Information Sciences: proceedings of the 13th International Scientific Conference ITMM 2014 named after A.F. Ter-pugov «Information Technologies and Mathematical Modeling» (November 20-22, 2014). Cham Heidelberg ; New York ; Dordrecht ; London : Springer, 2014. Р. 342-350.
8. Gortsev A.M., Nezhel ’skaya L.A., Solov’ev A.A. Optimal state estimation in MAP event flows with unextendable dead time // Automa-
tion and Remote Control. 2012. No. 8. Р. 1316-1326.
9. Gortsev A.M., Nezhel ’skaya L.A., Shevchenko T.I. Estimation of the states of an MC-stream of events in the presence of measurement
errors // Russian Physics Journal. 1993. V. 36, No. 12. Р. 1153-1167.
10. Gortsev A.M., Nezhel ’skaya L.A. An asynchronous double stochastic flow with initiation of superfluous events // Discrete Mathematics and Applications. 2011. V. 21, No. 3. P. 283-290.
11. Bushlanov I. V., Gortsev A.M., Nezhel ’skaya L.A. Estimating parameters of the synchronous twofold stochastic flow of events // Automation and Remote Control. 2008. V. 69, No. 9. P. 1517-1533.
12. Gortsev A.M., Nezhel’skaya L.A. Estimation of the dead time period and intensities of the synchronous double stochastic event flow // Радиотехника. 2004. No. 10. P. 8-16.
13. Gortsev A.M., Nezhel ’skaya L.A. Estimation of the dead time period and parameters of a semi-synchronous double stochastic stream of events // Measurement Techniques. 2003. V. 46, No. 6. P. 536-545.
14. Gortsev A.M., Nezhel’skaya L.A. Estimation of parameters of synchronously alternating Poisson stream of events by the moment method // Telecommunications and Radio Engineering. 1996. V. 50, No. 1. P. 56-63.
15. Gortsev A.M., Nezhel’skaya L.A. Estimation of parameters of synchro-alternating Poisson event flow by the method of moments // Радиотехника. 1995. V. 40, No. 7-8. P. 6-10.
16. Gortsev A.M., Sirotina M. Joint probability density function of modulated synchronous flow interval duration // Communications in Computers and Information Sciences: proceedings of the 13th International Scientific Conference ITMM 2014 named after A.F. Terpugov «Information Technologies and Mathematical Modeling» (November 20-22, 2014). Cham Heidelberg ; New York ; Dordrecht ; London : Springer, 2014. P. 145-152.
Березин Дмитрий Владимирович. E-mail: [email protected]
Нежельская Людмила Алексеевна, канд. техн. наук, доцент. E-mail: [email protected] Томский государственный университет
Поступила в редакцию 14 мая 2015 г.
Berezin Dmitriy V., Nezhel’skaya Lyudmila A. (Tomsk State University, Russian Federation).
Modulated MAP states optimal estimation under conditions of its partial observability.
Keywords: Modulated MAP; optimal state estimation; method of a posteriori probability maximum; non-extendable dead time. DOI 10.17223/19988605/32/1
11
This paper considers the modulated MAP, which rate is a piecewise constant random process X(t) with two states: X(t) = X1 and X(t) = X2 (Xi > X1 > 0). The time when the process X(t) remains at the i-th state, i = 1,2, depends on two random values: 1) the first random value has the exponential distribution function F/1-1 = 1 - e-a,t, i = 1,2; when the i-th state ends, the process X(t) transits with the probability equal to one from the i-th state to the j-th state, i, j = 1,2 (i ^ j); 2) the second random value has the exponential distribution function F/2-1 = 1 - e-X,t, i = 1,2; when the i-th state ends, the process X(t) transits with the probability P1 (Xj | X,) from the i-th state to the j-th state (i ^ j) and a flow event occurs or X(t) transits with the probability P0 (Xj | X,) from the i-th state to the j-th state (i ^ j) but an event does not occur, or the process X(t) transits with the probability P1 (X,- | Xi) from the i-th state to the i-th state and a flow event occurs. Here P1 (Xj | X,) + P0 (Xj | X,) + P1 (X, | X,) = 1, i, j = 1,2, i Ф j. The block transition rate matrix for the process X(t) is as follows:
-(a1 +X1 ) a1 +X1Po (X 2 | X1 ) X1P1 (X1 | X1 ) X1P1 (X 2 | X1 )
a 2 +X 2 Po (X1 | X 2 ) -(a 2 +X 2 ) X 2 P1 (X1 | X 2 ) X 2 P1 (X 2| X 2 J
An event generates the period of time called the dead time, during which the flow cannot be observed. After this period ends, a new event also generates the dead time. Having only a sample (tb..., tn) of events moments, we need to estimate the flow states.
The optimal states estimation algorithm is as following:
1) at the initial moment t0 a priori probability л1 that X(t) is in X1 is calculated using the formula
n =_______________a 2 +X 2 [1 - P1 (X 2! X 2 )]________ .
01 +a2 + X1 [1 -P1 (X1 | X1)] + X2[1 -P1 (X2 | X2)]
2) in the interval (t0, t1) a posteriori probability w(X1 t) is calculated using the formula му[2 - w( 110 + 0) - W2 К - w( 110 + 0)]e-A(w2 -W1 )(t-t0}
D =
= 1D01 D J .
w(X1 11) = ■
W2 - w(X1 | t0 + 0) - [ - w(X1 | t0 + 0)e
-a(w2 -w1 )(-t0 )
w(X1 110 + 0) = л1:
3) at event occurring moment tk a posteriori probability w(X1| tk + 0) is calculated using the formula
X2PjCXj | X2) + [X1P1(X1 |Xt)-X2P(Xj | X2)]w(Xj |tk -0)
w(X1| tk + 0) =
X2 [1 - P0 (X1 |X2 )] + [X1 -X2 -X1P0 (X2 | X1 ) + X2P0 (X1 |X2 )]v^(X1 | tk - 0) ■
where instead of w(X1| tk - 0) the value calculated on the formula
KX1 11 ) =
w1 [w2 - w(X1 | tk + 0) - w2 [ - w(X1 | tk + 0) •e
-a(w2-w1 )(-tk )
w2 -w(X1 | tk + 0)-[ -w(X1 | tk + 0)e
-a(w2-w1 )(-tk )
at tk, k = 1,2,., is used;
4) in the interval (tk, tk + rdead] the probability w(X1| t) can be found as
w(X1 11 ) = л1 +[w(X1 | tk + 0)-л1 ]• e-B(-tk *;
5) in the interval (tk + Tdead, tk+1), k = 1,2,., the value w(X1| t) can be calculated by formula used on the step 3, where instead of w(X1| tk + 0) the value w(X1| tk + Tdead) calculated on the step 4 is used. Then go to the step 3. The steps 3-5 are reiterated during observing time.
Simultaneously with probability calculation we estimate the flow states: if w(X1| t) > w(X2| t) than XL (t) = X1, otherwise XL (t) = X2.
The results show that the bigger a,, i=1,2, the higher estimation error, and that the bigger quotient X1/X2, the better estimation.
REFERENCES
1. Kingman, J.F.C. (1964) On doubly stochastic Poisson process. Proc. of Cambridge Philosophical Society. 60 (4). pp. 923-930. DOI:
10.1017/S030500410003838X
2. Basharin, G.P., Kokotushkin, V.A. & Naumov, V.A. (1979) O metode ekvivalentnykh zamen rascheta fragmentov setey svyazi [On
the equivalent substitutions method for computing fragments of communication networks]. Izv. Akad. Nauk USSR. Tekhn. Kibern. 6, pp. 92-99.
3. Basharin, G.P., Kokotushkin, V.A. & Naumov, V.A. (1980) O metode ekvivalentnykh zamen rascheta fragmentov setey svyazi [On
the equivalent substitutions method for computing fragments of communication networks]. Izv. Akad. Nauk USSR. Tekhn. Kibern, 1, pp. 55-61.
4. Neuts, M.F. (1979) A versatile Markovian point process. Journal of Applied Probability. 16(4). pp. 764-779. DOI: 10.2307/3213143
5. Lucantoni, D.M. (1991) New results on the single server queue with a batch Marcovian arrival process. Communications in Statistics
Stochastic Models. 7. pp. 1-46.
6. Dudin, A.N. & Klimenok, V.I. (2000) Queueing systems with correlated flows. Minsk: BGU.
7. Nezhel’skaya, L.A. (2014) Optimal state estimation in modulated MAP event flows with unextendable dead time. Communications in
Computers and Information Sciences: proceedings of the 13th International Scientific Conference ITMM 2014 named after A.F. Terpugov "Information Technologies and Mathematical Modeling”. 20th-22nd November. Cham Heidelberg, New York, Dordrecht, London: Springer. pp. 342-350.
8. Gortsev, A.M., Nezhel’skaya, L.A. & Solovyev, A.A. (2012) Optimal state estimation in MAP event flows with unextendable dead
time. Automation and Remote Control. 73 (8). pp. 1316-1326. DOI: 10.1134/S000511791208005X
12
9. Gortsev, A.M., Nezhel’skaya, L.A. & Shevchenko, T.I. (1993) Estimation of the states of an MC-stream of events in the presence of
measurement errors. Russian Physics Journal. 36 (12). pp. 1153-1167.
10. Gortsev, A.M. & Nezhel’skaya, L.A. (2011) An asynchronous double stochastic flow with initiation of superfluous events. Discrete Mathematics and Applications. 21 (3). pp. 283-290. DOI: 10.1515/dma.2011.017
11. Bushlanov, I.V., Gortsev, A.M. & Nezhel’skaya, L.A. (2008) Estimating parameters of the synchronous twofold stochastic flow of events. Automation and Remote Control. 69 (9). pp. 1517-1533. DOI: 10.1134/S0005117908090075
12. Gortsev, A.M. & Nezhel’skaya, L.A. (2014) Estimation of the dead time period and intensities of the synchronous double stochastic event flow. Radiotekhnika. 10. pp. 8-16.
13. Gortsev, A.M. & Nezhel’skaya, L.A. (2003) Estimation of the dead time period and parameters of a semi-synchronous double stochastic stream of events. Measurement Techniques. 46 (6). pp. 536-545. DOI: 10.1023/A:1025499509015
14. Gortsev, A.M. &Nezhel’skaya, L.A. (1996) Estimation of parameters of synchronously alternating Poisson stream of events by the moment method. Telecommunications and Radio Engineering. 50 (1). pp. 56-63.
15. Gortsev, A.M. & Nezhel’skaya, L.A. (1995) Estimation of parameters of synchro-alternating Poisson event flow by the method of moments. Radiotekhnika. 40 (7-8). pp. 6-10.
16. Gortsev A.M. & Sirotina, M. (2014) Joint probability density function of modulated synchronous flow interval duration. Communications in Computers and Information Sciences: proceedings of the 13th International Scientific Conference ITMM 2014 named after A.F. Terpugov "Information Technologies and Mathematical Modeling”. 20th to 22nd November, 2014. Cham Heidelberg, New York, Dordrecht, London: Springer. pp. 145-152.
13