УДК 519.21
СИНТЕЗ МАРКОВСКОГО ПРОЦЕССА ПО ЕГО ФРАГМЕНТАМ. ПРОГРАММНАЯ РЕАЛИЗАЦИЯ МЕТОДА СИНТЕЗА
фрагмента P11 и PI2, I1cI, I2cI. Предположим, что І1ПІ2=ІО^0, IiuI2=I.
Для каждой строки ie I0 обозначим:
Sli = Z -j S2i = Z РУ
jeIlj ЄІ2\Iq
Sr
Z -in
jeIi \Io
(1)
КРИПАКA.A., КРИПАК C.A.
Описывается процедура синтеза стохастической матрицы марковского процесса по его фрагментам. Составляется программа, реализующая указанный синтез.
1. Разбиение марковского процесса на фрагменты
Пусть дана стохастическая матрица некоторого марковского процесса (однородного или неоднородного)^^), размерности nxn. В дальнейшем будем опускать зависимость матрицы от времени и обозначать её Р[2].
Опишем общую схему синтеза[3]. Рассмотрим событие B, состоящее в том, что в момент времени t процесс будет находиться в классе состояний 1,2,..,п-1:B=(x(t)e{1,...,n-1|). Будем предполагать, что P(B)>0. Это позволяет ввести на пространстве <Q,F,P> условные вероятности PB(A)=P(A/B) у AeF и, тем самым, перейти к пространству <Q,F,Pb>[1]. Очевидно, что PB(A), задающая вероятность (меру) на F, удовлетворяет требованиям:
1) Pb(A)=P(AB)/P(B)>0, V A eF.
2) Pb(Q)=P(QB)/P(B)=P(B)/P(B)=1.
3) PB(A1uA2U...uAn)=[P(A0+P(A2)+
+P(An)]/P(B)=PB(A1)+PB(A2)+ ...+PB(An),
Ai n At=0, i^k.
Тогда переходные вероятности примут вид:
PB(x(t)=j/x(t-1)=i)=P(x(t)=j/B,x(t-1)= i)=
n-l
_ Pij/ Z Pij , i, j = 1, 2, ... n-1.
i=i
Таким образом, мы можем построить стохастическую матрицу P’ размерности (n-1)x(n-1), которая получена из исходной выбрасыванием состояния n. Аналогично, можно выбрасывать любое состояние k, 1<k<n или группу состояний.
Введём следующие обозначения. Обозначим I={ 1,2,. ..,п| — множество всех индесов процесса. Пусть множество индексов Ii получено из множества I путем выбрасывания некоторого числа индексов. Под матрицей PI1 будем понимать стохастическую матрицу, полученную из исходной стохастической матрицы P путём выбрасывания тех строк и столбцов, индексы которых не содержатся в I1, с последующим делением оставшихся элементов строки на их сумму. Эта процедура носит название нормирование матрицы.
Исследуем возможность восстановить исходную стохастическую матрицу P по заданной системе фрагментов. Сформулируем необходимые и достаточные условия восстановления.
2. Объединение двух фрагментов
Введем множество индексов I={ 1,2,3,...,п|. Множества I1,I2 получены из множества I путем выбрасывания некоторого числа индексов. Получены два
S2i - Z РЧ-
(ІЄІ2 \І0
Поскольку
(2)
pij1 = -ij/(l - S2i)’j Є І1 . (3)
Pij2 = Pij/(1 - S1iXj ЄІ2, (4)
то, просуммировав обе части равенств (в первом случае по jeI1\I0, а во втором по jeI2\I0), получим систему:
Sli = Sli / (1 - S 2i),
s2i = Sli / (l - Sli),
Это система уравнений относительно S1i, S2i.. Решив её, найдём:
Sli - Sli
l - S2l
l - SliS2i
S2i _ S2i
l - Sli
l - SHS2i
Тогда из (3), (4) можем найти:
- -І. 1 - S2i
Pij -ij і_ s'S'■ ’ ІЄІ0, jeIb
(5)
і, l - Sli
-ij _ -ij l_ s' s' ^ ’ i£Io, j£I2. (6)
где Sli, S2і определены в (1),(2).
Таким образом, по формулам (5),(6) можно вычислить элементы строк I0 матрицы P.
Заметим, что для элементов py, ie I0, je I0, формулы (5),(6) должны давать одинаковый результат, т.е. матрицы PI1 и PI2 не являются независимыми:
-Iі (l- S'i) = -Ij2 (l - Sli),i ЄІ0, j ЄІ0. (7)
Это означает, что ij-й элемент достаточно задать только в одном из фрагментов PI1, PI2, ieI0, j є I0 (блоки I0xI0 матриц PI1 и PI2 могут быть известны не полностью). Фрагменты PI1 и PI2 будут независимы тогда и только тогда, когда множество I0=I1nI2 содержит всего один элемент. В этом случае условие (7) будет всегда выполнено. Будем называть его условием согласования.
В определении элементов строк I0 матрицы P участвовали только элементы строк I0 фрагментов PI1 и PI2, причём для нахождения i-й строки матрицы P используются элементы той же строки матриц PI1 и PI2. Кроме того, если I1uI2=I3^I, то, проведя аналогичные рассуждения, по формулам (5), (6) найдём элементы строк I0 матрицы PI3.
Очевидно, что если I2MI1, то по матрице PI1 можно найти PI2 .
60
РИ, 1999, № 1
3. Необходимые и достаточные условия синтеза
Пусть даны множества индексов I і,І2,...,Іт. Обозначим Is=Iiul2U...uIm. Введём множество
Bk={i: keIj, 1<i<m}. (8)
В этом множестве содержатся номера i и тех множеств Ii, которые включают в себя индекс k.
Лемма. Если V i, j є Is 3k: i, jeIk , 1<k<m и, кроме того, Ii^IS, i=1,2, ..., m, то каждое из множеств Bk содержит не менее двух элементов.
Доказательство.
Bk содержит по крайней мере 1 элемент io 3ke Iio. Так как Iio^IS, то
3jeIs\Iio 3ip j, keIi1.
Значит, множество Bk содержит ещё и элемент i1. Лемма доказана.
Пусть Ak — собственное подмножество множества
Bk: Ak^Bk, Ak^Bk, Ak^0. (9)
При сделанных в лемме предположениях оно существует. Обозначим
MAk = ( U) П( и Ii). (10)
jeAk ieBk\Ak V '
Очевидно, что ke MAk.
Найдём необходимые и достаточные условия того, что по фрагментам Pn, PI2, ...,PIm можно произвести синтез матрицы PIS, где IS=I1uI2u...uIm.
Будем предполагать, что Ii^IS, i=1,2,...,m, в противном случае задача окажется уже решённой.
Теорема. Пусть I1uI2u...uIm=IS. Для того чтобы по фрагментам PI1,PI2,..., PIm произвести синтез матрицы PIS, необходимо и достаточно, чтобы
1) для любых пересекающихся фрагментов выполнялось условие согласования (7);
2) для любой пары индексов i,j є IS существовало множество Ik из набора I1,I2,...,Im, содержащее эти индексы одновременно, т.е. V i,j є IS 3k: i, jeIk, 1<k<m;
3) V V AkcBk3.jeMAk p^j^ r<EBk где Ak, Bk определены в (8)-(10).
Доказательство.
1) Необходимость.
Необходимость первого условия очевидна.
Докажем необходимость второго условия. Проведем доказательство от противного. Предположим, что 3io, joeIz: v Ik io £ Ik, jo ^ Ik. Далее обозначим Io={io, jo}.
Введем произвольную стохастическую матрицу PI0 Условие согласования выполнено для любого элемеш^^ так как пересечение I0 c любым другим множеством из I1,I2,...,Imбудет содержать не более одного элемента. Кроме того, фиксированной матрице PIE соответствует единственная матрица PI0. Значит, наше предположение неверно и условие 2 теоремы является необходимым.
Докажем необходимость третьего условия. Доказательство проведем от противного. Предположим, что синтез произвести можно, но условие 3 не выполнено. Предположим, что 3keIz 3AkcBkj
VjeMAk, pkj = 0. Обозначим:
Mj = У I^ M2 = у Ii5 M1nM2=MAk.
jeAk jeBk\Ak
Тогда элементы k-й строки матрицы PIE имеют вид
IУ • л /г
PijE = a' Pij 1 J є Mb
pj = (1 -a) • pMM2,J єM2,
где a є [0, 1] — задается произвольным образом, т.е. однозначно определить k-ю строку не удается. Значит, наше предположение неверно и условие 3 теоремы является необходимым.
2) Достаточность.
Найдем строку к матрицы PIE. Ввиду условия 2 теоремы и леммы множество Bk содержит не менее двух элементов. Возьмем некоторое i1 є Bk и рассмотрим
Mj = Iij П( UIi),
ieBk ;i ^ iJ
Согласно условию 3 существует pkj2 у 0, j^Mb
i2eBk/{i1}. Поскольку keIi1nIi2, то мы можем определить к-ю строку матрицы PIi1 uIi2-
Если IiJ U Ii2 ^ IЕ, то рассмотрим
M2 = (IiJ U Ii2) П( UH), .
icBk ;i ^iJ,i2
Согласно условию 3 теоремы существует pkj32 ^ 0,
j2eM2, i3eBk/{i1,i2}. Поскольку k e(IiJ U Ii2) П Ii3, то мы можем определить к-ую строку матрицы PIi1^Ii2^Ii3-
Продолжаем процесс до тех пор, пока не определим к-ю строку матрицы PIE- То же выполняем и для других строк матрицы PIE. Это полностью доказывает теорему
Доказательство достаточности дает метод нахождения матрицы PIE по ее фрагментам.
Условие 2 теоремы говорит о том, что каждый ij-элемент должен присутствовать хотя бы в одной из матриц PI1,PI2,...,PIm Условие 3 теоремы связано с тем, что при пересечении фрагментов не все элементы из пересечения должны быть равны 0.
Следствие. Для того чтобы по фрагментам PI1, PI2,..., PIm произвести синтез матрицы P, необходимо и достаточно, чтобы выполнялись все условия теоремы и IE={1,..., n}.
4. Невыполнение условия согласования
Рассмотрим подробнее случай, когда условие 1 теоремы не выполняется, а условия 2, 3 выполняются. Это может быть в том случае, когда во фрагменты PI1, PI2, ...,PIm были внесены некоторые погрешности, например, при измерениях.
Будем синтезировать такую матрицу P, которая отличалась бы от своих фрагментов минимальным образом, т.е. чтобы фрагменты матрицы P минимально отличались от искаженных фрагментовP1, Iі1,..,
pIm
В качестве функционала, задающего отклонение от фрагментов, можно взять сумму квадратов отклонений элементов фрагментов PI1,PI2,...,PIm от элементов искаженных фрагментов PI1, PI2,..., PIm.
Введем обозначение
Bkj={i: k,j є Ii, 1<i<m}.
k: U B
kj _ Bk •
j=1
Очевидно, что Bkj содержится в Bk:
В силу выполнения условия 2 теоремы Bkj^0. Тогда мы можем записать следующую задачу на условный экстремум:
РИ, 1999, № 1
61
n
222(pkj •ak -pki)2 ^ min, (11)
k=1 iGBkjell n
Ё pk.= j=i 1,k = 1,2,...,n, (12)
a • ki = :1/Ё У j=1 (13)
IV о w II ..,n, j=1,2,...,n. (14)
Поскольку элементы каждой из строк матрицы P оптимизируются независимо от других строк, то задача эквивалентна n более простым задачам, где функционал зависит только от элементов строки к.
Для простоты записи будем писать Xj вместо Pkj и Pj вместо Pj.
С учетом переобозначений задача (11)-( 14) при-
мет вид
22 i - Pj11)2 ^ min, ieBk je!i (15)
II !*T (16)
ai = 1/^ xj> j=1 (17)
xj > 0,j = 1,2,...,n. (18)
5. Решение задачи минимизации
Изменим постановку задачи. Если бы условия согласования были выполнены, то xj = P1PJI1, і є By,
j=1, 2,..., n. Будем искать такую матрицу P (т.е. строку x), которая бы отклонялась от величины
№ минимальным образом. С учетом этого задача
(15) - (18) примет вид
22(xj _ PjPi)2 ^ min, (19)
ieBkjGli x,p ' '
n
2 xj = 1 (20)
j=i
p = 2 V (21)
jell
xj > 0,j = 1,2,...,n. (22)
Это есть задача квадратичного программирования. Она имеет единственное решение, которое всегда может быть найдено. Уравнение связи (21) делает bi зависимыми (как и в случае, когда условие согласования выполнено). Очевидно, что когда условие согласования выполнено, решением задачи будет то, которое находилось по ранее описанным формулам, так как те значения обращают функцию цели в ноль (глобальный минимум), а в силу свойств целевой функции существует единственный минимум, причем глобальный, с неотрицательным значением целевой функции.
Используя метод Лагранжа, получаем систему линейных уравнений. Решив полученную систему, получим решение для строки к матрицы Р. Аналогично поступаем для всех строчек матрицы Р.
Данную систему можем решать либо точным методом (метод Гаусса, метод главных элементов, метод квадратных корней), либо итерационным (метод итераций, метод Зейделя). В данной работе систему решаем методом Гаусса.
6. Программная реализация
Был программно реализован метод синтеза марковского процесса (как однородного, так и неоднородного) по его фрагментам.
Программа позволяет задавать исходные данные-фрагменты стохастической матрицы исследуемого процесса, образующие базис, c клавиатуры (для реальных физических или социально-экономических процессов с многочисленными внутренними связями, например, занятость населения, его возрастная структура и образование). Предусмотрено формирование фрагментов стохастической матрицы случайным образом, что позволяет использовать данный программный продукт для теоретических исследований в области теории вероятностей и математической статистики.
На основании теоретических исследований, приведенных в данной работе, программный продукт дает возможность проводить синтез в случае, когда условие согласования как выполняется, так и не выполняется. Это позволяет проводить синтез в случаях, когда измерения были проведены с некоторыми погрешностями или в условиях неполной информации об исследуемом процессе. Это обстоятельство позволяет использовать данный программный продукт для реальных задач, так как на практике, в большинстве случаев, не удается получить полную и достоверную информацию об исследуемом процессе. Допускается исследовать процесс не только в определенный фиксированный момент времени, но и наблюдать за ним в динамике, зная начальный и конечный моменты времени.
Литература: 1. Розанов Ю.А. Теория вероятностей, случайные процессы и математическая статистика. М.: Наука. 1985. 319 с. 2. Феллер В. Введение в теорию вероятностей и ее приложения. М.: Мир. 1985. 285 с. 3. Басманов А.Е., Дикарев В.А. Синтез стохастической матрицы по системе ее фрагментов. ХТУРЭ. Харьков, 1997. 8 с. Рус. Деп в УкрИНТЭИ 23.01.97 №76-Уі97.
Поступила в редколлегию 21.01.99 Рецензент: д-р физ.-мат. наук. Руткас А.Г.
Крипак Андрей Анатольевич, аспирант кафедры ПМ ХТУРЭ. Научные интересы: теория вероятностей и математическая статистика. Адрес: Украина, 310141, ул. Клочковская, 199-Б, кв. 17.
Крипак Сергей Анатольевич, аспирант кафедры ПМ ХТУРЭ. Научные интересы: теория вероятностей, математическая статистика и программирование. Адрес: Украина, 310141, ул. Клочковская, 199-Б, кв. 17.
62
РИ, 1999, № 1