2018, Т. 160, кн. 3 С. 578-589
УЧЕНЫЕ ЗАПИСКИ КАЗАНСКОГО УНИВЕРСИТЕТА. СЕРИЯ ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ
ISSN 2541-7746 (Print) ISSN 2500-2198 (Online)
УДК 519.2
МОДИФИКАЦИЯ МОДЕЛИ И МЕТОДА «ПРЯМОГО-ОБРАТНОГО ХОДА» ДЛЯ ИДЕНТИФИКАЦИИ АВТОМАТНЫХ МАРКОВСКИХ МОДЕЛЕЙ
А.Р. Нурутдинова
Казанский национальный исследовательский технический университет им. А.Н. Туполева, г. Казань, 420111, Россия
Аннотация
Статья посвящена решению задачи идентификации дискретных стохастических процессов, порождаемых автоматными марковскими моделями. Актуальность работы обусловлена потребностью повышения эффективности распознавания автоматных марковских моделей в соответствии с выделением определенных подклассов исследуемых объектов. Эффективность идентификации автоматных марковских моделей с определенной доверительной вероятностью достигается снижением длины цепи Маркова, а также уменьшением вычислительной сложности алгоритмов распознавания и минимизацией погрешности вычисления признаков относительно эргодических стохастических матриц, задающих автоматные марковские модели. В работе предложена модификация известного алгоритма «прямого-обратного хода» для решения задачи идентификации автоматных марковских моделей, определенных с помощью эргодических стохастических матриц по порождаемым ими реализациям цепей Маркова. Исследовано применение модифицированного алгоритма «прямого-обратного хода» к решению задачи идентификации автоматных марковских моделей, определенных с помощью циклической стохастической матрицы. Рассчитаны оценки вычислительной сложности предложенных алгоритмов идентификации. Наиболее важными из полученных результатов представляются следующие моменты. Модифицированный алгоритм позволяет определить значения вероятности того, что наблюдаемая последовательность сгенерирована на основе автоматной марковской модели заданного класса, которая, в свою очередь, определяется структурой задающей ее стохастической матрицы. Особенностью предложенного алгоритма является способность распознать класс автоматной марковской модели в том случае, когда в порождаемой последовательности некоторые состояния не наблюдаемы. Полученные результаты позволяют с большей вычислительной эффективностью идентифицировать автоматную марковскую модель по выходной последовательности. Указанная задача может быть использована для решения широкого круга задач идентификации цепей Маркова, в том числе частично скрытых от наблюдения.
Ключевые слова: цепь Маркова, идентификация, стохастическая матрица, алгоритм «прямого-обратного хода»
Введение
Автоматные марковские модели (АММ) используются для моделирования, анализа, управления и контроля объектов и процессов, имеющих стохастическую природу, в сложных системах управления, диагностики и др. [1—4]. Актуальными являются задачи синтеза и анализа марковских моделей [5-8]. Теоретический и практический интерес представляют вопросы классификации и идентификации цепей
Маркова (ЦМ); эти вопросы, в частности, возникают при решении задач распознавания АММ. Задачи анализа энтропийных и асимптотических свойств дискретных марковских процессов рассматривались в работах отечественных (Ю.А. Альпин [9], Р.Г. Бухараев [10], В.М. Захаров [11, 12], А.А. Лоренц [13], В.И. Романовский [14], Н.Г. Федотов [15] и др.) и зарубежных ученых (Дж. Кемени и Дж. Снелл [16], И. Ли, Д. Джадж, А. Зельнер [17] и др.). Проблема известных подходов к распознаванию АММ, предложенных в [2, 8, 9, 17], состоит в том, что они основаны на вычислении функционалов по последовательностям конечной длины, генерируемых АММ с некоторой погрешностью относительно задающей ее эргодической стохастической матрицы (ЭСМ), что снижает точность анализа на основе указанных функционалов при ограничениях на длину наблюдаемой последовательности, особенно для ЦМ длины порядка 102-103. Поэтому требуется разработка новых подходов к распознаванию эффективных при анализе выходных последовательностей, реализаций ЦМ конечной длины. Эффективность методов определяется снижением длины последовательности ЦМ,требуемой для решения задачи идентификации и классификации АММ, определенных на основе заданных подклассов ЭСМ, с некоторой доверительной вероятностью, а также с уменьшением вычислительной сложности алгоритмов распознавания и снижением погрешности вычисления признаков относительно ЭСМ. При этом должны учитываться такие параметры модели, как размерность ЭСМ, точность представления элементов ЦМ и наличие в последовательности скрытых элементов.
В [18, 19] были предложены методы идентификации АММ, основанные на вычислении функционалов непосредственно по реализациям ЦМ с учетом структуры ЭСМ, определяющих АММ. Предложенные методы позволили повысить информативность решения задачи распознавания АММ, их идентификации с большей доверительной вероятностью для меньшего количества генерируемых элементов ЦМ.
В настоящей работе предлагается модель идентификации АММ, определенных на базе ЭСМ, на основе порождаемых ими реализаций ЦМ с помощью модификации алгоритма «прямого-обратного хода». Ранее этот метод был предложен для решения задачи распознавания речи в рамках скрытой марковской модели в работе [1]. Предложенный модифицированный метод позволяет исключить промежуточные вычисления п-грамм и решить задачу идентификации АММ непосредственно по реализациям ЦМ. Задача решена для регулярных и нерегулярных ЦМ. Рассчитаны также оценки сложности предложенных алгоритмов идентификации. Описанная модель может использоваться и для идентификации АММ со скрытыми элементами наблюдаемой последовательности.
1. Цепи Маркова и автоматные марковские модели
Будем рассматривать случайный процесс с дискретными состояниями во, в1, $2,вь . Обозначим через £ = 1, 2,... моменты времени, в которые происходит изменение состояния системы. В случае марковского процесса для любого момента времени ¿о вероятность любого состояния системы в будущем (при £ > £о) зависит только от ее состояния в настоящий момент времени и не зависит от того, когда и каким образом система 5 пришла в текущее состояние. Это означает, что для любой последовательности ЦМ имеет место равенство [14]: (Р(Хг+1 = вг+1| Хг = = вг, Хг-1 = в—1,..., Хо = во) = Р №+1 = ве+11 Хг = вг) для всех ве+1, вг,..., во €
Пусть задана простая однородная цепь Маркова задана в виде [15]
(5, Р*,по),
(1)
где S = {вг}, г = 0,1,.. .,п — 1, - множество состояний ЦМ, Р8 - эргодическая стохастическая матрица вида Р8 = (р3) размерности п х п, г, ] =0,1,.. ,п — 1, по - п-мерный вектор начального распределения вероятности появления каждого состояния ЦМ.
Закон ЦМ представляют в виде неотрицательной стохастической матрицы переходных вероятностей, где рар - переходные вероятности [14]:
/ри Р12 ... Р1п\ р = Р21 Р22 ... Р2п
\Рп1 Рп2 . . . Рпп/
В классе ЭСМ можно выделить различные подгруппы матриц (положительные, треугольные, блочно-сообщающиеся и др.), определяемые взаимным расположением положительных элементов. Такое выделение подклассов позволяет поставить задачи классификации и идентификации марковских моделей.
В настоящей работе определяются марковские модели, заданные на базе как эргодических стохастических матриц, так и нерегулярных циклических ЦМ, определяемые следующим образом.
Для множества состояний 5 неразложимой ЦМ можно определить разбиение на г непересекающихся циклических подмножеств Б1, Б2,...,БГ такое, что ЦМ, находясь в какой-либо момент времени в состоянии подмножества Б¡., в следующий момент неизбежно переходит в группу Бь+1. ЦМ движется по циклическим классам в определенном порядке, возвращаясь в класс с начальным состоянием
г
через г шагов, при этом щ = |Бг|, г = 1, 2,... ,г, щ = п [3]. Возвращение в со-
г=1
стояние вг € Б может происходить во все достаточно большие моменты времени, кратные периоду к. Пусть все периоды к имеют наибольший общий делитель г, г > 1. Последовательность таких шагов называют циклом порядка к матрицы Р (периодом) [14].
Если £ = кг, то, начиная из состояния вг € Б1, через £ шагов, система принимает состояние из того же циклического класса в' € Б1, I = 1, 2,... ,г .В зависимости от значения периода к, к =1, 2,... ,г, можно выделить подклассы циклических стохастических матриц.
Автоматной марковской моделью будем называть автономный вероятностный автомат без выхода вида [16]
(Б,^(в'/в)), (2)
где Б = {вг}, г = 0,1,п — 1 - множество состояний ЦМ вида (1) , в, .в' € Б, ^(в', в) — функция переходов, заданная стохастической матрицейР8, Р8 = (рц), размерности п х п, г, ] =0,1,... ,п — 1.
На основе АММ вида (2), задавая различные функции <р(в', в), получаем различные классы АММ, определяемые ЭСМ Р, Р € Q. Таким образом, определим задачу идентификации АММ по реализациям ЦМ, получаемых на основе заданных подклассов АММ. Рассматриваемая нами задача состоит в том, чтобы показать, как можно построить модель, пригодную для распознавания класса АММ непосредственно по наблюдаемой последовательности ее состояний с заданной доверительной вероятностью. Первая возникающая проблема при решении задачи распознавания АММ связана с увеличением вычислительной сложности процедуры распознавания при увеличении размерности ЭСМ Р3. Решение второй проблемы подразумевает уменьшение длины последовательности наблюдений, достаточной
УР' = 1, г = 1, 2,...,п.
3 = 1
для идентификации. Третий вопрос пригодности того или иного алгоритма идентификации возникает при наличии в последовательности пропущенных (ненаблюдаемых) элементов последовательности. В настоящей работе мы получаем оценки предложенных алгоритмов, учитывая вышеуказанные параметры и ограничения исследуемой модели распознавания АММ, что позволяет выбирать для заданного класса АММ более эффективный метод идентификации.
2. Модифицированный алгоритм «прямого-обратного хода»
Пусть для АММ (Р € Q) сгенерировано множество 5 реализаций цепи Маркова длины N вида ¿>(Ж) = в1, в2,..., в^, где вг - состояние АММ вида (2) в момент времени £, £ = 1, 2,..., N. Пусть задано множество Q подклассов ЭСМ Р, АММ (Р € Q), которые выделены в зависимости от расположения положительных элементов ЭСМ Р. Исследуемые ЭСМ имеют максимальную энтропию, определяемую в соответствии с [20]. На ЭСМ Р накладывается ограничение: значения положительных элементов Р кратны заданной величине Б. На всем множестве реа-
г
лизаций ЦМ существует разбиение на подмножества 5 = У Q^ (подклассы ЭСМ).
1=1
Требуется решить следующие задачи.
A. Определить Р(5(М)\(Р)) - вероятность того, что 5(М) сгенерирована на основе (Р), где ЭСМ Р принадлежит заданному подклассу Qi.
B. Определить для заданного множества ЭСМ {Р1, Р2,..., Рс}, значение Р("(^)\(Ра)) = шах |Р('(М)|(Р;))|, то есть определить (Ра), которая сгенерировала заданную ) с большей вероятностью.
В модели идентификации скрытой марковской модели ставится задача вычисления вероятности того, что последовательность, наблюдаемая на выходе, соответствует заданной модели. Предложенный модифицированный алгоритм дает возможность решить задачу идентификации АММ на основе порождаемых ею реализаций ЦМ и позволяет определить значения РС(М)\(Р)) - вероятности того, что ) сгенерирована на основе Р, где ЭСМ Р размерности п х п принадлежит заданному подклассу и имеет максимальную энтропию.
Алгоритм «прямого-обратного хода» для скрытых марковских моделей. Пусть задано множество состояний модели 5 = (51, 52,..., 5N), а состояние модели в момент £ обозначим через [3].
Множество наблюдаемых символов обозначим V = (у1, У2,... ,ум ). Матрица переходных вероятностей есть А = {а^}, а^ = Р[дг+1 = 5^ \дг = 54] , 1 < г, ] < N. Распределение вероятности появления символов наблюдения в состоянии ] есть В = {Ь(к)} Ь2 (к) = Р \ук аИ\цг = 5^ ^ , 1 < г < N, 1 < к < М. Начальное распределение вероятностей равно п = р [ц1 = 5г], 1 < г < N. Пусть О = О1, О2,..., От -наблюдаемые символы скрытой марковской модели. В рамках описанной модели решается задача определения Р(О \х) - вероятности Р(О \х) появления последовательности наблюдений О для модели х = (А, В, п) и выбора последовательности состояний Q = Ц1, Ц2,... ,цг, которая в некотором смысле будет оптимальной (наилучшим образом соответствовать имеющейся последовательности наблюдений [3].
Для решения задачи распознавания наблюдаемой последовательности в рамках скрытой марковской модели Л.Р. Рабинером в работе [3] предлагается алгоритм «прямого-обратного хода», состоящего из следующих этапов.
1. Вводится прямая переменная аг(г) = Р(О1О2,..., Ог, = 5^ \А) , представляющая собой вероятность появления для данной модели частичной последовательности наблюдения О = О1О2,... ,Ог до момента времени £.
2. Инициализуруются переменные а1(4) = пф^О^, 1 < г < N. При этом устанавливается значение прямой переменной, равной совместной вероятности состояния и начального значения О1 последовательности наблюдений.
3. По индукции вычисляются переменные
аг+1(з)
N
Л=1
Ъз (О+), г =1,...,т - 1, 1 < 3 < N. (3)
Суммирование по всем возможным состояниям Б^ со всеми возможными предыдущими наблюдениями дает вероятность появления в момент г +1 состояния Б3 . 4. Вычисляется вероятность
N
Р(О \Х) = Т, ат(г). (4)
г=1
Пусть задана последовательность наблюдаемых состояний АММ ^^) = = 8(1)8(2)... ), где - состояние АММ вида (2) в момент времени г, г = = 1, 2,..., N.
Для распознавания последовательности Б(^) = 8(1)8(2)... ) введем массивы переменных:
аг(г) = Р (8(1)8(2) ...в(г), в(г) = 8,\лмм (Р)), г = 1,...^, г = 1,...,т,
которые позволяют определить вероятность того, что АММ (Р) к моменту времени г порождает последовательность Б(г) = 8(1)8(2)... в(г) и в момент времени г АММ (Р) находится в состоянии . Введем переменную
{1, если в(г + 1) = 83,
г = 1, .. . ,п
0 в противном случа,
определяющую наличие перехода в наблюдаемой последовательности состояний АММ из состояния в состояние 83 в следующий момент времени г + 1. Преобразуем выражение (3), взяв за значение х^. Перепишем этап инициализации 2:
\1, если з(г + 1) = зз, а1(г) = по(г) • х1, г = 1,...,п, х1 =<
0 в противном случае.
Здесь устанавливается значение прямой переменной, равное произведению начального значения последовательности наблюдений О1 и переменной х^.
Тогда на следующем этапе 3 определяем значение а1+1(з) посредством вычисления произведения переходных вероятностей из состояния з^ в состояние 83 и вероятностей того, что в момент времени г будет достигнуто состояние з^ из п возможных состояний АММ. Суммирование этих произведений по всем возможным состояниям дает вероятность появления состояния 83 в момент времени г + 1 совместно со всеми вероятностями появления предыдущих элементов последовательности. При вычислении а1+1(з) необходимо учесть значение х^. Таким образом, перепишем выражение (4) в виде:
аг+1(з)
(г) • Рз
л=1
г = 11,
а
х
з
Этап 4 дает искомую вероятность Р(5(М)\А): Р(Б^)\(Р)) = аи(вN)).
Рассмотрим случай, когда не все состояния последовательности на выходе АММ наблюдаемы.
Пусть Бк N) - ЦМ длины N, вида, аналогичного ), для которой существуют к моментов времени, к < N, в которые состояния в(£) скрыты от наблюдения. При выполнении этапа 2 вычисления значений аг+1(г), £ = 1, 2,..., N — 1, г = 1, 2,... ,п, имеет место выражение
at+i(j) =
i=1
/ / I 1, если s(t + 1) скрыто
' zj, zj = ^
г^ в противном случае Кроме того, если в(М) скрыто от наблюдения, то вероятность равна
т
Р('кN)\(Р)) = ^ аи(г).
г=1
Задача В решается путем выполнения предложенного алгоритма для задачи А с раз - по количеству различных ЭСМ, задающих подклассы АММ. В результате получаем множество значений |р )\(Р;))|, I = 1, 2,... ,с. Путем выполнения (с — 1) -го сравнения получаем искомое значение вероятности а:
P (S(N )\(Pa)) = ;maxc{ P (S(N )\(Pl))}
i=i
Решение задач A и B позволяет идентифицировать принадлежность марковской последовательности, в том числе ЦМ, содержащей состояния, скрытые от наблюдения, к заданной АММ(Р). Полученная модификация алгоритма «прямого-обратного хода» для АММ, определенных с помощью ЭСМ эффективна по вычислительной сложности в сравнении с предложенными в работах [18, 19] методами. Справедлива [21]
Теорема 1. Вычислительная сложность поиска значения P(Sk(N)\(P)), если s(N) не скрыто от наблюдения, составляет (N — 1 + k(n — 1)) • (n — 1) операций умножения и сложения; если s(N) скрыто от наблюдения, то вычислительная сложность увеличивается на (n — 1) операцию сложения.
Из теоремы 1 вытекает, что, вычислительная сложность предложенного метода при решении задачи идентификации конечных простых однородных ЦМ имеет порядок O(Nn) в случае, если все ее элементы наблюдаемы, когда как наличие ненаблюдаемых элементов в количестве, сопоставимом с длиной последовательности N, увеличивает порядок вычислительной сложности алгоритма до O(Nn2).
Рассмотрим поставленную задачу для идентификации АММ, заданных с помощью класса циклических ЭСМ [16]. Класс АММ определяется периодом r, r > 1. Пусть задано множество циклических стохастических матриц периода r (ЦСМГ) с максимальной энтропией: P € Pn(ЦСМr), где Pn(ЦСМr) - семейство ЦСМГ размерности n х n, полученное путем разбиения множества из n состояний АММ на r непустых подмножеств, ^„(ЦСМ,, )\ = S(n,r). Модифицированный метод «прямого-обратного хода» позволяет определить вероятность того, что АММ (P), где P € Pn(ЦСМr), к моменту времени t порождает последовательность S(t) = = s(1)s(2),..., s(t) и в момент времени t АММ (P) находится в состоянии si.
Значения at(i), t = 1, 2,... ,N i = 1, 2,... ,n находятся методом индукции в соответствии со следующим алгоритмом [22].
Шаг 1. На этапе инициализации переменных вычисляем:
(1, если Ыг) > = 1), .
а1\1) = \ г = 1, 2, .. . ,т;
I 0 в противном случае.
г = 0.
{1, если в (г + 1) = в,, 0 в противном случае,
Шаг 2. Для этапа индукции полагаем, что
, /Л \1, если (3 а'ь(г) • Ргз > 0) & (гз = 1), ^ 1 ЛГ 1 . 1 аг+1(3) = { 1 = 1,---,М - 1,3 = 1,. .., т.
0 в противном случае,
Шаг 3. Если (в(М)) > 0, то в(М) € БСГ и производится расчет вероятности идентификации принадлежности в(М) заданному подклассу БСг согласно формуле
( п- 1
Р(Б(М) \ЛММ(Р)) = 1 - -В
п
Замечание. Если на шаге 2 алгоритма получаем, что
т
Т,а+(3)=0,
з=1
то в(М) € БСГ .
Пусть Бк (М) - ЦМ длины М, вида, аналогичного ¿>(М), для которой существуют к моментов времени, к < М, в которые состояния в (г) скрыты от наблюдения.
Для идентификации последовательности, часть элементов которой скрыта от наблюдения, при выполнении шага 2 алгоритма идентификации, строится логическое выражение
(1, если (3 аг(г) • р^ > 0) & (г, = ^,
аг+1(з) =
0 в противном случае;
1, если в(г + 1) скрыто,
г'з = .
I г, в противном случае.
Кроме того, если в(М) скрыто от наблюдения, то
\ \1, если Зам (г) > 0,
а'м (зк(М)) = \'
у 7 10 в противном случае.
Для модифицированного алгоритма «прямого-обратного хода» идентификации АММ, определенных в настоящей работе на базе циклических стохастических матриц, справедлива [21]
Теорема 2. Вычислительная сложность поиска .значения Р(Б к(М)\(Р)), где Р € Рп(ЦСМг), для значения к, сопоставимого с длиной М циклической ЦМ, имеет порядок 0(Мп2), а для семейства Р € Рп(ЦСМг) - порядок О (Б (п, т)Мп2).
Заключение
В настоящей статье предложена модель распознавания непосредственно по наблюдаемой последовательности состояний АММ, основанная на модификации алгоритма «прямого-обратного хода». Предложенная модель позволяет количественно оценить вероятность идентификации последовательности ЦМ на предмет возможности генерирования ее заданной АММ.
Проанализирована зависимость порядка вычислительной сложности алгоритмов от таких параметров автоматной марковской модели, как количество состояний и длина идентифицируемой последовательности. Наличие ненаблюдаемых элементов в количестве, сопоставимом с длинной последовательности N, увеличивает порядок вычислительной сложности алгоритма.
Показана применимость модифицированной модели идентификации методом «прямого обратного хода» относительно ЦМ, сгенерированных АММ на основе стохастических матриц класса циклических. Идентификация возможна как для ЦМ, все состояния которых наблюдаемы в полном объеме, так и для марковских последовательностей, часть состояний которых скрыта от наблюдения.
Литература
1. Левин Б.Р. Вероятностные модели и методы в системах связи и управления. - М.: Радио и связь, 1985. - 312 с.
2. Friedman W.F., Callimahos D. Military cryptanalysis. Pt. I, V. 2. - Laguna Hills, CA: Aegean Park Press, 1985. - 242 p.
3. Rabiner L.R. A tutorial on hidden Markov models and selected applications in speech recognition // Proc. IEEE. - 1989. - V. 77, No 2. - P. 257-286. - doi: 10.1109/5.18626.
4. Тептин Г.М., Иванов К.В. Марковские модели средств защиты автоматизированных систем специального назначения // Учен. зап. Казан. ун-та. Сер. Физ.-матем. науки. - 2008. - Т. 150, кн. 4. - С. 41-53.
5. Раскин Л.Г. Анализ стохастических систем и элементы теории оптимального управления. - М.: Сов. радио, 1976. - 344 с.
6. Поспелов Д.А. Вероятностные автоматы. - М.: Энергия, 1970. - 88 с.
7. Бухараев Р.Г. К задаче минимизации входа автомата, генерирующего заданную однородную цепь Маркова // Учен. зап. Казан. ун-та. - 1967. - Т. 129, кн. 4. - С. 3-11.
8. Бухараев Р. Г. О представимости событий в вероятностных автоматах // Учен. зап. Казан. ун-та. - 1967. - Т. 127, кн. 3. - С. 7-20.
9. Альпин Ю.А., Альпина В.С. О нормальной форме стохастической матрицы // Учен. зап. Казан. ун-та. Сер. Физ.-матем. науки. - 2012. - Т. 154, кн. 2. - С. 60-72.
10. Бухараев Р.Г. Вероятностные автоматы. - Казань: Изд-во Казан. ун-та, 1970. - 188 с.
11. Захаров В.М., Нурмеев Н.Н., Салимов Ф.И., Шалагин С.В. Анализ стохастических матриц методами многомерной классификации // Дискретная математика и ее приложения: Материалы 7-го Междунар. семинара: в 3 ч. - М.: Моск. гос. ун-т, 2001. -Ч. II. - С. 156-159.
12. Захаров В.М., Нурмеев Н.Н., Салимов Ф.И., Шалагин С.В. Классификация стохастических эргодических матриц методами кластерного и дискриминантного анализа // Исследования по информатике. - Казань: Отечество, 2000. - Вып. 2. - С. 91106.
13. Лоренц А.А. Надежность и быстродействие вероятностных автоматов. - Рига: Зи-натне, 1976. - 112 с.
14. Романовский В.И. Дискретные цепи Маркова. - М.: Гостехиздат, 1949. - 436 с.
15. Федотов Н.Г. Методы стохастической геометрии в распознавании образов. - М.: Радио и связь, 1990. - 144 с.
16. Kemeny J.G., Snell J.L. Finite Markov Chains. - N. Y.; Springer, 1970. - 272 p.
17. Li T., Jadg D, Zelner A Evaluation of parameters of Markov property models by aggregated temporary rows. - Moscow: Statistics, 1977. - 221 p.
18. Нурутдинова А.Р., Шалагин С.В. Методика идентификации автоматных марковских моделей на основе порождаемых ими последовательностей // Вестн. КГТУ им. А.Н. Туполева. - 2010. - № 1. - С. 94-99.
19. Нурутдинова А.Р., Шалагин С.В. Многопараметрическая классификация автоматных марковских моделей на основе генерируемых ими последовательностей состояний // Прикл. дискр. матем. - 2010. - № 4. - С. 41-54.
20. Хинчин А.Я. Понятие энтропии в теории вероятностей // Усп. матем. наук. - 1953. -№ 3. - С. 3-20.
21. Нурутдинова, А.Р. Модифицированный алгоритм «прямого-обратного хода» решения задачи идентификации автоматных марковских моделей // Системы управления и информационные технологии. - 2018. - № 2. - С. 36-41.
22. Shalagin S.V., Nurutdinova A.R. Identification algorithms of simple homogeneous Markov chains of cyclic class and their complexity analysis // Int. J. Pharm. Technol. - 2016. -V. 8, No 3. - P. 14926-14935.
23. Шалагин С.В., Нурутдинова А.Р. Идентификация последовательности измерений экономических параметров на основе скрытой марковской модели // Проблемы анализа и моделирования региональных социально-экономических процессов: Материалы докл. VII Междунар. науч.-практ. конф. - Казань: Изд-во Казан. ун-та, 2017. -С. 159-162.
Поступила в редакцию 24.04.18
Нурутдинова Алсу Рафаиловна, соискатель
Казанский национальный исследовательский технический университет им. А.Н. Туполева - КАИ
ул. К. Маркса, д. 10, г. Казань, 420111, Россия E-mail: [email protected]
ISSN 2541-7746 (Print)
ISSN 2500-2198 (Online)
UCHENYE ZAPISKI KAZANSKOGO UNIVERSITETA. SERIYA FIZIKO-MATEMATICHESKIE NAUKI
(Proceedings of Kazan University. Physics and Mathematics Series)
2018, vol. 160, no. 3, pp. 578-589
A Modified Algorithm of "Forward-Backward" Solving the Identification of Automata Markov Models
A.R. Nurutdinova
Tupolev Kazan National Research Technical University, Kazan, 420111 Russia E-mail: [email protected]
Received April 24, 2018 Abstract
The paper is devoted to solving the problem of identifying discrete stochastic processes generated on the basis of automata Markov models. This problem is relevant because of the need to increase the efficiency of automata Markov models recognition. The effectiveness of identifying automata Markov models with a certain confidence probability is determined by the decrease in the length of Markov chains, as well as by the decrease in the computational complexity of algorithms for recognizing and minimizing the error in calculating traits relative to the ergodic stochastic matrices that define automata Markov models. The modified model allows to determine the probability values that a sequence is generated on the basis of the automata Markov model of the given class, which, in turn, is determined by the structure of the stochastic matrix. A feature of this model is the ability of the algorithm to recognize the class of the automata Markov model in the case when some states are not observable in the generated sequence. A modification of the "forward-backward" algorithm and its adaptation to the problem of identification of automata Markov models defined using ergodic stochastic matrices on the basis of the realizations of Markov chains generated by them has been proposed. In the paper, the task of modifying the "forward-backward" algorithm for automata Markov models determined on the basis of cyclic ergodic stochastic matrices has been solved. The estimates of the computational complexity of the proposed identification algorithms have been calculated. The most important of the results obtained are the following. A feature of this model is the ability of the algorithm to recognize the class of the automata Markov model in the case when some states are not observable in the generated sequence. The results obtained make it possible to better identify the automata Markov models by the output sequence. This problem can be applied to solve a wide range of problems of identification of Markov chains, including partially hidden ones.
Keywords: Markov chains, identification, stochastic matrix, "forward-backward" algorithm
References
1. Levin B.R. Veroyatnostnye modeli i metody v sistem,akh svyazi i upravleniya [Probabilistic Models and Methods in Communication and Management Systems]. Moscow, Radio Svyaz', 1985. 312 p. (In Russian)
2. Friedman W.F. Military Cryptanalis. Pt. I. Vol. 2. Laguna Hills, Calif., Aegean Park Press, 1985. 242 p.
3. Rabiner Lawrence R. A tutorial on hidden Markov models and selected applications in speech recognition. Proc. IEEE, 1989, vol. 77, no. 2, pp. 257-286. doi: 10.1109/5.18626.
4. Teptin G.M., Ivanov K.V. Markov models of defense means for automated special-purpose systems. Uchenye Zapiski Kazanskogo Universiteta. Seriya Fiziko-Matematicheskie Nauki, 2008, vol. 150, no. 4, pp. 41-53. (In Russian)
5. Raskin L.G. Analiz stokhasticheskikh sistem i elementy teorii optimal'nogo upravleniya [Analysis of Stochastic Systems and Elements of the Optimal Control Theory]. Moscow, Sov. Radio, 1975, 344 p. (In Russian)
6. Pospelov D.A. Veroyatnostnye avtomaty [Probabilistic Automata]. Moscow, Energy, 1970, 88 p. (In Russian)
7. Bukharaev R.G. On the estimation of the minimal number of input values of an automaton that generates a homogeneous Markov chain. Uchenye Zapiski Kazanskogo Universiteta. Seriya Fiziko-Matematicheskie Nauki, 1967, vol. 129, no. 4, pp. 3-11. (In Russian)
8. Bukharaev R.G. The representability of events in probabilistic automata. Uchenye Zapiski Kazanskogo Universiteta. Seriya Fiziko-Matematicheskie Nauki, 1967, vol. 127, no. 3, pp. 7-20. (In Russian)
9. Alpin Yu.A., Alpina V.S. On the normal form of a stochastic matrix. Uchenye Zapiski Kazanskogo Universiteta. Seriya Fiziko-Matematicheskie Nauki, 2012, vol. 154, no. 2, pp. 60-72. (In Russian)
10. Bukharaev R.G. Veroyatnostnye avtomaty [Probabilistic Automata]. Kazan, Izd. Kazan. Univ., 1970. 188 p. (In Russian)
11. Zakharov V.M., Nurmeev N.N., Salimov F.I., Shalagin S.V. Analysis of stochastic matrices using multivariate classification methods. Diskretnaya matematika i ee prilozheniya: Materialy 7-go Mezhdunar. seminara [Discrete Mathematics and Its Applications: Proc. 7th Int. Seminar]. Moscow, 2001, pt. II, pp. 156-159. (In Russian)
12. Zakharov V.M., Nurmeev N.N., Salimov F.I., Shalagin S.V. Classification of ergodic stochastic matrices using methods of cluster and discriminant analysis. Issled. Inf., 2000, no. 2, pp. 91-106. (In Russian)
13. Lorenc A.A. Nadezhnost' i bystrodeistvie veroyatnostnykh avtomatov [Reliability and Speed of Probabilistic Automata]. Riga, Zinatne, 1976. 112 p. (In Russian)
14. Romanovskii V.I. Diskretnye tsepi Markova [Discrete Markov Chains]. Moscow, Gostekhizdat, 1949. 436 p. (In Russian)
15. Fedotov N.G. Metody stokhasticheskoi geometrii v raspoznavanii obrazov [Methods of Stochastic Geometry in Pattern Recognition]. Moscow, Radio Svyaz', 1990. 144 p. (In Russian)
16. Kemeny J.G., Snell J.L. Finite Markov Chains. New York, Springer, 1970. 272 p.
17. Li T., Jadg D., Zelner A. Evaluation of Parameters of Markov Property Models by Aggregated Temporary Rows. Moscow, Statistics, 1977. 221 p. (In Russian)
18. Nurutdinova A.R., Shalagin S.V. The method of identification of automaton Markov models on the basis of sequences generated by them. Vestn. KGTU im. A.N. Tupoleva, 2010, no. 1, pp. 94-99. (In Russian)
19. Nurutdinova A.R., Shalagin S.V. Multiparameter classification of automation Markov models based on their generated sequence of states. Prikl. Diskretn. Mat., 2010, no. 4, pp. 41-54. (In Russian)
20. Khinchin A.Ya. Concept of entropy in the theory of probability. Usp. Mat. Nauk, 1953, no. 3, pp. 3-20 (In Russian)
21. Nurutdinova A.R. A modification of the "forward-backward" algorithm of identification of automata Markov models. Sist. Upr. Inf. Tekhnol., 2018, no. 2, pp. 36-41 (In Russian)
22. Shalagin S.V., Nurutdinova A.R. Identification algorithms of simple homogeneous Markov chains of cyclic class and their complexity analysis. Int. J. Pharm.. Technol., 2016, vol. 8, no. 3, pp. 14926-14935.
23. Shalagin S.V., Nurutdinova A.R. Identification of a sequence of measurements of economic parameters based on a hidden Markov model. Problemy analiza i modelirovaniya regional'nykh sotsial'no-ekonomicheskikh protsessov: Materialy dokl. VII Mezhdunar. nauch.-prakt. konf. [Problems of Analysis and Modeling of Regional Social and Economic Processes: Proc. VII Int. Sci.-Pract. Conf.]. Kazan, Izd. Kazan. Univ., 2017, pp. 159-162. (In Russian)
/ Для цитирования: Нурутдинова А.Р. Модификация модели и метода «прямого-( обратного хода» для идентификации автоматных марковских моделей // Учен. зап. \ Казан. ун-та. Сер. Физ.-матем. науки. - 2018. - Т. 160, кн. 3. - С. 578-589.
/ For citation: Nurutdinova A.R. A modified algorithm of "forward-backward" solving ( the identification of automata Markov models. Uchenye Zapiski Kazanskogo Universiteta. \ Seriya Fiziko-Matematicheskie Nauki, 2018, vol. 160, no. 3, pp. 578-589. (In Russian)