Серия «Математика»
2013. Т. 6, № 4. С. 23-30
Онлайн-доступ к журналу: http://isu.ru/izvestia
УДК УДК 639.3
Информационные оценки в задаче
слепой идентификации динамических систем *
В. В. Карелин
Санкт-Петербургский государственный университет
Аннотация. В статье рассматриваются вопросы сходимости и устойчивости байесовских оценок при идентификации стохастических систем управления. Основным аппаратом при установлении факта сходимости в данной работе является информационная мера рассогласования между оцениваемым распределением и оценкой. В качестве такой меры взято так называемое информационное число Кульбака -Лейблера. В работе установлена сходимость оценки переходной функции процесса к нестационарной переходной функции.
Ключевые слова: байесовские оценки; идентификация; информационное число.
Под слепой идентификацией будем понимать задачу идентификации, которая характеризуется той или иной степенью неопределенности относительно параметров входного и выходного сигналов. Решение задачи слепой идентификации динамической системы предполагает оценку неизвестных параметров системы только по наблюдаемому сигналу. Наблюдается последовательность случайных величин хг € X условное распределение которых относительно хг-1, принадлежит заданному семейству V распределений, зависящих от хг-1. Важной статистической задачей является восстановление переходной функции процесса хг, т. е. определение состоятельной последовательности оценок Рг(ёхг+1\хг), переходной вероятности Р(ёхг+1\хг). Задача усложняется тем, что в реальных ситуациях Р(с!хг+1 \хг) зависит от неизвестного вектора параметров 9 € 0, т.е. Р(ёхг+1\хг, 9). Цель статьи - изложение рекуррентной конструкции байесовского процесса оценивания и доказательство схо-
1. Постановка задачи
* Работа выполнена при финансовой поддержке РФФИ, грант 12-01-00752.
димости ее к <истинному> распределению. Предполагаются следующие условия регулярности.
1. Для каждого 9 € 0 и хг € X мера Р(йх\хг,9) доминируется неотрицательной мерой ш(йх') на X, т. е. существуют плотности Р(х\хг,9) относительно ш((1х).
2. 0 - измеримое пространство и Р(х\хг,9) - измеримая функция при каждом х на измеримом пространстве X х 0. Обозначим
Р(хг+1\хг,и) = J Р(хг+1\хг,9)йи(9),
©
где V - конечная мера на 0. Существуют и конечны интегралы
Р (хг+1\хг,9у
I (9,хг) = !
X
Р (хг+1 \хг^)_
Р (хг+1 \хь,9)ш(йу).
Процесс хг определяемый переходной функцией Р(хг+1 \хг,9) можно трактовать как частично наблюдаемый марковский процесс в фазовом пространстве X х 0 с переходной функцией для 9 : 9г+1 = 9г. Используя конструкцию, предложенную А. А. Юшкевичем [1] для сведения задачи с неполной информацией к задаче с полной информацией, приходим к рассмотрению процесса в фазовом пространстве X х Н, где Н -пространство распределений на 0. Переходная фикция этого процесса задается соотношениями
Р(хг+1\хг ,vt) ^ J Р(хг+1\хг ,9^(9)и(с19), (1.1)
©
^ = (1'2>
с начальными распределениями Р1 (х1)^1(9) = ^1 /йи.
2. Информационное число Кульбака — Лейблера
Пусть Р1(х) и Р2 (х) - вероятностные меры на измеримом пространстве относительно неотрицательной меры ш(йх).
Определение 1. Информационным число Кульбака - Лейблера называют величину [2].
1{Р1]Р2) = I[1п ^щ\Р1(х)т(с1х). (2.1)
X
ИНФОРМАЦИОННЫЕ ОЦЕНКИ В ЗАДАЧЕ СЛЕПОЙ ИДЕНТИФИКАЦИИ 25
Если интеграл (2.1) существует, то
I(Р1 (х); Р2(х)) > 0.
При этом I(Р1(х); Р2(х)) = 0, тогда и только тогда, когда почти всюду Р1(х) = Р2(х).
Здесь имеет место следующее утверждение.
Теорема 1. Справедливо неравенство
1(Рг(хУ,Р2(х))>-
\Рі (х) — Р2(х)\т(йх)
(2.2)
Доказательство. Разлагая функцию — 1п(а) в окрестности точки а = 1 в ряд Тейлора, имеем
(1 ~ а)2
-1п(«) = 1-«+2[1_/?(1_а)]2, 0 < /3 < 1.
Полагая а = Р2/Р1, получим
/(«(*); ад) = і / її .'до-ъ(™1))УР1(х)т(,1х) ~
X
1
> -~ 2
2 1 с
Р\{х)т{с1х) + - ір{у)т{сІх),
Р1(х)\
Р1<Р2 Р >Р2
где ^(х) > 0. Обозначим /л(Л) = / Р1 (х)ш(йх) < 1, а множество А
А
определяется неравенством Р1(х) > Р2 (х).
Тогда
1 / Си Р2(х), ' 2
ЦРШР2М) > I ц - ^М|РіМт(Л:)} =
А
\Р2(х) — Рі (х)\т(йх)
ЫА)
А
Так как
([Рі(х) — Р2(х)]т(йх) = І [Рі(у) — Р2(у)]т(йу) =
А Рі<Р2
= J \Рі(х) — Р2(х)\т(сІх) = ^ J \Р\(х) — Р2(х)\т(сІх).
Рі<Р2 X
Окончательно имеем неравенство
1{Р1{х)-1Р2{х)) > I\Р2{х) - Р1{х)\т{(1х)^ >
X
1
> -- 8
J \Р2(х) — Р\(х)\т(йх) у
2
□
Таким образом, метрику р можно оценить сверху величиной (81 )2, т. е. для стремления р —^ 0 достаточно, чтобы I —^ 0. Для семейства нормальных распределений выполняется еще одно свойство.
Теорема 2. Пусть Ро(х) - произвольное распределение в Кп с центром в точке а и ковариационной матрицей V. Рассмотрим семейство Q нормальных распределений в Кп, в котором до(х) - нормальная плотность с тем же центром в а и ковариационной матрицей V. Тогда для любого д(х) € Q выполняется неравенство I(Ро; до) < I(Ро; о). Равенство достигается тогда и только тогда, когда д = до.
Доказательство. Ввиду того что 1п до/д— квадратичная форма,
У 1п(оо/д)Ро йх = J 1п(до/д)дойх
X X
Отсюда следует, что
I (Ро; о) = I (Ро; оо) +1 (до; о).
Так как
I(Ро; о) = ! \п(Ро/о)Ройх, I(до; д) = ! \п(до/д)Ройх,
X X
I(Ро; д) = ! 1п(Ро/д)Ройх + ! \п(до/д)Ройх.
X X
Поэтому I(Ро; до) < I(Ро; д) причем равенство будет тогда и только тогда, когда 1(до; д) = 0, т. е. д = до. □
то
ИНФОРМАЦИОННЫЕ ОЦЕНКИ В ЗАДАЧЕ СЛЕПОЙ ИДЕНТИФИКАЦИИ 27
3. Асимптотические свойства последовательности щ
Определим переходную функцию процесса {х*,Л*} соотношениями
В качестве оценки функции Л* (в) выбираем распределение щ(в), определяемое рекуррентным соотношением (1.2) с произвольным начальным значением Р\(в). Установим, что при Т переходная функция Р(х+^хг,^^ становится близкой к «истинной> переходной функции
Р (хг+1\хг,Хг).
Теорема 3. [2, 3] Пусть {хг, Л*} - марковский процесс, определяемый соотношениями (3.1) и (3.2). Тогда выполняется следующее неравенство:
Следствие 1. С вероятностью 1 справедливы соотношения
Распределение Л1(в) - произвольное. Например, в качестве Л1(в) может быть взято любое распределение, сосредоточенное в сколь угодно малой окрестности и0 точки в0. Тогда и все распределения Л1(в) сосредоточены в этой окрестности.
Процесс {хг, Л*} можно трактовать следующим образом: в* - случайная величина с распределением Лг(в); хг+1 - случайная величина с условным распределением Рг(хг+1\х*,вг), причем при всех £ > 1 выполняется включение в* € Цо. Таким образом, процесс х* можно трактовать как процесс, переходная функция которого определяется параметром, подверженным «малым> возмущениям. Ввиду включения в* € ио можно ожидать, что для в* = в0 оценки Р*(хг+1\хг,и*), будут близки к <истинной> переходной функции Р*(х*+1 \х*,в0),
Если множество 0 конечно, то окрестность точки вг совпадает с точкой в г (можно выбрать дискретную топологию). В этом случае интегральные соотношения принимают вид конечных или бесконечных
Р(х*+1\х*,Л*) = ! Рв(х*+1\х*)Л*(в)и(с1в),
(3.1)
(3.2)
(3.3)
где
I* = I(Р(•\х*), Л*); Р(•\х*, V)).
1=1
сумм, а функции ^*(в) превращаются в вероятностные последовательности щ(г),г = 1, 2,... . Тогда соотношение (3.3) принимает вид
ГО
Е(^2 I*) < -1п V1({о), г=1
где г0 - номер переходной функции, определяющий процесс х*;
ГО
I* = I(Рго; Р*), Р* = ^2 Рг(х*+1\х^*(г). г=1
4. Линейные разностные уравнения
Рассмотрим линейное разностное уравнение п-го порядка с нормальными возмущающими воздействиями.
к=п—1
хг+1 = ак х*-к + ft+1,
к=0
здесь ак - постоянные коэффициенты, ^ - последовательность неза-
2
висимых гауссовских величин с нулевым средним и дисперсией а . Пусть х* наблюдаются, коэффициенты ак неизвестны. На процессе {х*} рассмотрим функционал
1 т
,1 = Ит — Ех+. (4.1)
т^го Т ^ *
*=1
Введем следующие обозначения: в' = (а0,а]_, ...,ап-1). Тогда
х*+1 = в'г* + ^+1, г* = (х*,х*-1,...,х*-п). (4.2)
Переходная функция процесса, определяемая этим уравнением, имеет вид
Рв(х*+1\г*) = Е(х*+1 - в'г*),
где Е(у) - плотность распределения случайной величины Д. Байесовскую конструкцию, связанную с семейством переходных функций Рв(х*+1 \г*), представим следующим образом:
Р(х*+1^*,г*) = J Е(х*+1 - в'г^(в)и(йв),
&
.....“»
ИНФОРМАЦИОННЫЕ ОЦЕНКИ В ЗАДАЧЕ СЛЕПОЙ ИДЕНТИФИКАЦИИ 29
Пусть vt(9) - плотность нормального случайного вектора со средним значением 9t и корреляционной матрицей St. Тогда vt+i(9) - плотность нормального вектора с корреляционной матрицей St+i и средним значением 9t+i, причем справедливы рекуррентные соотношения, аналогичные соотношениям дискретного фильтра Калмана
Sr+i = Si1 + —ztz't, af2
Ot+1 = St+iiSf^t + —(xt+i)zt]. (4.4)
af2
Из этих соотношений вытекает, что в случае гауссовских величин ft апостериорные плотности vt(9) распределения обладают интересным свойством - их корреляционные матрицы монотонно убывают: St+i <
St.
И в заключение рассмотрим следующую теорему.
Теорема 4. Пусть vt(9) - последовательность апостериорных распределений, соответствующих нормальному априорному распределению vt(9), причем nSi < I. Пусть X(9) - плотность распределения, сосредоточенного в ограниченной области, удовлетворяющая неравенству X(9) < Cv(9). Тогда выполняются неравенства
E{z2} < const.
Доказательство. Ввиду неравенства Ezf < CE\z2 для доказательства ограниченности последовательности Ezt достаточно показать ограниченность последовательности E\z2. Последовательность матриц St монотонно убывает при всех t > 1, поэтому выполняется неравенство
I — nSt > I — nSo > во I,
если величина во достаточно мала. Следовательно,
EV(zt+i) < pEV(zt) + nd2,
где p < 1, V(zt) - квадратичная форма и Ef2 = d2. Отсюда EV(zt) < const, что эквивалентно ограниченности Ez2. □
Поясним смысл утверждений этой теоремы. Процесс (xt; vt), обусловленный переходной функцией P(xt+i\zt,vt), можно трактовать как процесс, определяемый уравнением
Xt+i = ef zt + ft+i,
где 9t - случайный вектор с распределением Xt(9). Так как носитель распределения Xt(9) сосредоточен в окрестности точки 9о, то при yt выполняется неравенство \9t—90\ < в. Таким образом, теорема утверждает,
что байесовской процесс оценивания минимизирует величину (4.1) на решениях уравнения (4.2) с «малым> случайным возмущением вектора коэффициентов. Естественно, можно надеяться, что он будет минимизировать эту величину и для уравнения с невозмущенным вектором параметров 9t = 90.
Список литературы
1. Дынкин Е. Е. Управляемые марковские процессы и их приложения / Е. Е. Дынкин, А. А. Ющкенич. - М. : Наука,1975. - 338 с.
2. Karelin V. V. Adaptiveoptimal strategies in controlled Markov processes / V. V. Karelin // Advances in Optimization. Proceedings of 6-th French-German Colloquium of Optimization. FEG. - 1991. - P. 518-525.
3. Карелин В. В. Один подход к задаче оценки параметров динамической системы в условиях неопределенности / В. В. Карелин // Вестн. С.-Петерб. ун-та. Сер. 10. - 2012. - Вып. 4. - С. 31-36.
V. V. Karelin
Information estimates in the problem blind identification of dynamic systems.
Abstract. The convergence and stability problems of the Bayesian estimations are considered for identification of stochastic control systems. The main tools to prove the convergence is the information measure of the mismatch between the given distribution and the estimation. As a measure, the so-called information number of Kulbaka - Leiblera is taken. The convergence of the estimation of the transitive function to the process to the nonstationary transitive function is established.
Keywords: Bayesian estimation, identification, information number.
Карелин Владимир Витальевич, кандидат физико-математических наук, доцент, Санкт-Петербургский государственный университет, 1990З4, Санкт-Петербург, Университетская набережная, д. 7-9 тел.: (812)4285048 ([email protected])
Karelin Vladimir, Saint Petersburg state university Universitetskaya nab. 7-9, Saint Petersburg, 1990З4, assoc. prof., Phone:(812)4285048 ([email protected])