Научная статья на тему 'О параметрическом моделировании стохастических объектов'

О параметрическом моделировании стохастических объектов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
252
61
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АПРИОРНАЯ ИНФОРМАЦИЯ / ИДЕНТИФИКАЦИЯ В УЗКОМ И ШИРОКОМ СМЫСЛАХ / СТОХАСТИЧЕСКИЙ ОБЪЕКТ / НЕПАРАМЕТРИЧЕСКИЕ И ПАРАМЕТРИЧЕСКИЕ МОДЕЛИ / IDENTIFICATION IN “NARROW” AND “WIDE” SENSE / PRIORI INFORMATION / STOCHASTIC OBJECT / NON-PARAMETRIC AND PARAMETRIC MODELS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Корнеева А. А., Чжан Е. А.

Рассматривается проблема идентификации многомерных статических объектов при различном уровне априорной информации. Исследуется вопрос о влиянии выбранной параметрической структуры модели на качество идентификации в условиях помех, ее соответствии реальному математическому описанию объекта. Приводятся результаты численного исследования различных параметрических моделей многомерных статических процессов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ABOUT THE PARAMETRIC MODELING OF STOCHASTIC OBJECTS

The authors consider the problem of multi-dimensional static objects identification at different levels of a priori information and investigate the question of the influence of the selected parametric model structure on the identification quality under noise conditions, its adequacy to the actual mathematical description of the object. The results of computational investigation of different parametric models of multi-dimensional static processes are presented.

Текст научной работы на тему «О параметрическом моделировании стохастических объектов»

R - надежность системы, максимизация которой осуществляется согласно выражению

maxR = KFk П R•

k=1 i^Sk

Межмодульный интерфейс - это количество одних и тех же мультиверсий модулей, использующихся разными программами [6].

Для формализации постановки задачи, обеспечивающей минимизацию межмодульного интерфейса, введем дополнительную переменную Wik - булеву переменную, равную 1, если i-й модуль используется k-й программой и 0 - в противном случае.

1 если tWikXj > 1,

Y = , i=1

k I n

0, если ^WikXij = 0.

i=1

Переменная Ykj служит для формализации взаимосвязи разрабатываемой системы с отдельными мультиверсиями модулей.

Для минимизации межмодульного интерфейса на уровне отдельных версий в качестве критерия используется следующее выражение:

J K-1 K

min£ £ £ Yk,Jk'j •

j=1 k=1 k'=k+1

Представленная постановка задачи позволяет сформировать мультиверсионный набор компонентов модулей, использующихся в программах модульного ПК как произвольно, так и в заданной заранее последовательности. Полученный набор мультиверсий будет удовлетворять заданным условиям, обеспечивая максимальную надежность ПК и минимальное значение характеристик межмодульного интерфейса.

Библиографические ссылки

1. Ковалев И. В., Капулин Д. В., Царев Р. Ю. Архитектурная надежность программного обеспечения

информационно-управляющих систем : монография / Краснояр. гос. аграр. ун-т. Красноярск, 2011.

2. Kovalev I. V. System of Multi-Version Development of Spacecrafts Control Software. Sinzheim, 2001.

3. Kovalev I. V., Younoussov R. V. Fault-Tolerant Software Architecture Creation Model Based on Reiability Evalutation // Advances in Modeling and Analysis. D. 2002. Vol. 7, № 3. P. 31-44.

4. Мамиконов А. Г., Кульба В. В. Синтез оптимальных модульных СОД. М. : Наука, 1986.

5. Капчинский И. А., Кузнецов А. С., Штенцель А. В. Принципы формирования мультиверсионного программного комплекса // Вестник СибГАУ. 2008. Вып. 1 (18). С. 18-23.

6. Новой А. В., Штенцель А. В. Оценка надежности мультиверсионной программной архитектуры систем управления и обработки информации // Вестник СибГАУ. 2008. Вып. 3 (20). С. 73-79.

References

1. Kovalev I. V. Kapulin D. V., Carev R. J. Arhitekturnaja nadezhnost' programmnogo obespechenija informacionno-upravljajushhih system (Architectural software reliability management information systems). Krasnojar. gos. agrar. un-t. Krasnojarskj, 2011, 182 p.

2. Kovalev I. V. System of multi-version development of spacecrafts control software. Pro Universitate Verlag Sinzheim. 2001, 77 p.

3. Kovalev I. V., Younoussov R. V. Fault-tolerant software architecture creation model based on reiability evalutation. Advances in Modeling and Analysis -D. 2002, vol. 7, № 3, pp. 31-44.

4. Mamikonov A. G., Kulba V. V. Sintez optimal'nyh modul'nyh SOD (Synthesis of optimal modular SOD). Moscow, Nauka, 1986.

5. Kapchinskij I. A., Kuznecov A. V., Shtendel A. V. VestnikSibGAU. 2008, № 1 (18), pp. 18-23.

6. Novoj A. V., Shtendel A. V. Vestnik SibGAU. 2008, № 3 (20), 73-79.

© Ковалев И. В., Нургалеева Ю. А., Шахматов А. В.,

Чекмарев С. А., Лукин Ф. А., 2013

УДК 519.87

О ПАРАМЕТРИЧЕСКОМ МОДЕЛИРОВАНИИ СТОХАСТИЧЕСКИХ ОБЪЕКТОВ

А. А. Корнеева, Е. А. Чжан

Сибирский федеральный университет Россия, 660041, Красноярск, просп. Свободный, 79. Е-шаП: [email protected]

Рассматривается проблема идентификации многомерных статических объектов при различном уровне априорной информации. Исследуется вопрос о влиянии выбранной параметрической структуры модели на качество идентификации в условиях помех, ее соответствии реальному математическому описанию объекта. Приводятся результаты численного исследования различных параметрических моделей многомерных статических процессов.

Ключевые слова: априорная информация, идентификация в узком и широком смыслах, стохастический объект, непараметрические и параметрические модели.

ABOUT THE PARAMETRIC MODELING OF STOCHASTIC OBJECTS

A. A. Korneeva, E. A. Chzhan

Siberian Federal University 79 “Svobodnyi” prosp., Krasnoyarsk, 660041, Russia. Е-mail: [email protected]

The authors consider the problem of multi-dimensional static objects identification at different levels of a priori information and investigate the question of the influence of the selected parametric model structure on the identification quality under noise conditions, its adequacy to the actual mathematical description of the object. The results of computational investigation of different parametric models of multi-dimensional static processes are presented.

Keywords: priori information, identification in “narrow’ parametric models.

При параметрическом моделировании (или идентификации в узком смысле) предполагают, что структура объекта каким-то образом выбрана на основании имеющейся априорной информации с точностью до параметров. Следующий основной этап состоит в оценке этих параметров на основании текущей информации. Итак, построение параметрической модели состоит из двух основных этапов: определения класса параметрических структур с точностью до параметров и их последующего оценивания по результатам наблюдения входных-выходных переменных исследуемого объекта. Однако на практике объема априорной информации часто недостаточно для обоснованного выбора класса моделей с точностью до параметров. Тем самым неизбежно возникает большая или меньшая неточность на стадии формулировки задачи идентификации. Здесь уместно вспомнить известную фразу Демокрита: «Даже незначительное отступление от истины в дальнейшем ведет к бесконечным ошибкам».

Ниже мы уделим особое внимание случаю, когда структура модели и уравнение исследуемого процесса в той или иной мере отличаются.

Постановка задачи. Общепринятая схема исследуемого процесса представлена на рис. 1 [1; 2].

На рис. 1 приняты следующие обозначения: А - неизвестный оператор объекта; x(t) e Q(x) с R1 - выходная

переменная процесса; u(t) = (ui (t), i = 1, m) e Q(m) с Rm -векторное входное воздействие; Ç(t) - векторное случайное воздействие; (t) - непрерывное время; Hu,

Их - каналы связи, соответствующие различным переменным, включающие в себя средства контроля;

and “wide” sense, stochastic object, non-parametric and

№ (/), ^ (/) - случайные помехи измерений соответствующих переменных процесса с нулевыми математическими ожиданиями и ограниченной дисперсией.

Измеряя значения входных и выходных переменных с интервалом времени At, получим обучающую

выборку {иг, , i = 1,5}, где 5 - объем выборки, которая используется для оценки параметров модели. Обратим внимание на одно важное обстоятельство, связанное со стохастической зависимостью компонент вектора и^). При наличии подобной зависимости вид параметрической модели исследуемого процесса существенно меняется [3]. Более подробно об этом см. в [4].

Следует отметить, что объем выборки и характер ее накопления оказывают существенное влияние на качество решения задачи идентификации, однако на практике чаще всего объем выборки весьма ограничен. О важности задач такого рода говорит председатель Экспертного совета РФФИ по математике, механике и информатике академик Е. И. Моисеев: «...существует очень важная проблема, как сделать заключение на основании малого - в смысле математической статистики - количества данных. У нас была рассмотрена задача из области медицины примерно с 20 параметрами (прогноз катастрофического течения послеоперационного периода) и всего 600 данными. По всем правилам, нельзя делать вывод по 600 данным, если меняются 20 параметров. Но где взять больше? 600 операций сделали - вот и вся статистика. Жизнь такие задачи ставит». Данное исследование тесно связано со сформулированной выше проблемой.

Рис. 1. Общая схема исследуемой системы (обозначения см. в тексте)

Параметрическая идентификация. При построении моделей разнообразных дискретно-непрерывных процессов в настоящее время доминирует теория параметрическая идентификации, или идентификация в узком смысле [1; 2]. Ее содержание, как было отмечено выше, состоит в том, что на первом этапе на основании имеющейся априорной информации определяется параметрический класс операторов Аа, например:

М0 =А“(и ( ) а), (1)

где Аа - параметрическая структура модели; а - вектор параметров. На втором этапе осуществляется оценка параметров а на основе имеющейся выборки {, ui, i = 1,5}, где 5 - объем выборки. Существует большое количество методов получения оценок параметров, например метод стохастических аппроксимаций [1]:

( N \

І I

а = а

*-1

+ У*

і=1

^ (1) = А ), X*, и*),

(3)

В качестве оценки (3) можно использовать непараметрическую оценку функции регрессии Надарая-Ватсона [5; 6]:

;(м ) =

Іх П Ф(с-1 (- и/))

г=1 у=1

І I! Ф( (- иі))

(4)

і=1 у=1

где Ф

(с51 (и] - и/)), i = 1,5, ' = 1, т - ядерная колоколообразная функция и коэффициент размытости ядра е8, которые удовлетворяют следующим условиям сходимости [2; 5]:

с* > 0, ііш с* = 0, ііш *сх = ад,

ф

Ііш с.

где у5, у = 1, N - коэффициенты Роббинса-Монро, удовлетворяющие определенным условиям сходимости [2].

На практике обычно основное внимание уделяется задаче определения параметров объекта при заданной или принятой структуре [2]. Качество полученной модели зависит от того, насколько хорошо угадана параметрическая структура. Однако структура зависимости априорно не известна, т. е. она подбирается экспериментальным путем. К чему может привести неправильно подобранная структура, будет показано ниже.

Непараметрическая идентификация. Априорная информация об объекте при непараметрической идентификации, или идентификации в широком смысле, отсутствует или очень бедная, поэтому приходится предварительно решать большое число дополнительных задач. К этим задачам относятся выбор структуры системы и задание класса моделей, оценивание степени стационарности и линейности объекта и действующих переменных, оценивание степени и формы влияния входных переменных на выходные, выбор информативных переменных и др. К настоящему времени накоплен большой опыт решения задачи идентификации в узком смысле. Методы же решения задач идентификации в широком смысле начали разрабатываться только в последние годы, и здесь результаты значительно скромнее, что в первую очередь можно объяснить чрезвычайной трудностью задачи [1].

Идентификация в широком смысле предполагает отсутствие этапа выбора параметрического класса оператора. В этом случае задача идентификации состоит в оценивании класса операторов на основе выборки {, и, i = 1,5} в форме

(с( -и) 0, с-' I ф(с5( -и)) =1 (5)

0(и )

1ф(с-1 (и-' - и/ ) = б(и-/ - и/) .

В качестве колоколообразной функции Ф^с-1(и-/ - и/))

могут быть использованы ядра различного вида: треугольное, параболическое или прямоугольное.

Параметр размытости с5 при наличии обучающей

выборки {хг-, и1, i = 1,5} находится из задачи минимизации квадратичного показателя соответствия выхода объекта и выхода модели, основанного на методе скользящего экзамена, когда в модели (4) по индексу i исключается к-е наблюдение переменной, предъявляемой для экзамена:

5 2

К(е5 ) = Е ( - X (ик , С5 )) = ШШ, к * i, (6)

к=1 е5

т. е. i = к, где индекс i фигурирует в формуле (4).

Вообще говоря, каждой компоненте вектора и может соответствовать компонента вектора е8. Таким образом, формула (4) может быть представлена в следующем виде:

ІХг П Ф(С-' ( - иІ ))

;(М ) =

г=1 у=1

І п Ф(с-1 ( - иі))

(7)

г =1 у=1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где X* = (х1,х2,...,X*),и* = (и1,и2,...,и*.) - временные

векторы. Оценка оператора А* в некоторых случаях

может быть осуществлена средствами непараметрической статистики [5].

тогда определение компонент вектора с* = с*1, с* 2,.., с*т может быть осуществлено из минимизации критерия Я (с* ) (6) по вект°ру с* = ^ с* 2 с*т .

Во многих практических задачах может быть использован следующий прием. Приведем численные значения наблюдений вектора и к одному и тому же интервалу с помощью операции центрирования и нормирования. В этом случае приближенно можно принять

компоненты вектора с* = с*1,с*2,...,с*т одинаковыми, т. е. с*1 = с*2 =... = с*т. В итоге определение параметра

размытости существенно упрощается, поскольку оно приводится к одномерной задаче оптимизации Я (е5) по е5.

Примечательным здесь является то, что при этом исключается этап выбора параметрической структуры, т. е. уравнения процесса с точностью до параметров. Тем самым можно утверждать, что идентификация в этом случае, а это вариант идентификации в широком смысле, является более адекватной многим реальным задачам.

Следует обратить внимание на то, что непараметрическая оценка функции регрессии относится к классу локальных аппроксимаций. Это и обусловливает возможность ухода от привычного этапа параметризации. Более того, при наличии «трубчатой» структуры исследуемого процесса в данном случае не требуется каких-либо коррекций непараметрической модели в отличие от параметрической [3].

Численные исследования. В целях проведения численного эксперимента зададим уравнение линейного относительно коэффициентов объекта. Для примера рассмотрим многомерный безынерционный стохастический объект

х (и ) = 1^ш и1 + 0,3и2 + и3 -- 0,6и4 + 0,3и5 + 0,5и6 + 0,5и7 + (8)

+ 0,2и8 + 0,3sinи9 -0,4cosи10,

где и е [0;3], i = 1,10 .

На выход объекта накладывалась помеха

I = хф , (9)

где д - случайная величина, нормально распределенная в интервале [-1; 1]; к - процент помехи.

О качестве модели будем судить по относительной ошибке аппроксимации:

ст=(х (и)- х5 (и ))21) ((и)- тх )2, (10)

5

где 5 - объем выборки; Пх = 5- ^ X (и) - оценка

г=1

математического ожидания.

Принято считать [7], что вид параметрической модели задан априорно и стоит лишь задача оценивания

коэффициентов по выборке. Рассмотрим, к чему приводит ошибка при математическом определении структуры. Приведем модель, структура которой отлична от структуры объекта:

xs (и) = ajexp(Mj) + а2и2 +

+ а3и3 +а 4и4 +а5и5 +а6и2 + (11)

+ а7и2 +а8и8 +а9 sin и9 +а10и10.

Таким образом, мы заменили один член, входящий в описание объекта, на явно отличающийся член. Результаты моделирования представлены в табл. 1.

Таблица 1

Результаты моделирования объекта (8) и модели (11)

Объем выборки s Процент помехи к Относительная ошибка ст

50 3 0,149

100 3 0,153

500 3 0,159

1000 3 0,159

10 000 3 0,159

100 000 3 0,156

50 5 0,167

100 5 0,167

500 5 0,165

1000 5 0,166

10 000 5 0,170

100 000 5 0,167

Как видно из табл. 1, с увеличением помехи измерений выхода объекта относительная ошибка аппроксимации увеличивается. Однако с увеличением выборки нет ожидаемого уменьшения ошибки (10), т. е. величина ошибка практически не меняется.

На рис. 2 представлен график значений выхода объекта и модели по переменной и1, т. е. и1 е [0; 3], и2 = и3 =... = и10 = 1,5 . Такой график будем называть срезом по переменной и1. Объем точек 5 = 50 и помеха к = 3%. На рис. 2 и далее показаны значения выхода объекта х(и) и его параметрической модели х5(и).

Из графика среза по переменной и1 (см. рис. 2) видно, что модель не повторяет поведение объекта. Этот факт вытекает из того, что функции при и1 в объекте и в модели не совпадают. Однако при оценивании коэффициентов с помощью МНК коэффициент при переменной и1 практически равен нулю (а1 = 0,024 ) при объеме выборки 5 = 50 и с ростом выборки 5 значение коэффициента уменьшается (табл. 2).

Таблица 2

Оценки коэффициентов модели (11) в зависимости от объема выборки

5 50 500 10 000 100 000

а1 0,024 0,016 0,011 -0,004

На рис. 3 показан срез по переменной и3 .

В данном случае значения модели и объекта практически совпадают (рис. 3), отличие в значениях модели и объекта вызвано наличием помехи (9). Значительное отличие в значениях объекта и модели наблюдается только по переменной и1 .

Теперь в модели при еще одной переменной возьмем функцию, отличную от истинной:

х5 (и) = а1exp(u1) + а2и2 +

+ а3и3 + а4и4 + а5и5 + а6и^ + а7 и7 + + а8и8 + а9 sinи9 + а10 cos и10.

(12)

В этой серии экспериментов уже при двух входных переменных функции были плохо угаданы.

Результаты моделирования при разном объеме выборки и различном уровне помех представлены в табл. 3.

Таблица 3

Результаты моделирования объекта (8) и модели (12)

Объем выборки 5 Процент помехи к Относительная ошибка ст

50 3 0,204

100 3 0,199

500 3 0,211

1 000 3 0,212

10 000 3 0,212

50 5 0,227

100 5 0,200

500 5 0,215

1 000 5 0,217

10 000 5 0,220

Ошибка аппроксимации увеличилась в среднем на 6 %. Однако в данном случае, как и в предыдущих, ошибка не уменьшается с ростом выборки. Функции при двух переменных не соответствуют истинным, ошибка моделирования при этом составляет 20 %.

Далее приведеу срез по переменной и3 (рис. 4). Как и следовало ожидать, в данном случае график модели более не линеен в отличие от графика объекта. Структура объекта и модели не совпадают по переменной и3 , что и привело к увеличению ошибки.

Рис. 3. Срез по переменной и3

9 ■■

а.а а.5 1.а 15 2,а 2£ г

Рис. 4. Срез по переменной и3

Рассмотрим еще один случай, который состоит в искажении члена, входящего в описание модели:

xs (и) = ajexp(Mj) + а2м3 +а3и3 +

+ а4и4 +а5и5 +а6 и4 +а7 и2 + (13)

+ а8и8 +а9 sinи9 +а10 cosи10.

Результаты серии аналогичных экспериментов представлены в табл. 4.

Таблица 4

Результаты моделирования объекта (8) и модели (13)

Объем выборки s Процент помехи к Относительная ошибка ст

50 3 0,253

100 3 0,252

500 3 0,255

1 000 3 0,257

10 000 3 0,257

50 5 0,268

100 5 0,250

500 5 0,260

1 000 5 0,260

10 000 5 0,262

Функции при трех переменных, входящих в уравнение модели, не соответствуют истинным, ошибка увеличилась на 4 % по сравнению с предыдущими результатами, т. е. чем хуже подобрана модель, тем больше ошибка.

На основе проведенных экспериментов можно сделать следующие выводы. Очевидным является тот факт, что при несовпадающей структуре модели, т. е. когда структура модели не соответствует математическому описанию объекта, ошибка аппроксимации велика и такая модель неадекватна. Были получены противоречивые результаты: увеличение выборки не приводит к уменьшению ошибки моделирования. Если математическое описание модели и объекта совпадает по всем переменным кроме одной, то это приводит к тому, что коэффициент при этой переменной стремится к нулю при увеличении выборки. Именно поэтому она не оказывает негативного влияния на модель и ошибка аппроксимации в этом случае не так велика (около 14 %).

Библиографические ссылки

1. Эйкхофф П. Основы идентификации систем управления. М. : Мир, 1975.

2. Цыпкин Я. З. Основы информационной теории идентификации. М. : Наука, 1984.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

3. Медведев А. В. Анализ данных в задаче идентификации // Компьютерный анализ данных моделирования. Минск : Изд-во Белорус. гос. ун-та, 1995. Т. 2. С. 201-206.

4. Корнеева А. А., Сергеева Н. А., Чжан Е. А. О непараметрическом анализе данных в задаче идентификации // Вестн. нац. исслед. Том. гос. ун-та. Управление, вычисл. техника и информатика. 2013. № 1 (22). С. 86-96.

5. Надарая Э. А. Непараметрические оценки плотности вероятности и кривой регрессии. Тбилиси : Изд-во Тбил. ун-та, 1983.

6. Медведев А. В. Непараметрические системы адаптации. Новосибирск : Наука. Сиб. отд-ние, 1983.

7. Зарубин В. С. Математическая статистика / под ред. В. С. Зарубина, А. П. Крищенко. М. : Изд-во Моск. гос. техн. ун-та им. Баумана, 2008.

References

1. Eykhoff P. Osnovy identifikacii sistem upravleniya (System Identification Parameter and State Estimation). Moscow, Mir, 1975, 683 p.

2. Cypkin Ja. Z. Osnovy informacionnoj teorii identifikacii (The foundation of information identification theory). Moscow, Nauka, 1984, 320 p.

3. Medvedev A. V. Analiz dannih v zadache identifikacii (Data analysis in the identification problem). Minsk, BGU, 1995, vol. 2, pp. 201-206.

4. Korneeva A. A., Sergeeva N. A., Chzhan E. A. Vestnik TGU. Upravlenie, vychislitelnaya texnika i informatika (Control, computer engineering and and computer science). 2013, no. 1 (22), pp. 86-96.

5. Nadaraya E. A. Neparametricheskie ocenki plot-nosti veroyatnosti i krivoj regressii (Non-parametric estimation of the probability density and the regression curve). Tbilisi, izd. Tbil. un^, 1983, 194 p.

6. Medvedev A. V. Neparametricheskie sistemy adap-tacii (Nonparametric adaptation systems). Novosibirsk: Nauka, 1983, 174 p.

7. Zarubin V. S., Krishhenko V. S. Matematicheskaya statistika (Mathematical statistics). Moscow, izd-vo MGTU im. Baumana (Publishing Bauman), 2008, 424 p.

© Корнеева А. А., Чжан Е. А., 2013

i Надоели баннеры? Вы всегда можете отключить рекламу.