АНАЛИЗ И СИНТЕЗ СЛОЖНЫХ СИСТЕМ
УДК 681.51
ПОСТРОЕНИЕ СИСТЕМЫ ИНТЕРВАЛЬНОГО ОЦЕНИВАНИЯ ДЛЯ МОДЕЛИ РЕГУЛЯЦИИ ГОРМОНА ТЕСТОСТЕРОНА1 Д.В. Ефимов, А.С. Кремлев, Т.А. Харьковская, С.Г. Чеботарев
Работа посвящена построению интервального наблюдателя для нелинейных систем с переменными параметрами в предположении, что вектор изменяющихся параметров недоступен для измерений. Показано, что наблюдатель позволяет получить область оценок переменных состояния системы, гарантированно содержащую фактическое значение состояния в данный момент времени. Эффективность подхода продемонстрирована с помощью компьютерного моделирования системы регуляции гормона тестостерона.
Ключевые слова: наблюдатель, интервальная оценка, неопределенность, системы с переменными параметрами, нелинейные системы, кооперативность.
Введение
Гормональная регуляция - сложный процесс, в котором уровни различных гормонов связаны между собой внутренними обратными связями [1, 2]. При описании динамики уровня гормонов учитывают два процесса: освобождение гормона, что приводит к понижению его уровня, и секреция гормона. Скорость освобождения в основном зависит от уровня самого гормона, скорость секреции обусловлена уровнем и динамикой связанных гормонов. Повышение уровня других гормонов может либо стимулировать секрецию данного гормона, либо подавлять ее. Таким образом, между уровнями различных гормонов имеет место либо положительная, либо отрицательная обратная связь. Цепочка взаимодействующих гормонов является замкнутой, что обеспечивает гомеостазис организма. Для коррекции этого процесса может использоваться внешняя обратная связь - медикаментозное или иное лечение, специальное питание.
Существует несколько работ, посвященных математическим содержательным моделям, описывающим динамику данной цепочки гормонов [3, 4]. Этические соображения не позволяют непосредственно измерять уровень некоторых гормонов цепочки у человека, но из опытов на животных известно, что их секреция под воздействием связанных гормонов и внешних факторов имеет колебательный, причем импульсный характер [1, 5].
Исходя из этого, построение классического устройства оценки представляется невозможным, но можно оценить интервал, в котором бы находился уровень концентрации гормонов в любой момент времени. Данная работа исследует теорию интервального оценивания, с помощью которой можно построить интервальный наблюдатель для заданной системы регуляции гормона и оценить уровни неизмеряемых концентраций гормонов.
Постановка задачи
В некоторых случаях использование классических методов построения наблюдателей, оценки которых сходятся к точному значению состояния при отсутствии шума, невозможно. Однако в таких случаях возможно использование методов интервальной оценки, т.е. методов построения интервального наблюдателя, который вычисляет множества допустимых значений для вектора состояний системы и генерирует два вектора оценок - минимальных и максимальных значений для каждого элемента вектора состояний объекта. Размер рассчитанного множества должен быть пропорционален неопределенности модели объекта. Неопределенности рассматриваются как детерминированные, но неизвестные функции времени. С этими ограничениями на параметры можно оценить границы ненаблюдаемых переменных.
Существует несколько подходов к построению интервальных наблюдателей [6-9]. Эта работа рассматривает и продолжает подход к построению интервальных наблюдателей, основанных на теории монотонных систем [8-12]. Одним из самых сложных допущений для построения интервального наблюдателя является требование кооперативности динамики ошибки интервальной оценки, которое было рассмотрено в работах [11, 13-16].
Целью настоящей работы является предложение некоторых предварительных результатов по построению интервальных наблюдателей для нелинейных систем с неизмеримыми переменными параметрами. Результат продемонстрирован на примере компьютерного моделирования системы регуляции гормона тестостерона.
4
1
Статья написана при поддержке гранта Президента Российской Федерации МК-464.2013.8
Общие сведения
Для матрицы А е Ятх" определим А е max {0, А}, А = А - А. Запись А е М означает, что матрица А - мецлерова, т.е. имеет неотрицательные элементы вне главной диагонали.
Лемма 1. Пусть х е Я" будет вектором переменных, х < х < х для некоторых х, х е Я", и А е ктх" будет постоянной матрицей, тогда Ах - Ах < Ах < Ах - Ах.
Доказательство. Отметим, что Ах = (А - А) х, что для х < х < х дает необходимые оценки.
Матрица А е Ятх" называется гурвицевой, если все ее собственные значения имеют отрицательную вещественную часть. Любое решение линейной системы
х = Ах + ю(/),ю : Я+ ^ К",
с х е Я" и мецлеровой матрицей А поэлементно неотрицательно для всех / > 0 при условии, что х(0) > 0 . Такие динамические системы называются кооперативными [17, 18].
Лемма 2. Даны матрицы А е Я"х" , Я е Я"х" и С е Ярх" . Если существует матрица Ь е Я"хр -такая, что матрицы А-ЬС и Я имеют одинаковые собственные значения, тогда Я =8-1(А-ЬС)8 , где матрица 8 е Я"х" при условии, что пары (А-ЬС, е1) и (Я, е2) наблюдаемы для некоторых е] е Я1",
е2 е Я1х".
Этот результат был использован в [11] для построения интервальных наблюдателей для линейных стационарных систем с мецлеровой матрицей Я .
Построение интервального наблюдателя
Рассмотрим следующий вид системы, имеющей зависимость от неизвестных нестационарных параметров е ©:
1х(0 = А(/, у, и)х(/) + /(/, у, и, 0; (1)
[у (/) = С(/, и)х(/), ()
где х(/) е Я" - состояние, у(/) е Яр - выходная переменная, и(/) е Ят - известное входное воздействие, ) е Я4 - неизвестное входное воздействие или неизвестные изменяющиеся параметры е© V/ > 0, множество © известно. Отметим, что
х = А©х + В©и = Ах + /(/, и, С); /(/, и, С) = [ А© - А] х + В©и. Допущение 1. ||х|| < X, ЦиЦ < и и ||у|| < У, границы Х>0, и>0, У>0 заданы.
Допущение 2. Пусть х < х < х для некоторых х, х е Я", тогда
/(/, х, х, и) < /(/, х, и, 0 < /(/, х, х, и) для некоторых заданных/: Я2"+т+1 ^ Я" , /: Я 2"+т+1 ^ Я" и всех />0, ||и|| < и , £ е© .
Допущение 3. Существует матричная функция Ь: Яр+т+1 ^ Я"хр, Р : Я+ ^ Я"хт, Р (•) = Р (•) > 0 такая, что для всех />0 и Ци|| < и , ||у|| < У
х = Р (/) + Б(/, у, и)г Р(/) + Р(/)Б(/, у, и) + Р(/)2 + О = 0; В(/, у, и) = А(/, у, и) - Ь(/, у, и)С(/, и); О = > 0.
Допущение 2 означает, что если даны границы х, х состояния х, то значения нелинейной функции /заключены в интервале /, / ^ для всех £ е © . В допущении 3 представлен коэффициент усиления наблюдателя Ь(/, у, и), который обеспечивает устойчивость нестационарной матрицы Б(/, у, и) с матрицей функции Ляпунова Р(/), это допущение определяет условия устойчивости динамики оценки.
При этих допущениях, если существует матрица-усилитель Ь е Я"хр из допущения 3, такая, что матрица Б(/, у, и)= А-ЬС является гурвицевой и мецлеровой, можно построить интервальный наблюдатель [4, 5] вида
х = (А - ЬС)х + / (/, у, и) + Ьу; - - (2) х = (А - ЬС)х + / (/, у, и) + Ьу.
Теорема 1. [19, 20] Пусть выполнены допущения 1, 2 и 3 и матрица Б(1, у, и) мецлерова для всех 1>0 и |и| < и , ||у|| < У . Пусть выполнено одно из следующих условий:
1. /(1,X, х,и) < /(1, х, х,и) < для любых 1>0, |и| < и и всех х, х е Я";
2. для любых 1>0, ||х|| < X, ||и|| < и , £ е© и всех х, х е Я"
\/(1, х,и, С) - /(1, х, х,и)|2 +1 /(1, х, х,и) - /(1, х,и, 0|2 < р||е||2 + р ||ё||2 + а для некоторых аеЯ+, р е Я+ и р1п - О + Я=0, Кт>0.
Тогда в (1) и (2) переменные х(1), х(1) остаются ограниченными для всех 1 >0, и х < х < х обеспечивает соотношение х(0) < х(0) < х(0).
Доказательство. Рассмотрим ошибки интервального оценивания е = х - х, е = х - х : е = Б(1, у, и) е + / (1, х, и, О - / (1, х, х, и);
е = Б(1, у, и) е + / (1, х, х, и) - / (1, х, и, 0.
Согласно допущению 2, для мецлеровой матрицы Б для всех 1>0 свойства /(1, х(1),и(1), 0 > /(1, х(1), х(1),и(1)), /(1, х(1),и(1), 0 < /(1, х, х,и) и х(1) < х(1) < х(1) выполняются при условии, что х(0) < х(0) < х(0). Чтобы доказать, что переменные х(1), х(1) ограничены, рассмотрим производную функции Ляпунова V = етР(1)е + етР(1)е :
V = ет [Р(1) + Б(1, у,и)тР(1) + Р(1)Б(1, у,и)] е +
+ет [Р(1) + Б(1, у,и)тР(1) + Р(1)Б(1, у,и)] е + 2етР(1) [/(1, х,и, О - /(1, х, х,и)] + +2ет [/(1, х, х,и) - /(1, х,и, С)].
Согласно допущению 3, это уравнение может быть переписано следующим образом:
V <- ет Ое - е т Ое +| / (1, х, и, С) - / (1, х, х, и)|2 +| / (1, х, х, и) - / (1, х, и, о|2
Если первое условие теоремы верно, тогда элементы |/(1, х, и, 0 - / (1, х, х, и) и
|/(1,х,х,и)-/(1,х,и,0| ограничены для любых 1>0, ||х||<X, Ц^!<и ,^ е© и всех х,х еЯ" . Таким образом, ошибки е, е ограничены стандартн^1ми аргументами Ляпунова, и поэтому переменные х, х также ограничены (из допущения 1 состояние х ограничено). Если второе условие теоремы выполняется, то это неравенство принимает вид
'V <-етое - етОе + а , что подразумевает ограниченность х, х теми же аргументами.
Результат теоремы 1 основан на довольно строгом допущении, что матрица Б - мецлерова. Все остальные предположения довольно часто встречаются в теории оценивания.
Пример
Рассмотрим модель регуляции гормона тестостерона [2-4]:
' Я (Г) = / (т) - ЬЯ^)+а (1);
Ь (1) = glR(t) - Ь21(1); / (1) =-;
К +(т (1) )и
т (1) = g 2 Ь(1) - Ьът (1); . У (1) = т (1),
где Я е Я+ - концентрация лютеинизирующего (гонадотропин) релизинг-гормона; Ь е Я+ - концентрация лютеинизирующего гормона; т е Я+ - концентрация гормона тестостерона.
Известны параметры системы: Ь1=3, Ь2=1, Ь3=1 - скорости освобождения гормонов, g1=10, g2=50 -скорости секреции гормонов. Неопределенность системы: 8 = А < А < А = 12, 1,5 = ц<ц<Ц = 2,5,
1,5 = К < К < К = 2,5. Для моделирования объекта управления мы используем средние значения: А=10, ц=2, К=2.
Входное воздействие ё(/)еЯ+ представляет собой пульсирующий механизм: ё(/) = ё0(/)-5ё(/), где ё0 известно, а 1- 5 < 5ё < 1- 5 - неизвестная модуляция. Для моделирования системы было взято:
¿0(О = (1 + эш(0,1/))е (5+581п(0,бг)) , 5ё(/) = 1 -5008(2/), 5 = 0,25..
В заданной системе вектор состояний х(/) состоит из трех переменных х(/) = [(/) Ь(/) Т(/)] . Тогда объект управления принимает следующий вид:
А =
-Ь
0
Т
, В = 0
0
С = [0 0 1],
1 0 а -Ьг 0
. 0 82 -Ьз Гх = Ах + В [ / (/) + ё (/)]; [у = Сх.
На рис. 1-3 приведены графики моделирования построенной системы интервального наблюдения для системы регуляции гормона. На рис. 1 показано изменение концентрации гонадотропин-релизинг-гормона Я(() (кривая 1) и его верхняя (кривая 2) и нижняя (кривая 3) оценка. По такому же принципу на рис. 2, 3 изображены результаты моделирования для изменения концентрации лютеинизирующего гормона Щ) и концентрации гормона тестостерона Т(/) соответственно.
1,4
1,2
11111
1 2 :
3
\ ! #4; ........................................................(Л ............................... ................. //'....'.Л
1
0,8 0,6 0,4 0,2
0
5
10
15
20
25
30
/, с
Рис. 1. Результаты моделирования: изменение состояния концентрации гормона Я^) (1) и его
интервальная оценка (2, 3)
1 1 1
........................................................../ — / \; .................................... ........................./........V...................................
-.......................................¡г ■ \\ 2 Г 1 1 / \ .................. /
//л\
1 ¡1 щ ¡1-
3 : //; ■ \\
П: ----
5
10
15
20
25
30
/, с
Рис. 2. Результаты моделирования: изменение состояния концентрации гормона ф) (1) и его
интервальная оценка (2, 3)
250 200 150 100 50
0
Рис.
1 1 2 1
: ж::;::::
] / \\ У/ : \\ /
___' __—
Е-,
5
10
15
20
25
30
/, с
3. Результаты моделирования: изменение состояния концентрации гормона тестостерона 7(0 (1)
и его интервальная оценка (2, 3)
0
Заключение
Проиллюстрировано, что интервальный наблюдатель позволяет получить область оценок переменных состояния системы, гарантированно содержащих фактическое значение состояния в данный момент времени. Показаны условия построения подобного устройства оценки для рассматриваемого класса систем. Приведено доказательство теоремы об ограниченности траекторий полученной области на основе свойств кооперативности системы. Подход проверен на основе компьютерного моделирования системы регуляции гормона.
Литература
1. Murray J.D. Mathematical Biology, I: An introduction.-3rd ed. - New York: Springer, 2002. - 551 p.
2. Farhy L.S. Modeling of oscillations of endocrine networks with feedback // Methods in Enzymology. - 2004.
- V. 384. - P. 54-81.
3. Медведев А.В., Чурилов А.Н., Шепелявый А.И. Математические модели регуляции тестостерона // Стохастическая оптимизация в информатике. - Изд-во СПбГУ, 2006. - № 2. - С. 147-158.
4. Enciso G., Sontag E.D. On the stability of a model of testosterone dynamics // J. Math. Biol. - 2004. - V. 49.
- P. 627-634.
5. Smith R.W. Hypothalamic regulation of pituitary secretion of luteinizing hormone - II. Feedback control or gonadotropin secretion // Bull. Math. Biol. - 1980. - V. 42. - № 1. - P. 57-78.
6. Jaulin. L. Nonlinear bounded-error state estimation of continuous time systems // Automatica. - 2002. -V. 38. - № 2. - P. 1079-1082.
7. Kiefer M., Walter E. Guaranteed nonlinear state estimator for cooperative systems // Numerical Algorithms.
- 2004. - V. 37. - P. 187-198.
8. Olivier B., Gouze J.L. Closed loop observers bundle for uncertain biotechnological models // Journal of Process Control. - 2004. - V. 14. - № 7. - P. 765-774.
9. Moisan M., Bernard O., Gouze J.L. Near optimal interval observers bundle for uncertain bio-reactors // Automatica. - 2009. - V. 45. - № 1. - P. 291-295.
10. Raissi T., Videau G., Zolghadri A. Interval observers design for consistency checks of nonlinear continuous-time systems // Automatica. - 2010. - V. 46. - № 3. - P. 518-527.
11. Raissi T., Efimov D., Zolghadri A. Interval state estimation for a class of nonlinear systems // IEEE Trans. Automatic Control. - 2012. - V. 57. - № 1. - P. 260-265.
12. Efimov D., Fridman L.M., Raissi T., Zolghadri A., R. Seydou. Interval estimation for LPV systems applying high order sliding mode techniques // Automatica. - 2012. - V. 48. - P. 2365-2371.
13. Mazenc F., Bernard O. Interval observers for linear time-invariant systems with disturbances // Automatica.
- 2011. - V. 47. - № 1. - P. 140-147.
14. Чеботарев С.Г., Кремлев А.С. Синтез интервального наблюдателя для линейной системы с переменными параметрами // Изв. вузов. Приборостроение. - 2013. - Т. 56. - № 4. - С. 42-47.
15. Chebotarev S., Efimov D., Raissi T., Zolghadri A. On Interval Observer Design for a Class of Continuous-Time LPV Systems // Proc. IFAC NOLCOS 2013. - Toulouse, 2013. - P. 68-73.
16. Chebotarev S., Kremlev A. Analysis conditions on interval observer synthesis for linear systems with variable parameters // 18th International Conference on Methods and Models in Automation & Robotics. -MMAR 2013. - Mi^dzyzdroje, 2013. - P. 390-392.
17. Чеботарев С.Г., Кремлев А.С. Анализ линейных систем с переменными параметрами для синтеза интервальных наблюдателей // Научно-технический вестник информационных технологий, механики и оптики. - 2012. - № 6 (82). - С. 50-53.
18. Smith H.L. Surveys and monographs: Monotone dynamical systems: an introduction to the theory of competitive and cooperative systems. - Providence: AMS, 1995. - V. 41. - 174 p.
19. Efimov Denis, Raissi Tarek, Chebotarev Stanislav, Zolghadri Ali. Interval state observer for nonlinear time varying systems // Automatica. - 2013. - V. 49. - № 1. - P. 200-205.
20. Efimov Denis V., Raissi Tarek, Chebotarev Stanislav, Zolghadri Ali. On set-membership observer design for a class of periodical time-varying systems // Decision and Control (CDC). - 2012. - P. 6767-6772.
Ефимов Денис Валентинович - France, Villeneuve d'Ascq, Национальный институт исследований по
информатике и автоматике, доктор технических наук, ответственный исследователь первого ранга, [email protected] Кремлев Артем Сергеевич - Россия, Санкт-Петербург, Санкт-Петербургский национальный иссле-
довательский университет информационных технологий, механики и оптики, кандидат технических наук, доцент, [email protected] Харьковская Татьяна Александровна - Россия, Санкт-Петербург, Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики, магистрант, [email protected] Чеботарев Станислав Геннадьевич - Россия, Санкт-Петербург, Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики, аспирант, [email protected]