Математика U Математическое
моделирование
Сетевое научное издание http://mathmelpub.ru ISSN 2412-5911
Ссылка на статью:
// Математика и математическое моделирование. 2018. №6. С. 52-71.
Б01: 10.24108/шаШш.0618.0000165
Представлена в редакцию: 15.12.2018 © НП <<НЭИКОН>>
УДК 51-76
Применение наблюдателя в скользящем режиме при моделировании процесса антиангиогенной терапии
Виноградова М. С.1'*, Ткачев С. Б.1, Ткачева О. С.1
[email protected] 1МГТУ им. Н.Э. Баумана, Москва, Россия
На основе российских и зарубежных публикаций рассмотрена проблема использования наблюдателей в биологических системах и проведен анализ имеющихся работ по этому вопросу. Для нелинейной динамической системы, описывающей развитие раковой опухоли при антиангиогенной терапии, приведен вид ее нормальной формы и построен нелинейный наблюдатель состояния функционирующий в скользящем режиме. В качестве выхода системы, доступного измерению, выбрана переменная, соответствующая объему раковой опухоли. Оценка полного вектора состояния системы, полученная наблюдателем, использована для построения обратной связи по состоянию, стабилизирующей программную траекторию. Теоретические положения подтверждены математическим моделированием.
Ключевые слова: наблюдатель состояния; наблюдатель на скользящем режиме; нормальная форма; управление; антиангиогенез
Введение
Математическое моделирование биологических процессов, в том числе процессов, происходящих в организме человека и животных, является актуальным направлением научных исследований, которое в последние десятилетия активно развивалось [1]. Изучение таких моделей позволяет лучше понять природу биологических процессов, улучшить диагностику заболеваний и разработку стратегий их лечения. Стратегия лечения может базироваться на усилении имунного ответа организма, заключающегося в распознавании и уничтожении патогена и поврежденных им тканей [2]. Проблемы иммунного ответа организма на различные инфекционные агенты активно изучаются. Например, в статье [3] на основе математической модели инфекционного заболевания, учитывающей фундаментальные механизмы иммунной защиты, рассмотрена задача оптимального управления иммунным ответом. Управление рассматривается как функция от времени, учитывающая воздействие медицинских препаратов на иммунитет пациента в процессе лечения заболевания. В [4] построена модель
влияния иммунотерапии на динамику иммунного ответа при инфекционном заболевании, также рассмотрена задача дискретного адаптивного управления и предложен алгоритм ее решения.
Несмотря на то, что предложено большое количество моделей медико-биологических систем, их практическое применение в ряде случаев затруднено. Это связано с тем, что не все переменные состояния в этих моделях доступны для измерений. Поэтому во многих случаях биологические модели следует рассматривать как системы с входом и выходом. Входами (управлениями) в данном случае могут быть дозы лекарств или иные количественные характеристики лечебных воздействий (радиотерапия, химиотерапия и т.п.), а выходами — количественные характеристики, доступные измерению и представляющие собой функции переменных состояния. Например, модели онкологических заболеваний в качестве переменных состояния могут включать объем опухоли, концентрацию лекарственного препарата в крови пациента, уровень клеточной подвижности, уровень пролиферативной и пространственной гетерогенности и др. Однако, как правило, при лечении онкологических заболеваний регулярным прямым измерениям доступен только объем опухоли [5], в то время как другие характеристики для регулярных измерений недоступны.
Задача восстановления вектора состояния, состоящая в получении оценок для его не-измеряемых компонент, может быть решена методами теории управления, в которых она формулируется как задача построения наблюдателя состояния. Под наблюдателем состояния заданной динамической системы обычно понимают параллельную динамическую систему, входами которой являются входы и выходы наблюдаемой динамической системы, а выходом — вектор, служащий оценкой вектора состояния наблюдаемой системы. Наблюдатель состояния по структуре аналогичен наблюдаемой системе, хотя собственные движения наблюдателя и наблюдаемой системы могут отличаться.
В данной работе мы рассмотрим один из видов наблюдателей состояния — наблюдатель на скользящих режимах. Порядок его построения для биологических систем мы рассмотрим на примере одной модели развития раковой опухоли, в которой лечение основано на блокировании процессов ангиогенеза.
Работа организована следующим образом. В первом разделе приведен краткий обзор работ, посвященных использованию наблюдателей состояния в биологии и в медицине. Во втором разделе рассмотрена нелинейная модель развития раковой опухоли, предложенная в [6] и дополненная в [7]. Для этой модели рассмотрена задача построения схемы лечения с использованием ингибиторов ангиогенеза. Эта задача интерпретируется как задача управления, управление строится с использованием полного вектора состояния. Построение управления в этой системе традиционно для задач управления, в частности используются методы линеаризации обратной связью [7, 8]. В третьем разделе описывается порядок построения наблюдателя на скользящем режиме и построение управления при неполных измерениях на основе такого наблюдателя. В четвертом разделе показаны результаты моделирования динамики системы при использовании управления с наблюдателем на скользящем режиме.
1. Наблюдатели состояния в биологии
Вопросы оценки состояния для биологических систем рассматриваются многими авторами. Оценка состояния системы может быть получена, например, с помощью фильтра Калмана [9, 10]. В цитированной работе исследуются математические модели процесса воспаления как типового ответа организма на воздействия патогенов. На основе расширенного фильтра Калмана была разработана конструкция контроллера медицинского насоса для минимально инвазивной хирургии [11]. Основной проблемой функционирования контроллера является неизмеряемая переменная — давление жидкостей организма в зоне операции, для оценки которого и был использован расширенный фильтр Калмана.
Наблюдатели состояния можно строить самым разным образом. Поясним, что подразумевается под наблюдателем состояния на примере линейной системы. Рассмотрим линейную динамическую систему непрерывного времени следующего вида (наблюдаемую систему):
х = Л(г)х + в (г)и + / (г), у = с (г)х + V (г),
где х € — вектор состояния; и € Кт, у € К1 — вектор входа и выход системы; Л(г), В (г), С (г) — известные функции времени; / (г), V (г) — внешние возмущения и погрешность (шум) измерений.
Пусть известны входной и(г) и выходной у(г) сигналы, в то время как вектор состояния х(г), внешние возмущения /(г) и погрешность измерений у(г) неизвестны.
Рассмотрим вспомогательную систему
X = Л(г)х + в(г)и + ь(у - у), у = с (г)х.
Эта система аналогична исходной системе, но включает специальное слагаемое Ь(у — у), называемое корректирующим воздействием. Задача состоит в таком выборе матрицы Ь, при котором невязка е = х — х при г ^ стремится к нулю. Если такая матрица выбрана, вектор состояния х(г) вспомогательной системы рассматривается как приближенное значение (оценка) вектора состояния х(г) наблюдаемой системы, а сама вспомогательная система называется наблюдателем.
Построенный наблюдатель имеет ту же размерность, что и наблюдаемая система. Такой наблюдатель называют наблюдателем полного порядка (наблюдателем Калмана). Однако наблюдатели могут иметь пониженный порядок, как наблюдатель Луенбергера, или повышенный, как адаптивные наблюдатели.
Интерес к использованию наблюдателей состояния для биологических систем возник достаточно давно. Одна из первых работ в этой области посвящена построению наблюдателя для математической модели биореактора [12]. В работе построен экспоненциальный наблюдатель для нелинейный динамической системы.
Обзор некоторых подходов к получению оценок для параметров математической модели роста сосудистой опухоли в присутствии химиопрепарата представлен в [13]. Здесь приведена математическая модель роста сосудистой опухоли, описана процедура дискретизации модели и выполена идентификация параметров модели с помощью нелинейного наблюдателя. Дискретизация была необходима, поскольку химиотерапия проводится через определенные интервалы времени.
Обширный перечень моделей процессов и наблюдателей для систем, описывающих химические процессы, содержится в [14]. В работах [15, 16] рассмотрена импульсная математическая модель регулировки тестостерона и построена схема наблюдателя состояния для импульсных систем с запаздыванием для получения оценки концентрации гормонов, недоступных для непосредственного измерения в кровотоке.
Исследование возможности проектирования наблюдателя для класса непрерывных динамических систем с неравномерной частотой дискретизации приведено в [17]. На примере биореактора оценена эффективность предложенного наблюдателя, построенного по схеме с изменяющимися по времени коэффициентами усиления. Предлагаемый наблюдатель является импульсной системой, описывающейся системой дифференциальных уравнений с импульсными воздействиями.
В [18] для модели протекания малярии внутри организма-хозяина (malaria's intra-host model) был построен наблюдатель для оценки общей массы плазмодиев у пациента с малярией и оценки параметра модели, характеризующего скорость заражения. Оценка этого параметра, полученная наблюдателем состояния, была проверена с использованием реальных данных.
В [19] рассмотрена модель роста опухоли с управлением в виде обратной связи. В модели учтены стимуляция и торможение ангиогенеза. В работе построен непрерывный наблюдатель, использующий данные, полученные в дискретные моменты времени.
Использование пропорциональных регуляторов, основанных на наблюдателях состояния, для имитации механизмов управления сигнально-регулируемыми метаболическими путями в живых организмах на примере регулирования уровня глюкозы в крови показано в [20].
В работе [21] рассмотрено использование непрерывно-дискретного наблюдателя состояния динамического объекта управления для экспериментальной оценки молярных долей бинарной смеси (этанол-вода) в ректификационной колонне.
В [22] построен наблюдатель для оценки запасов промысловых рыб на основе непрерывной модели динамики возрастной структуры биологической популяции. Показано, что построенный наблюдатель обладает хорошей сходимостью и применим на практике.
В работе [23] для нелинейной медико-биологической системы, описывающей развитие раковой опухоли в условиях антиангиогенной терапии, была предложена схема синтеза управления с использованием наблюдателя с высоким коэффициентом усиления. Синтез программного и стабилизирующего управлений, а также построение наблюдателя основаны
на преобразовании системы к нормальной форме. Модель развития раковой опухоли была предложена в [6] и дополнена в [7], основные результаты, связанные с преобразованием к нормальной форме, приведены в [8]. В этой работе построена схема лечения опухоли (управление), однако она использует полный вектор состояния, включающий объем опухоли, объем эндотелиальных клеток и концентрацию ингибитора ангиогенеза.
Отметим, что применение наблюдателя с высоким коэффициентом усиления в [23] приводит к существенным колебаниям («всплескам») траектории наблюдателя в начале переходного процесса, что характерно для систем с глубокой обратной связью, а также неоходимости расширения пространства состояний для учета влияния внешних неизмеряемых возмущений [24]. Использование наблюдателей состояния, функционирующих в скользящем режиме, позволяет избежать подобных «всплесков» [25]. К достоинствам таких наблюдателей можно также отнести возможность оценивания неизмеряемых переменных состояния за конечное время, а также корректную работу при наличии функциональных неопределенностей, связанных с внешними возмущениями и погрешностями в задании параметров модели [25].
2. Модель раковой опухоли и лечение с помощью ингибиторов ангионгенеза
Ангиогенезом называется процесс образования новых кровеносных сосудов в тканях организма, сопровождающий рост большинства злокачественых опухолей [26]. Применение для лечения онкологических больных ингбиторов ангиогенеза, т.е. средств подавления роста новых сосудов, приводит к значительному замедлению скорости роста опухолей и к регрессии опухоли в экспериментах in vivo [27, 28].
Рассмотрим следующую нелинейную модель развития раковой опухоли [7, 8]:
Здесь х1 — объем опухоли; х2 — объем эндотелия новых кровеносных сосудов, возникающих в опухоли; х3 — концентрация ингибитора ангиогенеза. Параметр и определяет дозу ингибитора ангиогенеза и рассматривается как управление. Параметры системы Аь Ь, 1, е, Аз — положительные вещественные числа, определяющие следующие величины: А1 — скорость роста опухоли; Ь — скорость формирования новых кровеносных сосудов; < — скорость гибели кровеносных сосудов; е — коэффициент, характеризующий влияние лекарственных средств на гибель кровеносных сосудов; А3 — клиренс (объем крови, который очищается от лекарственного средства за единицу времени).
Целью управления в этой системе является уменьшение объема опухоли до приемлемого уровня. Эта цель достигается построением программной траектории, которая переводит систему из какого-то текущего состояния в состояние малого объема опухоли, а затем в синтезе управления, которое реализует программную траекторию. И построение программной
X 1 = —Aix ln —,
Х2
A1x1ln
(1)
xx 3 = —A3X3 + u.
траектории, и синтез управления можно реализовать путем приведения системы к каноническому виду путем замены переменных состояния.
Как уже было отмечено, непосредственному измерению доступна только одна из переменных состояния, а именно объем опухоли -ь Это означает, что система имеет фиксированный выход, а приведение к каноническому виду реализуется путем дифференцирования выхода и приведения системы к нормальной форме [29].
Преобразование системы (1) с выходом - к нормальной форме было выполнено в работах [8, 23]. Нормальная форма имеет вид
= ¿2, ¿2 = ¿3,
(2)
¿3 = Р (¿) — Л1вг1м, Функция Р(¿) переменных = (¿1, ¿2, ¿3) имеет вид
Р(*) = &(Л1ЛЗ*1 + — ¿з^ ехр(—Л^) — (Л1 + Лз)*з + (Л3 + Л1)
/2 N ¿З
— Л^Р ^ 3 ¿2 + Лз2^ — Л1Лз^2 — 2 + 3
¿2^3 ¿1 '
Канонические переменные ¿1, ¿2, ¿3 связаны с исходными переменными х1, -2, -3 соотношениями
¿1 = х1,
. ¿2 = —Л1х11п -1, ^ -2
(3)
¿3 = Л2 ( 1 + 1п -1 )-11п -1 + Л1Ь—1 — Л1^-1/3 — Л1е-1-3 1 - 2 - 2 - 2 1
Уравнения (3) определяют замену переменных г = Ф(—), где — = (-1, -2, -3), определенную в области М+ = {—: -1 > 0, -2 > 0, -3 > 0}. Область изменения канонических переменных ¿1 > 0. Замена = Ф(—) обратима:
-1 = ¿1,
-2 = ¿1 ехр^ Л"^) = ^(¿1,^2),
(4)
-3
¿2 Л ¿2 Ь / ¿2 Л1^1 / б2;1 в \ Л1^1
_ _^2/3 _ ¿3
в 1 Л1в^1
^(¿1,^2 ,¿3).
Приведение к каноническому виду позволяет рассчитать программное и стабилизирующее управление [8, 23]. Пусть задано программное изменение выхода -!(£). Тогда известна функция ¿2 (¿), а также изменения других канонических переменных: ¿2 (¿) = ^¿1 (¿), (2 ( (3
¿2(¿) = ¿2(¿), — ¿3(£) = ¿1 (¿). Канонические уравнения (2) можно представить как дифференциальное уравнение третьего порядка:
■-¿.1 = Р (¿) + с^х
2
¿
2
где С(г1) = —А1ег1. Из этого представления (в предположении, что г1 меняется по закону ¿1 (¿)) находим программное управление
= |3 ¿1 ю—
и (<) = с«И) '
Стабилизирующее управление находим исходя из условия, что отклонение а(£) = '1 (¿) — (¿) истинной траектории от программной (¿) является решением линейного дифференциального уравнения
а' + С1<г + С2(Г + Сза = 0,
причем постоянные с1, с2, с3 выбраны так, что у этого дифференциального уравнения нулевое положение равновесия асимптотически устойчиво. Это обеспечивает экспоненгциальную сходимость к нулю отклонения системы от программной траектории. Отсюда
г^) = '¿'1(£) — С1<7 — С2(Г — Сз а
и в результате
и (. х) = '^СО — ^(') — С1('1 — ¿1*) — С2('1 — ¿^ — С3('1 — ) (5)
и(г,Х) = С('1) ' (5)
Отметим, что в замкнутой области
д = {(Х1, Х2, Х3): 5 < Х1 < С, 6 < Х2 < С, 5 < Х3 < С}
функция ^(') ограничена и имеет ограниченную производную, т.е. в этой области она равномерно липшицева. Можно считать, что и программная траектория Х1 (¿), и действительное движение Х(£) целиком находятся в области д.
Отметим также, что функция С('1) не обращается в нуль в д. Это означает, что система (2) является нормальной формой системы (1). Относительная степень выхода в данном случае равна 3.
3. Наблюдатель в скользящем режиме
На примере нелинейной трехмерной модели развития раковой опухоли в присутствии ингибиторов ангиогенеза рассмотрим процедуру построения наблюдателя состояния, функционирующего в скользящем режиме.
Скользящий режим для управления динамическими системами применяется уже давно [30, 31, 32, 33, 34]. Скользящий режим возникает у динамической системы, описываемой дифференциальными уравнениями с разрывной правой частью. При соответствующей структуре векторного поля в окрестности поверхности разрыва траектории системы стягиваются к поверхности разрыва, выходя на нее за конечное время и далее идут по этой
поверхности. Управление в скользящем режиме обеспечивает появление поверхности разрыва и скольжение траекторий по этой поверхности. С учетом погрешностей и возмущений удержание системы на поверхности скольжения требует частык переключений управления. Достоинством такого режима является то, что после возникновения скользящего режима движение происходит вдоль поверхности скольжения и не зависит от параметров управляемого объекта.
Идея построения наблюдателей состояния, функционирующих в скользящем режиме, основана на двойственности задач управления и наблюдения и впервые была реализована в [35, 36].
Для системы (2) канонического вида с выкодом z1 наблюдатель можно строить в каноническом виде без учета функции дрейфа F, которая зависит от ненаблюдаемых переменных состояния (ее можно рассматривать как неопределенное ограниченное возмущение):
z i = Z2 + vi;
£ 2 = Z3 + V2; (6)
z 3 = G(zi)u + V3.
Корректирующие воздействия v1, v2, v3 берутся в классе разрытнык функций с организацией скользящих режимов.
Корректирующие воздействия надо выбирать так, чтобы стабилизировать разности £ = zi — Zi, i = 1, 2, 3. Для отклонений £i имеем систему
¿1 = £2 — vi;
¿2 = £3 — V2; (7)
¿3 = F (z) — V3.
Корректирующие воздействия мы можем выбирать как функции zi, Zi, z2, Z3, т.е. £i известна, а £2, £3 нет. Функция F(z) также не известна. Предполагаем, что отклонения si имеют ограниченное изменение: |si| < Ei. То же предполагаем и относительно функции F: |F(z)| < Fm.
Величину vi выбираем в виде
vi (t) = Mi sign £i(t).
Константу Mi подбираем так, чтобы на поверхности £i = 0 возник скользящий режим, т.е. чтобы выполнялось неравенство eiei < 0 (величина ¿i должна иметь знак, противоположный знаку £i). Это означает, что
eiSi = s1£2 — M1|S1 | < 0,
или
Mi > £2 sign £i.
Для выполнения неравенства достаточно, чтобы M1 > |£2|. Так как |е2| < E2, неравенство Mi > E2 гарантирует, что на поверхности е1 = 0 возникает скользящий режим. Аналогично можно выбрать
V2(t) = M2 Sign £2 (t), (8)
выбирая M2 из условия M2 > E3, и
Vs(t) = M3 sign £3 (t), (9)
где M3 > Fm.
Однако величины £2 и £3 неизмеряемые, так что непосредственно их использовать нельзя. При стабилизации £1 около нуля можно полагать, что £2 = v1 (из первого уравнения системы (7)). Однако это равенство напрямую использовать нельзя, так как v1 принимает лишь два значения ±M1. Стабилизация £1 ^ 0 складывается из высокочастотных колебаний вокруг нуля, а для вылавливания тренда необходимо отсечь эти высокочастотные колебания. Это можно сделать усреднением значений v1(t) по времени. Возникает новая функция v1eq (t), которая лишена высокочастотных колебаний, но, тем не менее, в целом дает такое же поведение £1. Здесь на практике используют специальный фильтр — динамическую систему, которая дает такое усреднение. Фильтром является система
^1Т1 + Т1 = v1(t), (10)
Т1(0) = 0. ( )
с малым значением Параметр может регулировать процесс: чем ближе к нулю, тем меньше разница т} (t) — v1 (t).
Решение системы (10) и используется в качестве функции v1,eq (t). Корректирующее воздействие v2(t) строим с помощью этой функции как оценки £2(t) в (8):
V2(t) = M2 sign V1,eq (t)
Аналогично в качестве корректирующего воздействия v3(t) вместо (9) выбираем
V3 (t) = M3 sign V2,eq (t),
где v2,eq (t) — решение задачи
^2 + т2 = v2 (t) , (11) Т2(0) = 0. ()
Замечание. В фильтрах (10) и (11) выбор начального условия не является существенным, поскольку изменение этого условия добавляет к решению слагаемое, экспоненциально стремящееся к нулю. На больших диапазонах времени этим слагаемым можно пренебречь. Параметры = 1, 2 выбираются из условия разделимости движений [30, 37].
Следует отметить, что возможность оценивания за конечное время неизмеряемой переменной является главным преимуществом наблюдателя на скользящих режимах. Значения амплитуд разрывных корректирующих воздействий берутся исходя из оценок величин отклонений наблюдателя и неизвестной (по измерениям) функции т.е. без учета точной модели процесса, поэтому наблюдатель на скользящих режимах облоадает свойством ро-бастности. При этом порядок наблюдателя за счет ввода двух фильтров увеличивается, что вносит в процесс дополнительную малую динамику.
4. Результаты численного моделирования
Рассмотрим процесс управления системой (1) с использованием наблюдателя на скользящих режимах. Выберем следующие параметры системы [7]:
11 1 106 1 А1 = 0.0834-, Ь = 5.85-, й = 0.00873—^-, е = 0.66—, А3 = 1.7-.
день день мм2/3 ■ день день день
Единицы измерения параметров системы выбраны исходя из следующих единиц измерения переменных состояния: х1 — мм3; х2 — мм3; х3 — мг/кг.
В качестве управления выберем (5), где взамен неизмеряемых переменных г2, г3 используем их оценки ¿2, £3 наблюдателя (6).
Согласно [7, 8] за начальное состояние системы при ¿0 = 0, соответствующее ранней стадии развития болезни, примем:
ж1(*0) = £10 = 200 мм3, ж2(г0) = х20 = 200 мм3, ж3(£0) = х30 = 8.4113 —. (12)
кг
Время лечения положим ¿* = 120 и за конечное состояние системы выберем
£!(£*) = £1* = 2 мм3, Х2(¿*) = £2* = 1.75 мм3, Ж3(£*) = Ж3* = 8.8426 —. (13)
кг
Траекторию перехода из начального состояния в конечное можно выбрать в виде многочлена 5-й степени [8]:
5
£1(0 = ^ ак^,
к=0
где
а0 = 200,0, а1 = 0, а2 = -1,6■ 10-4, а3 = -5,4■ 10-4, а4 = 4■ 10-6, а5 = -6■ 10-9. Для наблюдателя выбираем следующие параметры:
М1 = 2,99, М2 = 1,001, М3 = 166.
Интегрирование системы, замкнутой управлением и наблюдателем, велось, в силу ее разрывного характера, явным методом Эйлера с шагом 10-6. Результаты моделирования системы (динамика в первые 60 дней) представлены на рис. 1-3.
О 10 20 30 40 50 60
I
Рис. 3. Концентрация ингибитора ангиогенеза и оценка концентрации наблюдателем
На рис. 4, 5 показаны изменения ошибок оценивания переменных -1 и -3 в модели (1). Из графиков видно, что наблюдатель на скользящих режимах позволяет оценивать переменные состояния модели.
Результаты моделирования показывают, что в принципе наблюдатель на скользящих режимах может использоваться в задачах управления биологическими системами. Такой наблюдатель позволяет получить адекватную оценку неизмеряемых компонент вектора состояния, которая может использоваться для стабилизации программной траектории. На качество работы замкнутой системы влияют настроечные коэффициенты М^, завышение которых ведет к увеличению амплитуды колебаний, характерных для скользящего режима. Коэффициенты фильтров ш являются ключевыми факторами фильтров, отсекающих высокочастотные колебания в наблюдателе. Качество оценки состояния наблюдателем ухудшается как при завышении значений ш, так и при их занижении.
Рис. 4. Ошибка оценивания переменной х\ Рис. 5. Ошибка оценивания переменной х3
Заключение
На основе российских и зарубежных публикаций рассмотрена проблема использования наблюдателей в биологических системах и проведен обзор имеющихся работ по этому вопросу.
Для модели, описывающей процесс лечения раковой опухоли в присутствии антиан-гиогенной терапии, предложено управление, стабилизующее программную траекторию, в котором используется оценка вектора состояния с помощью наблюдателя состояния, функционирующего в скользящем режиме.
При использовании наблюдателя на скользящих режимах интегрирование системы должно осуществляться достаточно грубым методом (например, методом Эйлера), поскольку используется динамика системы в окрестности поверхности разрыва. Такие методы чувствительны к ошибкам интегрирования, поэтому приходится использовать малый шаг интегрирования. Малый шаг также нужен для снижения амплитуд колебаний траектории вокруг поверхности скольжения.
В целом управление в скользящем режиме, а также наблюдатели на скользящих режимах, обладает рядом преимуществ, таких как устойчивость к параметрическим и внешним возмущениям, сходимость ошибки наблюдения к нулю (теоретически) за конечное время. Такой наблюдатель отличается также простотой его настройки, так как амплитуды корректирующих воздействий строятся на основе простых неравенств.
Однако следует отметить, что использование скользящих режимов сопровождается высокочастотными колебаниями, а такие колебания биологическим системам не свойственны, при применении управления или наблюдателя в скользящем режиме они носят искусственный характер. Более того, в ряде случаев (например, в процессе лечения) влияние на динамику в большей степени должно реализовываться кусочно-постоянными функциями. В силу этого использование скользящих режимов может носить ограниченный характер. В
частности, в рассмотренной системе лечения опухоли с помощью ингибиторов ангиогенеза управление достигается за счет практически постоянного измерения размера опухоли, что вряд ли достижимо на практике.
Работа выполнена при финансовой поддержке РФФИ (проект № 16-07-00902).
Список литературы
1. Романюха А.А. Математические модели в иммунологии и эпидимиологии инфекционных заболеваний. М.: Бином. Лаборатория знаний, 2012. 293 с.
2. Хаитов Р.М. Иммунология: структура и функции иммунной системы: учеб. пособие. М.: ГЭОТАР-Медиа, 2013. 277 с.
3. Болодурина И.П., Луговскова Ю.П. Оптимальное управление динамикой взаимодействия иммунной системы человека с инфекционными заболеваниями // Вестник Самарского ун-та. Естественнонаучная серия. 2009. № 8(74). С. 138-153.
4. Русаков С.В., Чирков М.В. Математическая модель влияния иммунотерапии на динамику иммунного ответа//Проблемы управления. 2012, №6. С. 45-50.
5. Абсалямова О.В., Аникеева О.Ю., Голанов А.В., Кобяков Г.Л., Коновалов А.Н., Корни-енкоВ.Н., Кривошапкин А.Л., ЛошаковВ.А., ОлюшинВ.Е., Потапов А.А., РыжоваМ.В., Таняшин С.В., Трунин Ю.Ю., Улитин А.Ю., Шишкина Л.В. Клинические рекомендации по лечению первичных опухолей центральной нервной системы (утверждены на заседании Правления Ассоциации нейрохирургов России 20.09.2013 г.). Нижний Новгород, 2013. 40 с.
6. Kerbel R., Folkman J. Clinical translation of angiogenesis inhibitors // Nature Reviews Cancer. 2002. Vol. 2. Pp. 727-739. DOI: 10.1038/nrc905
7. Drexler D., Kovacs L., Sapi J., Harmati I., Benyo Z. Model-based analysis and synthesis of tumor growth under angiogenic inhibition: a case study // 18th IF AC World Congress (Milano, Italy, Aug. 18 - Sept. 2, 2011): Proc. IFAC Publ., 2011. Pp. 3753-3758. DOI: 10.3182/20110828-6-IT-1002.02107
8. Мухоморова О.Ю., Крищенко А.П. Анализ модели развития раковой опухоли и построение схем антиангиогенной терапии на начальной стадии // Математика и математическое моделирование. 2015. №3. С. 39-58. DOI: 10.7463/mathm.0315.0790877
9. Zitelli G., Djouadi S.M., Day J.D. Combining robust state estimation with nonlinear model predictive control to regulate the acute inflammatory response to pathogen // Mathematical Biosciences and Engineering. 2015. Vol.12, iss. 5. Pp. 1127-1139. DOI: 10.3934/mbe.2015.12.1127
10. Bara O., Day J., Djouadi S.M. Nonlinear state estimation for complex immune responses // 52nd IEEE Conference on Decision and Control CDC 2013 (Florence, Italy, December 10-13, 2013): Proc. N.Y.: IEEE, 2013. Pp. 3373-3378. DOI: 10.1109/CDC.2013.6760399
11. Smolinski E., Benkmann A., Drewelow W., Jeinsch T., Cappius H-J., WesterhofffP. Observer-based controller design for the minimally invasive surgery // Current Directions in Biomedical Engineering. 2018. Vol. 4, iss. 1. Pp. 41-44. DOI: 10.1515/cdbme-2018-0011
12. Gauthier J.P., Hammouri H., Othman S. A simple observer for nonlinear systems. Application to bioreactors // IEEE Trans. on Automatic Control. 1992. Vol. 37, no. 6. Pp. 875-880. DOI: 10.1109/9.256352
13. Cacace F., Cusimano V., Di Paola L., Germani A. Observer-based techniques for the identification and analysis of a vascular tumor growth // Mathematical Biosciences. 2011. Vol. 234, iss. 2. Pp. 147-153. DOI: 10.1016/j.mbs.2011.10.002
14. Mohd Ali J., Ha Hoang N., Hussain M.A., Dochain D. Review and classification of recent observers applied in chemical process systems // Computers & Chemical Engineering. 2015. Vol. 76. Pp. 27-41. DOI: 10.1016/j.compchemeng.2015.01.019
15. Yamalova D., Churilov A., Medvedev A. State estimation in a delayed impulsive model of testosterone regulation by a finitedimensional hybrid observer // 14th European Control Conf.: ECC 2015 (Linz, Austria, July 15-17, 2015): Proc. N.Y.: IEEE, 2015. Art. no. 7330743. DOI: 10.1109/ECC.2015.7330743
16. Ямалова Д.Р. Преобразование Пуанкаре для уравнения наблюдателя состояния импульсной системы с запаздыванием // Вестник Санкт-Петербург. ун-та. Математика. Механика. Астрономия. 2017. Т. 4(62), № 1. С. 64-77. DOI: 10.21638/11701/spbu01.2017.109
17. Farza M., M'Saad M., Fall M.L., Pigeon E., Gehan O., Busawon K. Continuous-discrete time observers for a class of MIMO nonlinear systems // IEEE Trans. on Automatic Control. 2014. Vol. 59, no. 4. Pp. 1060-1065. DOI: 10.1109/TAC.2013.2283754
18. Bichara D., Cozic N., Iggidr A. On the estimation of sequestered infected erythrocytes in plasmodium falciparum malaria patients // Mathematical Biosciences & Engineering. 2014. Vol. 11, iss. 4. P. 741-759. DOI: 10.3934/mbe.2014.11.741
19. Cacace F., Cusimano V., Germani A., Palumbo P., Papa F. Closed-loop control of tumor growth by means of anti-angiogenic administration//Mathematical Biosciences & Engineering. 2018. Vol. 15, iss. 4. Pp. 827-839. DOI: 10.3934/mbe.2018037
20. Garimella R., Garimella U., Liu W. A theoretic control approach in signal-controlled metabolic pathways //Mathematical Biosciences & Engineering. 2007. Vol. 4, iss. 3. Pp. 471-488. DOI: 10.3934/mbe.2007.4.471
21. Tellez-Anguiano A.C., Astorga-Zaragoza C.M., Alcorta-Garcia E., Targui B., Quintero-Marmol E., Adam-Medina M., Olivares-Peregrino V.H. Nonlinear continuous-discrete observer application to distillation columns // Intern. J. of Innovative Computing, Information and Control. 2012. Vol. 8, no. 1(B). Pp. 763-778. Режим доступа: http://www.ijicic.org/ ijicic-10-09060.pdf (дата обращения 12.12.2018).
22. Ngom D., Iggidir A., Guiro A., Ouahbi A. An observer for a nonlinear age-structured model of a harvested fish population // Mathematical Biosciences and Engineering. 2008. Vol. 5, iss. 2. Pp. 337-354. DOI: 10.3934/mbe.2008.5.337
23. Виноградова М.С., Ткачев С.Б. Использование наблюдателя состояния при моделировании процесса антиангиогенной терапии // Наука и образование. МГТУ им. Н.Э. Баумана. Электрон. журн. 2016. № 12. С. 264-278. DOI: 10.7463/1216.0852798
24. Gauthier J.P., Kupka I. Deterministic observation theory and applications. Camb.: Camb. Univ. Press, 2001. 226 p.
25. Краснова С.А., Мысик Н.С. Каскадный синтез наблюдателя состояния с нелинейными корректирующими воздействиями// Автоматика и телемеханика. 2014. №2. С. 106-128.
26. O'Reilly M.S., Holmgren L., Shing Y., Chen C., Rosenthal R.A., Moses M., Lane W.S., Cao Y., Sage E.H., Folkman J. Angiostatin: a novel angiogenesis inhibitor that mediates the suppression of metastases by a lewis lung carcinoma // Cell. 1994. Vol. 79, no. 2. Pp. 315-328. DOI: 10.1016/0092-8674(94)90200-3
27. Hahnfeldt P., Panigrahy D., Folkman J., Hlatky L. Tumor development under angiogenic signaling: A dynamical theory of tumor growth, treatment response, and postvascular dormancy // Cancer research. 1999. Vol. 59, iss. 19. Pp. 4770-4775.
28. Степанова Е.В. Антиангиогенная терапия: новые возможности лечения злокачественных заболеваний // Практическая онкология. 2002. Т. 3, №4 (12). С. 246-252.
29. Isidori A. Nonlinear Control Systems. 3rd ed. B.; N.Y.: Springer, 1995. 549 p. DOI: 10.1007/978-1-84628-615-5
30. Уткин В.И. Скользящие режимы в задачах оптимизации и управления. М: Наука, 1981. 367 с.
31. Дракунов С.В., Изосимов Д.Б., Лукьянов А.Г., Уткин В.А., Уткин В.И. Принцип блочного управления. I // Автоматика и телемеханика. 1990, № 5. С. 38-47.
32. Utkin V., Guldner J., Shi J. Sliding mode control in electro-mechanical systems. 2nd ed. Boca Raton: CRC press, 2009. 503 p.
33. Емельянов С.В., Коровин С.К. Новые типы обратной связи: Управление при неопределенности. М.: Физматлит, 1997. 348 с.
34. Андриевский Б.Р., Фрадков А.Л. Адаптивное управление летательным аппаратом с идентификацией на скользящих режимах // Управление большими системами. 2009. № 26. С.113-144.
35. Drakunov S.V. Sliding-mode observers based on equivalent control method // 31st IEEE Conf. on Decision and Control: CDC 1992 (Tucson, Arizona, USA, December 16-18, 1992): Proc. N.Y.: IEEE, 1992. Pp. 2368-2369. DOI: 10.1109/CDC.1992.371368
36. Drakunov S.V., Utkin V. Sliding mode observers. Tutorial // 34th Conference on Decision and Control: CDC 1995 (New Orleans, LA, USA, December 13-15, 1995): Proc. Vol.4. IEEE, 2002. Pp. 3377-3378. DOI: 10.1109/CDC.1995.479009
37. Дик B.B., Краснова C.A., Ткачев С.Б. Аналитическое резервирование измерительных систем летательного аппарата. Наука и образование. МГТУ им. Н.Э. Баумана. Электрон. журн. 2013. №6. С. 211-226. DOI: 10.7463/0613.0571439
Mathematics i Mathematical Modelling
http://mathmelpub.ru ISSN 2412-5911
Using an Observer in a Sliding Mode for Modeling Anti-angiogenic Therapy
1 & 1 1 Vinogradova M. S.1, , Tkachev S. B.1, Tkacheva O. S.1 [email protected]
1Bauman Moscow State Technical University, Russia
Keywords: state observer, observer in a sliding mode, normal form, control, antiangiogenesis
Currently, a slew of biomedical system models have been proposed, but in certain cases their real-world application is a challenge. This is because in these models not all state variables can be measured. The problem of restoring the state vector, which is to obtain estimates for its non-measurable components, can be solved by control theory methods, in which it is formulated as the problem of constructing a state observer.
The article analyses Russian and foreign publications available in the field concerned to consider the problem of observer applications to biological systems. One of the types of state observers, an observer operating in a sliding mode in particular, is under consideration. The procedure to construct it for biological systems is shown by an example of a tumor growth model in which treatment is based on blocking the processes of angiogenesis.
For a nonlinear dynamic system describing the tumor growth in the process of antiangiogenic therapy, its normal form is shown and a nonlinear state observer in sliding modes is constructed. As the measurable system output, a variable appropriate to the tumor volume was selected. The estimate of the total vector of the system state, obtained by the observer, is used to build state feedback that stabilises the program trajectory. Mathematical modelling, which shows that, in principle, in sliding modes an observer can be used for control of biological systems, proves the theoretical principles.
References
1. Romanyukha A.A. Matematicheskiye modeli v immunologii i epidemiologii infektsionnykh zabolevaniy [Mathematical models in immunology and epidemiology of infectious diseases]. Moscow: BINOM. Laboratoriia znanij Publ., 2012. 293 p. (in Russian)
2. Khaitov R.M. Immunologiya: struktura ifunktsii immunnoy sistemy [Immunology: the structure and function of the immune system]: a textbook. Moscow: GEOTAR Media Publ., 2013. 277 p. (in Russian)
Mathematics and Mathematical Modeling, 2018, no. 6, pp. 52-71.
DOI: 10.24108/mathm.0618.0000165
Received: 15.12.2018
© NEICON
3. Bolodurina I.P., Lugovskova Yu.P. Optimal control of the dynamics of interaction between the human immune system and the infectious diseases. Vestnik Samarskogo universiteta. Yestestvennonauchnaya seriia [Bulletin of the Samara Univ. Natural science Ser.], 2009, no. 8(74), pp. 138-153. (in Russian)
4. Rusakov S.V., Chirkov M.V. Mathematical model of the effect of immunotherapy on the dynamics of the immune response. Problemy upravleniya [Control problems], 2012, no. 6, pp. 45-50. (in Russian)
5. Absalyamova O.V., Anikeeva O.Yu., Golanov A.V., Kobyakov G.L., Konovalov A.N., Ko-rnienko V.N., Krivoshapkin A.L., Loshakov V.A., Olyushin V.E., Potapov A.A., Ryzhova M.V., Taniashin S.V., Trunin Yu.Yu., Ulitin A.Yu., Shishkina L.V. Klinicheskie rekomendatsii po lecheniyu pervichnykh opukholej tsentral'noj nervnoj sistemy [Clinical recommendations for the treatment of primary tumors of the Central nervous system] (approved at a Meeting of the Board of the Association of neurosurgeons of Russia 20.09.2013). Nizhny Novgorod, 2013. 40 p. (in Russian)
6. Kerbel R., Folkman J. Clinical translation of angiogenesis inhibitors. Nature Reviews Cancer, 2002, vol. 2, pp. 727-739. DOI: 10.1038/nrc905
7. Drexler D., Kovacs L., Sapi J., Harmati I., Benyo Z. Model-based analysis and synthesis of tumor growth under angiogenic inhibition: a case study. 18th IFAC World Congress (Milano, Italy, Aug. 28{Sept. 2, 2011): Proc. IFAC Publ., 2011. Pp. 3753-3758. DOI: 10.3182/20110828-6-IT-1002.02107
8. Mukhomorova O.Yu., Krishchenko A.P. Cancerous tumour model analysis and constructing schemes of anti-angiogenesis therapy at an early stage. Matematika i matematicheskoe modelirovanie [Mathematics and Mathematical Modelling], 2015, no. 3, pp. 39-58. DOI: 10.7463/mathm.0315.0790877 (in Russian)
9. Zitelli G., Djouadi S.M., Day J.D. Combining robust state estimation with nonlinear model predictive control to regulate the acute inflammatory response to pathogen. Mathematical Biosciences & Engineering, 2015, vol. 12, iss. 5, pp. 1127-1139. DOI: 10.3934/mbe.2015.12.1127
10. Bara O., Day J., Djouadi S.M. Nonlinear State Estimation for Complex Immune Responses. 52nd IEEE Conf. on Decision and Control: CDC 2013 (Florence, Italy, December 10-13, 2013): Proc. N.Y.: IEEE, 2013. Pp. 3373-3378. DOI: 10.1109/CDC.2013.6760399
11. Smolinski E., Benkmann A., Drewelow W., Jeinsch T., Cappius H-J., Westerhoff P. Observer-based controller design for the minimally invasive surgery. Current Directions in Biomedical Engineering, 2018, vol. 4, iss. 1, pp. 41-44. DOI: 10.1515/cdbme-2018-0011
12. Gauthier J.P., Hammouri H., Othman S. A simple observer for nonlinear systems. Application to bioreactors. IEEE Trans. on Automatic Control, 1992, vol.37, no. 6, pp. 875-880. DOI: 10.1109/9.256352
13. Cacace F., Cusimano V., Di Paola L., Germani A. Observer-based techniques for the identification and analysis of a vascular tumor growth. Mathematical Biosciences, 2011, Vol. 234, iss. 2, pp. 147-153. DOI: 10.1016/j.mbs.2011.10.002
14. Mohd Ali J., Ha Hoang N., Hussain M.A., Dochain D. Review and classification of recent observers applied in chemical process systems. Computers & Chemical Engineering, 2015, vol. 76, pp. 27-41. DOI: 10.1016/j.compchemeng.2015.01.019
15. Yamalova D., Churilov A., Medvedev A. State estimation in a delayed impulsive model of testosterone regulation by a finitedimensional hybrid observer. 14th European Control Conf.: ECC 2015 (Linz, Austria, July 15-17, 2015): Proc. N.Y.: IEEE, 2015. Art. no. 7330743. DOI: 10.1109/ECC.2015.7330743
16. Yamalova D.R. Poincare mapping for a time-delay impulsive system. Vestnik St. Petersburg Univ. Mathematics. 2017, vol. 50, no. 1, pp. 44-54. DOI: 10.3103/S1063454117010149
17. Farza M., M'Saad M., Fall M.L., Pigeon E., Gehan O., Busawon K. Continuous-discrete time observers for a class of MIMO nonlinear systems. IEEE Trans. on Automatic Control, 2014, vol. 59, no. 4, pp. 1060-1065. DOI: 10.1109/TAC.2013.2283754
18. Bichara D., Cozic N., Iggidr A. On the estimation of sequestered infected erythrocytes in plasmodium falciparum malaria patients. Mathematical Biosciences & Engineering, 2014, Vol. 11, iss. 4, pp. 741-759. DOI: 10.3934/mbe.2014.11.741
19. Cacace F., Cusimano V., Germani A., Palumbo P., Papa F. Closed-loop control of tumor growth by means of anti-angiogenic administration. Mathematical Biosciences & Engineering, 2018, vol. 15, iss. 4, pp. 827-839. DOI: 10.3934/mbe.2018037
20. Garimella R., Garimella U., Liu W. A theoretic control approach in signal-controlled metabolic pathways. Mathematical Biosciences & Engineering, 2007, Vol. 4, iss. 3, pp. 471-488. DOI: 10.3934/mbe.2007.4.471
21. Tellez-Anguiano A.C., Astorga-ZaragozaC.M., Alcorta-GarcaE., Targui B., Quintero-Marmol E., Adam-Medina M., Olivares-Peregrino V.H. Nonlinear continuous-discrete observer application to distillation columns. Intern. J. of Innovative Computing, Information and Control, 2012, Vol.8, no. 1(B), pp. 763-778. Available at: http://www.iiicic.org/iiicic-10-09060.pdf, accessed 12.12.2018.
22. Ngom D., Iggidir A., Guiro A., Ouahbi A. An observer for a nonlinear age-structured model of a harvested fish population. Mathematical Biosciences & Engineering, 2008, Vol. 5, iss. 2, pp. 337-354. DOI: 10.3934/mbe.2008.5.337
23. Vinogradova M.S., Tkachev S.B. Using a state observer in the anti-angiogenesis therapy simulation. Nauka i obrazovanie MGTU im. N.E. Baumana [Science and Education of the Bauman MSTU], 2016, no. 12, pp. 264-278. DOI: 10.7463/1216.0852798 (in Russian)
24. Gauthier J.P., Kupka I. Deterministic Observation Theory And Applications. Camb.: Camb. Univ. Press, 2001. 226 p.
25. Krasnova S.A., Mysik N.S. Cascade synthesis of a state observer with nonlinear correcting influences. Automation and Remote Control, 2014, Vol.75, iss. 2, pp. 263-280 DOI: 10.1134/S0005117914020076
26. O'Reilly M.S., Holmgren L., Shing Y., Chen C., Rosenthal R.A., Moses M., Lane W.S., Cao Y., Sage E.H., Folkman J. Angiostatin: a novel angiogenesis inhibitor that mediates the suppression of metastases by a lewis lung carcinoma. Cell, 1994, vol. 79, no. 2, pp. 315-328. DOI: 10.1016/0092-8674(94)90200-3
27. Hahnfeldt P., Panigrahy D., Folkman J., Hlatky L. Tumor development under angiogenic signaling: A dynamical theory of tumor growth, treatment response, and postvascular dormancy. Cancer research, 1999, vol. 59, iss. 19, pp. 4770-4775.
28. Stepanova E.V. Antiangiogenic therapy: new possibilities of treatment of malignant diseases. Prakticheskaya onkologiya [Practical oncology], 2002, vol. 3, no. 4 (12), pp. 246-252. (in Russian)
29. Isidori A. Nonlinear Control Systems. 3rd ed. B.; N.Y.: Springer, 1995. 549 p. DOI: 10.1007/978-1-84628-615-5
30. Utkin V.I. Skol'zyashchiye rezhimy v zadachakh optimizatsii i upravleniya [Sliding modes in optimization and control problems]. Moscow: Nauka Publ., 1981. 367 p. (in Russian)
31. Drakunov S.V., Izosimov D.B., Luk'yanov A.G., Utkin V.A., Utkin V.I. The block control principle. 1. Automation and Remote Control, 1990, vol. 51, no. 5, pp. 601-608.
32. Utkin V., Guldner J., Shi J. Sliding mode control in electro-mechanical systems. 2nd ed. Boca Raton: CRC press, 2009. 503 p.
33. Yemel'ianov S.V., Korovin S.K. Novye tipy obratnoj sviazi: Upravleniyepri neopredelennosti [New types of feedback: Control under uncertainty]. Moscow: Fizmatlit Publ., 1997. 348 p. (in Russian)
34. Andrievsky B.R., Fradkov A.L. Adaptive flight control based on parameter identification procedure simultaneously with sliding mode motion. Upravlenie bol 'shimi sistemami [Large-Scale Systems Control], 2009, mo. 26, pp. 113-144. (in Russian)
35. Drakunov S.V. Sliding-Mode observers based on equivalent control method. 31st IEEE Conf. on Decision and Control: CDC 1992 (Tucson, Arizona, USA, Dec. 16-18, 1992): Proc. Vol. 2. N.Y.: IEEE, 1992. Pp. 2368-2369. DOI: 10.1109/CDC.1992.371368
36. Drakunov S.V., Utkin V. Sliding mode observers. Tutorial. 34th Conf. on Decision and Control: CDC 1995 (New Orleans, LA, ISA, December 13-15, 1995): Proc. Vol. 4. N.Y.: IEEE, 2002. Pp. 3377-3378. DOI: 10.1109/CDC.1995.479009
37. Dik V.V., Krasnova S.A., Tkachev S.B. Analytical reservation of measuring systems of an aircraft Nauka i obrazovanie. MGTU im.N.E. Baumana [Science and Education of the Bauman MSTU], 2013, № 6, pp. 211-226. DOI: 10.7463/0613.0571439 (in Russian)