УДК 519.71:004.942
ОЦЕНКА УСТОЙЧИВОСТИ МАТЕМАТИЧЕСКОЙ МОДЕЛИ ЧЕЛОВЕКА-ОПЕРАТОРА
В СИСТЕМЕ УПРАВЛЕНИЯ
Н.М. Новикова, А.Г. Моисеев
В данной статье рассматриваются две системы управления роботом. Одна система использует человека-оператора в качестве регулятора, другая - многослойную нейронную сеть. Показано и подтверждено экспериментами, что в качестве моделей работы человека-оператора можно использовать многослойную нейронную сеть
Ключевые слова: математическое моделирование, нейронные сети, оценка устойчивости
В настоящее время широкое распространение получили эргатические (человеко-машинные) системы управления процессами и производствами, построенные на основе взаимодействия автоматизированных систем управления различных уровней, использовании компьютеров, типизации программного и технического обеспечения, построения баз данных. При создании таких систем необходим учет человеческого фактора, который призван повысить эффективность работы, как человека, так и системы управления. Оценку человеческого фактора можно произвести, используя математические модели деятельности человека-оператора. Роль человека в системах управления производством, технологическими процессами достаточно разнообразна, отсюда и разнообразие математических моделей работы человека-оператора [1]. Нужно заметить, что среди множества математических моделей нет моделей, построенных на основе искусственных нейронных сетей (ИНС). Множество работ посвящено техническим системам управления [2,3], однако, отсутствуют исследования по применению нейронных сетей для моделирования работы человека-оператора. Известно [2], что искусственные нейронные сети обладают рядом особенностей: параллельность обработки
информации, ассоциативность, способность к обучению, обобщение, абстрагирование. Представляется, что благодаря этим особенностям они могут быть использованы для моделирования работы человека-оператора в системе управления.
Цель статьи - показать возможность использования искусственных нейронных сетей для описания модели работы человека оператора в задачах управления и оценка устойчивости данной модели.
Простейшим с точки зрения анализа и моделирования типом задачи управления является непрерывное одномерное отслеживание, при котором задача оператора заключается в формировании на выходе управляемого процесса, который наиболее соответствует задающему входному сигналу. Человек-оператор (регулятор)
действует на основе наблюдаемой им ошибки и регулирует управляемый процесс так, чтобы уменьшить ошибку до нуля (компенсировать ее).
В качестве объекта управления (ОУ) было выбрано звено робота. Уравнение движения звена:
ф = -10 БІп(ф) - 2 ф + и
(1)
Новикова Нелли Михайловна - ВГУ, д-р техн. наук, профессор, тел. (4732) 20-87-15
Моисеев Алексей Георгиевич - ВГУ, аспирант, тел. (4732) 52-65-43
' " Ж
где ф - угол поворота звена; и - момент, развиваемый двигателем постоянного тока.
Системы управления, использующие нейронные сети, являются одной из возможных альтернатив классическим методам управления. Возможность использования ИНС для решения задач управления во многом основывается на том, что ИНС, состоящая из двух слоев и имеющая в скрытом слое произвольное большое количество узлов, может аппроксимировать любую функцию действительных чисел с заданной степенью точности. Доказательство этого положения, основанное на известной теореме Вейерштрасса, приведено в [2]. В настоящее время достаточно хорошо разработан и широко используется целый ряд других возможных архитектур построения нейросетевых систем управления. Во всех системах, назначением нейросетевого контроллера является выработка адекватного управляющего сигнала для управления динамикой состояний объекта управления от начального до желаемого итогового состояния. Причем смена состояний должна проходить по максимальной траектории. Организация контроля за состоянием объекта управления и реализация нейросетевого контроллера в значительной степени зависят от выбранного алгоритма обучения и используемой структуры управления.
Обоснование использования нейронной сети в системе управления приводится в [2].
Для того чтобы ИНС использовать в системе управления её необходимо обучить. Под обучением искусственной нейронной сети понимается процесс
настройки весовых коэффициентов у ее слоев, в
результате чего сеть выполняет конкретную задачу, в нашем случае - управление. Достижение этих целей
формализуется критерием качества 0, , минимальное
*
значение 0 =0 которого соответствует
w
наилучшему решению задачи.
Существует много методов и алгоритмов обучения ИНС в зависимости от архитектуры, функционального назначения сети и стратегии обучения.
Обобщенную запись алгоритма обучения сети можно представить в виде [2]
м> (1) = й ') + / ( й '), Ц (1 — 1), 0 ) (2)
й (1)
где УУ1 представляет новую входную
информацию; ) - старую информацию; Ц( )
- текущее решение.
Функция /($'), Ц (/-1), 0) зависит от
конкретной цели обучения, архитектуры нейросети, характеристик входной информации, способа преобразования информации между слоями. Эта функция отображает закон изменения вектора й(/) б Ц(/“1) уу в зависимости от меры близости к Ч. и
критерия 0 . В случае использования градиентных
й (/)
методов обучения критерием выбора решений может служить близость к нулю производной функции активации по своему аргументу.
Для обучения рассматриваемой многослойной нейронной сети был выбран метод обратного распространения ошибки - метод ВР[2]. Метод обратного распространения ошибки был разработан для обучения статических нелинейных многослойных нейросетей. Этот метод использует последовательную, послойную настройку элементов сети, начиная с последнего выходного слоя и заканчивая настройкой элементов первого слоя. Обучение представляет собой итеративный процесс, повторяющийся необходимое число раз. Для настройки весовых коэффициентов применяется
5 - правило в виде алгоритма градиентного метода минимизации критерия обучения 0(еи) . Здесь
(К)
вектор ошибки
обучения сети относительно желаемого (эталонного)
г*
выхода и при нелинейном преобразовании входного
7 „ ,7 = Ц (К)
вектора г в выходной и ~ Ч последнего слоя
К.
Это преобразование имеет вид
(К—1) 7-( К—2)
и—/(К) — 7(К >К( К) +
+ WlKf(К—1)(м>0(К—1) + 7
х (...^(/) + <)7(/—1)(^0(/—1) + 7
х (...^0(2) + +<2) 7 (1)( ^(1) + ^(1) Ц(0))...))...)))
— Р (г).
х
(/—1) 7 (/—2)
(3)
где Ц — СО/(Ц1,..., ЦіЦк ) - вектор выхода, г — Со/(г1,...,гі,...,гк) - вектор входа,
^(К) —1| н!і,у ||, і — 1,К, у — 0, п - матрица весовых коэффициентов,
Ж/К) —1| у ||, і — 1,К , у — 1,п - матрица
весовых коэффициентов,
7 (') - функция активации - монотонная,
непрерывно дифференцируемая на интервале либо (-
1,+1), либо (0,+1).
Из (3) следует, что многослойная нейронная сеть выполняет сложное нелинейное преобразование Б^)
входного вектора г в зависимости от весовых
,(/)
коэффициентов 7 и функций активации /(/). Ошибка еи явным образом зависит от
коэффициентов й(К) и используется как аргумент
', У
функционала 0 для настройки элементов К-го слоя. Вектор еи и функция 0(еи) явно не зависят от
весовых коэффициентов й(/) (/ = 1, К — 1) .
Поэтому в случае использования критерия обучения 0(еи ) для настройки коэффициентов $(/), ошибка
еи , в процедуре обучения, пересчитывается последовательно в обобщенные ошибки Си , которые явно зависят от значений $(/). Настройка
коэффициентов $(/) осуществляется по 5 -
', У
правилу, где используются обобщенные ошибки
7 ( К )
ошибка С . Для слоя К ошибка, очевидно,
С(К) = 7 (й(К)) такова и — ^и ^ ) .
В методе ВР далее используется локальный
7 7^7
квадратичный функционал 0(с) = 0,5 С С .
Итак, суть метода ВР обучения многослойной нейронной сети определяет минимизация
функционала 0(с) по настраиваемым весовым
коэффициентам ^(/) (/ — К —1,...,1)
* п /
У
методом
градиентного спуска с пересчетом ошибки
^(К) — еи (^Л ) для слоя К в ошибку
ст(/) — еи(ц,(/)) для слоев (/ — К — 1,К — 2,...,1). Единственное требование к функции активации, накладываемое алгоритмом обратного
распространения ошибки это ее
-,(К)
*
*
и
дифференцируемость. В качестве такой функций была выбрана логистическая функция
7,(х)=п+е%,
ее область значений принадлежит отрезку [0,1]. Производная этой функции имеет вид:
/ '(х) = - е—Х
■ = / (х)(1 — / (X))
(4)
[1+е—х ]2
Равенство (4) достигает своего максимума при /(х) = 0,5 , а минимума на краях интервала [0,1].
Поскольку коррекции весов у ~ , то для
максимального изменения синаптических весов функциональные сигналы нейрона должны находиться в середине диапазона. Именно это свойство обуславливает устойчивость алгоритма обратного распространения.
Рассмотрим устойчивость уравнения движения звена (1).
Вводя новую независимую переменную т = 7Ю уравнение ОУ можно привести к виду 2
й ф 2 йф и
—2 + ^“Т +8ш(ф) — 777 = 0
йт2 лД0 йт 10
Для дальнейшего исследования введем новую
йф
переменную 2 = — и получим систему уравнений йт
первого порядка
йг 2 .. и
— = —т= г — 81п ф +-----------
йт ^10 10
йт
(5)
Исключая из которой т, можно получить
одно уравнение первого порядка
йг 2 .. . и
г— = —;= 2 — 81П(ф) +------
йф 710 10
В этом случае уравнение интегральных кривых
2 ■ ф и
, —т= г — ^1п(ф) + —
йг = д/10 10
йф г
не поддается непосредственному интегрированию,
поэтому применяется метод качественного
интегрирования. Изоклина = 0 есть сдвинутая
— — 51п(ф)
синусоида. Ее уравнение г =-----------------------------2-. Она
л/Ю
и
пересекает ось ф только при — < 1 (Рис. 1.). При
и
10 > 1 эта изоклина не пересекает оси ф (Рис. 2.).
йг
Далее — > 0 между синусоидой и осью ф, т.е. в
областях заштрихованных на Рис. 1. и Рис. 2. Во всей остальной области < 0 .
Координаты особых точек по-прежнему
определяются уравнениями
и и
----Бш(ф) = 0, г = 0 . Следовательно, при — > 1
10 10
особых точек нет. При 10 < 1 существуют две
особые точки ф = ф , г = 0 и ф = ф2 = п — ф, г = 0,
. и . . _ . п,
где ф = агс51п(—) (0 < ф < —).
Выясняя характер этих точек, положим в уравнениях (5) ф = ф■ + % (г=1, 2) и разложим 81п(ф)
в ряд по степеням %. Ограничиваясь первой степенью % получаем систему уравнений, описывающую поведение системы около состояния равновесия (ф. ,0)
йг 2
— = —■;= г — %соф йт у/10
й%
йт
=г
с характеристическим уравнением 2 2
Л +—■:= Л + соБф,-) = 0 .
л/10
Так как соБф1 > 0, а со8ф2 =— соБф1 <0, то следовательно, состояние равновесия (ф1,0) -
= г
устойчивый фокус при 4cosф1 > — и устойчивый
2
узел при 4cosф1 < —. (ф2,0) всегда седло.
Таким образом доказана устойчивость системы управления с ИНС, где в качестве объекта управления используется звено (1).
Структурная схема системы управления с использованием человека-оператора
представлена на рис.3.
Рис. 3
В этой системе управления в качестве регулятора используется человек-оператор. Работа человека
оператора описывается передаточной функцией
Г (P) — ^ (6)
вида [4]
(Tp +3)p коэффициент усиления , T
постоянная
где k -времени.
Коэффициент усиления был принят равным k = 22.5 1/с. Постоянная времени в опытах имела значение T = 0.5 с. [4]
Структурная схема системы управления с использованием многослойной нейронной сети приведена на рис. 4.
Архитектура нейронной сети содержит: 2 слоя,
3 входа, 2 нейрона скрытого слоя, 1 выход. Многослойная нейронная сеть реализована в виде S-функции NN.m. S-функции являются описанием блока на одном из языков программирования: MATLAB, C, C++, Ada, или Fortran. Набор стандартных блоков Simulink, достаточно обширен, однако в практике моделирования встречаются ситуации, когда нужного блока нет. В этом случае необходимо использовать технологию S-функций для создания нужного блока [5].
В NN.m описана архитектура, обучение сети (пересчет отклонений и весовых коэффициентов) и формирование выходного сигнала.
Ее начальными входными параметрами являются начальные значения для весовых коэффициентов синаптических связей нейросети и коэффициента настройки.
Рассмотренные системы управления были реализованы в наборе библиотек SIMULINK пакета MATLAB 6.5 [5].
Рис. 4
Экспериментально была исследована реакция этих систем на различные входные сигналы. Если в качестве входного сигнала используется синусоида или косинусоида с амплитудой, равной 1 и частотой
0,25 рад/с, то нейронная сеть на начальной стадии ведет себя хуже, чем человек-оператор. Она имеет большую ошибку, чем человек оператор. Затем она обучается, перенастраивая весовые коэффициенты, и в дальнейшем более точно повторяет эталонный входной сигнал.
Из анализа экспериментальных данных
следует, что реакция системы на ступенчатые воздействия со случайной амплитудой отрабатывается:
1) системой управления с использованием человека - оператора в пределах 5 секунд,
2) системой управления с использованием многослойной нейронной сети в пределах 4 секунд.
На рис. 5 представлен совмещенный график выхода объекта управления для системы
управления с использованием человека-оператора и системы управления с использованием многослойной нейронной сети. Из рисунка видно, что эти графики практически совпадают. В таблице
представлены экспериментальные данные, полученные для выходных сигналов этих систем.
Рис. 5
t,c 0 10 20 30 40 50
Yoper 0 0,129 0,394 0,149 0,404 0,066
Yann 0 0,129 0,394 0,149 0,402 0,066
П родолжение таблицы
t,c 60 70 80 90 100
Yoper 0,209 0,383 0,421 0,131 0,466
Yann 0,209 0,384 0,422 0,131 0,464
Первая строка таблицы соответствует моментам времени t.
Вторая строка соответствует точкам графика выходного сигнала системы управления с использованием человека-оператора.
Третья соответствует точкам графика выходного сигнала системы управления с использованием многослойной нейронной сети.
Для доказательства того факта, что выходные сигналы двух систем управления совпадают, необходимо применить статистический критерий для проверки однородности двух независимых выборок Yoper и Yann .
Выдвигается гипотеза Ho: выборки
однородны, то есть извлечены из одной генеральной совокупности, против альтернативы H1: выборки не однородны, то есть извлечены из разных генеральных совокупностей.
Поскольку неизвестен закон распределения выходных сигналов, поэтому используется непараметрический ранговый критерий
Вилкоксона [6]. Применение критерия Вилкоксона к экспериментальным данным показывает, что гипотеза однородности принимается при уровне значимости p=0,01, то есть выборки принадлежат одной генеральной совокупности. Это значит, что работа человека-оператора может быть описана с помощью искусственной нейронной сети.
Итак, на основании рассмотренных моделей управления звеном робота показано, что многослойные нейронные сети могут быть использованы для описания моделей работы человека оператора в задачах управления.
Литература
1. Голиков Ю.Я. Современные концепции автоматизации и подходы к человеку и технике. / Ю.Я. Голиков // Психологический журнал РАН - 2002, т. 23, №1. - С. 18-30.
2. Терехов В.А, Ефимов Д.В., Тюкин Н.Ю. Нейросетевые системы управления / В.А. Терехов, Д.В. Ефимов, Н.Ю. Тюкин - М.: ИПЖР, 2002г. - 480с.
3. Lewis F.L., Partisini T. Neural network feed-back control with guaranteed stability. - Int. J. Cintrol, 1998. v.70. №3, pp 337 - 345.
4. Шеридан Т.Б. Системы человек - машина. Модели информации, управления и принятия решений человеком - оператором: Пер. с англ./Т.Б. Шеридан, У.Р. Феррелл. — М.: Машиностроение, 1980. — 400 с.
5. Дьяконов В. Математические пакеты расширения Matlab. Специальный справочник. / В. Дьяконов В. Круглов -СПб.: Питер,2001. -467с.
6. Андронов А.М., Копытов Е.А., Гринглаз Л.Я. Теория вероятностей и математическая статистика -Спб. Питер, 2004. - 461с.
Воронежский государственный университет
STABILITY ESTIMATION OF THE MATHEMATICAL NEURAL OPERATOR MODEL
IN THE CONTROL SYSTEM
N.M. Novikova, A.G. Moiseev
Two robot control systems are considered in this paper. One system uses the observer as a regulator, another uses a multilayered neural network. It is shown and confirmed by experiments, that it is possible to use a multilayered neural network as the observer work model
Key words: mathematical model, neural networks, stability estimation
Сведения об авторах Новикова Нелля Михайловна
Профессор кафедры технической кибернетики и автоматического регулирования факультета прикладной математики, информатики и механики Воронежского государственного университета.
Домашний адрес: 394000, г. Воронеж, Проспект Революции д. 23, кв. 10 Служебный адрес: 39400, г. Воронеж, Университетская площадь д. 1 Дом. Телефон: 8(4732) 55-19-71, служ. тел.: 8(4732) 20-87-15
Моисеев Алексей Георгиевич
Аспирант кафедры технической кибернетики и автоматического регулирования факультета прикладной математики, информатики и механики Воронежского государственного университета.
Домашний адрес: 394000, г. Воронеж, ул. бульвар Победы д.41,кв. 65.
Дом. Телефон: 8(4732) 52-65-43, сот. тел.: 8-920-219-20-38. E-mail: [email protected], [email protected].