УДК 004.89
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ И УПРАВЛЕНИЕ ПРОЦЕССАМИ В СИСТЕМАХ АВТОМАТИЗАЦИИ ПРОМЫШЛЕННЫХ УСТАНОВОК С ПОМОЩЬЮ МНОГОЗНАЧНЫХ НЕЙРОННЫХ СЕТЕЙ
В.Н. Мещеряков, О.В. Мещерякова, П.В. Сараев
Рассмотрена многозначная пороговая логика, на которой базируются основные принципы многозначных нейронов, перечислены преимущества многозначных нейронных сетей. Для многозначного нейрона определена функция активации и приведены алгоритм обучения и алгоритм обучения многозначной нейронной сети методом обратного распространения ошибки. Предложен метод применения многозначных нейронных сетей для решения задачи моделирования технологических процессов.
Ключевые слова: математическое моделирование, многозначная нейронная сеть, нейросетевое управление.
ВВЕДЕНИЕ
При построении систем автоматизации технологических процессов возможно применение нейронных сетей в случаях, когда традиционные решения недостаточно эффективны. Искусственные нейронные сети могут быть использованы для решения различных задач, таких как моделирование технологических процессов, управление объектами, диагностика оборудования, прогнозирование ситуаций.
Нейронная сеть является математическим аппаратом, который имеет ряд преимуществ в задачах моделирования и управления по сравнению с традиционными системами: возможность реализации задач с существенными нелинейностями, высокая производительность вычислений благодаря параллельности нейронной сети, способность к обучению и обобщению накопленных знаний
[1-3].
Нейросетевые технологии успешно применяются для решения задач прогнозирования значений выходных параметров сложных технологических процессов, характерных, например, для металлургического производства. В таких случаях перспективно применение многозначной нейронной сети, функционирующей на множестве комплексных чисел, обладающей некоторыми преимуществами по сравнению с классическими нейронными сетями на множестве действительных чисел.
Многозначные нейронные сети отличаются более быстрым алгоритмом обучения и более точным прогнозом, что позволяет судить о возможности их применения к моделированию технологических процессов.
Цель исследования состоит в разработке методики моделирования технологических процессов с помощью многозначных нейронных сетей. Актуальность данной работы определяется необходимостью применения наиболее современных математических методов, к которым относятся нейронные сети, для математического моделирования технологических процессов, прогнозирования значений технологических параметров и управления.
1. АНАЛИЗ МЕТОДОВ УПРАВЛЕНИЯ
В управлении промышленными процессами со сложными математическими моделями эффективно применяются ПИ- и ПИД-контроллеры, и знание точной модели процесса не обязательно. Эти контроллеры строятся на основе классической теории управления. Тем не менее, ПИД-контролле-ры обладают рядом недостатков. При возникновении возмущений требуется ручная перенастройка параметров. При наличии в системе переменных параметров, временных задержек, существенных нелинейностей и помех, ПИД-контроллеры могут не обеспечить оптимального управления.
Идея управления с самонастройкой была предложена Калманом. В ее основе лежит концепция
машины, которая бы автоматически выполняла самонастройку. Продолжением этой идеи было создание ПИД-управления с самонастройкой, которое позволяет контроллерам приспосабливаться к изменениям параметров объекта управления в оперативном режиме. Винтгенмарком была предложена схема самонастраивающегося контроллера на основе схемы размещения полюсов.
Еще один метод управления — алгоритм обобщенного управления по минимальной дисперсии. Такое управление на основе долгосрочного прогнозирования предполагает применение ряда методов обобщенного управления (динамическое матричное прогнозирование, адаптивное управление по расширенному горизонту, обобщенное прогнозирующее управление) [1].
Один из наиболее эффективных — метод нечеткого управления. Логический контроллер может разрабатываться по лингвистическим правилами, и для него не требуется априорная математическая модель объекта. Он может применяться для многомерных нелинейных процессов, для систем с неизвестной динамикой.
Адаптивные методы управления требуют наличия математической модели, основанной на физических явлениях. При изменениях в объекте управления или во внешних условиях необходима перенастройка модели и определение нового закона управления. Для применения методов управления на практике они должны обладать способностью к обучению, гибкостью, устойчивостью, нелинейностью. Нейросетевые методы управления обладают этими свойствами.
Нейросетевое управление имеет ряд преимуществ по сравнению с перечисленными ранее методами. Нейронные сети обладают свойством нелинейности, способностью к самообучению, в отличие от других методов нейроуправление не требует сложного математического аппарата и большого объема априорной информации об объекте. Кроме того, нейронные сети обеспечивают параллельную обработку информации [1, 4].
2. МНОГОЗНАЧНЫЙ НЕЙРОН
Многозначные нейроны основаны на многозначной пороговой логике [5] и определены на множестве комплексных чисел. Их входы, выходы и весовые коэффициенты являются комплексными числами.
Главные преимущества многозначных нейронов по сравнению с другими типами нейронов заключаются в значительно более высоких функциональных возможностях быстро сходящихся алгоритмов обучения. Высокие функциональные возможности означают, что любая заданная многозначная функция может быть реализована на од-
ном нейроне [6]. Многозначные нейроны быстрее обучаются и лучше адаптируются, обучаются даже нелинейным функциям. Кроме того, в отличие от обычного нейрона, функционирующего на поле действительных чисел, многозначный нейрон способен решить проблему исключающего ИЛИ.
Так как функциональность отдельно взятого многозначного нейрона выше, чем обычного нейрона, функциональность многозначной нейронной сети также выше. Даже малая многозначная нейронная сеть обучается быстрее, чем нейронная сеть на действительных числах.
На рис. 1 представлена модель многозначного нейрона. Математическая модель нейрона характеризуется входными сигналами х1, ..., хп , весовыми коэффициентами w1, ..., функцией активации f(х1, ..., хп) и выходным сигналом у. Значения входных сигналов перемножаются на соответствующие весовые коэффициенты, после чего суммируются, и к этому значению применяется функция активации, преобразующая взвешенную сумму в выходной сигнал.
Особенность многозначного нейрона состоит в том, что входы, весовые коэффициенты и выход нейрона являются комплексными числами, а функция активации — пороговой многозначной функцией. Входы и выход лежат на единичной окружности в комплексной плоскости.
Рассмотрим многозначную пороговую функцию, которая определена на множестве комплексных чисел [5]. Она принимает значения корней степени к из единицы. Рассмотрим множество Е(Р), образованное корнями степени к из единицы:
Е( р) = 14 = е
2п//
к
] = 0, 1, ..., к - 1.
Рассмотрим комплексную плоскость и покажем, где расположены эти корни. Разделим единичную окружность на к частей. На рис. 2 приведен пример для случая к = 8.
Таким образом, в многозначной логике на поле комплексных чисел действует многозначная (к-значная) функция п переменных f(х1, ..., хп) :
БЩ ^ Б,.
Рис. 1. Модель многозначного нейрона
Рис. 2. Корни степени 8 из единицы
Многозначный нейрон реализует принципы многозначной пороговой логики. Он представляет переход между п входами и одним выходом. Такие нейроны функционируют на поле комплексных чисел.
Многозначная пороговая функция приведена в работах [2, 5]:
2пЦ
Р(г) = СБЮЩг) = 4 = е к , у = 0, 1, ..., к - 1,
(2л1 2 + 1)
если а^ к ' к
Ее можно трактовать следующим образом: если комплексное число г расположено в у-м секторе,
2м
так что Ц^ < а^г < 2 71 У + 1 -, то Р(г) = е к . кк
Отметим, что булева пороговая функция представляет собой частный случай многозначной пороговой функции. В самом деле, в случае к = 2 функция активации может быть представлена в виде:
Р(г) =
1,0 < аг§ г < п, -1, п < аг§ г < 2 п.
В процессе обучения многозначный нейрон корректирует свои весовые коэффициенты в соответствии с правилом корректировки весов. Другими словами, в ходе итерационного процесса обучения весовые коэффициенты изменяются каждый раз, когда для некоторой обучающей выборки фактическое значение выхода нейрона не совпадает с желаемым выходом.
Доказано, что алгоритм обучения многозначных нейронов сходится за конечное число шагов [7]. Так как обучение многозначных нейронов не сводится к решению некоторой задачи оптимизации, проблема локального минимума не возникает.
Введем обозначения: X = (хр ..., хп) — вектор входов; W = ..., — вектор весовых коэффициентов; г = + х^ + ... + х^п — взвешенная сум-
ма; /(х1, ..., хп) = Р(г) = Р^0 + х^ + ... + хпм>п) — многозначная пороговая функция активации; у = Р(г) — выход нейрона; й — ожидаемый выход; 8 = й — у — ошибка нейрона.
Алгоритм 1. Обучение многозначного нейрона
1. Подать входы нейрона, рассчитать выход у.
2. Рассчитать ошибку нейрона 8 = й — у.
3. Изменить веса по правилу корректировки весов [8]:
К +1 = wr +
г + 1 г п + 1
С1 (й — у) X = Wr + -1т 8 X,
п + 1
где г — номер итерации; С — скорость обучения;
X — вектор, сопряженный входному.
4. Если критерий останова не выполняется, перейти на шаг 1;
N
2
N х 18 8 = 1
1 N
ШЕ = N х < х,
RMSE = 7МЕ = N X У 2 <Х,
V 8 = 1
где у8 — ошибка на ¿-м обучающем примере, X — точность обучения.
3. МНОГОЗНАЧНАЯ НЕЙРОННАЯ СЕТЬ
Рассмотрим многослойную нейронную сеть прямого распространения на основе многозначных нейронов (рис. 3). Входной сигнал в таких сетях распространяется в прямом направлении, от слоя к слою. Число входных и выходных элементов в многослойном нейронной сети определяется условиями задачи.
Представим алгоритм обучения многозначной нейронной сети в векторном виде, для этого введем обозначения: Ь — число слоев нейронной сети; X1 — вектор входов 1-го слоя, I = 1, ..., Ь; К1 — вектор весовых коэффициентов 1-го слоя; У— век-
Рис. 3. Многозначная нейронная сеть
тор выходов нейронной сети; Б — вектор желаемых выходов нейронной сети; Ъ1 — вектор ошибок 1-го слоя.
Алгоритм обучения многозначной нейронной сети методом обратного распространения ошибки по сути аналогичен классическому алгоритму для нейронных сетей, действующих на множестве действительных чисел, но отличается большим быстродействием. Этот алгоритм имеет ряд преимуществ: основан на правиле корректировки ошибки и не требует вычисления производной; самоадаптация скорости обучения для всех нейронов; более высокие быстродействие и скорость распознавания/предсказания/классификации по сравнению с другими нейронными сетями, нечеткими сетями на основе метода опорных векторов.
Алгоритм 2. Обучение многозначной нейронной сети
1. Подать входы нейронной сети X1, рассчитать вектор выходов.
2. Рассчитать ошибку нейронной сети
Б - У
8l =
NL -1 + 1
3. Рассчитать вектор ошибок каждого слоя
о 1 + 1/ ТТ 7-Ь + К-1
о1 Ъ ( V ) , 1 т ,
Ъ = --—, где I = 1, ..., Ь - 1.
N1 -1 + 1
4. Изменить веса по правилу корректировки весов:
W1 , = W1 +
" r + 1 " r
Cr 8l Xl, где l = 1, ..., L.
Nl -1 + 1
5. Если критерий останова не выполняется, перейти на шаг 1;
1 N
ЫБЕ = к £ у,2 < X,
N
s = 1
Шбб = 4и5Е = N X у2 , 1 ^ = 1
где у^ — ошибка на 5-м обучающем примере, X — точность обучения.
4. МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ ТЕХНОЛОГИЧЕСКИХ ПРОЦЕССОВ С ПОМОЩЬЮ МНОГОЗНАЧНЫХ НЕЙРОННЫХ СЕТЕЙ
Многозначные нейронные сети могут быть применены для прогнозирования параметров технологических процессов. В качестве входов X = (х1, ..., хп) нейронной сети могут выступать измеряемые величины, а в качестве выхода У — моделируемое значение. Нейронная сеть строится следующим образом: выбирается число слоев и скрытых ней-
ронов, весовые коэффициенты W = (w1, ..., wn) — произвольные комплексные числа. Далее на обучающей выборке производится обучение нейронной сети по алгоритму, описанному в § 2. После обучения сети мы получаем математическую модель процесса в виде черного ящика: имеем входные значения и выходные значения, которые описаны некоторой зависимостью, скрытой внутри многозначной сети.
Благодаря эффективному моделированию достигается оптимальное управление различными объектами. Аппарат многозначных нейронных сетей позволяет успешно реализовывать задачу прогнозирования и моделирования технологических процессов, при этом проявляются преимущества этого типа нейронных сетей [9].
5. УПРАВЛЕНИЕ С ПОМОЩЬЮ НЕЙРОННЫХ СЕТЕЙ
Работающая и адекватная модель технологического процесса позволяет прогнозировать значения технологических параметров, что приводит к решению обратной задачи моделирования — управлению. В реальном производстве часть переменных измеряется с большой погрешностью, а некоторые возмущающие переменные и факторы вообще не поддаются измерению и контролю [10], поэтому для получения продукции требуемого качества необходим контроль технологических параметров. В данной работе для этой задачи предложен аппарат многозначных нейронных сетей.
При управлении с помощью нейронных сетей используется модель объекта управления в виде черного ящика. Состояние объекта нейроуправле-ния считается недоступным для внешнего наблюдения, а наблюдаемыми являются текущие значения входа и выхода [4].
Основные методы нейроуправления: подражающее нейроуправление (Controller Modeling), инверсное нейроуправление (Direct Inverse Control), прогнозирующее нейроуправление (NN Predictive Control), гибридное нейроуправление, вспомогательное нейроуправление (Adaptive Inverse Control)
[4] и др.
Другой подход к нейронному управлению — косвенное адаптивное управление (управление с пассивной адаптацией или косвенным измерением возмущений), в зарубежной литературе он известен под названием Internal Model Control (IMC). Этот метод позволяет компенсировать возмущения. Для оценки возмущений вычисляется разность регистрируемого выхода объекта y(t) и модели (рис. 4). Сигнал рассогласования e(t), вычитаемый из сигнала уставки r(t), используется для оценки возмущения d(t). Данная схема часто применяется в сочетании с классическими подходами к синтезу систем управления, к примеру, с ПИД-регулятором [12].
Рис. 4. Схема адаптивного косвенного управления
В этой схеме для управления объектом используются две нейронные сети — нейроконтроллер и нейроэмулятор. Нейроэмулятор служит прямой моделью объекта, а нейроконтроллер — инверсной моделью и предназначен для выработки управляющего сигнала. В такой архитектуре нейронного управления применяется алгоритм обратного распространения и обеспечивается более точное непосредственное обучение нейроконтроллера, так как ошибка может распространяться в обратном направлении через эмулятор в каждой выборке [1].
В качестве нейроконтроллера и нейроэмулято-ра предлагается использовать многозначные нейронные сети. Обучение прямого нейроэмулятора происходит в режиме офф-лайн. Для этого применяется алгоритм 2 — алгоритм обратного распространения для многозначной нейронной сети. Обучение происходит до тех пор, пока отличие выходных сигналов объекта и модели (нейроэмулятора) не будет незначительным. Далее, также с помощью алгоритма 2, происходит он-лайн обучение нейроконтроллера — инверсной модели. На вход нейроконтроллера поступает значение уставки г(к) для следующего такта, нейроконтроллер генерирует значение управляющего сигнала и(к — 1), который идет на вход объекта управления и модели. На объект также воздействуют возмущения й(к). В результате вырабатывается выход объекта управления у(к) и выход модели — нейроэмулятора упп(к).
Разность этих значений является ошибкой управления ет(к) = упп(к) — у(к), которая пропускается в обратном направлении (при этом весовые коэффициенты нейроэмулятора не корректируются). После прохождения нейроэмулятора ошибка далее распространяется через нейроконтроллер, где корректируются весовые коэффициенты. Этот метод позволяет оценивать возмущения по реакции модели объекта на управляющие воздействия [11]. Он может быть применен для моделирования нагрузки [12].
ЗАКЛЮЧЕНИЕ
Интеллектуальное управление находит все более широкое применение в различных технических приложениях. Во многих случаях обучение системы
управления должно быть выполнено с учетом различных факторов, таких как динамические и статические характеристики объекта, возмущения окружающей среды. Благодаря особенностям обучения, параллельности и адаптации многозначные нейронные сети, отличающиеся более простыми и быстрыми алгоритмами обучения, более точным прогнозом выходных параметров, могут успешно применяться для решения задач моделирования и управления техническими процессами.
Предложенный подход к моделированию и управлению технологическими процессами с помощью многозначных нейронных сетей позволяет повысить точность системы управления и, в свою очередь, качество конечной продукции.
ЛИТЕРАТУРА
1. Омату С., Халид М, Юсов Р. Нейроуправление и его приложения. - М: ИПРЖР, 2000. - 272 с.
2. Сараев П.В. Идентификация нейросетевых моделей. — Липецк: ЛГТУ, 2011. — 94 с.
3. Леденева Т.М., Подвальный С.Л., Васильев В.И. Системы искусственного интеллекта и принятия решений. — Уфа, 2005. — 165 с.
4. Чернодуб А.Н., Дзюба Д.А. Обзор методов нейроуправле-ния // Проблемы программирования. — 2011. — № 2. — С. 79—94.
5. Блюмин С.Л. Пороговые многозначные функции // Известия АН СССР. Техническая кибернетика. — 1972. — № 1. — С. 101—108.
6. Айзенберг Н.Н., Айзенберг И.Н., Кривошеев Г.А. Нейросети на многозначных нейроэлементах: обучение, обработка и распознавание изображений // Компьютерная оптика. — 1995. — № 14—15. — С. 179—186.
7. Aizenberg I. Complex-Valued Neural Networks with Multi-Valued Neurons. — Berlin: Springer, 2011. — 264 p.
8. Айзенберг Н.Н., Иваськив Ю.Л., Поспелов Д.А. Об одном обобщении пороговой функции // Доклады АН СССР. — 1971. — Т. 196, № 6. — С. 1287—1290.
9. Мещерякова О. В. Применение многозначных нейронных сетей // Управление большими системами: материалы IX Всерос. школы-конференции молодых ученых. — Тамбов—Липецк, 2012. — Т. 2. — С. 58—59.
10. Кудинов Ю.И., Военков А.В., Келина А.Ю. Моделирование технологических и экологических процессов. — Липецк: ЛЭГИ, 2001. — 131 с.
11. Змеу К.В., Марков Н.А., Ноткин Б.С. Прогнозирующее инверсное нейроуправление позиционно-следящим пневмоприводом // Информатика и системы управления. — 2011. — № 3. — С. 104—117.
12. Подвальный Е.С, Тюрин С.В., Соляник A.A. Оперативное управление автоматизированными технологическими комплексами на основе графического моделирования и визуализации задач диагностики и моделирования нагрузки // Системы управления и информационные технологии. — 2011. — Т. 46, № 4.1. — С. 171—175.
Статья представлена к публикации членом редколлегии
А.С. Манделем.
Виктор Николаевич Мещеряков — д-р техн. наук, зав. кафедрой,
Ш (4742) 32-80-56, И [email protected],
Ольга Викторовна Мещерякова — мл. науч. сотрудник,
Павел Викторович Сараев — канд. техн. наук, декан,
Ш (4742) 32-80-02, И [email protected],
Липецкий государственный технический университет.