Научная статья на тему 'Гибридный метод обучения нейронных сетей для классификации каталитической стадии процесса Клауса'

Гибридный метод обучения нейронных сетей для классификации каталитической стадии процесса Клауса Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
470
123
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЙРОННЫЕ СЕТИ / ГРАДИЕНТНЫЙ МЕТОД / ГЕНЕТИЧЕСКИЙ АЛГОРИТМ / ПРОЦЕСС КЛАУСА / NEURAL NETWORKS / GRADIENT METHOD / GENETIC ALGORITHM / CLAUS PROCESS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Проталинский О. М., Щербатов И. А., Беляев И. О.

Представлена гибридная методика обучения нейронных сетей применительно к нейросетевым системам управления, которая включает классические градиентные методы, а также модифицированный генетический алгоритм для корректировки весов. Рассматривается применение этой методики для обучения модели нейрорегулятора, применительно к классификации каталитической стадии процесса Клауса. Сформулированы выводы о скорости сходимости предложенной методики.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Проталинский О. М., Щербатов И. А., Беляев И. О.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

HYBRID METHOD OF TRAINING NEURAL NETWORKS FOR CLASSIFICATION CATALYTIC STAGE OF CLAUS PROCESS

Presented a hybrid technique of neural networks as applied to neural network control systems. Technique includes the classic gradient methods, as well as a modified genetic algorithm for adjusting weights. Considers the application of this technique to train the model neuroregulator, for classification of catalytic stage Claus process. The conclusions about the rate of convergence of the proposed methodology.

Текст научной работы на тему «Гибридный метод обучения нейронных сетей для классификации каталитической стадии процесса Клауса»

УДК 681.51.015: [69: 519.711.3]

О.М. Проталинский, И.А. Щербатов, И.О. Беляев ГИБРИДНЫЙ МЕТОД ОБУЧЕНИЯ НЕЙРОННЫХ СЕТЕЙ ДЛЯ КЛАССИФИКАЦИИ КАТАЛИТИЧЕСКОЙ СТАДИИ ПРОЦЕССА КЛАУСА

Представлена гибридная методика обучения нейронных сетей применительно к нейросетевым системам управления, которая включает классические градиентные методы, а также модифицированный генетический алгоритм для корректировки весов. Рассматривается применение этой методики для обучения модели нейрорегулятора, применительно к классификации каталитической стадии процесса Клауса. Сформулированы выводы о скорости сходимости предложенной методики.

Нейронные сети, градиентный метод, генетический алгоритм, процесс Клауса

O.M. Protalinsky, I.A. Sherbatov, I.O. Belyaev

HYBRID METHOD OF TRAINING NEURAL NETWORKS FOR CLASSIFICATION CATALYTIC STAGE OF CLAUS PROCESS

Presented a hybrid technique of neural networks as applied to neural network control systems. Technique includes the classic gradient methods, as well as a modified genetic algorithm for adjusting weights. Considers the application of this technique to train the model neuroregulator, for classification of catalytic stage Claus process. The conclusions about the rate of convergence of the proposed methodology.

Neural networks, gradient method, genetic algorithm, Claus process

Введение

Существует множество решений задачи автоматической классификации на основе теории нейронных сетей. Однако эти решения не являются достаточно полными и эффективными. Прежде всего, методы, основанные на нейросетевых моделях, не обеспечивают полной гарантии правильной классификации объекта, хотя вероятность успешного результата довольно высока. Кроме того, в теории нейронных сетей актуальным является выбор оптимальной структуры нейронной сети и алгоритма ее обучения.

Рассмотрим применение теории нейронных сетей на примере систем автоматического управления (рис. 1). Главными особенностями объекта управления являются нестационарность и отсутствие быстротекущих физико-химических процессов. В качестве управляющего устройства рассмотрим нейросетевой регулятор.

От нейросетевого регулятора на вход объекта поступает управляющий сигнал. Помимо управляющего воздействия, к объекту приложено возмущающее воздействие, которое изменяет состояние объекта.

На вход нейросетевого регулятора подается задающее воздействие, содержащее

информацию о

требуемом значении выходного сигнала.

Отметим, что

нейросетевой регулятор находится в

отрицательной обратной связи с объектом управления.

Целью данной

статьи является построение методики обучения нейронных сетей, построенной на основе комбинации классических градиентных методов и генетических алгоритмов. Эта методика будет применена для классификации каталитической стадии процесса Клауса.

Описание метода Клауса

Сера относится к основнвш продуктам химической промышленности. До середины 50-х годов XX в. основное ее количество добывалось как полезное ископаемое в виде самородной серы или из пирита, в виде серной кислоты. Во второй половине XX века произошло бурное развитие производства газовой серы из сероводорода, получаемого в виде попутного газа при обессеривании природного газа и нефтепродуктов (в установках очистки растворами этаноламинов). Полученная таким образом сера является очень чистой и пригодной для широкого использования, т.к. не уступает сере природного происхождения.

Процесс получения элементарной серы из сероводородсодержащих газов предложен лондонским химиком Карлом Фридрихом Клаусом в 1883 году и заключался в том, что сероводородсодержащий газ сжигали в реакторе в соответствии со стехиометрическим уравнением (1) в присутствии железорудного катализатора:

Н5 +1 о2 = H2O +1 Snl. (1)

2 п

В 1937 г. оригинальный процесс Клауса усовершенствован (рис. 2), что позволило увеличить объемы переработки сероводородных газов. С этого момента процесс проводили в две стадии. На первой стадии треть сероводорода сжигалась до сернистого ангидрида (термическая стадия процесса - высокотемпературное окисление). Затем оставшаяся часть сероводорода окислялась полученным сернистым ангидридом в присутствии железорудного катализатора до серы (каталитическая стадия процесса -низкотемпературное окисление).

Функционирование каталитической стадии процесса Клауса определяется следующими ввкоднвши координатами: 1) производительностью установки Q;

2) степенью конверсии сероводорода в серу УС; 3) суммой концентраций серосодержащих соединений, выбрасываемых в атмосферу; сроком службы катализатора Т.

Входными координатами этого технологического процесса являются: 1) температура То, давление Ро, расход Ео кислого газа; 2) температура ТА, давление РА, расход Ед атмосферного воздуха; 3) качество кислого газа GQ; 4) качество атмосферного воздуха AQ.

Рис. 1. Блок-схема системы автоматического управления

Температуры, давления и расходы технологических потоков могут быть измерены традиционными методами. Кислый газ является продуктом установки аминовой очистки, и в ряде случаев определение его состава невозможно, что затрудняет количественное определение его характеристик.

1

воздух

воздух

2

ТТ

пар с.д.

воздух

5

пар. с.д.

пар с.д.

3 п

1—1

5

Рис. 2. Упрощенная схема установки получения серы методом Клауса:

1 - сепаратор кислого газа; 2 и 3 - реакционные печи (реактор-генератор со встроенным

котлом-утилизатором); 4 - котел-утилизатор; 5 - подогреватель кислого газа; 6 и 8 -каталитические конвертеры; 7 и 9 - конденсаторы серы; 10 - серная яма суточного хранения

Выбор архитектуры

В [1] автором рассмотрен выбор оптимальной структуры нейронной сети. Полученные выводы будут использованы при построении нейросетевой архитектуры для рассматриваемого нейрорегулятора. В качестве базовой архитектуры используется трехслойный полносвязный персептрон. При этом количество нейронов на скрытом слое не должно превышать удвоенного количества входных сигналов.

Г ибридная методика обучения

Данная работа посвящена гибридной методике обучения нейронных сетей применительно к нейросетевым системам управления. Суть ее заключается в использовании классических градиентных методов с генетическим алгоритмом, позволяющим обеспечить более быструю сходимость классического метода.

Г радиентный метод

Наиболее известным и широко используемым методом обучения нейронных сетей является алгоритм обратного распространения ошибки с применением сигмоидальных нейронов. Этот метод является одним из градиентных методов обучения нейронных сетей. Тем не менее он обладает рядом недостатков, главным из которых является довольно большая длительность обучения. Методика, предложенная в этой статье, позволяет сократить ее с помощью применения генетических алгоритмов.

Введем следующие обозначения:

„( к)

(Х0к), х|к ),...х!к))

(к )>

у(к)(у0к), у1к),... ут)) а(к V 0к \ а(к \...4к >)

- входной вектор обучающей выборки номер к на п входов,

- соответствующий входному вектору выходной сигнал на т выходов,

- правильное значение выходного сигнала, ставящееся в соответствие

„(к)

входному сигналу х ™ = (^у ) - множество весов нейронной сети,

Мера ошибки нейронной сети, где р - общее количество примеров в обучающей выборке [3], может быть вычислена как

Е = 1/2 И=і(ук - йк )2

(2)

8

6

4

7

Так как обучающая выборка остается постоянной, можно рассматривать зависимость этой целевой функции от заданной архитектуры.

Пример целевой функции в проекции Н<1 \Л/у

2 -

* -

л А 1—

Л <3

с

н

I ? \

В

1 1 1 1 1 1 1 1

синоптический вес №.)

Рис. 3. Схематичное представление проекции целевой функции на один из элементов архитектуры нейронной сети - синоптический вес j

Задача обучения нейронной сети, таким образом, сводится к задаче минимизации функции ошибки, определенной в многомерном пространстве. При использовании классических градиентных методов гарантированно можно определить локальный минимум целевой функции, что не позволит оптимально обучить нейронную сеть.

Общую природу попадания в локальный минимум можно прояснить, используя проекцию целевой функции (рис. 3). Рассмотрим более подробно пошаговый алгоритм обучения градиентным методом [2] на основе представленной блок-схемы (рис. 4):

При выборе положения начальной точки в блоке

1 необходимо выбрать начальное значение аргумента (синоптического веса Ж1 j). Как правило, в качестве

начальной точки выбирается случайное значение в интервале [- 1, 1].

При выполнении блока 3 движение в многомерном пространстве происходит в направлении минимизации целевой функции задаваемой градиентом.

При стабилизации целевой функции постепенное уменьшение шага гарантирует, что алгоритм сойдется в одном из минимумов целевой функции. Такой подход не дает гарантии, что найденный минимум окажется глобальным.

Представленную проекцию функции можно условно разбить на 4 интервала, каждый из которых имеет локальный минимум: [А,С]; [С,Е]; [Б,0]; [вД]. На практике целевая функция может иметь гораздо больше подобных интервалов, но их количество конечно. Вне зависимости от выбора точки интервала на первом этапе, алгоритм сойдется в одном из окрестных заданному интервалу локальных минимумов.

Рис. 4. Блок-схема градиентного Г енетический алгоритм метода

Для решения поставленной задачи предлагается использовать специализированный генетический алгоритм, применяются 3 базовые операции: селекция, скрещивание и мутация. Множество м = (м у) можно рассматривать как хромосому, т.к. хромосома представляет собой

неразрывный массив независимых значений; при выборочном попарном скрещивании

различных хромосом можно применять классические механизмы скрещивания и мутации отдельных генов на случайные значения в заданном диапазоне.

Во время селекции происходит отсев хромосом, обладающих худшими значениями оценочной функции. В качестве оценочной функции будем использовать меру ошибки нейронной сети. Сходимость генетического алгоритма и градиентного метода позволяет утверждать, что и представленная методика также обладает свойством сходимости.

Результаты эксперимента

Предложенная методика применена в обучении модели нейрорегулятора для классификации каталитической стадии процесса Клауса. Эксперимент проводился на компьютере с характеристиками: Intel Core 2Duo proccesor T5500(1,66 GHz, 667 MHz FSB,

2 MB L2 cache), 1 GB DDR2. Результаты представлены на графике (рис. 5).

Т(сек)

Рис. 5. Скорость сходимости градиентного метода и предложенной методики

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Выводы

Представленная методика позволяет уменьшить время сходимости по отношению к градиентным методам. Благодаря эволюционизму генетического алгоритма будет осуществлен больший охват значений синоптических весов и их комбинаций. Однако он обладает недостатками: для его реализации нужны большие вычислительные мощности. Но при использовании многопоточности на многопроцессорных вычислительных машинах эта проблема не чувствуется так остро.

Предложенную методику планируется применить при разработке программы для ЭВМ Аёар1КЫС, позволяющей моделировать адаптивные нейрорегуляторы для задач автоматического управления.

ЛИТЕРАТУРА

1. Беляев И.О. Выбор характеристик скрытого слоя нейросетевой модели в задачах классификации / И.О. Беляев // Информационные технологии будущего и современного электронного обучения. Астрахань, 2009. С. 275.

2. Круглов В.В. Искусственные нейронные сети. Теория и практика / В.В. Круглов, В.В. Борисов. М.: Горячая линия-Телеком, 2002. 382 с.

3. Хайкин С. Нейронные сети. Полный курс / С. Хайкин. М.: Вильямс, 2006. 1104 с.

Проталинский Олег Мирославович -

доктор технических наук, профессор, проректор по информатизации Астраханского государственного технического университета

Щербатов Иван Анатольевич -

кандидат технических наук, доцент, заведующий кафедрой «Вычислительная техника и электроника» Астраханского государственного технического университета

Беляев Игорь Олегович -

аспирант кафедры «Прикладная информатика в экономике» Института информационных технологий и коммуникаций Астраханского государственного технического университета

Статья поступила в редакцию 08.10.10, принята к опубликованию 27.10.10

i Надоели баннеры? Вы всегда можете отключить рекламу.