УДК 543.087.9.004.042
Д.С. Зинин1, А.А. Пономарёв2, С.В. Земятова1
Российский химико-технологический университет имени Д.И. Менделеева, Москва, Россия
125047, Москва, Миусская пл., д. 9 2
Национальный исследовательский университет Московский энергетический институт, Москва, Россия 111250, Москва, Красноказарменная ул., д. 14
e-mail: [email protected]
АППРОКСИМАЦИЯ КРИВЫХ ТИТРОВАНИЯ С ПОМОЩЬЮ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ
Создан автоматизированный метод аппроксимации кривых титрования, основанный на построении нейросетевой модели. Разработано программное обеспечение для расчёта кривых титрования, которое успешно апробировано на различных титриметрических данных. Предложено использовать априорную информацию в ходе обучения нейронной сети и реализовывать полуавтоматический режим титрования, для повышения адекватности нейросетевой модели.
Ключевые слова: процесс титрования; аппроксимация кривых титрования; нейросетевая модель; использование априорной информации при обучении нейросети; анализ качества нейросетевой модели.
При планировании экспериментальных работ, в том числе титриметрических, исключительно большую роль играет правильная организация математической обработки результатов. Простейшая обработка экспериментальных данных титрования заключатся в построении графика зависимости аналитического сигнала от объема добавленного титранта. Полученная диаграмма обычно имеет характерную ступенчатую форму. Результатом титрования являются физико-химические свойства оттитрованного раствора и затраченный объем титранта в точках эквивалентности (перегиба кривой). Как правило, погрешность определения величины аналитического сигнала увеличивается, если энергия взаимодействия компонентов титранта и титруемого раствора недостаточно велика, в том числе при использовании сильно разбавленных растворов [1].
С увеличением систематической погрешности становится труднее установить расположение точек эквивалентности, а также адекватно описать процесс титрования математической моделью. Задача исследования - это разработка универсального метода для обработки различных типов кривых титрования с получением достоверных результатов. Основой метода стало интерполяционное моделирование, учитывающее априорную информацию о процессе.
Под априорной информацией подразумевается та информация об общих свойствах моделируемого процесса, которая имеется в наличии до начала процедуры вычисления параметров модели. В качестве априорной информации выделены следующие
характеристики истинной кривой титрования: гладкость, тип монотонности и число точек
перегиба [2]. Для получения достоверных оценок расположения точек эквивалентности необходимо не только достаточно точное воспроизведение моделью экспериментальных данных, но и отсутствие явления переобучения модели. Переобучение - это наличие свойств у модели, не характерных для моделируемого процесса. В нашем случае это появление дополнительных точек перегиба и нарушение условия монотонности. Для предотвращения переобучения модели необходимо учитывать априорную информацию.
Для моделирования процесса титрования использована искусственная нейронная сеть (ИНС). В качестве архитектуры ИНС выбран многослойный персептрон (МСП). ИНС с такой архитектурой состоит из множества входных узлов, которые образуют входной слой; одного или нескольких скрытых слоев и одного выходного слоя нейронов. Входной сигнал распространяется по сети в прямом направлении от слоя к слою. В модели использован МСП с одним скрытым слоем, одним входным и одним выходным нейроном. В качестве функции активации нейронов скрытого слоя выбран гиперболический тангенс, функция активации выходного нейрона линейная. Преобразование, которое осуществляет подобранная ИНС:
('> = а»+Ёа, + )]-'
^ ехр[2( + Ь )] +1
где п - число нейронов в скрытом слое; w * - вес /-го нейрона в скрытом слое; Ь - смещение /-го нейрона в скрытом слое; а* - /-й вес выходного нейрона; ао - смещение выходного нейрона.
Во многих случаях ИНС используют в качестве интерполяционной модели из-за её универсальности [3]. Однако применение ИНС для решения поставленной задачи обусловлено подобием процесса активации нейронов и появления скачков на кривой титрования, а также гладкостью кривой на выходе ИНС. Активация искусственного нейрона соответствует скачку, а последующая область насыщения - буферной зоне на кривой титрования. Если титруется сложная смесь, то на кривой титрования наблюдается суперпозиция скачков. В этом случае обнаружить скачок на кривой титрования в области незначительного изменения аналитического сигнала представляет сложность.
В программе организована процедура автоматического подсчета числа скачков. Вначале вычисляется последовательность конечных разностей первого порядка между соседними экспериментальными точками. Далее происходит подсчет количества пиков последовательности, превысившей заданный порог. Каждый пик последовательности соответствует скачку на кривой титрования, порог же вводится для исключения влияния шумовой составляющей исходных данных.
Полученное количество пиков
последовательности предлагается исследователю в качестве числа скачков на кривой титрования, он может принять его, а может выставить свое значение. Выбор порогового значения является нетривиальной задачей, так как
экспериментальных данных недостаточно для однозначного определения числа скачков на кривой титрования. Поэтому информация о реальном числе скачков носит априорный характер.
Число нейронов в скрытом слое вычисляется как число скачков плюс два. Добавленные нейроны используются для учета монотонности участков кривой в начальной и конечной стадии титрования. Таким образом, учитывается полученная априорная информация о процессе. Число настраиваемых параметров ИНС выбирается как минимально необходимое для соответствия априорной информации. Наличие переобучения у такой модели невозможно по определению.
Настройка параметров нейросетевой модели происходит в процессе обучения с учителем. В качестве учителя выступают экспериментально полученные данные. Обучение нейронной сети происходит с помощью алгоритма Бройдена-Флетчера-Гольдфарба-Шанно (БРОБ-алгоритм). В настоящее время он является самой популярной реализацией квазиньютоновского метода. БРОБ-алгоритм был выбран по причине распространенности его программных реализаций. В качестве критерия останова выступает уменьшение величины шага ниже 0,001. Подбор предельного значения шага обусловлен
стабилизацией целевой функции СКО при достижении данного значения шага. Под величиной шага понимается декартово расстояние между векторами параметров текущего и предыдущего шага.
Расчет точек перегиба смоделированной кривой происходит автоматически. Наличие точки перегиба соответствует изменению знака 2-й разностной производной. Уточнение положения точки перегиба происходит с помощью метода дихотомии. Вычислить точку перегиба смоделированной кривой можно с любой заданной точностью.
Нейронная сеть и её обучение программно реализованы с помощью кросс-платформенной библиотеки численного анализа ALGLIB Free Edition. Такой выбор сделан, потому что библиотека успела себя зарекомендовать с лучшей стороны, и разработчик дает полное согласие на её использование в академических целях. Приложение разработано в среде Microsoft .NET Framework 4.0. Оно обладает удобным графическим интерфейсом и предоставляет доступ к заявленным функциям.
Разработанное программное обеспечение было апробировано на более чем 60 кривых кислотно-основного титрования:
1. Титрование многоосновных кислот (H3PO4; H2C2O4; C3H4(OH)(COOH)3) раствором NaOH.
2. Титрование оснований (Et2NH; Ca(OH)2; KOH) раствором HCl, а также одноосновных кислот (Et-COOH; HCOOH; HF) раствором NaOH.
Среди исходных экспериментальных данных, обработка которых производилась, можно выделить две примерно равные группы: данные с постоянной и непостоянной частотой съема. Разделение обусловлено замедлением шага титрования вблизи скачка для части выборок. Полученные статистические результаты по СКО моделей представлены в табл. 1.
Таблица 1.
Статистические результаты процесса _нейросетевого моделирования
Среднеквадратичное отклонение (СКО)
Шаг титрования постоянный Шаг титрования непостоянный
Среднее значение 0,0791 0,1944
Максимальное значение 0,1912 0,4264
Статистические результаты получены по моделям с априорно заданным числом скачков, поэтому величина СКО увеличена из-за неучтенных колебаний аналитического сигнала и превосходит абсолютную погрешность измерений.
Увеличение априорного количества скачков при расчете модели приводит к значительному
уменьшению величины СКО. При этом на кривой титрования можно обнаружить все колебания аналитического сигнала. Дополнительные колебания обусловлены ошибкой измерительных приборов или наличием в титруемом веществе примесей, оказывающих влияние на форму кривой титрования. Выбор интересующих точек перегиба в данном случае остается за экспертом-аналитиком.
С помощью одного нейрона невозможно аппроксимировать достаточно резкий скачок данных, поэтому в тех экспериментах, где шаг титрования замедляли при приближении к скачку, точность смоделированной кривой резко снижена. Таким образом, разработанный метод позиционируется как метод аппроксимации кривых, полученных при полуавтоматическом
титровании. Вычисление точек перегиба происходит не только по точкам скачка на кривой титрования, но и по точкам медленного изменения аналитического сигнала, это и обеспечивает достоверность расчета точек перегиба смоделированной кривой.
Разработанный метод автоматизированного расчета имеет принципиальное значение для нахождения точек эквивалентности на кривых титрования. Автоматизированный расчет обеспечивает экспрессность обработки данных и прецизионность по сравнению с графическими методами, которые применялись ранее. Проведена серия экспериментов по аппроксимации кривых титрования с помощью ИНС, при этом явлений переобучения практически не наблюдалось.
Зинин Дмитрий Сергеевич, студент группы ЕН-51, РХТУ имени Д. И. Менделеева, Россия, Москва.
Пономарев Алексей Александрович, магистрант 1-го года обучения, группа А-1-09, Национальный исследовательский университет Московский энергетический институт, Россия, Москва
Земятова Светлана Владимировна* к.х.н., доцент кафедры аналитической химии РХТУ имени Д. И. Менделеева, Россия, Москва.
* e-mail: [email protected]
Литература
1. В.К. Чеботарев. Прогнозирование в титриметрических методах анализа с использованием реакций комплексообразования и осаждения. Изд-во Алт. ун-та, 1999. - 114 с.
2. В.И. Дворкин. Метрология и обеспечение качества количественного химического анализа. - М.: Химия, 2001. - 263 с.
3. Саймон Хайкин. Нейронные сети: полный курс, 2-е изд., испр. : Пер. с англ. - М. : OOO «И.Д. Вильямс», 2006. - 1104 с. : ил. - Парал. тит. англ.
Zinin Dmitry Sergeevich1, Ponomariov Alexey Alexandrovich2, lZemyatova Svetlana Vladimirovna
1D. Mendeleev University of Chemical Technology of Russia, Moscow, Russia. 1National Research University «Moscow Power Engineering Institute»*, Moscow, Russia.
APPROXIMATION OF TITRATION CURVES BY ARTIFICIAL NEURAL NETWORKS
Abstract
The automated method of the approximation of titration curves by the neural network model was created. The software for account titration curves, used successfully on various titration data, was developed. It was offered to use a priori information in a course of training the neural network and to realize a semi-automatic mode of titration, for increase of adequacy the neural network model.
Keywords: titration; approximation of titration curves; neural network model; using of a priori information in the neural network training; quality analysis of neural network model.