УДК 541.69: 547.7
В. М. Гиниятуллин (к.т.н., доц., преп.)1, Р. М. Ахметшин (студ.) 1, Е. И. Мельницкая (к.х.н., инж.) 1, С. А. Кирлан (д.х.н., зав. лаб.)2
Оценка селективных свойств органических растворителей с применением системы SARD-21 и нейронных сетей
1 Уфимский государственный нефтяной технический университет, кафедра физики 450062, г. Уфа, ул. Космонавтов; 1, тел. (347) 2431737, e-mail: [email protected] 2Научно-исследовательский технологический институт гербицидов и регуляторов роста растений с c опытно-экспериментальным производством АН РБ 450029, г. Уфа, ул. Ульяновых, 65; тел. (347) 2433614, e-mail: [email protected]
V. M. Giniyatullin1, R. M. Akhmetshin1, E. I. Mel'nitskaya 1, S. A. Kirlan 2
Evaluation of the selective properties of organic solvents using a system of «SARD-21» and the complex neural networks
1 UfaState Petroleum Technological University 1, Kosmonavtov Str, 450062 Ufa, Russia; ph. (347) 2431878, e-mail: [email protected] 2TResearch Technological Institute of Herbicides and Plant Growth Regulators Bashkortostan Republic Academy of Sciences 65, Ulyanovyih Str., 450029, Ufa, Russia; ph. (347) 2433614, e-mail: [email protected]
Исследована возможность теоретической оценки селективных свойств органических растворителей на основе совместного применения компьютерной системы БЛКО-21 и комплекснозначного персептрона. Предложен подход кластеризации и прогнозирования селективных свойств на основе комплекснозначных нейронных сетей. Результаты исследований показали преимущество комплексного применения двух методов для определения оптимальных направлений поиска новых эффективных растворителей.
The possibility of a theoretical estimate of the selective properties of organic solvents on the basis of joint use of the computer system SARD-21 and a complex-perceptron is investigated. The clustering and forecasting approach based on the selective properties of complex neural networks have been proposed. The results showed the advantage of complex application of two methods to determine the optimal directions of search for new effective solvents.
Key words: activity; chemical compound; information content; neural networks; pattern recognition theory; selectivity; solvents.
Ключевые слова: активность; информативность; нейронные сети; растворители; селективность; теория распознавания образов; химическое соединение.
Теоретические исследования в области до-экспериментальной оценки полезных свойств химических соединений и моделирования их структур активно развиваются в последнее время 1. Для нефтехимии и нефтепереработки большое значение имеют экстракционные процессы очистки углеводородного сырья селективными растворителями 2. Является актуальным проведение исследований на основе закономерности связи «структура—свойство» для теоретической оценки, моделирования и синтеза селективных растворителей для более тонкой очистки продуктов нефтепереработки. Це-
Дата поступления 10.10.13
лью данного исследования является разработка подхода к доэкспериментальной оценке и моделированию селективных свойств органических растворителей на основе системы БЛКВ-21 и комплекснозначных персептронов. Предложен метод объединения в одну сеть комплекснозначных и многомерных веществен-нозначных нейронов для достоверного распознавания структур селективных растворителей. Сформирован алгоритм распознавания структур селективных растворителей на основе нейронной сети, демонстрирующий результаты, сопоставимые с результатами, полученными в рамках системы БЛКВ-21 3'4.
Материалы и методы исследования
При проведении исследования использовались теоретические методы структурного анализа и проектирования информационных систем, методы математического моделирования, принципы объектно-ориентированного программирования 5'6. Сформированная нейронная сеть обучалась на выборке из 209 химических структур (табл. 1), относящихся к различным классам органических соединений циклического и ациклического строения и имеющих данные по селективности (Б) при определенной температуре 2. Селективность растворителей оценивалась величиной отношения предельных коэффициентов активности разделяемых ими углеводородов системы «гексан— бензол» 2'4. К активным (группа А-91 структура) отнесены растворители, которые обладали более высокой селективностью (Б>10), к неактивным (группа В—118 структур) — с меньшей селективностью (Б<10).
Результаты и их обсуждение
При дезагрегировании структур обучающей выборки получено 89 монад (отдельные атомы, функциональные химические группы, циклические фрагменты), которые составили длину входного вектора. Нейронная сеть (пер-септрон) состоит из комплекснозначных нейронов и имеет определенную структуру и алгоритм обучения 5. Ранее на ее основе было исследовано 8 обучающих выборок, в ходе чего возникла проблема их неполного распознавания и появились определенные исключения 6. Поскольку каждый входной вектор является вершиной п-мерного гиперкуба, где п — число монад обучающей выборки, то любую вершину можно отсечь одной гиперплоскостью. Значения коэффициентов весов нейрона, характеризующего эту гиперплоскость, можно получить с помощью классического дельта-правила 7. Формализуя для каждого исключения отдельный нейрон, можно создать нейронную сеть,
ЯГ
.X
1
Л
X
/
У
2
Я1-3
3
X 4
Я
X У 5
Х=0, N.
Р1=СН20Н,
-С(О)СНз
х=о,
У=^ С Р-!= N02, CH20(CH2)2CN Р2=СНз
Р-!=Р, NH2, СНЭР2, CH20(CH2)2CN R2=N02, ^Р2, NH2
Rз=S02CFз
Х=^ S, 0 У= S, 0 R1=N0, (CH2)2CN CH20(CH2)2CN, (=0), ^0)^ C(0)CHз, -C(0)C2H5 R2=(=0), Rз4=CHз
Х=0, N, C У=N, S, C
г=0
R1=N02, CN, CH2CN, CHз, -H (CH2)2CN, -C(0)C2H5, (=0), ^(0)^, -C(0)H R2=(=0), -0-CHз, -К C(0)CHз, -0(CH2)2CN
Таблица 1
Циклические соединения, включенные в обучающий массив
Рис.1. Структура дополненной нейронной сети
Таблица 2
Экзаменационные структуры
№ Название Набор монад (коды по словарю) Структурная формула
1 1,3-диметил-2-имидазолидинон 1 3 14 25 218 ГЛ си/ Y СНз O
2 3-ацетилтиазолидин 1 3 14 25 29 373 CU N СНз
3 1-метилпирролидон 1 2 3 14 25 135 СНз
достоверно опознающую обучающую выборку. На рис. 1 представлена структура нейронной сети, дополненной многомерными нейронами. Здесь «A.cmplx» и «B.cmplx» — комплексно-значные нейроны подсетей А и В; «A.dlt» и «B.dlt» — многомерные вещественнозначные нейроны подсетей А и В, обучаемые дельта-правилом; «AND» — AND-подобные многомерные функции бинарной логики; «XOR» — XOR-подобная функция. Модифицированный таким образом персептрон полностью решает проблему недостоверного распознавания обучающих выборок.
С применением теории распознавания образов (система SARD-21) и разработанной нейронной сети исследованы 209 соединений обучающей выборки и 17 экзаменационных структур растворителей с селективностью от 10 до 17 при температуре 25 оС 2. В рамках системы SARD-21 получены 6 моделей, которые показали достоверность распознавания структур обучения на уровне 71—97 % и хороший результат при оценке селективности экзаменационных соединений — 71%. При использовании нейронной сети получено правильное распознавание всех структур обучающей выборки 8. При исследовании 17 экзаменационных структур наблюдалось несколько вариантов распознавания. Например, структура 3 (табл. 2) распознана как принадлежащая к классу А (требуемое свойство имеется), структура 2 одновременно относится и к классу А, и к классу В (отсутствие свойства), структура 1 распознана как не принадлежащая ни к одному из классов.
Неопределенность в распознавании структур 1 и 2 связана с наличием в них монад, отсутствовавших в обучающей выборке. При добавлении отсутствовавших монад в обучающую выборку, экзаменационные структуры распознаются как активные.
В результате исследования разработан подход к оценке селективных свойств органических растворителей на основе системы БЛКВ-21 и комплекснозначного персептрона. Предложен метод и алгоритм объединения в одну сеть комплекснозначных и многомерных вещественнозначных нейронов для достоверного распознавания структур. Полученные результаты применены для формирования базы знаний для оценки и целенаправленного моделирования селективных свойств органических растворителей, которая содержит: комплекс математических моделей прогноза уровня селективности органических растворителей; количественные значения вкладов фрагментов каждой из исследованных молекул растворителей в селективные свойства; расчетные ранги соединений относительно эталонных структур в рамках селективных свойств; молекулярные фрагменты для оптимального моделирования в системе «фунгицидная активность- токсичность». Результаты исследований могут применяться для доэкспериментальной оценки свойств органических растворителей, оптимизации поиска и целенаправленного синтеза новых селективных растворителей.
2.
3.
Литература
1. Филимонов Д. А., Поройков В. В. // Рос. хим. 1. ж.- 2006.- №2.- С.66.
2. Гайле А. А., Сомов В. Е. Экстракционная де-ароматизация нефтяных фракций.- Санкт-Петербург, 2002.- 324 с.
3. Кирлан В. В., Кирлан С. А., Кирлан А. В. Комплекс программ для прогноза биологических свойств химических соединений / Свидетельство об офиц. регистрации базы данных №2007614234. // Зарегистрировано в Реестре баз данных 04.10.2007 (RU).
4. Мельницкая Е. И., Кирлан С. А., Сементеева Л. Ш., Димогло А. С., Кантор Е. А. // Баш. хим. ж.- 2010.- Т.17, №2.- С.96.
5. Гиниятуллин В. М. //Нефтегазовое дело.-2008.- Т.6, №1.- С.35.
6. Akhmetsin R. M., Giniyatullin V. M., Kirlan S. A. // Optical Memory and Neural Networks (Information Optics).- 2012.- V.21, №1.- P. 11.
7. Уоссермен Ф. Нейрокомпьютерная техника.-М.: Мир, 1992.- 240 с.
8. Ахметшин Р. М., Гиниятуллин В. М., Кир-лан С. А. Прогнозирование свойств химических веществ на основе комплекснозначных нейронных сетей / Свидетельство о государственной регистрации программы для ЭВМ №2012616129.
5.
7.
References
Filimonov D. A., Poroikov V. V. Ros. khim. zh. [Russian Chemical Journal]. 2006. No. 2. P.66.
Gaile A. A., Somov V. E. Ekstraktsionnaia de-aromatizatsiia neftianykh fraktsii [Extraction of petroleum fractions dearomatization]. Sankt-Peterburg, 2002. 324 p.
Kirlan V. V., Kirlan S. A., Kirlan A. V. Kompleks programm dlia prognoza biologicheskikh svoistv khimicheskikh soedinenii [Software for prediction of biological properties of chemical compounds]. Svidetel'stvo ob ofits. registratsii bazy dannykh no.2007614234. Zaregistrirovano v Reestre baz dannykh 04.10.2007 (RU).
Mel'nitskaia E. I., Kirlan S. A., Sementeeva L. Sh., Dimoglo A. S., Kantor E. A. Bash. khim. zh. 2010. V.17, no. 2. P.96.
Giniiatullin V. M. Neftegazovoe delo [Oil and Gas Business]. 2008. V.6, no.1.- P.35. Akhmetsin R. M., Giniyatullin V. M., Kirlan S. A. Optical Memory and Neural Networks (Information Optics). 2012. V.21, no.1. P. 11. Uossermen F. Neirokomp'iuternaia tekhnika [Neurocomputing]. Moscow: Mir Publ., 1992. 240 p.
Akhmetshin R. M., Giniiatullin V. M., Kir-lan S. A. Prognozirovanie svoistv khimicheskikh veshchestv na osnove kompleksnoznachnykh neironnykh setei [Predicting the properties of chemical substances on the basis of complex neural networks]. Svidetel'stvo o gosudarstvennoi registratsii programmy dlia EVM №2012616129.