АБРУКОВ ВИКТОР СЕРГЕЕВИЧ - доктор физико-математических наук, профессор, заведующий кафедрой прикладной физики и нанотехнологий, Чувашский государственный университет, Россия, Чебоксары (abrukov@yandex.ru).
ABRUKOV VIKTOR SERGEEVICH - doctor of physics and mathematical sciences, professor, head of Applied Physics and Nanotechnology Chair, Chuvash State University, Russia, Cheboksary.
абРуков Сергей Викторович - аспирант кафедры прикладной физики и нанотехнологий, Чувашский государственный университет, Россия, Чебоксары (abrukovs@yandex.ru).
ABRUKOV SERgEy VICTOROVICH - post-graduate student of Applied Physics and Nanotechnology Chair, Chuvash State University, Russia, Cheboksary.
КАРЛОВИЧ ЕЛЕНА ВАЛЕРЬЕВНА - аспирант кафедры прикладной физики и нанотехнологий, Чувашский государственный университет, Россия, Чебоксары (lenka-buzuluk@yandex. ru).
KARLOVICH ELENA VALERIEVNA - post-graduate student of Applied Physics and Nanotechnology Chair, Chuvash State University, Russia, Cheboksary.
СЕМЕНОВ ЮРИЙ ВЛАДИМИРОВИЧ - магистрант кафедры прикладной физики и нанотехнологий, Чувашский государственный университет, Россия, Чебоксары (hromoj_88@mail.ru ).
SEMENOV YURIY VLADIMIROVICH - master student of Applied Physics and Nanotechnology Chair, Chuvash State University, Russia, Cheboksary.
УДК 621.3.049.77:004.9 ББК 22.36
С.В. АБРУКОВ, А.В. СМИРНОВ СОЗДАНИЕ БАЗЫ ЗНАНИЙ - НОВОЕ НАПРАВЛЕНИЕ ИССЛЕДОВАНИЙ НАНОМАТЕРИАЛОВ И НАНОТЕХНОЛОГИЙ*
Ключевые слова: наноматериалы, нанотехнологии, Data Mining, искусственные нейронные сети, многофакторные вычислительные модели, база знаний.
Цель работы - обратить внимание на необходимость и возможность обобщения экспериментальных данных накопленных в мире наноматериалов в виде базы знаний. База знаний будет представлять собой комплекс, состоящий из базы данных экспериментальных результатов, полученных в мире наноматериалов, и набора многофакторных вычислительных моделей, созданных с помощью средств Data Mining и искусственных нейронных сетей и включающих в себя зависимости между характеристиками наноматериалов и параметрами технологий их получения. В качестве примеров приведены базы данных и многофакторные модели характеристик наноплёнок линейноцепочечного углерода с внедрёнными в них атомами металлов и неметаллов.
S.V. ABRUKOV, A.V. SMIRNOV A CREATION OF KNOWLEDGE BASE IS A NEW RESEARCH DIRECTION OF NANOMATERIALS AND NANOTECHNOLOGIES
Key words: nanomaterials, nanotechnology, data mining, artificial neural networks, multifactor computational models, knowledge base.
The goals of the paper is to pay attention to the time has came to make a generalization from the experimental data accumulated in the world of nanomaterials in a knowledge base. The Knowledge Base will be a complex consisting of a data base of experimental results obtained in all of the nanomaterials world and the whole set of multifactor computational models that will be established on the basis of the data base and will include in itself all connections between the characteristics of nanomaterials and technology parameters of their production. As examples, the paper presents the database and multi-factor models of the characteristics of nanofilms of linear-chain carbon with embedded atoms of metals and non-metals.
В настоящее время в России и в мире накоплено чрезвычайно большое количество экспериментальных данных о свойствах и характеристиках разнообразных наноматериа-
* Исследование выполнено при финансовой поддержке РФФИ (проект № 13-02-97071).
лов, полученных с помощью различных технологий. И это количество растет с каждым днем. Вопрос заключается в следующем: можем ли мы обобщить их и представить в виде моделей, позволяющих описать все ранее исследованные наноматериалы?
Очевидно, что характеристики наноматериалов связаны с их структурой, составом, видом компонентов, формой, размером и технологией получения. Вопрос - можем ли мы аппроксимировать эти связи и представить их в виде моделей, которые позволят быстро определять характеристики ранее исследованных наноматериалов, а также прогнозировать характеристики новых, еще не исследованных наноматериалов без проведения экспериментов?
Ещё более важный вопрос заключается в следующем. Возможно ли, на основе этих моделей предсказать, каким должен быть наноматериал (структура, состав, компоненты, размеры), а также какие технологии нужно использовать для получения наноматериала с заранее заданными характеристиками?
В данной статье мы представляем результаты применения методов интеллектуального анализа данных - Data Mining (DM), в частности искусственных нейронных сетей (ИНС), для создания таких моделей (другие примеры применения ИНС в фундаментальных и прикладных исследованиях приведены в [1, 2, 11, 12, 13, 15]). Эти результаты основаны на экспериментах по исследованию характеристик наноплёнок линейно-цепочечного углерода (ЛЦУ) с внедрёнными в них атомами металлов и неметаллов (ЛЦУ АМН) [3, 4, 5, 8, 9, 14]. Впервые ЛЦУ АМН были получены в Чувашском государственном университете [6] с использованием запатентованной технологии [10] и различных ноу-хау. ЛЦУ АМН могут представлять большой интерес для активных и пассивных элементов твердотельной электроники [7], элементов солнечных батарей, сенсоров, медицинских приложений и т.д.
DM в широком понимании этого термина представляет собой комплекс современных средств обработки информации, ее анализа и моделирования и включает в себя различные инструменты предобработки данных (выявление аномальных данных, выявление дубликатов и противоречий, очистка данных); инструменты предварительного анализа данных (факторный и корреляционный анализ, спектральный анализ), инструменты моделирования (линейная и логическая регрессии, деревья решений, искусственные нейронные сети (ИНС), самоорганизующиеся карты - карты Кохонена). ИНС как инструмент аппроксимации экспериментальных функций нескольких переменных играет главную роль в создании моделей, позволяющих обобщать экспериментальные данные, прогнозировать свойства и характеристики новых наноматериалов.
Результаты исследования и их обсуждение. К настоящему времени получены две модели: 1. Вольт-амперная характеристика ЛЦУ АМН. 2. Спектральный коэффициент пропускания ЛЦУ АМН.
Модели позволяют на основе обобщения закономерностей в экспериментальных данных вычислять электрофизические и оптические характеристики ЛЦУ АМН в зависимости от количества видов атомов (один или два вида), внедрённых в ЛЦУ, вида атомов (номер и группа атомов в соответствии с периодической таблицей Менделеева) и толщины ЛЦУ АМН и прогнозировать вольт-амперную характеристику и спектр пропускания новых видов ЛЦУ АМН, а также решать обратную задачу: определять количество видов атомов, виды атомов и толщину ЛЦУ АМН, которые обеспечивают требуемое значение тока при заданном напряжении и требуемый коэффициент пропускания для заданной длины волны излучения.
Рассмотрим схему создания моделей на примере модели «Вольт-амперная характеристика ЛЦУ АМН».
Сначала экспериментальные данные по вольт-амперным характеристикам различных ЛЦУ АМН были представлены в виде базы данных. Пример представлен в таблице.
Затем была выбрана соответствующая собранной базе данных архитектура ИНС и проведено ее обучение.
Пример данных, использованных для создания модели «Вольт-амперная характеристика ЛЦУ АМН»
Номер элемента 1, внедренного в ЛЦУ АМН Г руппа элемента 1 Номер элемента 2, внедренного в ЛЦУ АМН Г руппа элемента 2 Толщина пленки, внедренного в ЛЦУ АМН, нм Напряжение, В Сила тока, мкА
14 4 48 2 1000 -3,0 -26
14 4 48 2 1000 -2,5 -24
14 4 48 2 1000 2,9 150
48 2 52 6 1000 -3,0 -8
48 2 52 6 1000 -2,9 -5
48 2 52 6 1000 -2,6 -3,5
48 2 52 6 1000 2,9 5,7
14 4 81 3 2000 -30 -50942
14 4 81 3 2000 -28,8 -36869
14 4 81 3 2000 -15,4 -3721
14 4 81 3 2000 -12,4 -2144
Обучение заключалось в том, что различные наборы значений первых шести столбцов таблицы подавались на входной слой ИНС, а соответствующие значения тока устанавливались в выходном слое ИНС и с помощью известного метода обучения ИНС - метода «обратного распространения ошибки» создавалась вычислительная ИНС-модель вольт-амперной характеристики.
Эта модель представляет собой модель типа «чёрного ящика». Полученный «чёрный ящик» может использоваться для определения (прогнозирования) вольт-амперной характеристики ЛЦУ для различных комбинаций, внедренных в ЛЦУ атомов без проведения экспериментов следующим образом. Номера и группы атомов (в соответствии с периодической таблицей элементов Менделеева), толщина пленки ЛЦУ и одно интересующее значение напряжения устанавливаются во входном слое ИНС. После этого «черный ящик» мгновенно вычисляет соответствующее этому набору данных значение тока, а также (!) непосредственно всю вольт-амперную характеристику. Пример представлен на рис. 1.
Проверка и оценка модели. Общепринятым методом проверки ИНС-моделей является перекрестная проверка с исключением.
Перекрестная проверка - метод формирования обучающего и тестового множеств для проверки модели. В его основе лежит разделение исходного множества данных на к примерно равных блоков, например к = 5. Затем на к-1, т.е. на 4 блоках, производится обучение модели, а 5-й блок используется для тестирования. Процедура повторяется к раз, при этом на каждом проходе для проверки выбирается новый блок, а обучение производится на оставшихся. После чего по методу «что - если» определяется выходная характеристика пятой выборки при фиксированных входных значениях. На рис. 2 приведены результаты перекрестной проверки созданной ИНС-модели.
Из рис. 2 видно, что моделируемые выходные значения («пров.») хорошо соответствуют реальным («реал.»), поэтому можно считать, что полученные ИНС-модели хорошо решают поставленную задачу.
Работу по моделированию электрофизических и оптических характеристик ЛЦУ при различных комбинациях атомов элементов периодической таблицы Менделеева, внедряемых в ЛЦУ, планируется продолжить. Цель ее - создание базы знаний характеристик пленок ЛЦУ, позволяющей определять перспективные с точки зрения твердотельной электроники, солнечной энергетики и различного типа сенсоров направления исследований.
Рис. 1. Аппроксимация вольт-амперной характеристики ЛЦУ АМН с внедренными атомами кремния и кадмия (толщина 200 нм)
п А В С D Е F G H 1
1 НОМЕР блока НОМЕР элемента 1 но мер группы 1 номер элемента 2 номер группы 2 лцу напряже ние реал. Сила тока пров. Сила тока
2 1 48 2 52 6 2000 -2j74E+00 -9.05E-02 -8.Э8Е-02
3 1 48 2 52 6 2000 -2j41E+00 -Gj07E-02 -Sjl0E-02
4 2 14 4 48 2 1000 1j24E+00 2j59E-05 2j63E-05
5 2 14 4 48 2 1000 1j85E+00 3j 47E-05 3j45E-05
6 3 52 6 14 4 2000 -7,07Е+00 -6j67E-04 -6j71E-04
7 3 52 6 14 4 2000 -3j84E+00 -8j74E-05 -8j65E-05
8 4 22 4 52 6 1000 -453E+01 -402E-05 -4Д2Е-05
9 4 22 4 52 6 1000 -433E+01 -3j73E-05 -3.81E-05
10 5 48 2 51 5 1000 1,51E-01 U9E-04 lj23E-04
11 5 48 2 51 5 1000 7,58E-01 8,3 5 E-04 8j30E-04
Рис. 2. Результаты перекрестной проверки ИНС-модели (два последних столбца)
Выводы. В целом анализ полученных результатов показывает следующее:
1. Полученные ИНС-модели «правильно» определяют вольт-амперную характеристику и спектральный коэффициент пропускания ЛЦУ АМН и являются хорошим инструментом аппроксимации многомерных экспериментальных функций и хорошим средством обобщения и прогнозирования связей между переменными.
2. Полученные ИНС-модели мгновенно вычисляют значения необходимых характеристик и представляют собой специализированный инженерный калькулятор характеристик ЛЦУ АМН, который является самым недорогим способом получения «новых» экспериментальных данных без непосредственного проведения эксперимента.
3. Совокупность полученных ИНС-моделей представляет собой базу знаний ЛЦУ АМН.
Литература
1. Абруков В.С., Абрукова Л.С., Троешестова Д.А., Петров А.А. Моделирование закономерностей вибрационного горения с помощью искусственных нейронных сетей // Вестник Чувашского университета. 2011. № 3. С. 178-184.
2. Абруков В.С., Карлович Е.В., Иванов А.Г. Моделирование горения конденсированных систем с помощью средств Data Mining // Вестник Чувашского университета. 2011. № 3. С. 184-189.
3. Белова А.Г., Краснова А.Г., Кокшина А.В., Кочаков В.Д. Особенности взаимодействия углерода в состоянии Sp1 с некарбидообразующими металлами // Вестник Чувашского университета. 2012. № 3. С. 41-43.
4. Васильев А.И., Кочаков В.Д. Влияние отжига на физические свойства металлоуглеродных пленок // Вестник Чувашского университета. 2011. № 3. С. 189-192.
5. Кокшина А.В., Белова А.В., Краснова А.Г., Кочаков В.Д. Особенности взаимодействия пленок селена с углеродом в состоянии sp1 // Вестник Чувашского университета. 2012. № 3. С. 44-46.
6. Кочаков В.Д., Новиков Н.Д. Интеркалирование серебра в пленку линейно-цепочечного углерода // Вестник Чувашского университета. 2007. № 2. С. 20-25.
7. Кочаков В.Д., Новиков Н.Д. Углеродная электроника // Вестник Чувашского университета. 2007. № 2. С. 25-28.
8. Кочаков В.Д., Новиков Н.Д., Васильев А.И., Смирнов А.В. Элементы электроники на основе пленок линейно-цепочечного углерода // Вестник Чувашского университета. 2011. № 3. С. 194-197.
9. Краснова А.Г., Кокшина А.В., Белова А.В., Кочаков В.Д. Исследование взаимодействия PbSe с углеродом в состоянии sp1 // Вестник Чувашского университета. 2012. № 3. С. 46-47.
10. Пат. 2360036 РФ, МПК С23С 26/00, С23С 14/06, С23С 14/32, В82В 3/00. Способ получения углеродного наноматериала, содержащего металл / Кочаков В.Д., Новиков Н.Д.; заявитель и патентообладатель. Чуваш. гос. ун-т. № 2007139182/02; заявл. 22.10.2007; опубл. 27.06.2009, Бюл. № 18. 11 с.
11. Применение средств интеллектуального анализа данных (Data Mining) для исследования неполно определенных систем / В.С. Абруков, Я.Г. Николаева, Д.Н. Макаров и др. // Вестник Чувашского университета. № 2. 2008. С. 233-241.
12. Разработка моделей неполно определенных систем с помощью самоорганизующихся карт Кохонена / В.С. Абруков, Я.Г. Николаева, Л.С. Абрукова и др. // Вестник Чувашского университета. 2008. № 2. С. 241-246.
13. Славутская Е.В., Абруков В.С., Славутский Л.А. Интеллектуальный анализ данных психодиагностики школьников предподросткового возраста // Вестник Чувашского университета. 2012. № 3. С. 226-231.
14. Смирнов А.В., Иванов А.Л., Кочаков В.Д., Васильев А.И. Плазмонный резонанс в наноструктурах серебро-никель // Вестник Чувашского университета. 2010. № 3. С. 15-18.
15. Чернов А.С., Троешестова Д.А., Абруков В.С. Разработка модели адаптивного управления пароперегревателем котлоагрегата с помощью искусственных нейронных сетей // Вестник Чувашского университета. 2010. № 3. C. 317-322.
АБРУКОВ СЕРГЕЙ ВИКТОРОВИЧ. См. с. 52.
СМИРНОВ АЛКСАНДР ВЯЧЕСЛАВОВИЧ - аспирант кафедры прикладной физики и нанотехнологий, Чувашский государственный университет, Россия, Чебоксары (fizteh21@yandex. ru).
SMIRNOV ALEXANDER VYACHESLAVOVICH - post-graduate student of Applied Physics and Nanotechnology Chair, Chuvash State University, Russia, Cheboksary.