Локализация и идентификация СТМ-изображений ультрадисперсных частиц с применением аппарата нейронных сетей

Тюриков Александр Валерьевич; Суворов Александр Сергеевич; Шелковников Евгений Юрьевич; Гуляев Павел Валентинович; Гафаров Марат Ренатович

ЛОКАЛИЗАЦИЯ И ИДЕНТИФИКАЦИЯ СТМ-ИЗОБРАЖЕНИЙ УЛЬТРАДИСПЕРСНЫХ ЧАСТИЦ _С ПРИМЕНЕНИЕМ АППАРАТА НЕЙРОННЫХ СЕТЕЙ_

УДК 621.385.833

ЛОКАЛИЗАЦИЯ И ИДЕНТИФИКАЦИЯ СТМ-ИЗОБРАЖЕНИЙ УЛЬТРАДИСПЕРСНЫХ ЧАСТИЦ С ПРИМЕНЕНИЕМ АППАРАТА НЕЙРОННЫХ СЕТЕЙ

ТЮРИКОВ А.В., СУВОРОВ А.С., ШЕЛКОВНИКОВ Е Ю., ГУЛЯЕВ П.В., ГАФАРОВ М.Р.

Институт прикладной механики УрО РАН, 426067, г.Ижевск, ул.Т.Барамзиной, 34

АННОТАЦИЯ. В работе рассмотрены вопросы локализации СТМ-изображений ультрадисперсных частиц кластерных материалов на поверхности подложки, разработана методика их распознавания по профилограммам изображения с использованием математического аппарата нейронных сетей, что позволяет существенно повысить достоверность и степень автоматизации идентификации СТМ-изображений ультрадисперсных частиц.

КЛЮЧЕВЫЕ СЛОВА: сканирующий туннельный микроскоп, локализация ультрадисперсных частиц, идентификация, нейронная сеть.

ВВЕДЕНИЕ

Исследования ультрадисперсных частиц (УДЧ) кластерных материалов с применением сканирующего туннельного микроскопа (СТМ) являются важным этапом при создании новых перспективных материалов на их основе. Поскольку СТМ позволяет получать топографические изображения поверхности постоянного туннельного тока (величина которого в каждой точке над поверхностью определяется суперпозицией определенных электронных состояний, а, следовательно, и квантово-электронным строением исследуемой УДЧ и подложки), то идентификация подобных СТМ-изображений достаточно затруднена и требует привлечения достоверных изображений, построенных теоретическим путем. Использование в области сканирующей туннельной микроскопии теории нейронных сетей [1,2] в сочетании с методиками моделирования теоретических СТМ-изображений актуально и целесообразно, в частности, для локализации и идентификации СТМ-изображений УДЧ.

Изображения, получаемые с помощью СТМ, обладают свойственными аналоговым сигналам недостатками: отсутствием строго-ограниченной шкалы координат, произвольным углом отображения частиц и присутствием шумов и искажающих факторов. Для исключения их влияния использованы следующие меры, которые можно представить в виде алгоритма:

- выделение участка изображения с объемной частицей на подложке графита;

- нахождение характерных для частицы профилограмм;

- нормирование профилограмм в заданном диапазоне.

ЛОКАЛИЗАЦИЯ ЧАСТИЦЫ НА СТМ-ИЗОБРАЖЕНИИ

Для обнаружения частицы на изображении используются аппарат нейронных сетей с применением методики обучения адаптивного усиления (AdaBoost) и примитивы (Haar-like features) для описания объекта.

Процедура распознавания объекта классифицирует частицу как объект на изображении, основываясь на значениях примитивов (рис.1). Анализ изображения с помощью примитивов (а не анализ точек непосредственно) позволяет существенно сократить вычислительные затраты и количество наборов изображений, используемых для обучения.

Значением каждого примитива является разница суммы значений высот точек в белой и черной областях:

V = Е w1 (x y) -Z ь1 (x У (1)

I . / I I ■ - ■

л г :- -: -III I =

"ittKHHAVfr

-frijiiix;

iAi!»

II I I

II II II

^-¡-■¡-¿-¡¡-ййн

tHh

Л X ffl s

= Iй.

Рис. 1. Примитивы для классификации графических объектов

При размере изображения 24х24 полный набор классификатора состоит из более, чем 180 тыс. примитивов. Для снижения временных затрат на вычисления значений каждого примитива из набора используется метод интегрирования изображения - для каждой его точки производится суммирование значений высот точек в области, лежащей слева и сверху данной точки:

ii(x, y) = £ i(x', y'), (2)

x '< x, y '< y

где ii( x, y) - интегрированное изображение; i( x, y) - оригинальное изображение. С помощью последующих вычислений изображение интегрируется за одну итерацию:

s( x, y) = s( x, y -1) + i( x, y);

ii( x, y) = ii( x -1, y) + s( x, y). (3)

Таким образом, подсчет значения каждого примитива сводится к вычислению разницы между значениями высот правой - нижней и левой - верхней точек белой и черной областей, соответственно (рис. 2):

12 = B + A;

13 = A + C;

14 = A + B + C + D;

(4)

Ь = и + *1 - (*2 + *зХ

где А - сумма высот точек слева - сверху от точки 1; В - сумма высот точек слева - сверху от точки 2; С - сумма высот точек слева - сверху от точки 3; Б - сумма высот точек слева -

сверху от точки 4.

А В 1 7

С D 3 4

Рис. 2. Интегрирование изображений для распознавания суммированием значений высот точек

ЛОКАЛИЗАЦИЯ И ИДЕНТИФИКАЦИЯ СТМ-ИЗОБРАЖЕНИЙ УЛЬТРАДИСПЕРСНЫХ ЧАСТИЦ _С ПРИМЕНЕНИЕМ АППАРАТА НЕЙРОННЫХ СЕТЕЙ_

Однако даже при использовании интегрированного изображения применение каждого примитива из большого набора требует значительных вычислительных затрат. Снизить их позволяет использование алгоритма AdaBoost.

AdaBoost (сокр. Adaptive Boosting) является адаптивным алгоритмом машинного обучения - каждый последующий классификатор строится по объектам, неверно классифицированным предыдущими классификаторами [3-6]. AdaBoost чувствителен к шуму в данных и к импульсным помехам. Однако он менее подвержен переобучению, чем многие другие алгоритмы обучения. Применяется для обнаружения слабых аномалий на фоне сильных помех в данных, не связанных с изображениями и имеющих другую физическую природу.

AdaBoost вызывает классификатор в цикле t = 1,..., T. После каждого вызова обновляется распределение весов Dt, которые отвечают важности для классификации каждого из объектов обучающего множества. На каждой итерации веса неверно классифицированного объекта возрастают (или аналогично, вес каждого корректно классифицированного объекта уменьшается); таким образом, новый классификатор фокусируется на этих объектах [4]. Алгоритм является эффективным и быстрым для задач распознавания образов, так как из множества простых классификаторов, не требующих больших вычислительных затрат, в процессе обучения составляется комбинация, с достаточной степенью точности определяющая наличие и положение объекта на изображении.

Для обучения классификаторов используются два набора изображений: положительные (изображения объекта) и отрицательные (фон) (рис. 3).

Рис. 3. Положительные изображения с УДЧ (а - меди; б - цинка; в - никеля) и отрицательные (г, д) изображения с фоном, применяемые для обучения нейронной сети с помощью алгоритма AdaBoost и Haar примитивов

Алгоритм AdaBoost для обучения нейронной сети с помощью классификаторов изображен на рис. 4. В каждую итерацию последовательно выбирается один примитив из ~180000 примитивов. Обученная таким образом нейронная сеть принимает форму каскада (рис. 5): если первый слой классифицирует изображение как положительное, сеть начинает обрабатывать второй слой; в случае, если изображение классифицировано как отрицательное, сеть прекращает работу. Каждый последующий слой обладает большей степенью точности обнаружения объекта, но требует значительных вычислительных затрат. При этом существенно снижается время обработки изображения

[4].

Рис. 4. Алгоритм AdaBoost для обучения нейронной сети с помощью классификаторов

Рис. 5. Обработка изображения каскадом

ИДЕНТИФИКАЦИЯ СТМ-ИЗОБРАЖЕНИИ УЛЬТРАДИСПЕРСНЫХ ЧАСТИЦ С ПРИМЕНЕНИЕМ АППАРАТА НЕЙРОННЫХ СЕТЕЙ

а) б)

Рис. 6. УДЧ меди (а) и никеля (б), локализованные в результате применения алгоритма AdaBoost и Нааг-примитивов

Использование каскада помогает на ранних этапах выделить изображения, содержащие объект, или прекратить обработку при его отсутствии.

Для найденных УДЧ (выделенных квадратом на рис.6) проводится ряд соответствующих профилограмм. На этих профилограммах определяется участок, соответствующий частице, и производится нормирование по длине и ширине в диапазоне 0^1.

Таким образом, в ходе обработки трехмерного изображения рядом общих и узкоспециализированных алгоритмов, формируется набор нормализованных профилей, пригодных для автоматического распознавания с помощью аппарата нейронных сетей.

Обработка изображения первым слоем, состоящим из классификатора с двумя примитивами, требует 60 операций микропроцессора; в то время как однослойная нейронная сеть производит обработку изображения в 20 раз медленнее. Это позволяет говорить об оптимальном использовании алгоритма обучения AdaBoost и Нааг-примитивов в задачах распознавания объекта на изображениях.

ИДЕНТИФИКАЦИЯ ТИПА ЧАСТИЦЫ ПО ХАРАКТЕРНЫМ ПРОФИЛОГРАММАМ

Следующим шагом в распознавании УДЧ является обучение нейронной сети с произвольным числом скрытых слоев, сохранение параметров нейронной сети и создание методики распознавания СТМ-изображений.

Среди различных структур нейронных сетей (НС) одной из наиболее известных является многослойная структура, в которой каждый нейрон произвольного слоя связан со всеми выходами (аксонами) нейронов предыдущего слоя или, в случае первого слоя, со всеми входами НС.

На рис. 7, а 1 п-мерный вектор-столбец X = (х1

г )Т обозначает входящий

сигнал, подлежащий распознаванию; к-му слою нейронов (обозначенному на рис. 7, а

(к)

прямоугольниками) соответствует матрица Ж(к) весовых коэффициентов

определяющая состояние 5(к) у-го нейрона слоя к (которое есть взвешенная сумма его входов,

(к-1)

являющихся одновременно выходами предыдущего слоя нейронов уу ', при этом для

(0)

первого слоя уу; = ху:

У )=Е ) у

г=1

Мк

(к) у(к-1)

(5)

где Мк - число нейронов слоя к). Выход каждого нейрона определяется активационной функцией его состояния / (5). Активационная функция (рис. 7, б) представляет собой сигмовидную кривую, обычно определяемую соотношением:

/ (5) =

1 + е-

(6)

1

з42)

б)

а - структура узлов; б - активационная функция Рис. 7. Двухслойная нейронная сеть

Процедура обучения нейронной сети состоит в следующем. На вход подается эталонный сигнал (обрабатываемый НС), а выходной сигнал (результат распознавания) сравнивается с заранее известным ответом (выходным вектором эталона) при помощи целевой функции, построенной методом наименьших квадратов [3]:

1 > (уГ -^У, (7)

]Р ^ '

где у^ - реальное выходное состояние нейронау-го выходного слоя N - нейронной сети при

подаче на ее входы р-го эталонного образа; ёур - идеальное (желаемое) выходное состояние этого нейрона. В случае, если ошибка (вычисляемая согласно [3]) превышает заданную величину, происходит корректировка весовых коэффициентов НС, протекающая в обратном порядке (от последнего слоя к первому):

Е (и=21 (,) - а]р )2,

$N) = (у(N) - 4) •

* (^).

N

У =

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(п+1) г,,("+1)

# ( *И ).

(И) ,,(«-1)

'У '' ~ У У

(8)

где п- коэффициент скорости обучения, 0<п<1; Аи( - поправка, вносимая в синаптические весовые коэффициенты и - го слоя. После корректировки весов НС

и

.(И)(0 = -1) + (¿) (9)

(где ¿-шаг обучения) процедура обучения повторяется до достижения нужной точности распознавания. Алгоритм процедуры обучения НС представлен на рис. 8.

Предложенная методика обучения НС для распознавания профилей заключается в следующем.

1. Сформировать входной вектор X = (х1, х2..., хп )Т НС, компонентами которого являются дискретные значения функции Р (и) : х^ = Р (щ ), описывающей предварительно нормированный профиль (рис. 9).

2. Обучить НС согласно алгоритма (рис. 8).

3. Произвести обучение НС для распознавания всех возможных образцов.

к

ЛОКАЛИЗАЦИЯ И ИДЕНТИФИКАЦИЯ СТМ-ИЗОБРАЖЕНИЙ УЛЬТРАДИСПЕРСНЫХ ЧАСТИЦ С ПРИМЕНЕНИЕМ АППАРАТА НЕЙРОННЫХ СЕТЕЙ

Рис. 8. Алгоритм обучения нейронной сети распознаванию профилограммы

Р(п)

1-

Р(п,)- 1 1 \ 1 1 1 1 1 1

п,= 0 п2 Пз •• 1 1 1 . П, ... Щ= 1

Рис. 9. Формирование входного вектора нейронной сети с помощью дискретных отсчетов

Так как аппарат нейронной сети обладает достаточной масштабируемостью, каждой из 256 точек нормированной профилограммы (рис. 10) соответствует вход сети, которая может содержать произвольное число скрытых слоев и узлов в каждом слое.

а) б) в)

а - цинка; б - никеля; в - меди

Рис. 10. Применяемые для обучения нейронной сети нормализованные профилограммы

УДЧ

Количество выходов принимается с учетом количества различных эталонных образцов для обучения и распознавания таким образом, что O = Trunc(log2N), где N -количество образцов (рис. 11).

Результаты показали, что система нейронной сети, состоящая из 256 входов, внутреннего слоя из 32 узлов и 2-4 выходов, обладает необходимой скоростью обучения и обработки данных при достаточной точности распознавания.

При этом для каждого образца сохраняется своя система весов, перестроенная в процессе обучения. При распознавании к каждому образцу применяется поочередно система весов, при наилучшем совпадении кода образец признается соответствующим классу эталона.

а) б)

а - медь; б - цинк

Рис. 11. Ввод данных в нейронную сеть при обучении распознаванию профилограмм УДЧ

РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ

Обученной нейронной сети на вход подаются 256 значений координат по оси Y образцов, система с определенной вероятностью определяет, какому закодированному эталону соответствует образец.

На рис. 10 изображены применяемые для обучения нормализованные профилограммы УДЧ и соответствующие выходные векторы (табл. 1), сопоставляемые на выходах нейронной сети.

Таблица 1

Эталонные выходные векторы, используемые при обучении

Цинк Никель Медь

0,0000 0,0000 1,0000 0,0000 1,0000 0,0000 1,0000 0,0000 0,0000

После того, как нейронная сеть обучена, она используется для распознавания нормализованных профилограмм УДЧ (рис. 12).

а) б) в)

а - цинка; б - никеля; в - меди

Рис. 12. Распознаваемые нейронной сетью нормализованные профилограммы УДЧ

ЛОКАЛИЗАЦИЯ И ИДЕНТИФИКАЦИЯ СТМ-ИЗОБРАЖЕНИЙ УЛЬТРАДИСПЕРСНЫХ ЧАСТИЦ _С ПРИМЕНЕНИЕМ АППАРАТА НЕЙРОННЫХ СЕТЕЙ_

В процессе распознавания для каждой профилограммы последовательно применяется нейронная сеть с системами весов, полученных в результате обучения. Профилограмма считается классифицированной при максимальном совпадении выходных векторов (строки в табл. 2) с сопоставленными при обучении.

Таблица 2

Выходные векторы, классифицирующие профилограммы

Цинк Никель Медь

0,00134 0,00227 0,89238 0,00921 0,81948 0,01042 0,79409 0,00513 0,00452

Использование двух методов - обучения и применения аппарата нейронных сетей, позволило решить задачи обнаружения частицы на изображении и распознавания ее вида. Два данных метода - AdaBoost и многослойная структура - используются специализированно для решения свойственных им задач, что повышает как производительность, так и качество получаемых результатов. Применение автоматического распознавания и в первом, и во втором случаях позволяет на имеющихся зашумленных данных обнаруживать и классифицировать объекты СТМ-изображений.

СПИСОК ЛИТЕРАТУРЫ

1. Круглов В.В., Дли М.И., Голубов Р.Ю. Нечеткая логика и искусственные нейронные сети. М. : ФИЗМАТЛИТ, 2001. 226 с.

2. Круглов В.В., Борисов В.В. Искусственные нейронные сети. Теория и практика. М. : Горячая линия-Телеком, 2002. 178 с.

3. Уоссермен Ф. Нейрокомпьютерная техника. М. : Мир, 1992. 105 с.

4. Viola P., Jones M. Rapid Object Detection using a Boosted Cascade of Simple Features // Accepted conference on computer vision and pattern recognition. Cambridge, 2001. Р.1-9.

5. Lienhart R., Kuranov A., Pisarevsky V. Empirical Analysis of Detection Cascades of Boosted Classifiers for Rapid Object Detection // Microprocessor Research Lab, Intel Labs.-USA, 2002.Р.1-8.

6. Young J., Sharlin E., Boyd J. Implementing Bubblegrams: The Use of Haar-Like Features for Human-Robot Interaction // Accepted conference on computer vision and pattern recognition. University of Calgary, 2002. Р.1-6.

LOCALIZATION AND IDENTIFICATION OF STM-IMAGES OF ULTRADISPERSED PARTICLES USING THE NEURAL NET FRAMEWORK

Tyurikov A.V., Suvorov A.S., Shelkovnikov E.Yu., Gulyaev P.V., Gafarov M.R.

Institute of Applied Mechanics Ural Branch of the Russian Academy of Science, Izhevsk, Russia

SUMMARY. The work covers the ultradispersed particles of cluster materials localization on images, obtained by scanning tunnel microscopy method. In addition a particle profilogram recognition technique was elaborated using a neural net mathematical framework, which allows essentially increase reliability and automation level of cluster materials STM images identification.

KEYWORDS: scanning tunneling microscope, particle localization, identification, neural net.

Тюбиков Александр Валерьевич, кандидат физико-математических наук, старший научный сотрудник ИПМ У^О РАН

Суворов Александр Сергеевич, аспирант ИПМ УрО РАН

Шелковников Евгений Юрьевич, доктор технических наук, старший научный сотрудник ИПМ УрО РАН, тел. (3412) 585-333, e-mail: [email protected]

Гуляев Павел Валентинович, кандидат технических наук, старший научный сотрудник ИПМ УрО РАН Гафаров Марат Ренатович, аспирант ИПМ УрО РАН

LOCALIZATION AND IDENTIFICATION OF STM-IMAGES OF ULTRADISPERSED PARTICLES USING THE NEURAL NET FRAMEWORK

Текст научной работы на тему «Локализация и идентификация СТМ-изображений ультрадисперсных частиц с применением аппарата нейронных сетей»