УДК 681.518:004.93.1'
А. С. ДОВБИШ, К. В. АЛТИНН1КОВА
1€РАРХ1ЧНИЙ АЛГОРИТМ РОЗП1ЗНАВАННЯ ЕЛЕКТРОНОГРАМ
Розглядаеться iнформацiйно-екстремальний ieрархiчний алгоритм розпiзнавання елек-тронограм, одержаних в електроннiй мжроскопп в режимi м^одифракцп, який дозволяе тдвищити функцiональну ефективнiсть навчання системи при збшьшент потужностi алфавиту класiв. Оброблення електронограм в полярних координатах дае можливiсть зробити алгоритм iнварiантним до зсуву та повороту.
Вступ
Розтзнавання одержаних в електроннш мшроскопп в режим1 мшродифракци електроног -рам е важливою науково-практичною задачею [1], актуальною в металургшнш та х1м1чнш промисловосп, геологи, кристалографп та шших галузях. 1снуюч1 аналггико-геометричт методи розтзнавання електронограм [2] вимагають значних часових витрат i потребують високого р1вня квал1ф1кацИ особи, що приймае ршення. Бшьшють вщомих машинних алго-ршмв розтзнавання зображень [2-4] ор1ентовано на розв'язання модельних задач, яю виключають перетин клас1в, характеризуются невисокою достов1рн1стю розтзнавання i потребують на тдготовчому етат навчання нормал1зацп апрюрно деформованих образ1в, що на практищ, як правило, е ускладненим.
Одним ¡з шлях1в виршення ще! проблеми е використання щей i метод1в шформацшно-екстремально! штелектуально! технологи (1Е1-технологп), що грунтуеться на максим1зацп шформацшно! спроможносп системи розтзнавання шляхом введення в процес навчання додаткових шформацшних обмежень [5]. У працях [6,7] дослщжувалися у рамках 1Е1-технологп питання анал1зу i синтезу систем розтзнавання електронограм за не1ерарх1чним алгоритмом, який е чутливим до збшьшення потужносп алфавiту клашв розтзнавання. У статп розглядаеться питання стиснення та оброблення вщеошформацп в шформацшно-екстремальних алгоритмах навчання системи розтзнавання електронограм, як мають iерархiчну структуру.
1. Постановка задачi
Розглянемо задачу загального синтезу системи розтзнавання зображень. Нехай ефек-тивтсть навчання розтзнаванню реалiзацiй класу Х^, т = 1,М, характеризуеться значен-ням Ет критерiю функцюнально! ефективностi (КФЕ). Вщома навчальна матриця || 11,1 = 1,^,] = 1,п, де Ы,п - кщьюсть ознак розпiзнавання i випробувань вщповщно. Рядок матриц {у^^ 11 = 1,N1 утворюе ] -ту реалiзацiю образу, а стовпець {у^^ I ] = 1,п} -навчальну ви61рку з генерально! сукупносп значень ь! ознаки розтзнавання. Треба для структурованого вектора параметр!в функцiонування системи розпiзнавання §т =<gmД,•••,gm,q,•••,gm,Q >, як будемо називати параметрами навчання ! для яких вщом1 обмеження gQ) ^ 0, шляхом оргатзацп послщовних iтерацiйних процедур
знайти екстремальт значення координат вектора gm, що забезпечують максимум КФЕ навчання системи розтзнавання:
^ах = "^ш, (1)
де в - область допустимих значень параметр!в навчання.
На етат екзамену треба за побудованими в процес навчання системи розтзнавання виршальними правилами визначити належтсть реалiзацil образу, що розпiзнаеться, до вщповщного класу розпiзнавання ¡з заданого алфавггу { xm }.
Метою роботи е пiдвищення достов1рносп та оперативностi розпiзнавання електронограм за 1Е1- технологiею при збшьшент потужносп алфавiту класiв розпiзнавання•
2. Алгоритм навчання системи розтзнавання
Математичну (категоршну) модель процесу навчання системи розтзнавання за 1Е1-технологieю подамо у виглядi дiаграми вiдображень множин. При обгрунтувант гiпотези
нечигсо! компактносп мае мiсце нечiтке розбиття ЭТ|М| с О, де о - простр ознак розтзна-вання. Введемо оператор 6 нечггко! факторизацп простору ознак: 9 : У ^ ^|М| i оператор класифшацп у: ЭТ|М| ^ 1|г|, який перевiряе основну статистичну гiпотезу про належтсть
реалiзацiй {
Дй и=
1, п } нечiткому класу хт . Тут 1- кiлькiсть статистичних гшотез. Опера-
тор §: I' 1 1 ^ З^ шляхом ощнки статистичних гiпотез формуе множину точнюних характеристик З^, де д=12 - кiлькiсть точнiсних характеристик. Оператор Ф: З^ ^ Е обчислюе множину значень шформацшного КФЕ, який е функцiоналом точнюних характеристик. Контур оптимiзацil геометричних параметрiв нечiткого розбиття ЭТ|М| шляхом пошуку максимуму КФЕ навчання розпiзнаванню реалiзацiй класу Х^ замикаеться оператором г: Е ^ Й|М| .
Структурну дiаграму вщображень множин у процесi навчання за базовим шформацшно-екстремальним алгоритмом показано на рис. 1.
и Ф
Ф
З
I
Т х С х П х Z
У
~М1
I
|1 I
Рис. 1. Д1аграма ввдображень множин у процеа навчання системи розтзнавання
Оператор и: Е ^ О х Т х О х Ъ регламентуе процес навчання i дозволяе оптимiзувати параметри його плану, яю визначають, наприклад, обсяг i структуру випробувань, чер-говiсть розгляду класiв розпiзнавання та шше.
Вхiдною iнформацiею для навчання за базовим алгоритмом е багатовимiрна навчальна матриця Нут^ I т = 1,М; 1 = = 1, п||, де М,^п- кiлькiсть класiв, ознак розтзнавання та векторiв-реалiзацiй класiв вiдповiдно; система полiв контрольних допускiв {8К1} на ознаки розпiзнавання i рiвнi селекцп {р т} координат еталонних векторiв-реалiзацiй, якi за замовчуванням дорiвнюють 0,5 для всiх класiв розтзнавання. Основт етапи реатзацп алгоритму:
1. Побудова iерархiчноl структури алфавiту клашв розпiзнавання. При цьому перший ярус структури складаеться з типових представниюв якюно вiдмiнних класiв електроног-
рам, яю визначають алфавiт класiв розтзнавання {хЦ*} , а наступнi яруси - з представниюв !х клашв та пiдкласiв. Кожна гiлка вищого ярусу утворюе страту, яка визначае свш алфавiт
класiв розпiзнавання {ХкГ)т} , де к, г - номери страт i ярусiв вщповщно.
2. Для кожного класу будуеться спектрограма яскравосп шляхом оброблення електро-нограми у полярних координатах за умови, що центр електронного пучка приймаеться за центр електронограми.
3. Для кожного алфавпу формуеться вхщна навчальна матриця || Ук')1П х 11(Г), вектори-
реалiзацil яко! утворюються шляхом квантування у чаш вщповщно! спектрограми яскравосп.
4. Для кожного алфавггу формуеться бшарна навчальна матриця || х|к')т 1 ||(г), елементи яко! дорiвнюють
г
У
6
(j) МуЙ,.^ K.,;
Xk-i"l ».»y^«» K.,. (2)
5.Формування масиву еталонних двшкових BeKTopiB {xk,mji | m = 1,M, i = 1,N}, елементи якого визначаються за правилом:
1 n ■ 1 if - Z xk,m,i >Pk,m;
j"1 (3)
k,m,i
0, if else,
Де Pkr)m - PiBeHb селекцп координат вектора xj.m e X^ .
6. Розбиття множини еталонних векторiв на пари найближчих «сусщв»: =<xm , xi >,
v(r)
де xi - еталонний вектор сусiднього класу Xj,m, за таким алгоритмом:
а) структурусться множина еталонних векторiв, починаючи з вектора x1 базового класу
X°, який характеризуе найбiльшу функцiональну ефективнiсть системи розпiзнавання;
б) будуеться матриця кодових вщстаней мiж еталонними векторами розмiрностi M гМ;
в) для кожного рядка матриц кодових вiдстаней знаходиться мшмальний елемент, який належить стовпцю вектора, найближчого до вектора, що визначае рядок. За наявностi декшькох однакових мiнiмальних елементiв вибираеться з них будь-який, оскшьки вони е ршноправними;
г) формуеться структурована множина елеменпв попарного розбиття | m = 1,М}, яка задае план навчання.
7. Оптимiзацiя кодово! вiдстанi dkr)m вiдбуваеться за рекурентною процедурою. При цьому приймаеться Ekr,m (0) " 0 .
8.Процедура закшчуеться при знаходженнi максимуму КФЕ в робочш областi визначен-
ня його функци: Ej(m " maxEm, де{d} = {dj,...,dk ,...,dmax}e [0;d(xm ©xl)-1] - множина радь
' И
ушв концентрованих гiперсфер, центр яких визначаеться вершиною еталонного вектора
x
(r) e X(r)
k,m
e Xk,m . При цьому множина {d} е так само множиною крокiв навчання системи
розшзнавання.
Таким чином, базовий алгоритм навчання е ггерацшною процедурою пошуку глобального максимуму шформацшного КФЕ в робочiй областi визначення його функци:
4(т = а^а^т. (4)
{ё} V '
Параметри навчання системи розпiзнавання за базовим алгоритмом - оптимальш кодовi вiдстанi {¿к(т} i оптимальнi еталонш вектори-реалiзацil {хк<,т)} для заданого алфавпу {Хкг,т> е обов'язковими вхщними даними для функцiонування системи розшзнавання в режимi екзамену, тобто безпосереднього прийняття рiшень.
Отже, основною функщею базового алгоритму навчання у рамках 1Е1-технологи е обчис-лення на кожному крощ навчання iнформацiйного КФЕ i органiзацiя пошуку його глобального максимуму в робочш обласп визначення функци критерда з метою визначення опти-мальних геометричних параметрiв розбиття простору ознак на класи розшзнавання.
Як критерш оптимiзацil параметрiв навчання у рамках 1Е1-технологи може розглядатися будь-яка статистична шформацшна мiра, яка е функцiоналом вiд точнюних характеристик. Широкого використання в алгоритмах навчання набула модифшащя шформацшно! мiри Кульбака [7], в якiй розглядаеться вщношення правдоподiбностi у виглядi логарифмiчного вiдношення повно! ймовiрностi правильного прийняття ршень Р4 до повно! ймовiрностi помилкового прийняття рiшень . Для рiвноймовiрних гiпотез, що характеризуе найбшьш важкий у статистичному розумшш випадок прийняття рiшень, мiру Кульбака подамо у виглядо
р
7(0 - ^ Р{'к'т *
Екг,т - 1СЕ2
Ч\к,т (
- ^2
[Р1,к,т Р£,к,т ] -
л
Р^к,т - 0,5О1>к,т + 0,5Б2,к,т
Р£,к,т - 0,5ак,т + 0,5Рк,т-
°1,к,т + ^2,к,т
а к,т +Р - ^2
[(01,к,т + 02,к,т ) - (ак,т + Рк,т )] =
' 2 - (ак,т +Рк,т) Л
а к,т + Р к,т
[2 - (ак,т +Рк,т )]
де О,,
2,к,1
Рк,т - точнiснi характеристики розпiзнавання реалiзацiй класу {Хкг)т }:
:,т ' гк,т
перша i друга достовiрностi, помилки першого та другого роду вщповщно. 3. Реалiзацiя ieрархiчного алгоритму розппнавання електронограм
Для реатзаци прикладу роботи системи розпiзнавання електронограм використовува-лись отриманi на просвiчуючому електронному мшроскош електронограми, зображенi на рис. 2.
д е е ж
Рис. 2. Електронограми: а - моза!чного монокристалу; б - з Юкучьлшями; в - текстури; г - полжри-сталу; д - алюмшш; е - №С1; е - тодороюту; ж - золота
Оброблення електронограм, зображених на рис. 2, здшснювалось у полярних координатах, яю дозволяють зробити електронограми, що дослщжуються, iнварiантними до зсуву i повороту. При обробленш зображень в полярних координатах рядок навчально! матрицi -вектор-реалiзацiя образу формувався з ознак розтзнавання, якi обчислювалися за формулою
© :
-1
N
(6)
де © j - числове значення спектра в j -му радiусi кола зчитування, j - 1Д; 61 - значення яскравосп в 1 -му шксел^ 1 -1, N; N - загальна кiлькiсть пiкселiв у колi зчитування. Було побудовано iерархiчну структуру, яка зображена на рис. 3.
На першому яруш iерархiчноl структури (див. рис. 3) розташовано чотири класи основних типiв електронограм: монокристалу - клас Х^ (електронограми з рефлексами у виглядi
плям), з Юкучьлшшми - клас Х21, текстури - клас Х^ (з рефлексами у виглядi дуг) та полшристалу - клас Х^1-* (концентричш кiльця). На другому ярусi розташоваш: тодорокiт -клас Х('1), золото - клас Х(2) та алюмшш - клас х4 1 i NaC1 - клас Х^.
Базовий алгоритм навчання проводився при значенш параметра поля контрольних до-пускiв 5 = 15. Графш залежностi усередненого КФЕ вщ радiуса контейнера для класу Х^ зображений на рис. 4.
а
к
т
б
а
в
г
Рис. 3. Ieрархiчна структура алфавиу клаав розпiзнaвaння
Рис. 4. Графк зaлежностi КФЕ вiд рaдiусa контейнера для класу x41)
Свггла дшянка на графшу рис. 4 визначае робочу область, в якш проводиться пошук глобального максимуму КФЕ (5). Анал1з графша показуе, що максимальне значення КФЕ для класу досягаеться при значенш рад1уса контейнера d = 37 { становить 2.53. При цьому мають мюце таю точнюш характеристики: перша достов!рнють Dl=0,9, друга достов!рнють
D2=0,9, помилка першого роду а = 0,1, помилка другого роду Р = 0,1.
Середне значення КФЕ тсля проведення навчання для першого ярусу !ерарх!чно! струк-
тури дор1внюе E = 2,01.
З метою перев1рки працездатносп розробленого !ерарх!чного алгоритму в режим! екза-мену на моштор комп'ютера електронного растрового мшроскопа РЕМ-103М виробництва ВАТ «Selmi» (Суми, Укра!на) транслювалася електронограма алюмшда, яка в !ерарх!чнш
структур! (див. рис. 3) знаходиться у другому ярус! (клас x4'2l)). Результати екзамену наведено на рис. 5.
Рис. 5. 1нтерфейс програми в режимi проведення екзамену
Анал!з рис. 5 показуе, що у режим! екзамену електронограма, що розтзнавалася, була правильно вщнесена до вщповщного класу за максимальним значенням геометрично!
(дистанцшно!) функцп належностi реалiзацп образу вщповщному гiперсферичному контейнеру i обчислювалася за формулою
(r) , d(xk,m © x(j))
= 1--7-, (7)
dk,m
*(r) (i) (r)
де xk m, x - еталонний вектор-реалiзацiя класу Xk m i реатзащя класу, що розтзнаеть-*(r) (r)
ся, вiдповiдно; d^m - оптимальний радiус контейнера класу Xk m , побудований на етапi навчання.
Таким чином, ieрархiчний алгоритм екзамену складасться з послiдовних процедур визна-чення максимально! функцп' належностi (7) реатзаци, що розпiзнаeться, класу першого ярусу iерархiчно! структури, переходу на вщповщну страту другого ярусу, визначення максимально! функцп належносп для алфавпу класiв цie! страти i так до тих тр, поки не буде знайдено фшальну вершину, яка не утворюе свою страту.
Висновки
1. Запропоновано ieрархiчний шформацшно-екстремальний алгоритм розпiзнавання елек-тронограм, одержаних в електроннш мiкроскопi! у режимi мiкродифракцi!, який шляхом оптимiзацi! у процес навчання параметрiв функцiонування за шформацшним критерieм дозволяе пщвищити достсшрнють розпiзнавання та зменшити чутливiсть системи до збшьшен-ня потужностi шформацшного фонду електронограм. При цьому оброблення електронограм у полярних координатах дозволяе забезпечити iнварiантнiсть алгоритму розтзнавання до !х зсуву та повороту.
2. У перспективi при розширенш iнформацiйного фонду електронограм для побудови безпомилкових за навчальною вибiркою вирiшальних правил необхщно здiйснювати оптимь зацiю додаткових просторово-часових параметрiв функцюнування системи розпiзнавання.
Список лiтератури: 1. Томас Г., Гориндж М.Дж. Просвечивающая электронная микроскопия материалов: Пер. с англ. / Под ред. Б.К. Вайнштейна. М.:Наука. 1983. 320 с. 2. Васильев В.И. Распознающие системы: Справочник. 2-е изд., перераб. и доп. Киев: Наук. думка, 1983. 422 с. 3. Duda R. O., Hart P. E., Stork D. G. Pattern Classification, second ed. John Wiley & Sons, New York, 2001. 738 p. 4. Shalkoff RJ. Digital image processing and computer vision. New York-Chichester-Brisbane-Toronto-Singapore: John Wiley & Sons, Inc., 1989. 489 p. 5. Краснопоясовський А.С. 1нформацшний синтез штелектуальних систем керування, що навчаються: Щдхвд, що грунтуеться на методi функцюнально-статистичних випробувань. Суми: Видавництво СумДУ, 2003. 257 с. 6. Краснопоясовський А.С., Козинець М.В., Шелехов 1.В. Розтзнавання електронограм в електроннш мшроскопп // Открытые информационные и компьютерные интегрированные технологии. Харьков: Нац. аерокосмический ун-т «ХАИ», 2002. Вып. 12. С. 140-146. 7. ДовбишА.С., Мартиненко С.С. 1нформацшно-екстремальний метод розтзнавання електронограм // Вюник СумДУ. Техтчт науки. 2009. №2. С. 85-91.
Надшшла до редколегИ 13.07.2009 Довбиш Анатолш Степанович, д-р техн. наук, професор, завщувач кафедри шформатики Сумського державного утверситету. Науковi штереси: шформацшний аналiз i синтез штелектуальних систем, що навчаються (самонавчаються). Адреса: УкраИна, 40035, Суми, вул. Заливна, б. 7, кв. 40, тел. (0542) 77-08-27, e-mail: [email protected]. Алтиншкова Катерина BamíiBHa, астрантка кафедри шформатики Сумського державного утверситету. Науковi тереси: шформацшний аналiз i синтез штелектуальних систем, що навчаються (самонавчаються). Захоплення та хобi : туризм та плавання. Тел. (0542) 77-0827, e-mail: [email protected].