Научная статья на тему 'Зменшення розмірності ознакового простору рослинних обєктів за допомогою факторного аналізу'

Зменшення розмірності ознакового простору рослинних обєктів за допомогою факторного аналізу Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
206
30
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
факторний аналіз / ознаковий простір / спектральні коефіцієнти яскравості / ознаки / класифікатор / factor analysis / feature space / spectral coefficients of brightness / feature / classifier / факторный анализ / признаковое пространство / спектральные коэффициенты яркости / признаки / классификатор

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Шама Є. О.

У статті показана можливість зменшення кількості інформативних ознак для багатоспектральних даних рослинного походження за допомогою методів факторного аналізу. Для дослідження були використані реальні коефіцієнти відбиття кукурудзи, мишію та амброзії. Перед використанням метода факторного аналізу була виконана процедура перевірки відповідності початкового набору даних до нормального закону розподілу. Факторний аналіз проводився окремо для трьох рослин: кукурудзи, мишію та амброзії. Для кожної рослини встановлені розміри нового простору, а також надана якісна оцінка кореляції між елементами нового і початкового простору даних. Перехід до нового ознакового простору виконувався за умови, що рівень інформативності підтримувався на рівні не менше 80% по відношенню до початкового набору даних. Для кожного виду рослини була проведена процедура перевірки правильності вибору кількості ознак за допомогою розрахунку спільностей. Отримані результати можуть бути використані при побудові класифікатора рослинних об’єктів.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE FUATURE SPACE DIMENSIONALITY REDUCTION OF PLANT OBJECTS BASED ON FACTOR ANALYSIS

A possibility of reducing the number of informative features for multispectral phytogenous data by means of the factor analysis method is shown in the article. For investigation there were used real reflection coefficients of maize, bristlegrass and ambrosia. Prior to usage of the factor analysis it was performed the procedure to verify an initial set of data for conformity with distribution by the normal distribution law. The factor analysis was conducted separately for three plants: maize, bristlegrass and ambrosia. Sizes of a new space were set for each plant, and also there was given quality estimation of correlation between elements of a new and initial space of the data. Transfer to new features was executed provided that a level of informativeness was maintained at a level of 80% minimum in comparison with the initial set of data. For each plant species the procedure of verification of the feature number choice correctness was performed by calculating of generalities. The obtained results can be used to construct plant objects classifier.

Текст научной работы на тему «Зменшення розмірності ознакового простору рослинних обєктів за допомогою факторного аналізу»

МАТЕМАТИЧНЕ ТА КОМП'ЮТЕРНЕ МОДЕЛЮВАННЯ

МАТЕМАТИЧЕСКОЕ И КОМПЬЮТЕРНОЕ МОДЕЛИРОВАНИЕ

MATHEMATICAL _AND COMPUTER MODELLING_

УДК 528.85

Шама е. О.

AcnipaHm кафедри радотехнки та телекомушкацй Запо^зького нацонального mexHi4Hoao yHieepcumemy, Запорiжжя,

Украна

ЗМЕНШЕННЯ РОЗМ1РНОСТ1 ОЗНАКОВОГО ПРОСТОРУ

РОСЛИННИХ ОБСКТ1В ЗА ДОПОМОГОЮ ФАКТОРНОГО АНАЛ1ЗУ

У статт показана можливiсть зменшення кiлькостi шформативних ознак для багатоспектральних даних рослинного походження за допомогою методiв факторного аналiзу. Для дослiдження були використаш реальнi коефiцieнти вiдбиття кукурудзи, мишто та амбрози. Перед використанням метода факторного аналiзу була виконана процедура перевiрки вiдповiдностi початкового набору даних до нормального закону розпод^. Факторний аналiз проводився окремо для трьох рослин: кукурудзи, мишто та амбрози. Для кожно! рослини встановленi розмiри нового простору, а також надана якюна оцiнка кореляци мiж елементами нового i початкового простору даних. Перехщ до нового ознакового простору виконувався за умови, що рiвень iнформативностi пiдтримувався на рiвнi не менше 80% по вiдношенню до початкового набору даних. Для кожного виду рослини була проведена процедура перевiрки правильной вибору юлькост ознак за допомогою розрахунку спiльностей. Отримаш результати можуть бути використанi при побудовi класифiкатора рослинних об'eктiв.

Ключовi слова: факторний аналiз, ознаковий прос^р, спектральнi коефiцieнти яскравостi, ознаки, класифжатор.

НОМЕНКЛАТУРА

ajk - факторт навантаження i-го значення k-го фактору;

Fk - k-й загальний фактор; hf - сшльшсть i-го значення;

N - кшьюсть вишрювань, що зроблеш для окремо! рослини за допомогою спектрометра; P - кшьюсть фактор1в;

S2 - специф1чшсть i-го значення; Sj - стандартне в1дхилення j-го значення; х»j - середне значення j-i ознаки; Xj - j-та спостережувана змшна; zij - компоненти матриц стандартизованих початко-вих даних;

U. - j-та складова специф1чних фактор1в; X i - i-та довжина хвилц

цi - i-й вишрюваний спектральний коефщент вщбит-

тя;

Цг,тах - i-й максимальний вишрюваний спектральний коефщент вщбиття;

Mi min— i-й мшмальний вишрюваний спектральний коефщент вщбиття;

- i-й нормований спектральний коефiцiенг ввдбиття.

© Шама е. О., 2015

DOI 10.15588/1607-3274-2015-2-2

ВСТУП

Вдамо, що велика розмiрнiсть ознакового простору становить суттеву проблему для багатьох процедур роз-пiзнавання образiв, зокрема рослинних об'екпв.

Об'ектом дослiдження е процес зменшення розмiр-ностi простору ознак для побудови розтзнавальних моделей.

На сьогодшшнш день зростае кiлькiсть теоретичних робiт по методам зменшення розмiрностi ознакового простору для класифжацп образiв [1]. Деякi з цих метседв прагнуть сформувати новi ознаки на осжда лiнiйних ком-бiнацiй старих ознак, а iншi прагнуть створити меншу пiдмножину початкових ознак. Основна проблема ще! теорп полягае в тому, що подш розпiзнавання образiв на видiлення ознак, а потам класифжащю теоретично е штуч-ним. Повшстю оптимальний видiльник ознак е не чим iншим, як оптимальним класифiкатором. А тому, вирь шивши задачу зменшення iнформативних ознак, при збе-реженнi необхiдного рiвня шформативноста, можна спро-стити задачу побудови класифжатора рослинних об'ектiв.

Бiльшiсть запропонованих методiв зменшення роз-мiрностi [1] забезпечують функцiональне в^ображен-ня, так що можливо знайти вщображення довшьного вектора ознак [2]. Класичними процедурами зменшення роз-мiрностi е аналiз головних компонент i факторний аналiз

[3], обидва з яких зменшують розм1рн1сть шляхом фор-мування лшшних комбшацш ознак. Метою анал1зу го-ловних компонент (розкладання Кархунена-Лоева) е зна-ходження зображень у простор! меншо! розм1рност1, яке враховуе дисперию ознак. Метою факторного анал1зу е знаходження зображень у простор! меншо! розм!рносл, яке враховуе корелящю м1ж ознаками. Изн1 алгоритми факторного анал1зу об'еднаш тим, що в умх них вщбу-ваеться перехщ до нового базису в початковому «-м1рно-му простор!, тому у статл буде використаний фактор-ний анал1з, так як вш е загальним методом зменшення розм1рност1 серед метод1в головних компонента та факторного анал1зу.

Предметом досл1дження е процедура зменшення розм1рност1 ознакового простору коефщенпв в1дбиття рослинних об'екпв за допомогою метод1в факторного анал1зу. При цьому, початкова (перед проведенням про-цедури зменшення ознакового простору) розм1ршсть коефшденпв ввдбиття рослинних об'ектпв, складае 256, яка визначаеться роздшьною здатшсть вишрювального при-ладу - спектрометра.

Мета роботи полягае у дослщженш можливост зменшення кшькост шформацшних ознак за допомогою ви-користання метод1в факторного анал1зу.

1 ПОСТАНОВКА ЗАДАЧ1

Нехай ми маемо масив експериментально отрима-них даних коефшденпв вщбиття рослинних об'ектпв X j. Розм1рн1сть масиву коефщенпв в1дбиття рослинних об'ектпв - 256 х N, де 256 - розм1ршсть ознакового простору (визначаеться роздшьною здатшстю спектрометру). Тод1, задача зменшення ознакового простору рослинних об'екпв, полягае у тому, щоб отримати масив меншо! розм1рност1 даних для в1дпов1дно! рослини, за допомогою якого можна зробити процедуру розтзна-вання 1з заздалепдь встановленим р1внем в1рог1дност1. Тобто необхщно згенерувати вих1дний масив даних F^, який був би меншим за розм1ром i за допомогою якого можливо було б зробити процедуру розтзнання рослини за видом. Так, якщо вихщний масив можливо описати

m

за допомогою лшшного перетворення Fk = ^ ajk ' Xj,

j=1

то вирiшувана задача в рамках ще! статтi полягае в здо-буттi нового масиву, у якого m << N i m ^ min.

2 ОГЛЯД Л1ТЕРАТУРИ

Найбiльш вiдомими методами розтзнавання е метод потенцiальних функцiй [1, 7], дискримшантний аналiз [1, 2, 7], метод граничних спрощень [8], регресшний аналiз [2], метод групового урахування аргументiв [7], нейро-мережевi методи [1, 2]. Порiвняльний аналiз основних методiв розпiзнавання - кореляцшних, ознакових (стати-стичних i детермiнованих), нейромережевих [2] - дозво-ляе зробити висновок, що метод факторного аналiзу е найбшьш ефективним для виршення завдань розтзна-вання [9]. Крiм того, факторнi методи забезпечують бiльш високу стiйкiсть роботи системи розтзнавання в умовах перешкод i дозволяють об'еднати процедуру розпiзна-вання i процедуру зменшення ознак.

Розтзнавання рослинних об'екпв за допомогою факторного аналiзу розглянуто у рядi робот [3, 5, 9]. Але в цих роботах класифжащя рослинних об'ектав проводилась лише на два класи (корисну культуру i бур'яни). Проте на практицi доцшьною е класифiкацiя на бiльшу кшьюсть класiв, що обумовлюеться необхiднiстю вико-ристання рiзних гербiцидiв для рiзних видiв бур'янiв. Бiльша кiлькiсть кламв обумовлена тим, що для бороть-би з бур'янами при хiмiчнiй обробцi застосовують рiзнi види гербiцидiв. Необхiднiсть розпiзнавання рослинних об'ектiв на три класи визначаеться також алгоритмом роботи штелектуального обприскувача для обробки про-сапних культур в рослиннищга. Також процедура розт-знавання в моделях на осжда дискримiнантного аналiзу [1, 6], нейронно! мережi [2, 4, 8], регресшного аналiзу [7], як правило, характеризуемся великою надлишковютю i в них висуваються висою вимоги до обчислювальних ре-сурмв. Для того, щоб виключити недолжи цих методiв, доцiльно застосувати процедуру факторного аналiзу для зменшення надлишковост даних моделi при розтзна-ванш рослинних об'ектiв, що скоротить час навчання та суттево збiльшить швидюсть прийняття рiшень i дозволить зменшити вимоги до обчислювальних ресурмв.

3 МАТЕР1АЛИ I МЕТОДИ

Факторний аналiз дозволяе розв'язати двi важливi проблеми, якi виникають пiд час дослщження: компактно описати об'ект вишру i в той же час всебiчно. За допомогою факторного аналiзу можливе виявлення при-хованих змiнних факторiв, що вiдповiдають за наявшсть лiнiйних статистичних кореляцiй мiж спостережуваними змiнними [4].

При проведенш факторного аналiзу, в один чинник об'еднуються змiннi, що сильно корелюють мiж собою, як наслiдок вщбуваеться перерозподiл дисперсп мiж компонентами i виходить максимально проста i наявна структура факторiв. Шсля об'еднання корельованiсть компо-нентiв, всередиш кожного фактору мiж собою, буде ви-щим, нiж !х корельовашсть з компонентами з iнших факгс^в. Ця процедура також дозволяе видшити латентнi змiннi, що може бути корисним при побудовi класифжа-тора рослинних об'екпв.

Таким чином можна видшити двi мети факторного аналiзу:

- визначення взаемозв'язкiв мiж змшними (класифь кацiя змшних);

- зменшення кшькост змiнних необхiдних для опису даних.

При факторному аналiзi, коли необх^но подати по-чатковi змiннi у виглядi лшшно! комбшацп факторiв Р, якi розрахованi так, щоб найкращим способом (з мшмаль-ною погршшстю) подати Х, можна показати [10]:

Х} =^а]к • Рк + и} , к=1,2,...,р; ;=1,2...,т. (1) к=1

Одним з найбшьш поширених методiв пошуку фак-тс^в е метод головних компонент (саме цей метод буде-мо використовувати в межах факторного аналiзу). Його основна вiдмiннiсть вiд факторного аналiзу полягае в тому,

що головт компоненти Fk пов'язанi i3 спостережуваними змiнними X. лiнiйними функцiями перетворення:

Xj = Z ajk ■ Fk i Fk =z k=1 j=1

ajk • Xj ■

(2)

Суть цього методу полягае в замiнi корельованих компонента некорельованими чинниками. 1ншою важливою характеристикою методу е можливiсть обмежитися найбшьш iнформативними головними компонентами i виключити iншi з аналiзу, що спрощуе iнтерпретацiю ре-зультатiв. Цшшсть метода головних компонентiв також в тому, що вш - единий математично обгрунтований метод факторного анатзу [5]. Але слiд зауважити, що за тверд-женням деяких дослдаиюв, метод головних компонентiв не е методом факторного аналiзу, оскiльки не розщеплюе дисперсiю iндикаторiв на загальну i унiкальну [6].

Метод головних компонент е прослшим в розрахун-ках i штерпретацп, але одна з головних трудж^в його використання - необх^шсть перетворення початкових даних, якi представленi в рiзних одиницях вимiру, в вели-чини, яю можливо спiвставити. Традицiйним методом перетворення, але не обов'язковим, е нормування по стандартним вдаиленням, коли матриця Ъ стандартизо-ваних початкових даних визначаеться за формулою:

Zj = Xj x'j ,j=1,2.

,m; i=1,2.

S

(3)

j

Також слiд зауважити, що при проведенш факторного аналiзу за допомогою методу головних компонент може використовуватись така характеристика, як спшьшсть, яка визначаеться формулою:

= Z aik + S k=1

M

2

(4)

Тобто спiльнiсть e диспермею змшних, обумовленою факторами, а специфiчнiсть являе собою частину дис-персп, яка обумовлена випадковими помилками або змiнними, неврахованими в моделi. Вiдповiдно до постановки завдання необхiдно шукати таю фактори, при яких сумарна спшьшсть е максимальною, а специфiчнiсть -мшмальною.

У роботi [7] видшяють такi умови проведення факторного аналiзу: всi ознаки повиннi бути юльюсними; кшьюсть спостережень мае бути не менше як у два рази бшьшою кiлькостi змiнних; вибiрка мае бути однорiдною; фактор-ний аналiз здiйснюeться по корелюючими змшними.

4ЕКСПЕРИМЕНТИ

Вимiри спектральних коефщенлв вiдбиття проводи-лися влiтку 2013 року на жш ТОВ «Агрофiрма «Матвп-вка» (Запорiзька область, Укра1на). В якостi корисно1 куль-тури була обрана кукурудза. Також на жш зустрiчались такi бур'яни: амброзiя, берiзка, мишiй, пирiй, пастуша сумка, суршиця та iн. Серед бур'яшв, для дослiдження, були вiдiбранi мишш та амброзiя, оскiльки вони склада-ли переважну долю бур'янiв на полг Вимiрювання про-водилися максимально наближеним до реальних польо-вих робгг на самохiднiй установцi: швидкiсть руху 0,5-

1 м/с, вiдстань об'ектива до рослини - приблизно 0,3 м. Перемiщення об'ектива приймача спектрометра в!д одше1 рослини до шшо1 в продовж рядка проводилося рiвномiрно, без ривкiв■ Вишрювання проводилися впро-довж проходу мiжряддя як в одному напрямку так i в шшому Пристрiй, за допомогою якого проводилися ви-мiрювання спектральних коефщенлв вiдбиття, мiстив спектрометр Red Tide650 з волоконно-оптичним кабелем P200 - 2 - UV - VIS i лшзою 74 - VIS ^рма Ocean Optics) та веб-камеру Ä4Tech PK-838G.

Вимiрювання спектральних характеристик рослин проводилися за допомогою приладу, який автоматично з перюдом 1 с збериав поточну шформащю (коефiцiент вiдбиття i координати м^ця) i фотографiю зовнiшнього вигляду рослини.

З уах експериментальних даних, для подальшого досль дження було вщбрано 2268 спектральних кDефiцiентiв в!д6иг-тя рослин. Критерiем вiдбору була можливють вiзуальногD визначення виду рослин по зображеннях i формi спектраль-но1 криво! Назва i кшьюсть рослин, як були вiдiбранi для подальшого до^дження, наведен! в таблиц! 1.

Таблиця 1 - Видовий склад дослщжуваних рослин

Вид рослини Латинська назва Кшьюсть екземиляр1в

Кукурудза Zea mays 699

Амброз1я Ambrosia artemisiifolia 882

Мишш Setaria viridis 687

Усього 2268

РЕЗУЛЬТАТИ

За допомогою спектрометра експериментально були отримаш спектральш коефiцiенти вiдбиття рослин, якi були попм експериментально обробленi. Було отрима -но три матрищ: матриця коефщенлв вiдбиття для куку-рудзи - 699x256, матриця коефщенлв вщбиття для ми-шiю - 687x256 i матриця коефiцiентiв вiдбиття для амб-розп - 882x256. Наступним етапом було нормування цих даних. Кожна з трьох матриць тддавалася нормуванню за лiнiйним законом:

М-г — М-г'шт =---- (5)

М-г,шах — М-г,тш

Перед проведенням факторного аналiзу необхiдно перевiрити генеральну сукупшсть даних для кожно1 рослини на вщповщшсть нормальному розподiлу.

Нормальшсть розподiлу даних для кукурудзи, мишж> i амброзп була перевiрена у статистичному пакетi про-грам. Для перевiрки розподiлу на нормальнiсть викори-стовувались нормованi значення мишiю. Результата пе-ревiрки наведенi на рис. 1 i в табл. 2.

Таким чином, аналiз дослiджуваного розподшу вибь рок визначив його наближешсть до нормального, на що вказують як вид гiстограми, так i значення коефiцiентiв асиметрп та ексцесу: вони одного порядку по вщношен-ню до початкових значень вибiрок, а також мають малi значення стандартних помилок. Для усiх видiв аналiзу статистично значимими вважали вiдмiнностi при Р<0,05.

Набiр початкових ознак для кукурудзи та амброзп також тддавався аналогiчнiй процедурi перевiрки на нор-мальнiсть i також було встановлено наближенiсть роз-

n

подЫв цих рослин до нормального закону (що не дивно, бо природа походження i умови вим1ру коефшденпв яс-кравост для ycix трьох рослин е однаковими).

Наступним етапом було проведення факторного ана-лiзу При проведенш факторного аналiзу в програмно-му пакета були встановлеш наступнi параметри: метод видшення факторiв - компонентний аналiз; максимальна кiлькiсть фактс^в - 256; мiнiмальне власне число - 0.

Факторний аналiз будемо використовувати окремо для кожного виду рослинних об'екпв: корисноï культури (ку-курудза), однодольного бур 'яну (мишш), дводольного бур'яну (амброзiя). Умовою переходу в^ початкового «Арного простору до нового ознакового простору, буде

Рисунок 1 - Пстограма усереднено!' вибiрковоï сукупностi значень мишiю. Суцiльна лтя - крива нормального закону розпод^

рiвень iнформативностi нового простору, який повинен бути не менше 80% по ввдношенню до початкового.

Рiвень iнформативностi факторного ознакового простору встановимо рiвним 80% по ввдношенню до початкового. Це е достаттм рiвнем iнформативностi при перехода ввд одного ознакового простору до шшого [8]. Для визначення кшькоста факторiв, як1 можна залишити i при цьому ввдпо-вiдати встановленому рiвню iнформативностi визначимо вклад головних компонент для кожжа рослини.

На таблицях 3 та 4 в перших стовбцях наведенi оцiнки власних чисел, в третьому стовбцi - накопичеш значен-ня власних чисел, у другому i у четвертому стовбцях -вiдносний вклад кожжй головноï компоненти та накопи-чений вщносний вклад вiдповiдно.

У першому наближеннi накопичений вiдносний вклад можна вважати рiвнем iнформативностi нового ознакового простору по вщношенню до початкового (для бшьш точного значення рiвня iнформативностi необхiдно зробити перерахунок через власнi числа з урахуванням до-вiрчих iнтервалiв) [9]. Як бачимо, для досягнення вста-новленого рiвня iнформативностi, для кукурудзи можна залишити 3 фактора, для мишж> - 8 факторiв i для амб-розiï - 2 фактора.

Для штерпретацп нових ознак необх^но провести аналiз матрицi факторних навантажень з урахуванням новоï кшькост факторiв для кожноï рослини. 5 ОБГОВОРЕННЯ

Як бачимо з таблиць 5 i 6, для кукурудзи перший фактор найбiльш корельований з початковими ознаками, що вiдповiдають довжинам хвиль 353-464 нм, 631-704 нм i

Таблиця 2 - Результати розрахунку критерiïв асиметрiï та ексцесу для мишто

Змшна Середне значення МЫмум Максимум Станд. вщхилення Асиметр1я Похибка асиметри Ексцес Похибка ексцесу

1 0,083706 0 0,600420 0,071435 1,47213 0,093251 5,46625 0,186233

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2 0,015076 0 0,124923 0,018389 1,58612 0,093251 3,48430 0,186233

3 0,013580 0 0,153521 0,018177 2,09398 0,093251 7,26450 0,186233

4 0,057173 0 0,203566 0,025330 1,11122 0,093251 3,16737 0,186233

5 0,054378 0 0,243602 0,025989 1,15261 0,093251 4,32015 0,186233

6 0,059009 0 0,225000 0,027683 1,38278 0,093251 5,47856 0,186233

7 0,054660 0 0,204996 0,026185 0,82713 0,093251 1,94301 0,186233

Таблиця 3 - Вклад головних компонент в сумарну дисперсто початкових ознак для кукурудзи i для мишто

№ фактору Власш значення для кукурудзи Власш значення для мишш

Значення % вщ загального Накопичене значення % накопичення Значення % вщ загального Накопичене значення % накопичення

1 163,3985 63,827 163,3985 63,827 101,1679 39,5187 101,1679 39,518

2 29,9047 11,681 193,3032 75,509 70,7136 27,6224 171,8815 67,141

3 13,4457 5,252 206,7489 80,761 15,0487 5,8784 186,9302 73,019

4 2,9825 1,165 209,7314 81,926 9,94743 3,7009 196,4046 76,720

5 1,5078 0,588 211,1577 82,515 4,8562 1,8969 201,2607 78,617

6 0,9185 0,358 212,1577 82,874 1,5239 0,5952 202,7847 79,212

7 0,8381 0,327 212,9958 83,201 1,4546 0,5682 204,2393 79,781

8 0,7767 0,303 213,7725 83,504 1,0522 0,4110 205,2914 80,192

9 0,7139 0,278 214,4864 83,783 1,0216 0,3990 206,3130 80,591

10 0,6942 0,271 215,1806 84,057 0,9499 0,3710 207,2629 80,962

11 0,6580 0,257 215,8387 84,312 0,8506 0,3322 208,1135 81,294

12 0,6277 0,245 216,4664 84,557 0,8196 0,3201 208,9331 81,614

13 0,5955 0,232 217,0618 84,789 0,7968 0,3112 209,7298 81,925

14 0,5709 0,223 217,6327 85,012 0,7567 0,29558 210,4865 82,221

15 0,5537 0,216 218,1864 85,229 0,7094 0,2771 211,1959 82,498

16 0,5488 0,214 218,7352 85,443 0,7006 0,2773 211,8965 82,772

17 0,5163 0,201 219,2515 85,645 0,6876 0,2685 212,5841 83,040

18 0,5048 0,197 219,7563 85,842 0,6605 0,2580 213,2446 83,298

19 0,4910 0,191 220,2474 86,034 0,6506 0,2541 213,8951 83,552

Таблиця 4 - Вклад головних компонент в сумарну дисперсто початкових ознак для амбрози

№ фактору Власш значения для амбрози

Значення % вщ загального Накопичене значення % накопичення

1 145,327 56,76864 145,3277 56,7686

2 79,2253 30,94740 224,5530 87,7160

3 13,0125 5,08299 237,5655 92,7990

4 6,7203 2,62510 244,2858 95,4241

5 3,1865 1,24471 247,4722 96,6688

6 1,4380 0,56172 248,9103 97,2306

7 0,9799 0,38276 249,8901 97,6133

8 0,7389 0,28863 250,6290 97,9020

9 0,6168 0,24094 251,2458 98,1429

10 0,5851 0,22856 251,8309 98,3715

11 0,3474 0,13571 252,1783 98,5072

12 0,2324 0,09077 252,4107 98,5979

13 0,1990 0,07772 252,6097 98,6757

14 0,1852 0,07233 252,7948 98,7480

15 0,17764 0,06892 252,9713 98,8169

16 0,1617 0,06318 253,1330 98,8801

17 0,1588 0,06203 253,2918 98,9421

18 0,1416 0,05530 253,4334 98,9974

19 0,1335 0,05215 253,5669 99,0496

20 0,1194 0,04475 253,6862 99,0962

21 0,1146 0,06318 2553,8008 99,1409

Таблиця 5 - Факторш навантаження для кукурудзи та для амбрози

Змшт Факторт навантаження (для кукурудзи) Факторт навантаження (для амбрози)

Фактор 1 Фактор 2 Фактор 3 Фактор 1 Фактор 2

1 0,3154 -0,00652 0,13011 -0,5882 0,0373

2 -0,9133 0,00270 -0,02649 -0,3287 -0,20267

3 -0,8951 -0,01129 -0,02044 -0,3214 -0,17772

4 -0,9299 0,02037 0,01800 -0,8883 -0,26265

5 -0,9362 0,02430 0,06539 -0,8995 -0,28255

6 -0,9240 0,02867 0,07868 -0,8882 -0,26591

7 -0,9262 0,02683 0,00677 -0,8948 -0,27936

8 -0,9344 0,04891 0,06100 -0,8981 -0,27451

9 -0,9203 0,03827 0,05974 -0,9045 -0,27820

10 -0,9367 0,02823 0,04644 -0,9076 -0,27883

Нова 1 -0,9327 0,01571 0,15592 -0,9072 -0,27496

Нова 2 -0,9316 0,02617 0,09776 -0,9078 -0,27583

Нова 3 -0,9281 0,04715 0,16311 -0,9086 -0,27435

Нова 4 -0,9229 0,04346 0,14530 -0,9095 -0,27747

Нова 5 -0,9211 0,03981 0,18024 -0,9131 -0,27920

Нова 6 -0,9326 0,03498 0,12592 -0,9163 -0,28652

Нова 7 -0,9298 0,05401 0,13759 -0,9231 -0,28774

Нова 8 -0,9184 0,02574 0,20173 -0,9204 -0,27198

Нова 9 -0,9200 0,06748 0,18150 -0,9230 -0,28410

Нова 10 -0,9235 0,09543 0,17181 -0,9256 -0,28923

Нова 11 -0,8994 0,10865 0,22821 -0,9270 -0,28758

Нова 12 -0,8508 0,08934 0,31835 -0,9261 -0,28418

Нова 13 -0,9194 0,10535 0,08860 -0,9284 -0,29927

Нова 14 -0,9212 0,10979 0,11372 -0,9272 -0,30349

802-1050 нм, другий фактор - корельований з початко-вим ознаками, що вщпов1дають довжинам хвиль 718753 нм 1 третш фактор - корельований з початковим ознаками, що вщповщають довжинам хвиль 507-540 нм.

Для мишго перший фактор найбшьш корельований з початковими ознаками, що ввдповвдають довжинам хвиль 414-504 нм, 547-683 нм [ 712-850 нм; другий фактор -корельований з початковим ознаками, що вщпов1дають довжинам хвиль 850-1050 нм; третш фактор - з початковим ознаками, що вщпов1дають довжинам хвиль 510535 нм; четвертий фактор - з початковим ознаками, що вщпов1дають довжинам хвиль 437-480 нм; п'ятий фактор - з початковим ознаками, що вщповщають довжинам хвиль 400-434 нм; шостий фактор - з початковим ознаками, що в1дпов1дають довжинам хвиль 353 нм,

370 нм [ 976 нм; сьомий фактор - з початковим ознаками, що в1дповщають довжинам хвиль 350 нм [ 996 нм; восьмий фактор - з початковим ознаками, що вщповща-ють довжинам хвиль 350-360 нм.

Для амбрози перший фактор найбшьш корельований з початковими ознаками, що в1дпов1дають довжинам хвиль 360-504 нм, 614-675 нм, 695-944 нм [ 712-850 нм; другий фактор - корельований з початковим ознаками, що вщпов1дають довжинам хвиль 495510 нм, 535-593 нм, 678-690 нм, 947-1038 нм.

Для перев1рки достатноста розм1ру нового простору для кожно! рослини, була проведена процедура розрахун-ку сумарно! спшьноста [ спшьноста по кожному фактору Так, для амбрози сумарна спшьшсть дор1внюе 254,28, для першого фактору - 145,27, для другого фактору - 124,55. Тобто загальна спшьшсть за двома факторами дор1внюе 145,27+124,55=269,82. Оскшьки загальна спшьшсть за двома факторами (269,82) бшьше тж сумарна спшьшсть (254,28), то розм1ршсть ознакового простору у кшькоста двох обрано в1рно. У табл. 7 наведено результат розрахун -ку спшьноста для амбрози. Графжи власних значень для кукурудзи, мишж> та амбрози наведеш рис. 2-4.

Аналопчна процедура перев1рки нових розм1рнос-тей була проведена для кукурудзи та мишж>. В результат! проведених розрахунюв, розм1ршсть ознакових простор1в для кукурудзи та мишж> обрано в1рно, оскшьки для ми-ш1ю сума спшьностей по факторам дор1внюе 356,87, а сумарна спшьшсть 224,78. Для кукурудзи: сума спшьно-стей по факторам - 256,14, а сумарна спшьшсть - 229,24.

6 ВИСНОВКИ

В робота розглянута задача зменшення кшькоста шфор-мацшних ознак за допомогою факторного анал1зу, а саме методу головних компонентав.

В результата проведення експериментальних досл1д-жень встановлено, що можливо перейти до нового простору з меншою к1льк1стю ознак при збереженш р1вня 1нформативност1 не менше 80%. Так для кукурудзи

Таблиця 6 - Факторш навантаження для мишш

Змшш Факторш навантаження (для мишш)

Фактор 1 Фактор 2 Фактор 3 Фактор 4 Фактор 5 Фактор 6 Фактор 7 Фактор 8

1 -0,0832 0,00065 -0,13211 0,259002 0,121068 0,141987 0,782968 -0,162445

2 -0,1140 -0,44176 -0,04021 -0,238139 -0,088848 -0,385649 -0,031048 0,477626

3 -0,0672 -0,41766 -0,03178 -0,320021 -0,026030 -0,079956 -0,299183 -0,486865

4 -0,2888 -0,64547 -0,03854 -0,235601 -0,035044 -0,041635 -0,060987 -0,088411

5 -0,3005 -0,60634 -0,03809 -0,231377 -0,056948 -0,041635 0,051629 0,100092

6 -0,3465 -0,60569 -0,10694 -0,226901 -0,054001 -0,167011 0,081305 0,191632

7 -0,3274 -0,65189 -0,05375 -0,200093 -0,124574 -0,062364 0,003541 -0,067721

8 -0,3494 -0,62809 -0,14527 -0,187012 -0,091447 -0,229901 -0,024393 -0,074242

9 -0,3689 -0,56764 -0,12693 -0,208454 -0,156561 -0,083712 0,064355 0,037291

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

10 -0,3340 -0,61098 -0,07223 -0,163582 -0,112814 -0,254564 0,072627 0,001780

Нова 1 -0,3455 -0,69667 -0,07004 -0,145086 -0,046614 0,036432 -0,012333 -0,037291

Нова 2 -0,3741 -0,67225 -0,14621 -0,171111 -0,099000 -0,089167 0,014638 0,001780

Нова 3 -0,4215 -0,69452 -0,18345 -0,149507 -0,070722 0,185336 -0,010266 0,020758

Нова 4 -0,4024 -0,66716 -0,13470 -0,159141 -0,091824 0,131594 -0,032505 -0,019124

Нова 5 -0,3559 -0,71232 -0,10534 -0,125823 -0,070673 0,001574 0,012386 0,117445

Нова 6 -0,4320 -0,67551 -0,11532 -0,144367 -0,127146 -0,024959 0,010995 -0,012405

Нова 7 -0,4828 -0,63595 -0,14191 -0,067666 -0,123461 0,020609 0,013794 -0,040740

Нова 8 -0,4398 -0,69172 -0,17675 -0,075642 -0,076265 0,158533 -0,037117 0,022666

Нова 9 -0,4870 -0,64593 -0,14645 -0,133559 -0,135250 0,132538 0,018388 0,037193

Нова 10 -0,5379 -0,62809 -0,12343 0,021363 -0,172884 0,028273 -0,012258 -0,042859

Нова 11 -0,5832 -0,62341 -0,17869 0,034503 -0,174038 0,156002 -0,036742 0,083318

Нова 12 -0,5296 -0,66663 -0,23535 0,018286 -0,136432 0,258610 -0,062037 0,079887

Нова 13 -0,6214 -0,53139 -0,06501 0,025591 -0,274416 0,009128 -0,000690 0,083146

Таблиця 7 - Результат розрахунку сшльностей для амбрози

Змшна Сшльшсть для амбрози

Вщ фактора 1 Вщ фактора 2 Значення ^-Square

1 0,345961 0,347358 0,951460

2 0,108021 0,149095 0,811392

3 0,103269 0,134854 0,855376

4 0,789116 0,858102 0,995631

5 0,809054 0,888888 0,997044

6 0,788982 0,859689 0,997014

7 0,800586 0,878628 0,997250

8 0,806656 0,882010 0,997462

9 0,818060 0,895454 0,998322

10 0,823716 0,901460 0,998506

ее

х ос X X

<и х

s ш

ГО эх го m х ш ™100 х о ГО I—

m о О х 5 ° О.™

2 S

20

Kt/ibKicTb ознак

Рисунок 2 - Графж власних значень для кукурудзи

Ктьшсть ознак

Рисунок 3 - Графж власних значень для мишш

Ki/îbKicTb ознак

Рисунок 4 - Графж власних значень для амбрози

розмiрнiсть нового простору дорiвнюе три, для мишж> вiсiм, а для амброзiï два. Рiзницю в кiлькостi ознак для дос-лiджуваних рослин, можна пояснити рiзною геометрич-ною структурою листюв, ïхньою вiдмiннiстю у морфоло-пчному та анатомiчному складу, а це в свою чергу накла-дае вщбиток на структурi багатоспектральних даних.

Практична цшшсть отриманих результатiв полягае в тому, що результати розрахунюв можуть бути корисни-ми при побудовi класифiкатора рослинних об'ектiв. Як зазначалось, при використанш факторного аналiзу, ок-ремi процедури виявлення ознак i класифшащя не потрiбнi, вони вже закладеш в самому методь, а тому класифiкатор, в алгоритм розтзнавання рослин якого буде закладений метод факторного аналiзу, буде мати бшьш просту схему побудови, а це в свою чергу дасть виграш в екож^чному сенш.

7ПОДЯКИ

Стаття пов'язана з бюджетною науково-досл^ною роботою Запорiзького нацiонального технiчного утвер-ситету «Методи, моделi та пристроï прийняття рiшень в системах розтзнавання образiв», номер державноï рее-страци 0111U000059.

СПИСОК ЛГГЕРАТУРИ

1. Загоруйко Н.Г. Методы распознавания и их применение / Н. Г. Загоруйко. - М. : Сов. радио, 1972. - 270 с.

2. Дуда Р. Распознавание образов и анализ сцен / Р. Дуда, П. Харт. - М. : Мир, 1976. - 326 с.

3. Харман Г. Современный факторный анализ / Г. Харман. - М. : Статистика, 1972. - 488 с.

4. Бююль А. SPSS: Искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей / А. Бююль, П. Цефель. - СПб.: ООО «ДиаСофтЮП», 2002. - 603 с.

5. Факторный, дискриминантный и кластерный анализ: пер. с англ. / [Дж.-О. Ким, Ч. У Мьюллер, У Р. Клекка и др.; под ред. И. С. Енюкова. - М. : Финансы и статистика, 1989. - 215 с.

6. Прикладная статистика. Классификация и снижение размерности. Справочное издание/ [С. А. Айвазян, В. М. Бухштабер,

И. С. Енюков, Л. Д. Мешалкин]. - М. : Финансы и статистика, 1989. - 607 с.

7. Купер К. Индивидуальные различия / К. Купер. - М. : Аспект Пресс, 2000. - 527 с.

8. Боровиков В. STATISTICA: искусство анализа данных на компьютере. Для профессионалов / В. Боровиков. - СПб: Питер, 2001. - 656 с.

9. Митина О. В. Факторный анализ для психологов / О. В. Митина, И. Б. Михайловская. - М. : Учебно-методический колектор, Психология, 2001. - 169 с.

10. Краснопоясовський А. С. Факторний класифжацшний аналiз за методом функщонально-статистичних випробувань / А. С. Краснопоясовський // Радюелектронш та комп'ютерш системи. - 2004. - № 4. - С. 46-50.

Стаття надшшла до редакци 01.09.2014.

Шсля доробки 27.01.2015.

Шама Е. А.

Аспирант кафедры радиотехники и телекоммуникации Запорожского национального технического университета, Запорожье, Украина

УМЕНЬШЕНИЕ РАЗМЕРНОСТИ ПРИЗНАКОВОГО ПРОСТРАНСТВА РАСТИТЕЛЬНЫХ ОБЪЕКТОВ С ПОМОЩЬЮ ФАКТОРНОГО АНАЛИЗA

В статье показана возможность уменьшения числа информативных признаков для многоспектральных данных растительного происхождения с помощью методов факторного анализа. Для исследования были использованы реальные коэффициенты отражения кукурузы, мышея и амброзии. Перед использованием метода факторного анализа была выполнена процедура проверки соответствия начального набора данных нормальному закону распределению. Факторный анализ проводился отдельно для трех растений: кукурузы, мышея и амброзии. Для каждого растения установлены размеры нового пространства, а также предоставлена качественная оценка корреляции между элементами нового и начального пространства данных. Переход к новому признаковому пространству производился при условии, что уровень информативности поддерживался на уровне не менее 80% по отношению к начальному набору данных. Для каждого вида растения была проведена процедура проверки правильности выбора количества признаков с помощью расчета общностей. Полученные результаты могут быть использованы при построении классификатора растительных объектов.

Ключевые слова: факторный анализ, признаковое пространство, спектральные коэффициенты яркости, признаки, классификатор.

Shama E. О.

Post-graduate Student of Department of Radio Engineering of Zaporizhzhya National Technical University, Ukraine

THE FUATURE SPACE DIMENSIONALITY REDUCTION OF PLANT OBJECTS BASED ON FACTOR ANALYSIS

A possibility of reducing the number of informative features for multispectral phytogenous data by means of the factor analysis method is shown in the article. For investigation there were used real reflection coefficients of maize, bristlegrass and ambrosia. Prior to usage of the factor analysis it was performed the procedure to verify an initial set of data for conformity with distribution by the normal distribution law. The factor analysis was conducted separately for three plants: maize, bristlegrass and ambrosia. Sizes of a new space were set for each plant, and also there was given quality estimation of correlation between elements of a new and initial space of the data. Transfer to new features was executed provided that a level of informativeness was maintained at a level of 80% minimum in comparison with the initial set of data. For each plant species the procedure of verification of the feature number choice correctness was performed by calculating of generalities. The obtained results can be used to construct plant objects classifier.

Keywords: factor analysis, feature space, spectral coefficients of brightness, feature, classifier.

REFERENCES

1. Zagoruyko N. G. Metody raspoznavaniya i ih primeneniye. Moscow, Sov. Radio, 1972, 270 p.

2. Duda R., Hart P. Raspoznavanie obrazov i analiz stsen. Moscow, Mir, 1976, 326 p.

3. Harman G. Sovremenniy faktorniy analiz. Moscow, Statistica. 1972, 488 p.

4. Byuyul А., Cefel P. SPSS: Iskustvo obrabotki informaci. Analiz statisticheskih dannuh i vosstanovlenie skrutuh zakonomernostey. SPb, ООО «DiaSoftYUP», 2002, 603 p.

5. Kim Dzh.-О., Muller Ch. U. Factorniy analiz: statisticheskir metodu i prakticheskie, Faktorniy, diskriminantniy i klasterniy analiz: sbornik rabot; per. s angl.; Pod. red. I. S. Enyukova. Moscow, Finansu i ststistica, 1989, 215 p.

6. Aivazyan S. A., Buhshtaber V. M., Yenyukov I. S., Meshalkin L. D. Prikladnaya statistika. Klassifikatsiya i snizheniye razmernosti. Spravochnoe izdaniye. Moscow, Finansy I statistika, 1989, 607 p.

7. Kuper K. Individualnie razlichiya. Moscow, Aspekt Press, 2000, 527 p.

8. Borovikov V. STATISTICA: iskusstvo analiza dannuh na komputere. Dlya professionalov, SPb: Piter, 2001, 656 p.

9. Mitina O. V, Mihaylovskaya I. B. Faktorniy analiz dlya psihologov. Moscow. Uchebno-metodicheskiy kolektor. Psihologiya, 2001, 169 p.

10. Krasnopoyasovskiy A. S. Faktorniy klasifikatsiynui analiz za metodom funnktsionalno-statustuchnuh vuprobuvan, Radioelektronni ta komputerni systemu, 2004, No.4, pp. 46-50.

i Надоели баннеры? Вы всегда можете отключить рекламу.