Научная статья на тему 'Исследование методов классификации трудноразличимых типов растительности по гиперспектральным данным'

Исследование методов классификации трудноразличимых типов растительности по гиперспектральным данным Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
145
43
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ ЗЕМЛИ / ОБРАБОТКА ГИПЕРСПЕКТРАЛЬНЫХ ДАННЫХ / СПЕКТРАЛЬНЫЕ И ПРОСТРАНСТВЕННЫЕ ПРИЗНАКИ / REMOTE SENSING / HYPERSPECTRAL IMAGE CLASSIFICATION / SPECTRAL AND SPATIAL FEATURES

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Борзов Сергей Михайлович

В статье приведены результаты экспериментальных исследований эффективности ряда методов спектральной и спектрально-пространственной классификации крупноформатного гиперспектрального изображения при различных способах формирования обучающих выборок. Выполнено сравнение точности классификации трудноразличимы типов растительности.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Борзов Сергей Михайлович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ANALYSIS OF METHODS FOR CLASSIFYING SIMILAR LOOKING VEGETATION USING HYPERSPECTRAL IMAGERY

In this paper we present an efficiency analysis of a number of methods for spectral and spectral-spatial classification of the high-resolution hyperspectral images for different approaches to construction of the training set. Classification accuracy comparison for similar looking vegetation is carried out.

Текст научной работы на тему «Исследование методов классификации трудноразличимых типов растительности по гиперспектральным данным»

УДК 528.72:004.93

ИССЛЕДОВАНИЕ МЕТОДОВ КЛАССИФИКАЦИИ ТРУДНОРАЗЛИЧИМЫХ ТИПОВ РАСТИТЕЛЬНОСТИ ПО ГИПЕРСПЕКТРАЛЬНЫМ ДАННЫМ

Сергей Михайлович Борзов

Институт автоматики и электрометрии СО РАН, 630090, Россия, г. Новосибирск, пр. Академика Коптюга, 1, зав. лабораторией, тел. (383)330-90-33, e-mail: [email protected]

В статье приведены результаты экспериментальных исследований эффективности ряда методов спектральной и спектрально-пространственной классификации крупноформатного гиперспектрального изображения при различных способах формирования обучающих выборок. Выполнено сравнение точности классификации трудноразличимы типов растительности.

Ключевые слова: дистанционное зондирование Земли, обработка гиперспектральных данных, спектральные и пространственные признаки.

ANALYSIS OF METHODS FOR CLASSIFYING SIMILAR LOOKING VEGETATION USING HYPERSPECTRAL IMAGERY

Sergey M. Borzov

Institute of Automation and Electrometry SB RAS, 630090, Russia, Novosibirsk, 3 Аkademik Koptyug Prospect, head of laboratory, tel. (383)330-90-33, e-mail: [email protected]

In this paper we present an efficiency analysis of a number of methods for spectral and spectral-spatial classification of the high-resolution hyperspectral images for different approaches to construction of the training set. Classification accuracy comparison for similar looking vegetation is carried out.

Key words: remote sensing, hyperspectral image classification, spectral and spatial features.

Введение. В настоящее время при исследовании Земли из космоса все более широкое применение находят технологии гиперспектральной (ГС) съемки в видимом и инфракрасном диапазонах. Отличительными особенностями регистрируемых при такой съемке данных является узкая ширина и большое количество спектральных каналов, потенциально позволяющие осуществлять анализ тонкой структуры спектров отражения отдельных участков поверхности и их классификацию [1]. Однако на практике изображения большинства объектов оказываются неоднородны, несмотря на то, что соседние пиксели с большой долей вероятности относятся к одному и тому же классу (как правило, сцена состоит из однородных регионов). Для решения данной проблемы применяются одновременный анализ спектральных и пространственных признаков [2]. В частности, широкое распространение получили методы, осуществляющие предварительное сглаживание исходных изображений или постобработку получаемых картосхем с целью выбора наиболее достоверного класса пикселя с учетом его ближайшей окрестности.

Достоверную оценку эффективности методов классификации ГС изображений можно получить лишь на основе сопоставления результатов обработки реальных данных и карт наземных наблюдений. Во многих работах подобные исследования выполняются на небольших тестовых фрагментах. При этом в качестве обучающей выборки используется случайный набор пикселей каждого класса, а в качестве контрольной - все оставшиеся. Такой подход позволяет оперативно получить требуемую оценку, однако ее объективность вызывает определенные сомнения в связи с малым объемом обучающих выборок, а также с непрактичностью способа их формирования.

В настоящей работе выполнены сравнительные исследования эффективности метода максимального правдоподобия и спектрально-пространственных алгоритмов на его основе при различных способах формирования обучающих выборок (ОВ) на примере классификации крупноформатного гиперспектрального изображения.

Исходные данные. Исследование эффективности методов классификации данных ДЗЗ проводилось на примере обработки гиперспектрального изображения (рис. 1, а), полученного в рамках программы AVIRIS (Airborne Visible Infrared Imaging Spectrometer) на опытном полигоне Индиан Пайнс (штат Индиана, США). Его размер - 614 х 2677 пикселей, разрешение - 20 м/пикс., число каналов - 220 в диапазоне 0.4-2.5 мкм.

а) б)

Рис. 1. Исходные данные:

а) RGB композит анализируемого изображения, б) эталонная картосхема классов

По результатам наземных наблюдений выполнено разбиение данного изображения на 58 классов (рис. 1, б), в частности, 15 классов кукурузы и 18 сои, отличающиеся методиками возделывания почвы. Общее количество пикселей в размеченной части изображения 334 245, из них 128 719 (39 %) различные классы кукурузы, 91 770 (27 %) - сои, 63 706 (19 %) - лес, 15 % пикселей относятся к прочим 23 классам.

Сравнение карты наземных наблюдений с изображением показывает, что многочисленные небольшие особенности, визуально различимые на изображении, на ней не отмечены. Кроме того, из-за ранней даты регистрации изображения (12 июня), на ряде участков всходы растительности составляют только малый процент покрытия. Так, область, отмеченная на карте как "Согп-тШГ, в действительности содержит по большей части участки голой почвы и остатки прошлогодней растительности (рис. 2). Таким образом, не следует ожидать, что каждый пиксель определенной области будет отнесен к классу с ней связанному. Интегральная разделимость классов, оцененная как доля верно классифицированных пикселей при применении метода максимального правдоподобия (с обучением по всем данным), составляет лишь 76.25 %.

Рис. 2. Всходы кукурузы, регион согп-шш1 (данные с сайта https://purr.purdue.edu)

Экспериментальные результаты. В данной работе сравнивается эффективность методов классификации ГС изображений, учитывающих локальные окрестности пикселей, при различных способах формирования ОВ. Рассматриваются алгоритмы, использующие как предварительное пространственное усреднение исходных данных (I), так и постобработку картосхем попиксельной спектральной классификации (II). Обе процедуру пространственной обработки выполняются скользящим окном размером 7 х 7 пикселей, а в качестве спектральной классификации используется метод максимального правдоподобия (ML).

Исследование указанных алгоритмов выполняется при трех способах формирования обучающей выборки:

- случайным образом выбирается 25 % пикселей из всего изображения;

- случайным образом выбирается 50 % пикселей из левой половины изображения;

- выбираются 50 % пиксели «темных» клеток по периодической клетчатой структуре в виде шахматной доски.

Оценка эффективности классификации выполняется путем сопоставления сформированных картосхем классов и подспутниковых данных (рис. 1, б). В качестве критерия используется так называемая результирующая точность классификации (overall accuracy), определяемая как выраженное в процентах отношение количества верно классифицированных пикселей к их общему количеству. При этом точность классификации рассчитывается:

- по всем классам;

- по основным классам (с объединением подклассов кукурузы и сои в класс кукуруза и класс соя в результирующей картосхеме).

Результаты классификации крупноформатного изображения перечисленными выше методами при 20 и 100 используемых спектральных признаков представлены в рис. 3, 4. Можно видеть, что при ОВ, сформированной случайным образом из всего изображения, большую результативность демонстрирует метод, основанный на предварительном сглаживании изображения. При 20 признаках он позволяет для основных классов повысить точность классификации относительно спектральной на 7-12 %, а при 100 признаках - на 20 % и более, в то время как метод, основанный на постобработке картосхем попик-сельной классификации для 20 признаков приводит к увеличению точности лишь на 2 %, а для 100 - от 2 до 5 %.

Однако при выборе ОВ лишь из части изображения эффективность классификации оказывается значительно ниже, а учет пространственных признаков не позволяет добиться ее существенного повышения в не зависимости от количества используемых спектральных каналов. Это объясняется тем, что пиксели одного и того же класса разных пространственных зон снимка имеют несколько отличающиеся параметры, и в результате ОВ, сформированная по части изображения, плохо характеризуют соответствующие классы на всем изображении.

Отметим, что из двух используемых способов формирования ОВ из части изображения более эффективным оказывается способ, основанный на клетчатой структуре. Он, очевидно, более точно характеризует параметры каждого класса на всем изображении, поскольку в определенной степени исключает влияние неоднородности характеристик регистрирующей системы по полю зрения.

а) б)

Рис. 3. Точность методов классификации на базе МЬ при различных обучающих выборках в случае использования 20 (а) и 100 (б) признаков для основных классов

Рис. 4. Точность методов классификации на базе МЬ при различных обучающих выборках в случае использования 20 (а) и 100 (б) признаков для всех классов

Заключение. Выполнено сравнение эффективности спектральной и спектрально-пространственной классификации крупноформатных гиперспектральных изображений при различных способах формирования обучающих выборок. Первый способ заключается в случайном выборе пикселей из всего изображения, второй - из некоторой его части. Установлено, что при формировании ОВ из всего изображения точность классификации основных типов поверхности составила 72,5 %, а пространственная обработка позволила ее повысить до 93,1 %. Точность классификации при обучении по части изображения не превысила 56,8 %. Применение предварительной пространственной обработки улучшило результаты на ~3 %.

В случае разделения подклассов кукурузы и сои при формировании ОВ из всего изображения точность составила 53,8 %, а пространственная обработка позволила ее повысить до 72,1 %. При формировании ОВ из части изображения точность составила лишь 27,9 %, а применение пространственной обработки практически нечего не дало. При использовании большего количества признаков расхождение в оценках еще более значительное. Так, в случае 100 признаков для ОВ, сформированной из всего изображения, точность составила 59,6 %, а после предварительной пространственной обработки достигла 89,2 %, тогда как для ОВ близкого объема, сформированной из части изображения, точность не превысила 43,1 % и практически не менялась при пространственной обработке.

Таким образом, показано, что качественная классификация трудноразличимых подклассов растительности достижима только при использовании обучающих выборок с максимальной степенью распределения пикселей по изображению.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Бондур В. Г. Современные подходы к обработке больших потоков гиперспектральной и многоспектральной аэрокосмической информации // Исследование Земли из космоса. -2014. - № 1. - С. 4-16.

2. Борзов С. М., Потатуркин О. И. Исследование эффективности спектрально-пространственной классификации данных гиперспектральных наблюдений // Автометрия. - 2017. -№ 1. - С. 32-42.

© С. М. Борзов, 2017

i Надоели баннеры? Вы всегда можете отключить рекламу.