Научная статья на тему 'Классификация гиперспектральных изображений с помощью преобразования Гильберта Хуанга'

Классификация гиперспектральных изображений с помощью преобразования Гильберта Хуанга Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
585
621
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КЛАССИФИКАЦИЯ / ГИПЕРСПЕКТРАЛЬНОЕ ИЗОБРАЖЕНИЕ / ПРЕОБРАЗОВАНИЕ ГИЛЬБЕРТА ХУАНГА / CLASSIFICATION / HYPERSPECTRAL IMAGE / HILBERT HUANG TRANSFORM

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Феоктистов Артем Сергеевич, Нежевенко Евгений Семенович

Описывается метод классификации гиперспектрального изображения с предварительной трансформацией его к главным компонентам и использованием преобразования Гильберта Хуанга. Эффективность этого метода показана на примере нейросетевой классификации мультиспектрального изображения путем сравнения с традиционными методами нейросетевой классификации.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Феоктистов Артем Сергеевич, Нежевенко Евгений Семенович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

CLASSIFICATION OF HYPERSPECTRAL IMAGES BY MEANS OF HILBERT-HUANG TRANSFORM

Classification results of a hyperspectral image by means of Hilbert Huang transform are presented. The efficiency of method is demonstrated by example of neural network classification of multispectral images by comparison with traditional methods of neural network classification.

Текст научной работы на тему «Классификация гиперспектральных изображений с помощью преобразования Гильберта Хуанга»

УДК 004.93

КЛАССИФИКАЦИЯ ГИПЕРСПЕКТРАЛЬНЫХ ИЗОБРАЖЕНИЙ С ПОМОЩЬЮ ПРЕОБРАЗОВАНИЯ ГИЛЬБЕРТА - ХУАНГА

Артем Сергеевич Феоктистов

Институт автоматики и электрометрии СО РАН, 630090, Россия, г. Новосибирск, пр. Академика Коптюга, 1, аспирант, e-mail: [email protected]

Евгений Семенович Нежевенко

Институт автоматики и электрометрии СО РАН, 630090, Россия, г. Новосибирск, пр. Академика Коптюга, 1, доктор технических наук, старший научный сотрудник, ведущий научный сотрудник лаборатории информационной оптики, e-mail: [email protected]

Описывается метод классификации гиперспектрального изображения с предварительной трансформацией его к главным компонентам и использованием преобразования Гильберта - Хуанга. Эффективность этого метода показана на примере нейросетевой классификации мультиспектрального изображения путем сравнения с традиционными методами ней-росетевой классификации.

Ключевые слова: классификация, гиперспектральное изображение, преобразование Гильберта - Хуанга.

CLASSIFICATION OF HYPERSPECTRAL IMAGES BY MEANS OF HILBERT-HUANG TRANSFORM

Artem S. Feoktistov

Institute of Automation and Electrometry SB RAS. 630090, Russia, Novosibirsk, 1 Koptyuga prosp., Ph. D., e-mail: [email protected]

Evgeny S. Nejevenko

Institute of Automation and Electrometry SB RAS. 630090, Russia, Novosibirsk, 1 Koptyuga prosp., Ph. D., e-mail: [email protected]

Classification results of a hyperspectral image by means of Hilbert - Huang transform are presented. The efficiency of method is demonstrated by example of neural network classification of multispectral images by comparison with traditional methods of neural network classification.

Key words: classification, hyperspectral image, Hilbert - Huang transform.

Гиперспектральная съемка является перспективным методом дистанционного зондирования Земли. Каждый пиксель гиперспектрального изображения представляет собой вектор, компоненты которого - значения отражения или излучения света в очень узком участке спектра. В результате все изображение представляет собой гиперкуб, сечения которого - изображения в узком спектральном диапазоне. Для сегментации такого изображения при обучении с учителем необходимо выделить зоны интереса на изображении и указать класс, к которому принадлежит каждая зона. Однако компоненты векторов гиперспектральных изображений сильно коррелированны ввиду того, что спектры отра-

жения или излучения участков поверхности Земли - как правило гладкие функции (речь здесь не идет о материалах с дискретным спектром излучения), кроме того значительные участки спектров различных материалов могут быть близки между собой. Отсюда следует, что для сегментации такие спектры переизбыточны и необходимо выделять эффективную систему признаков.

Во многих работах (в т. ч. в [1]) показано, что наиболее эффективным методом сокращения пространства признаков является преобразование к главным компонентам (ГК). Однако такое преобразование проводится попиксельно, т.е. никак не учитывается пространственная структура (текстура) изображений. Это может приводить к тому, что, например, тайга и мелколесье будут отнесены к одному классу, если у них близкие спектральные диапазоны отражения. Существует множество методов пространственного анализа изображений, в настоящей работе рассмотрен сравнительно новый метод нелинейной трансформации исходного пространства признаков на основе преобразования Гильберта-Хуанга, причем он применяется не к исходному изображению, а к его главным компонентам.

Преобразования Гильберта-Хуанга (HHT) включает две части: разложение на эмпирические моды (EMD) и спектральный анализ Гильберта (HSA). Последний позволяет найти мгновенные амплитуды и мгновенные частоты сигнала, которые полностью его характеризуют.

В его основе лежит предположение, что любые данные состоят из разнообразных внутренних видов колебаний, наложенных одно на другое. Результат - конечное сложное колебание. Каждое из составляющих колебаний представляет собой функцию (intrinsic mode function - IMF, эмпирическая мода) со следующими особенностями:

1. В наборе данных число экстремумов и число нулевых пересечений должны быть равными или отличаться самое большее на единицу.

2. В любой точке данных среднее значение огибающих, определенных локальными максимумами и локальными минимумами, является нулем.

Алгоритм разложения сигнала на эмпирические моды выглядит следующим образом:

1. Определяются локальные экстремумы сигнала (минимумы и максимумы).

2. Получаются огибающие сигнала путем аппроксимации отдельно локальных максимумов и отдельно локальных минимумов кривой аппроксимации. Наиболее часто для этой процедуры используются кубические сплайны.

3. Получаются средние значения верхней и нижней огибающей m1 и разность сигнала и среднего значения h1= x(t) - m1.

4. Далее в качестве исходного сигнала берется уже функция h1 и алгоритм повторяется до выполнения условия останова. Исторически использовались два различных критерия. Первый определен как нормализованная квадратичная разность между двумя последовательными операциями отсеивания. Если эта квадратичная разность SDk меньше, чем предопределенное значение, процесс отсеивания будет остановлен. Второй критерий (S критерий) заключается в том,

что число экстремумов на последующей и предыдущей итерации должно остаться неизменным.

i(t)- ик (t )|

SD,=

t=0

к T

2 к- 11

2>2 ^ i(t)

t= 0

5. После остановки hk принимается за первую IMF функцию c1. В качестве исходного сигнала берется разность г1 = x(t) - c1 и процесс повторяется.

6. В конечном итоге мы имеем разложение сигнала на эмпирические моды в следующем виде

Завершающим шагом HHT преобразования является преобразование Гильберта, возможность которого определяется тем, что эмпирические моды, полученные в ходе разложения, являются аналитическими сигналами. Это преобразование позволяет выделить такие признаки, характеризующие сигнал, как мгновенные частоты и амплитуды каждой моды.

5(г)

H (t) = pv[ ^dz

t z ,

Z(t)=s(t)+iHs(t)=a(t)eim,

a(t ) = yls(t )2 + Hs (t )2 ,в(г ) = arctan

Ы1 ^) ,

где a(t) и 0(t)- соответственно, амплитуда и фаза сигнала во время 1 Мгновенная частота может быть вычислена по формуле:

юф = d0 фМ

Соответственно при применении преобразования Гильберта-Хуанга к изображению для каждого пикселя возникает 2^ признаков, где m - это число полученных эмпирических мод [2]. Пример применения ННТ к изображению представлен на рис. 1.

Рис. 1

На рис. 1 представлено исходное изображение и три его эмпирические моды.

Эксперимент

Для экспериментального исследования использовалась центральная часть мультиспектрального изображения Portion of Southern Tippecanoe County, размерностью 201х221 (рис. 2) [3]. На нем были выделены 8 зон интереса, разделенные путем экспертной оценки на 4 класса. Общее количество пикселов в зонах интереса 4202, каждому из них соответствует N = 12 спектральных каналов.

Рис. 2

Это изображение было преобразовано к ГК, после чего по критерию «каменистая осыпь» для классификации было отобрано 3 ГК, обеспечивающие 96,54% дисперсии данных. К каждой из ГК было применено ННТ, в результате чего было получено для каждой ГК по 5 эмпирических мод. Преобразование ННТ было проведено в программе, которая была разработана в среде Matlab, основными модулями которой являются модули преобразования Хуанга и Гильберта, для поиска локальных экстремумов реализованы операторы морфологической реконструкции, а для построения огибающих реализована аппроксимация с помощью RBF функций, и с помощью сплайнов. Для определения критерия остановки также были реализованы два варианта: критерий S и критерий SDmax.

Таким образом, имеется 3 массива, подлежащих классификации: массив спектральных компонент (МСК), массив главных компонент (МГК) и массив эмпирических мод главных компонент (МЭМГК). Решаемая задача: определение вероятности правильной классификации на каждом из массивов, т.е. выбор эффективной и наиболее экономичной системы признаков. Классификация проводилась в нейросетевом пакете программы STATSOFT. При этом конструировалось 10 нейронных сетей, из которых отбиралось 5 наилучших. Каждый массив делился случайным образом на 3 выборки: обучающую, контрольную и тестовую. Результаты обучения и классификации будут представлены вероятностями распознавания: на обучающей выборке - Роб, на тестовой - РТ.

На МСК Роб=0,916 , РТ=0,904. Как видно, почти 10% пикселов классифицированы неправильно. На МГК Роб=0,997 , РТ=0,996. Т.е. главные компоненты как признаки намного эффективнее исходных признаков. Но самые удивительные результаты получились при использовании эмпирических мод. Для МЭМГК Роб=1 , РТ=1. После получения такого результата мы решили выяснить,

какие именно из 5 мод дают 100 процентную классификацию. Были перебраны самые разные комбинации мод и оказалось, что когда мы взяли только пятые моды главных компонент, результат классификации не изменился: Роб=1 , РТ=1. Следует сказать, что пятая мода - это фактически набор пятен вместо изображения. Одно из объяснений полученного результата: каждое из этих пятен сохраняет характеристики классов, т.е. соотношение преобразованных в соответствии с модами главных компонент, причем для всего участка, характеризующего класс.

ЗАКЛЮЧЕНИЕ

Преобразование Гильберта-Хуанга в сочетании с главными компонентами - весьма эффективное преобразование мультиспектральных (а почти наверняка и гиперспектральных) изображений с точки зрения классификации. Однако здесь еще требуются серьезные исследования для определения эффективного состава мод для разных типов изображений и зон интереса - например, результаты на высоких модах будут скорее всего не такие хорошие, если зоны интереса будут соприкасаться - повлияет «размаз» моды, который может привести к пересечению классов и, соответственно, нестопроцентной классификации.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Козик В. И., Нежевенко Е. С. Выбор эффективной системы признаков при сегментации гиперспектральных изображений // Перспективы развития науки и образования, 2014, часть 7, С. 70-72.

2. N. Huang, et al., The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis, Proc. R. Soc., Lond. A 454 (1998) 903 - 995.

3. A Freeware Multispectral Image Data Analysis System: [Электронный ресурс]. URL: https://engineering.purdue.edu/~biehl/MultiSpec/hyperspectral.html

© А. С. Феокстистов, Е. С. Нежевенко, 2015

i Надоели баннеры? Вы всегда можете отключить рекламу.