УДК 528.72:004.93
СПЕКТРАЛЬНО-ПРОСТРАНСТВЕННАЯ КЛАССИФИКАЦИЯ ТИПОВ ПОДСТИЛАЮЩЕЙ ПОВЕРХНОСТИ ПО ГИПЕРСПЕКТРАЛЬНЫМ ДАННЫМ
Сергей Михайлович Борзов
Институт автоматики и электрометрии СО РАН, 630090, Россия, г. Новосибирск, пр. Академика Коптюга, 1, заведующий лабораторией, (383)330-90-33, e-mail: [email protected]
Андрей Олегович Потатуркин
Институт автоматики и электрометрии СО РАН, 630090, Россия, г. Новосибирск, пр. Академика Коптюга, 1, аспирант, e-mail: [email protected]
В статье приведены результаты экспериментальных исследований эффективности ряда методов спектрально-пространственной классификации гиперспектральных данных. Выполнено сравнение точности классификации тестового изображения с применением предварительной сегментации и с использованием сглаживания данных скользящим окном.
Ключевые слова: дистанционное зондирование Земли, обработка гиперспектральных данных, спектральные и пространственные признаки.
SPECTRAL-SPATIAL CLASSIFICATION OF HYPERSPECTRAL REMOTE SENSING IMAGE
Sergey M. Borzov
Institute of Automation and Electrometry SB RAS, 630090, Russia, Novosibirsk, 1 Acad. Koptyu-ga, head of laboratory, tel. (383)330-90-33, e-mail: [email protected]
Andrey O. Potaturkin
Institute of Automation and Electrometry SB RAS, 630090, Russia, Novosibirsk, 1 Acad. Koptyu-ga, post-graduate student, e-mail: [email protected]
This article provides the results of experimental research of effectiveness of various spectral-spatial hyperspectral data classification methods. Classification effectiveness is evaluated based on comparison of test image classification with the use of pre-classification segmentation and sliding-window smoothing.
Key words: remote sensing, hyperspectral image classification, spectral and spatial features.
Введение. При гиперспектральной съемке поверхности Земли из космоса изображения большинства объектов оказываются неоднородны, несмотря то, что соседние пиксели с большой долей вероятности относятся к одному и тому же классу (как правило, сцена состоит из однородных регионов). Это обусловлено несколькими факторами. Во-первых, спектральный состав пикселя является комбинацией спектральных характеристик объектов, образующих этот пиксель. Во-вторых, различные участки поверхности оказываются в разных условиях. Одни освещены прямым солнечным излучением, другие находятся в тени и освещаются отраженным или рассеянным светом. Кроме того, они имеют различную ориентацию поверхности по отношению к источнику освещения.
К значительным искажениям результирующего спектра так же приводит переотражение между слоями в системах вода-почва, растительность-почва и т.п.
Для решения данной проблемы целесообразно применять одновременный анализ спектральных и пространственных признаков [1]. В частности, широкое распространение получили методы, осуществляющие предварительную сегментацию изображения (деление его на однородные в физическом плане области). После этого каждый сегмент (область) рассматривается как отдельный объект и выполняется его классификация на основе усредненных по пикселям спектральных характеристик, либо посредствам выбора наиболее часто встречающегося в границах сегмента (доминирующего) класса в карте попиксельной спектральной классификации. Такой подход в последнее десятилетие активно развивается и является одним из наиболее перспективных для обработки данных гиперспектральной съемки [2]. Его эффективность в значительной степени определяется корректностью выполнения процедуры предварительной сегментации изображений, которая особенно затруднена при обработке снимков природных территорий среднего и высокого разрешения [3].
В качестве альтернативы может быть применен подход, основанный на непосредственном использовании для классификации каждого пикселя его окрестности [4]. В этом случае с учетом пространственной связности данных принимается допущение, что пиксель изображения зависит от своего окружения и каждый из соседей может рассматриваться как гипотеза при его уточнении. Способы выбора наиболее достоверной из имеющихся гипотез рассматриваются различные. В простейшем случае на этапе предварительной обработки может быть выполнено равно-взвешенное или медианное сглаживание.
В настоящей работе выполнены сравнительные исследования эффективности перечисленных подходов на примере классификации одного из широко известных тестовых фрагментов гиперспектрального изображения, предлагаемого в открытом пакете MultiSpec.
Экспериментальные исследования. Данное изображение получено в рамках программы AVIRIS (Airborne Visible Infrared Imaging Spectrometer) на опытном полигоне Индиан Пайс (штат Индиана, США). Фрагмент имеет размер - 145х145 пикселей, разрешение - 20 м/пикс., число каналов - 220 в диапазоне 0.4-2.5 мкм., при этом 20 каналов, содержащих высокий уровень шума, при проведении исследований удалены из рассмотрения. На изображении представлены: магистраль, железная дорога, с/х культуры, лес, жилые постройки (рис. 1). По результатам наземных наблюдений выполнено разбиение данного фрагмента на 16 классов, 14 из которых различные типы растительности. В частности, 3 класса кукурузы и 3 сои, отличающиеся методиками возделывания почвы. При этом, отмечается что, данное разбиение в большей степени отражает классы использования земли, а не классы сельхоз культур, поскольку из-за ранней даты регистрации изображения (12 июня) всходы однолетней растительности составляют только малый процент покрытия. Часть территории не размечена и в дальнейшем в работе не рассматривается.
а б
Рис. 1. Исходные данные: а - исходное изображение; б - карта классов для данного фрагмента
Сравнивалась эффективность нескольких алгоритмов спектрально-пространственной классификации. Кратко опишем каждый:
I. Выполняется избыточная сегментация и, независимо, попиксельная классификация. Затем в рамках образованных сегментов определяется наиболее часто встречающийся класс, и все пиксели сегмента относятся к этому классу, т.е. класс сегмента определяется в результате голосования пикселей.
II. Выполняется избыточная сегментация, затем в рамках образованных сегментов значения пикселей каждого канала усредняются, и осуществляется классификация сегментов по усредненным спектрам.
III. Выполняется попиксельная классификация, затем - обработка сформированной карты скользящим окном с отнесением центрального элемента к наиболее часто встречающемуся классу. Такой фильтр получил в англоязычной литературе название «Majority analysis» [5] - мажорная обработка.
IV. Выполняется предварительное сглаживание данных каждого канала скользящим окном посредствам медианной фильтрации, затем - попиксельная классификация.
Для обучения во всех случаях использовалась случайная выборка пикселей каждого класса (для классов, представленных на изображении большим количеством пикселей, по 50, малым - по 15). Классификация выполнялась методом опорных векторов с линейной разделяющей функцией по 20 главным компонентам изображения.
Первые два из сравниваемых алгоритмов предполагают использование предварительной сегментации, и их эффективность значительно зависит от выполнения именно этой процедуры. В наших исследованиях мы намерено не пытались визуально контролировать качество сегментации, поскольку при автоматическом решении практических задач такая возможность отсутствует. Использовались варианты сегментации, основанной на выделении границ, с параметрами, обеспечивающими заведомо избыточное разбиение изображения. На рис. 2 приведен пример такого разбиения, а также композит главных компонент исходных данных до и после усреднения по сегментам.
Результирующая общая точность классификации, оцениваемая как доля верно классифицированных пикселей (в процентах), при различном количестве сегментов представлена в табл. 1. Здесь во второй колонке для сравнения приведена точность попиксельной спектральной классификации данного фрагмента.
а б в
Рис. 2. Сформированные сегменты (а) и композит главных компонент изображения до и после усреднения по сегментам (б, в)
Таблица 1
Эффективность классификации изображения с учетом параметров сегментов
Спектральная Спектрально-пространственная классификация
классификация I при разном количестве II при разном количестве
сегментов сегментов
176 361 730 1283 176 361 730 1283
Общая 76.7 89.3 90.0 88.6 88.1 91.2 93.3 92.9 91.3
точность (%)
Видно, что алгоритмы I и II позволяют повысить точность классификации более чем на 10%. При этом процедуры, использующие усреднение данных по сегменту на этапе предварительной обработки, более эффективны. Из [6] известно, что оптимизация процедуры сегментации позволяет повысить точность классификации с использованием первого из перечисленных алгоритмов до 92.4%, второй же достигает схожих значений и без этого.
При выполнении второй пары алгоритмов классификации принципиальным является размер окна обработки, поэтому для них результаты приведены при различных значениях этого параметра (табл. 2).
Таблица 2
Эффективность классификации изображения с учетом параметров локальных окрестностей
Спектрально-пространственная классификация
III с различным размером IV с различным размером
окрестности окрестности
3х3 5х5 7х7 9х9 3х3 5х5 7х7 9х9
Общая точность (%) 83.5 86.0 86.9 87.5 84.9 91.4 92.1 91.7
В данном случае также лучшая эффективность достигается при использовании предварительного сглаживания данных. Причем следует отметить, что при изменении размера окна обработки от 5х5 до 9х9 результаты наблюдаются близкие. Наивысшее же значение точности достигнуто при сочетании предварительной и пост классификационной обработки (94.7%). На рис. 3 приведены карты классов, полученные с применением различных алгоритмов классификации.
а б в
Рис. 3. Результаты классификации:
а - попиксельная спектральная, б - голосование пикселей в сегментах, в - с предварительным усреднением по сегментам
Заключение. Показано, что выполнение процедур предобработки изображений путем учета близкорасположенных пикселей позволяет повысить точность классификации обрабатываемого фрагмента на 15-17%. При этом принципиально важным является то, что указанные результаты достигаются без применения визуального контроля качества сегментации данных. Для дальнейшего повышения эффективности обработки гипер- и мультиспектральных изображений представляется перспективным развитие рассмотренного подхода в части сочетания выбора наиболее информативных спектральных признаков и применения процедур адаптивного 3D сглаживания.
Работа выполнена при поддержке РФФИ (грант № 13-07-12202).
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Plaza A., Benediktsson J.A., Boardman J.W., Brazile J., Bruzzone L., Camps-Valls G., Chanussot J., Fauvel M., Gamba P., Gualtieri A., Marconcini M., Tilton J.C., Trianni G. Recent advances in techniques for hyperspectral image processing // Remote Sensing of Environment, 2009, V. 113. P.110-122.
2. Бондур В.Г. Современные подходы к обработке больших потоков гиперспектральной и многоспектральной аэрокосмической информации // Исследование Земли из космоса. 2014. №1. С. 4-16.
3. Пестунов И.А., Синявский Ю.Н. Алгоритмы кластеризации в задачах сегментации спутниковых изображений // Вестник КемГУ. 2012. № 4/2 (52). С.110-125.
4. Chen, C.; Li, W.; Tramel, E.W.; Cui, M.; Prasad, S.; Fowler, J.E. Spectral-spatial preprocessing using multihypothesis prediction for noise-robust hyperspectral image classification. IEEE J. Sel. Top. Appl. Earth Observ. Remote Sens. 2014, 7, 1047-1059.
5. Thomas M. Lillesand, Raiph W. Kiefer, Jonathan W. Chipman, Remote Sensing and Image Interpretation. - 2004. - John Wiley & Song, Inc. - 763 P
6. Fauvel M, Tarabalka Y, Benediktsson J, Chanussot J, Tilton J. Advances in spectral-spatial classification of hyperspectral images. Proc. IEEE. 2013;101 (3 SI):652-675.
© С. М. Борзов, А. О. Потатуркин, 2015