УДК 004.852; 004.855.5
НЕЙРОСЕТЕВОЙ МЕТОД ДЕШИФРАЦИИ СПУТНИКОВЫХ СНИМКОВ В ЗАДАЧАХ ОБНАРУЖЕНИЯ НЕСАНКЦИОНИРОВАННЫХ СВАЛОК
Н.В. Акинина
Рассмотрены преимущества использования древовидного нейросетевого классификатора, состоящего из совокупности простых (бинарных) классификаторов, в задачах обнаружения несанкционированных свалок мусора. Рассмотрено использование анализа главных компонент как алгоритма понижения размерности пространства рассматриваемых признаков. Приведены результаты экспериментальных исследований, доказывающие эффективность использования описанного метода дешифрации спутниковых снимков.
Ключевые слова: метод парзеновского окна, алгоритм AdaBoost, алгоритм нечетных к-средних, текстурные признаки Харалика, Анализ главных компонент, древовидный нейросетевой классификатор, бинарный классификатор, метод сопряженных градиентов.
Введение. Несанкционированные свалки являются одним из значимых факторов загрязнения, оказывающих негативное воздействие на природные компоненты: атмосферу, водные источники, почву, растительный и животный мир. Размещаясь непосредственно на почвенном покрове, свалки выводят из сельскохозяйственного оборота и биосферы значительную часть земель, привнося в них загрязняющие вещества. При анализе местоположения свалок была обнаружена их приуроченность к следующим природным объектам: к лесным массивам - 94%, к лугам - 1%, к пустырям -1.5%, к берегам водоемов - 3%, к оврагам - менее 1%. Установлено, что чаще свалки встречаются у транзитных транспортных путей (шоссе, железная дорога и т.п.), гаражей, в местах проживания людей (частный сектор городов, садоводческие товарищества, отдаленные населенные пункты и т. п.).
Постановка задачи. В данной статье исследуется задача поиска несанкционированных свалок, которая может быть решена при помощи дешифрации спутниковых снимков и составлении карт местности, с отмеченными на них местами складирования отходов. При рассмотрении задачи обнаружения несанкционированных свалок одной из главных проблем является минимизация количества неправильно распознанных образов на спутниковом снимке. Следовательно, это является одним из основных критериев при выборе метода классификации выделенных на снимке образов.
На данный момент существует много способов распознавания образов на спутниковых снимков, например:
Метод парзеновского окна — метод байесовской классификации, основанный на непараметрическом восстановлении плотности по имеющейся выборке. В основе подхода лежит идея о том, что плотность выше в тех точках, рядом с которыми находится большое количество объектов выборки. Данный метод обладает следующими недостатками:
- влияние локальных сгущений на точность классификации. Проявляется в тех случаях, когда распределение объектов в пространстве значительно неравномерно, и одно и то же значение ширины окна h приводит к чрезмерному сглаживанию плотности в одних местах, и недостаточному сглаживанию в других. Проблему решают окна переменной ширины;
- «проклятие» размерности [1].
Алгоритм AdaBoost (сокр. от adaptive boosting) является мета-алгоритмом, в процессе обучения строит композицию из базовых алгоритмов обучения для улучшения их эффективности. В ходе выполнения данного алгоритма формируется сложный классификатор, состоящий из набора простых. AdaBoost является алгоритмом адаптивного бустинга в том смысле, что каждый следующий классификатор строится по объектам, которые плохо классифицируются предыдущими классификаторами. Данный алгоритм имеет следующие недостатки:
- склонность к переобучению при наличии значительного уровня шума в данных;
- требует достаточно длинных обучающих выборок;
- бустинг может приводить к построению громоздких композиций, состоящих из сотен алгоритмов. Такие композиции исключают возможность содержательной интерпретации, требуют больших объёмов памяти для хранения базовых алгоритмов и существенных затрат времени на вычисление классификаций [2].
Кроме перечисленных, существуют и другие алгоритмы распознавания образов на спутниковых снимках, недостатки которых аналогичны вышеперечисленным.
Из всего вышесказанного следует, что необходимо разработать такой алгоритм классификации образов, который будет свободен от всех перечисленных недостатков, а также будет обладать приемлемой точностью распознавания несанкционированных свалок при сохранении быстродействия.
Теоретическая часть. Обобщенная схема процесса дешифрации спутникового снимка приведена на рис. 1.
Входными данными модели является спутниковый снимок B = {bij } bij = {bijk e [ 1 .I]; j e [ 1, J];k e [ 1, K]; byk e [-1,1 ], где by - пиксель в i-й строке, j-м столбце, bijk - нормированная спектральная яркость
пискселя в k-ом спектральном канале, полученная из диапазона [0,255], К - количество спектральных каналов.
Результатом выполнения процесса дешифрации спутникового снимка будет карта М с отмеченными на ней свалками (1):
M = ^(В);М = {ту } mij е [ 1, L];L е (1)
где ту - индекс класса, к которому принадлежит пиксель, Ь - количество классов.
Рис. 1. Обобщенная схема процесса дешифрации спутникового снимка
Процесс дешифрации спутникового снимка состоит из следующих
этапов.
1. Сегментация.
На данном этапе на спутниковом снимке выделяются образы объектов, которые будут в дальнейшем классифицированы. В качестве алгоритма сегментации выбран алгоритм нечетных к-средних. Суть алгоритма состоит в разделении множества элементов векторного пространства на заранее известное число сегментов. на каждой итерации перевычисляется центр масс для каждого кластера, полученного на предыдущем шаге, затем векторы разбиваются на кластеры вновь в соответствии с тем, какой из новых центров оказался ближе по выбранной метрике. Алгоритм завершается, когда на какой-то итерации не происходит изменения центра масс кластеров. Это происходит за конечное число итераций, так как количество возможных разбиений конечного множества конечно, а на каждом шаге суммарное квадратичное отклонение не увеличивается, поэтому зацикливание невозможно.
Таким образом, Б = segm(B); Б = (sq); sq п ьд'= 0, если д Ф д';
ьд п = ьд , если д = д= В, где ьд - связанная область на спутниковом снимке В - сегмент.
2. Описание образов.
V' = йеьо(Б); V' = {у'д \;у'д = (у^ \п'=[ 1, И1],
где у'д - нормированный вектор признаков сегмента ьд ; N - размерность пространства признаков.
Существуют следующие способы описания текстур:
- описание текстур с помощью признаков, рассчитываемых по гистограмме изображения;
- спектральные текстурные характеристики;
- энергетические характеристики Лавса;
- текстурные признаки Харалика;
- прочие способы.
Харалик предложил описывать текстуру, покрывающую изображение, характеристиками специальных матриц вхождений, рассчитываемых по изображению. Каждая матрица вхождений описывает структуру текстуры в соответствующем направлении от одного края обрабатываемого изображения к другому. По результатам расчета характеристик матриц составляется вектор текстурных признаков изображения, которые могут рассматриваться как характеристики текстуры, покрывающей каждый пиксель изображения. В случае изображения В данный снимок необходимо обойти с помощью окна размером Oh на Oh пикселей, рассчитывая для каждого окна набор текстурных признаков Харалика. Значение Oh должно быть выбрано в соответствии с решаемой задачей.
Расчет текстурных признаков Харалика может быть эффективно распараллелен средствами современных вычислительных систем. Недостатком текстурных признаков Харалика является их меньшая компактность, по сравнению с соответствующим вектором энергетических характеристик Лавса, что объясняется необходимостью расчета одних и тех же характеристик для нескольких матриц вхождений. На практике же последний недостаток не играет существенной роли в случае, если текстурные признаки Харалика лучшим образом, с точки зрения качества работы классификатора, описывают классифицируемые текстуры [3, 4].
3. Понижение пространства признаков.
Анализ главных компонент (principal component analysis, PCA) — один из основных способов уменьшить размерность данных, потеряв минимальный объем информации. Иногда PCA называют преобразованием Карунена — Лоева или преобразованием Хотеллинга. PCA состоит в линейном ортогональном преобразовании входного вектора X размерности n в выходной вектор Y размерности p, где p< n - при этом компоненты вектора Y являются некоррелированными и общая дисперсия после преобразования остается неизменной [5].
Таким образом,
V = pca(V ); V = {vq \vq= {vqn \,n e [ 1, N]; N << N.
4. Классификация.
В качестве классификатора применяется древовидный нейросетевой классификатор, схема которого приведена на рис. 2.
н
2 I 3 )
Рис. 2. Принципиальная схема древовидного нейросетевого
классификатора
Из рис. 2 видно, что для классификации образов используется сложный классификатор, состоящий из набора простых (бинарных) классификаторов [6]. Каждый простой классификатор выполняет разбиение
'.Н ® Н+ и Н-;Н+ п Н- = 0 . Разбиения продолжаются до тех пор, пока не будет достигнут сток дерева. Как только классифицируемый образ достигнет стока, образ является отнесенным к одному из классов.
В качестве способа обучения простых классификаторов используется метод сопряженного градиента. Метод сопряжённых градиентов — итерационный метод для безусловной оптимизации в многомерном пространстве. Основным достоинством метода является то, что он решает квадратичную задачу оптимизации за конечное число шагов. Метод гарантирует сходимость за конечное число шагов, а нужная точность может быть достигнута значительно раньше. Основная проблема заключается в том, что из-за накопления погрешностей может нарушаться ортогональность базисных векторов, что ухудшает сходимость.
5. Визуализация.
После проведения классификации выделенных образов получается обработанный спутниковый снимок с выделенными на нем местами несанкционированных свалок.
Практическая часть. В ходе проведения экспериментальных исследований было проведено сравнение следующих алгоритмов и методов:
29
- алгоритм дешифрации спутниковых снимков на основе древовидного нейросетевого классификатора (далее FF);
- алгоритм парзеновского окна (далее PW);
- Алгоритм АёаВооБ^далее AB).
Эксперимент заключался в обработке набора спутниковых снимков для тестовой местности. В качестве источника спутниковых снимков была использована камера ТМ, установленная на космическом аппарате Landsat 5. В качестве тестовой местности была использована средняя полоса России (Рязанская область) - по 10 снимков для трех отрезков времени:
- лето 2009 (тестовая выборка 1);
- лето 2010 (тестовая выборка 2);
- лето 2011 (тестовая выборка 3).
Для каждого спутникового снимка была составлена эталонная карта с применением сервиса OpenStreetMaps, Google Maps, Yandex Maps.
В качестве метрики точности было использовано количество правильно классифицированных пикселей на спутниковых снимках, выраженное в процентах.
В качестве временной метрики было использовано время выполнения алгоритма (без учета процесса обучения, если таковой присутствует), выраженной в миллисекундах.
Результаты экспериментальных исследований приведены в таблице.
Результаты экспериментальных исследований
Тестовая выборка 1 Тестовая выборка 2 Тестовая выборка 3
Точность, % Время, мс Точность, % Время, мс Точность, % Время, мс
FF 99,9 7,1 99,8 7,3 98,8 6,9
PW 95,3 8,3 96,0 7,4 93,9 8,1
AB 96,8 7,9 95,7 8,2 97,1 7,4
Заключение. Разработанный метод позволяет эффективно находить на спутниковых снимках места несанкционированного складирования отходов. По сравнению с другими алгоритмами точность обнаружения в среднем на 4,2 % и снизить временную сложность в среднем в 1,2 раз, что является следствием:
- применения РСА для улучшения временных характеристик процесса распознавания образов;
- применения нейросетевого древовидного классификатора, что позволяет повысить качественные характеристики метода.
Список литературы
1. Ting Hu, Jun Fan, Qiang Wu, Ding-Xuan Zhou. Learning Theory Approach to Minimum Error Entropy Criterion. ArXiv e-prints, arXiv: 1208.0848v2 [cs.LG], 2013.
2. Tingxi Wen, Zhongnan Zhang.: Effective and Extensible Feature Extraction Method Using Genetic Algorithm-Based Frequency-Domain Feature Search for Epileptic EEG Multi-classification. ArXiv e-prints, ar-Xiv:1701.06120v1 [cs.LG], 2017.
3. Haykin S., Neural Networks: A Comprehensive Foundation, New Jersey: Prentice Hall, 1999.
4. David A. Forsyth, Jean Ponce, Computer Vision: A Modern Approach, Prentice Hall, New. Jersey, 2003.
5. Levy A., Lindenbaum M. Sequential Karhunen-Loeve basis extraction and its application to images. // IEEE Trans. Image Processing, 9, 8, August 2000. P. 1371 - 1374.
6. Akinin M.V., Konkin Y.V., Nikiforov M.B. Using Kitano's grammar encoding for finding optimal multilayer artificial neural network without feedback in image processing problems. // Science and Education: Materials of the III International research and practice conference (vol. I). Germany, Munich: Vela Verlag Waldkraiburg, 2013. P. 82 - 88.
Акинина Наталья Викторовна, асп., асс., natalya.akininaagmail. com, Россия, Рязань, Рязанский государственный радиотехнический университет
NEURAL NETWORK METHOD OF DECRYPTION OF SATELLITE IMAGES IN THE PROBLEM OF DETECTION OF UNA UTHORIZED DUMPS
N. V. Akinina
The advantages of using a tree-like neural network classifier consisting of a set of simple (binary) classifiers in problems of detection of unauthorized garbage dumps. We consider the use of principal component analysis as a dimension reduction algorithm space to treat the symptoms. The results of experimental studies demonstrating the effectiveness of using this method of detection of unauthorized dumps.
Key words: Parzen 's window method, AdaBoost algorithm, k-means clustering, Ha-ralik's textural features, principal component analysis, neural network classifier tree, a binary classifier, conjugate gradient method.
Akinina Natalia Viktorovna, postgraduate, assistant, natalya. akininaagmail. com, Russia, Ryazan, Ryazan State Radio Engineering University