УДК 528.7:004.93'1
Вестник СПбГУ. Сер. 7. 2013. Вып. 4
А. А. Симинеев, Н. А. Позднякова, Е. И. Тарасова
ОЦЕНКА ВОЗМОЖНОСТИ ПРИМЕНЕНИЯ СИНГУЛЯРНЫХ ЧИСЕЛ ДЛЯ КЛАССИФИКАЦИИ ЦИФРОВЫХ ИЗОБРАЖЕНИЙ ПЛОЩАДНЫХ ОБЪЕКТОВ ЗЕМНОЙ ПОВЕРХНОСТИ
Изображение земной поверхности на цифровом снимке представляет собой растр: матрицу B = (bi,j)m,n, состоящую из отдельных элементов (пикселов) bi,j, записанных в m строк (i = 1, 2, ..., m) и n столбцов (j = 1, 2, ..., n). Каждый пиксел характеризуется своим местоположением (i, j) и яркостью bi,j. Множества таких элементов, объединенных по величине яркости, образуют на снимке изображения отдельных объектов земной поверхности.
Для распознавания объектов по их изображениям применяются различные методы компьютерной классификации [1], в том числе и с использованием сингулярного разложения матриц (общепринятая аббревиатура — SVD) [2]. Несмотря на то, что SVD-разложение, возможно, является самым важным матричным разложением из всех известных [3], оно не нашло широкого применения в отечественной практике компьютерного анализа изображений.
Выделим в матрице B подматрицу Bk, состоящую из k строк и k столбцов (k < min (m, n). Тогда ее сингулярное разложение имеет вид [2, 3]
Bk = USVT,
(1)
где и, VТ — ортогональные матрицы размера (к х к), символ тильда у матрицы V введен для отличия матрицы от вектора поправок V (см. ниже); Т — верхний индекс, обозначающий операцию транспонирования матриц;
X =
— диагональная матрица размера (k х к);
>к J
стрст2 , • • •, ак — сингулярные числа (стх > ст2 > ••■ >ак > 0).
В отличие от матриц и и V, обладающих свойствами лишь частичной однозначности, сингулярные числа ст; (I = 1, 2,...,к) определяются однозначно [3]. Известно [2, 3], что количество чисел а ^ 0 соответствует рангу матрицы, а ее число обусловлен-
Симинеев Алексей Александрович — кандидат технических наук, доцент, Санкт-Петербургский государственный университет; e-mail: [email protected]
Позднякова Наталия Александровна — старший преподаватель, Санкт-Петербургский государственный университет; e-mail: [email protected]
Тарасова Евгения Ивановна — студент, Санкт-Петербургский государственный университет; e-mail: [email protected]
© А. А. Симинеев, Н. А. Позднякова, Е. И. Тарасова, 2013
ности к2 = атах/ ат;п (где атах, ат;п — максимальное и минимальное сингулярные числа).
Существующие методы распознавания, использующие аз ложение, ос-
новываются на применении всех матриц разложения (1). Так, в [4] предлагается использовать наборы троек, состоящих из сингулярного числа и соответствующих ему левого и правого сингулярных векторов матриц и и V. В [5] предварительно вычисляется нормальная матрица ВТВ, а затем ее полное сингулярное разложение. Однако вычисление матриц и и V связано с некоторым произволом [3], что может сказаться на результатах и привести к определенным сложностям при повторении вычислений в других условиях. Кроме того, известно [2], что числа обусловленности матриц В и ВТВ связаны соотношением к2(ВтВ) = (к2(В))2. Поэтому в случае плохой обусловленности матрицы В обусловленность матрицы ВТВ будет во много раз хуже. Вследствие чего переход к нормальным матрицам представляется необоснованным.
Рассмотрим возможность распознавания площадных объектов местности с использованием только одной матрицы разложения (1), а именно матрицы X. В качестве тест-объекта выберем участок соснового леса природного парка «Самаровский чугас», расположенный в Ханты-Мансийском автономном округе. Территория заповедника покрыта материалами съемки, выполненной 12 мая 2000 г. космической съемочной системой Landsat-7 в панхроматическом, а также зеленом (З), красном (К) и ближнем инфракрасном (ИК) диапазонах спектра [6]. Основные характеристики снимков приведены в табл. 1.
Таблица 1. Характеристики цифровых снимков тест-объекта
Параметры съемки и название характеристик Режим съемки
панхроматический многозональный
Высота орбиты, км 705
Время съемки (местное солнечное), час ± мин. 10 ± 15
Спектральный диапазон, мкм 0,52-0,90 0,53-0,61 (З) 0,63-0,69 (К) 0,78-0,90 (ИК)
Фокусное расстояние, см 243,8
Пространственное разрешение в надир, м 14,25 28,50
Радиометрическое разрешение, бит на пиксел 8
Изображение тест-объекта на панхроматическом снимке размером 32 х 32 пиксела разобьем на четыре равные части (элементарные участки). Схема расположения тест-объекта и контрольных полигонов приведена на рис. 1.
Сингулярное разложение матрицы яркостей первого участка размером 16 х 16 пикселов выполним с помощью программы $уй [7], особенностью которой является то, что, в отличие от теории [2, 3], числа а, не упорядочиваются по величине (табл. 2).
Рис. 1. Изображение тест-объекта и контрольных полигонов на фрагменте цифрового снимка.
Условные обозначения: 1 — населенный пункт Ханты-Мансийск; 2 — граница природного заповедника «Самаровский чугас»; 3 — тест-объект (1-4 номера участков); 4 — контрольные полигоны (9 — номер полигона).
Таблица 2. Значения сингулярных чисел матрицы яркостей
Номер Значение Номер Значение Номер Значение Номер Значение
1 648,709 5 25,023 9 15,188 13 6,177
2 38,892 6 21,606 10 13,719 14 1,371
3 34,684 7 20,274 11 12,425 15 3,439
4 32,177 8 18,224 12 10,192 16 2,831
Из табл. 2 видно, что а1 = 648,709 значительно отличается по величине от остальных сингулярных чисел. Кроме того, начиная с а15, нарушается естественный порядок убывания их значений.
Исключив а1 из дальнейшей обработки, расставим сингулярные числа в порядке их убывания и определим уравнение прямой а(х) = a0 + a1(x), аппроксимирующей
множество точек (i, аг), i = 2,...,16, взятых из табл. 2.
16
Решив указанную задачу под условием ^(ai -o(xi ))2 = min, где xi = i, найдем
i=2
значения параметров: a0 = 40,46, a1 = -2,5974. Параметр a1 = tg ф, где ф — угол наклона аппроксимирующей прямой к оси абсцисс. Очевидно, что ф = аrctg(a1) = -68°57'. Учтя вычисленные значения параметров, составим уравнение искомой прямой: а^) = 40,46 - 2,5974 x и нанесем его на график (рис. 2).
Для оценки точности найденных значений параметров в последнем приближении вычислим вектор поправок V, определим квадратичную форму VTV и матрицу весовых коэффициентов Q. Затем найдем средние квадратические ошибки (СКО) параметров [8]
maj JÖj, (2)
л п
где и = \1—- — ошибка единицы веса; п — количество
\ п - 2
сингулярных чисел (п < А—1); = 1, 2) — диагональные элементы матрицы Q.
Выполнив необходимые действия, по формуле (2) найдем: та = 2,1, та = 0,13. Аналогично вычислим значения сингулярных чисел, средние значения яркости Ь и параметры аппроксимирующих прямых для остальных участков тест-объекта. Обобщенные результаты экспериментальных исследований приведены в табл. 3.
Анализ данных табл. 3 показывает, что максимальное отклонение углов наклона ф от среднего значения (-69°00') не превышает 13'. В ходе вычислений было установлено, что количество сингулярных чисел, используемых для решения задачи, влияет на близость параметра а0 к среднему значению яркости Ь. Вследствие чего при определении параметров аппроксимирующих прямых использовалось различное количество сингулярных чисел. Кроме того, сравнение чисел обусловленности, приведенных в табл. 3, показывает, что матрицы яркостей третьего и четвертого участков плохо обусловлены. Объясняется это тем, что на указанных участках имеются небольшие поляны, элементы изображения которых Ь¡^ близки друг к другу по своей величине (яркости), существенно отличающейся от окружающего фона. Исправив яркости пикселов, соответствующих названным объектам, можно существенно улучшить обусловленность и сходимость результатов. Отметим также, что общее изменение фона практически не оказывает влияния на значения параметров. Так, увеличение яркостей всех пикселов матрицы Вк на 4 единицы приводит к изменению угла ф на пренебрегаемо малую величину равную 20", при этом параметр а0 остается без изменений.
Таблица 3. Результаты обработки панхроматических изображений тест-объекта
Номер участка Номера й Параметры прямой СКО ma1 Угол наклона ф, град., мин. Среднее значение Ь Число обусловленности к2
ao a\
1 2-16 40,46 -2,5974 0,13 -68 57 40,45 473,14
2 3-16 40,06 -2,5759 0,14 -68 47 40,96 332,79
3 2-16 40,20 -2,6171 0,15 -69 05 41,30 6377,52
4 3-16 41,46 -2,6350 0,08 -69 13 41,32 15335,58
Тест-объект, помимо панхроматического, покрыт многозональными снимками, пространственное разрешение которых в два раза хуже (см. табл. 1). Вследствие чего изображение элементарных участков на них имеет размер 8 х 8 пикселов. Определим по приведенной выше методике параметры прямых, аппроксимирующих сингулярные
40 36 32
* 28
К!
и =
р 24
0 ^ |
1 20
г?
§ 16
I
12
I
1«
•
\ 4 Л §
\ \
к 5
/ ф
0
2 6 10 14 18 I (х) — номера чисел
Рис. 2. Сингулярные числа и прямая, аппроксимирующая их значения.
числа матриц яркостей спектральных образов первого участка. Результаты вычислений приведены в табл. 4.
Таблица 4. Результаты обработки многозональных снимков
Спектральный диапазон Номера ^ Параметры прямой СКО ma1 Угол наклона ф, град., мин. Среднее значение Ь Число обусловленности к2
Й0
З 3-7 28,22 -3,8205 0,32 -75 20 51,38 2410,73
К 2-7 27,34 -3,2515 0,58 -72 54 43,08 193,91
ИК 2-8 18,75 -2,5120 0,34 -68 18 46,62 15392,83
Из сравнения табл. 3 и 4 следует, что параметры я1 близки по величине только для инфракрасного и панхроматического снимков с изображением одного и того же участка леса.
Оценка возможности применения сингулярных чисел для классификации изображений других объектов местности на панхроматическом снимке приведена в табл. 5.
Из табл. 3 и 5 следует, что изображения различных объектов местности имеют параметры a0 и a1, отличающиеся друг от друга. Указанный фактор позволяет использовать названные величины в качестве признаков для распознавания объектов по их изображениям. Классификация объектов по рассматриваемым признакам приведена на рис. 3, где вместо параметра al для наглядности показан модуль угла наклона |ф| = |аг^
Таблица 5. Результаты обработки изображений контрольных полигонов
Название и номера полигонов Параметры прямой Угол наклона ф, град., мин. Среднее значение Ь Число обусловленности к2
Й0
Болото, 5 29,16 -1,9242 -62 32 46,38 17121,92
6 28,17 -1,7936 -60 52 47,48 2016,16
7 29,18 -1,8109 -61 06 47,30 499,50
Городская застройка, 8 53,04 -3,3585 -73 25 51,36 578,89
9 56,01 -3,4092 -73 39 55,46 473,31
10 51,15 -3,2349 -72 49 50,64 908,27
Лес, 11 36,88 -2,6372 -69 14 36,73 4669,20
Водная поверхность, 12 25,89 -1,7095 -59 40 30,18 814,45
13 26,77 -1,7488 -60 14 29,78 688,29
14 25,13 -1,7232 -59 52 29,78 8768,89
Анализ рис. 3 показывает, что поле признаков таких площадных объектов, как сосновый лес, застроенные территории, болото, водная поверхность реки Иртыш представляют собой замкнутые, непересекающиеся области, т. е. могут быть уверенно классифицированы с помощью предлагаемых параметров a0 и a1. Более четкое различение водной поверхности от болота возможно с привлечением средних зна-
55
50
'S 42
S 40
35
30
25
55 60 65 70 75 | Ф | — модуль угла наклона
Рис. 3. Двумерное поле признаков площадных объектов местности.
чений яркости b или снимка в ближней инфракрасной зоне. Так, в ИК-диапазоне модули |ф| для указанных объектов (13 и 6 участки) соответственно равны 32°45' и 51°44'.
Таким образом, параметры a0 и a\ прямых, аппроксимирующих сингулярные числа матриц яркостей, не зависят от изменения общего фона изображений и могут быть использованы в качестве признаков для распознавания площадных объектов местности по их изображениям на цифровых снимках, в том числе и разновременных.
Литература
1. Шовенгердт Р. А. Дистанционное зондирование. Модели и методы обработки изображений / пер. с англ. М.: Техносфера, 2010. С. 428-474.
2. Деммель Дж. Вычислительная линейная алгебра. Теория и приложения / пер. с англ. М.: Мир, 2001. 430 с.
3. Уоткинс Д. С. Основы матричных вычислений / пер. с англ. М.: БИНОМ. Лаборатория знаний, 2006. С. 282-302.
4. Гальяно Ф. Р. Алгоритм классификации участков поверхности Земли на основе сингулярного разложения матриц // Информационные технологии. 2010. № 12. С. 35-37.
5. Прэтт У. Цифровая обработка изображений / пер. с англ. М.: Мир, 1982. Т. 1. 310 с.; Т. 2. 790 с.
6. Global Observatory for Ecosystem Services. Michigan State University.USA. URL: http://35.8.163.34/? version=Website&sensor=ETM&path=159&rpw=017 (дата обращения: 03.07.2009)
7. Куштин И. Ф., Куштин В. И. Геодезия: учеб.-практ. пособ. Ростов н/Д: Феникс, 2009. 909 с.
8. Форсайт Дж. Машинные методы математических вычислений / Дж. Форсайт, М. Малькольм, К. Моулер. М.: Мир, 1980. С. 248-256.
Статья поступила в редакцию 19 июня 2013 г.
+
ородска [застро? ка +
С ОСНОВЫ! лес -U ф
Лес +
^ Водн Болото 1я повер: [НОСТЬ