Научная статья на тему 'Оценка характеристик запросов для содержательного поиска в базах данных космических изображений'

Оценка характеристик запросов для содержательного поиска в базах данных космических изображений Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
134
65
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ковалевская Н. М., Боенко К. А.

Современные базы данных космических изображений (БДКИ) насчитывают террабай-ты информации. На орбиту выводятся новые и новые спутники с высоким и сверхвысоким разрешением. В этих условиях анализ каждого снимка занимает огромные временные ресурсы, и особенно актуальным становится решение задачи содержательного поиска. Несмотря на неослабевающий интерес исследователей и большое количество работ в этой области, остается открытым вопрос о выборе подходящих характеристик для поиска в БДКИ, особенно высокого и сверхвысокого разрешения. С этой целью предложена модель эскиза текстуры, которая позволяет выделять наиболее представительные структурные сочетания элементов запросного образца. На основе этой модели реализованы эффективные запросы в модельной и реальной базах данных. Эксперименты показали гибкость параметров и возможности обучения на основе применения модели, что позволит ее использовать в дальнейшем для наполнения визуального тезауруса искомых объектов заданного разрешения.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Ковалевская Н. М., Боенко К. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Content-based image retrieval for high-resolutionsatellite imagery data base

Recent technological advances have made it possible to process and store large amounts of image data. The most impressive example is the accumulation of image data in scientific applications such as satellite imagery. However, in order to realize their full potential, tools for efficient extraction of information and for intelligent search in image databases need to be developed. The paper describes a new approach to image data retrieval, which allows queries to be composed of textured patterns. The textured pattern is converted into a feature representation of reduced dimensionality, which can be used for searching similar-looking patterns in the database. This representation is obtained by texture sketch model based on Gibbs random field approach to describe satellite imagery. Experimental results are presented which illustrate that the proposed representation preserves the perceptual similarities, and provides a powerful tool for content-based satellite image retrieval.

Текст научной работы на тему «Оценка характеристик запросов для содержательного поиска в базах данных космических изображений»

Вычислительные технологии

Том 13, № 2, 2008

Оценка характеристик запросов для содержательного поиска в базах данных космических изображений

Н.М. КОВАЛЕВСКАЯ, К. А. БОЕНКО Институт водных и экологических проблем СО РАН, Барнаул, Россия e-mail: [email protected], [email protected]

Recent technological advances have made it possible to process and store large amounts of image data. The most impressive example is the accumulation of image data in scientific applications such as satellite imagery. However, in order to realize their full potential, tools for efficient extraction of information and for intelligent search in image databases need to be developed. The paper describes a new approach to image data retrieval, which allows queries to be composed of textured patterns. The textured pattern is converted into a feature representation of reduced dimensionality, which can be used for searching similar-looking patterns in the database. This representation is obtained by texture sketch model based on Gibbs random field approach to describe satellite imagery. Experimental results are presented which illustrate that the proposed representation preserves the perceptual similarities, and provides a powerful tool for content-based satellite image retrieval.

Введение

Содержательный поиск в базах данных изображений (БДИ) продолжает оставаться актуальным на протяжении последних десятилетий. Несмотря на неослабевающий интерес исследователей и большое количество работ в этой области, остается открытым вопрос о выборе подходящих характеристик для поиска в современных базах данных космических изображений (БДКИ), особенно высокого и сверхвысокого разрешения. Большинство исследований последних лет, связанных с содержательными запросами изображений, сосредоточено на выделении подходящих признаков. Для осуществления запроса в соответствии с заданным образцом (query image) вычисляется вектор признаков образца, традиционно связанный с тремя описательными характеристиками — цветом, формой и текстурой. Следующим шагом является поиск в базе данных таких изображений, которые содержат участки, наиболее сходные с запросным образцом в соответствии с некоторой мерой сходства.

В приложении к современным БДКИ традиционные описательные характеристики весьма различаются по содержательной емкости захватываемой информации. Цветовые характеристики (гистограммы) не учитывают информации о пространственной зависимости элементов, поэтому поиск космических изображений среднего и высокого разре-

© Институт вычислительных технологий Сибирского отделения Российской академии наук, 2008.

шения на основе цветовых гистограмм приводит к ошибочным результатам запросов. Формы наблюдаемых естественных объектов земной поверхности настолько разнообразны и сложны, что трудно рассчитывать на эффективные результаты запросов в соответствии с характеристиками формы представленных образцов.

Большинство участков земной поверхности имеет более или менее однородные пространственные характеристики яркости, которые, очевидно, могут быть решающими при осуществлении содержательных запросов в базах данных современных космических снимков. Пространственная однородность участков космических изображений высокого разрешения непосредственно связана с их текстурными характеристиками.

Цель настоящей работы — исследование характеристик текстур и представление модели, описывающей однородность текстурных образцов в терминах вероятностного самоподобия. Приведены результаты первого шага содержательного поиска в БДКИ на основе предложенной модели.

1. Понятие текстуры и существующие модели текстур

До сих пор не существует точного определения текстуры, что говорит о сложности этого понятия. Текстура (от лат. textura — плетение, структура) связана со специфической структурой визуальных или осязательных характеристик отдельных объектов. В широком смысле текстура определяет структуру некоторого объекта по отношению к его компонентам. Для человека текстура связана в основном с определенными, пространственно повторяющимися (микро- или макро-) структурами, которые представляют организацию основных составляющих некоторой поверхности.

На цифровом космическом изображении текстура представляется пространственными взаимоотношениями элементов растра и их пространственной организации. Визуально эти пространственные взаимоотношения выглядят как изменения яркости (значений сигналов, полутонов, уровней серого цвета) на плоскости изображения. Таким образом, текстурный анализ космических изображений опирается на анализ значений сигналов в элементах растра каждого снимка.

В дальнейшем ограничимся рассмотрением моделей полутоновых текстурных образцов, которые могут быть аналогично представлены для многоспектрального случая.

Существующие модели текстур естественных объектов можно условно разделить на четыре класса:

— статистические модели, определяющие текстуру в терминах пространственного распределения полутонов [1, 2];

— модели, основанные на анализе пространственных частот в области Фурье [3], фильтры Габора [4], вейвлет-модели [5];

— модели, основанные на свойствах визуального восприятия [6, 7];

— модели, опирающиеся на допущение о том, что визуально-однородные образцы естественных объектов являются выборками случайных полей (СП). СП-модели текстур связывают значения сигналов с некоторой вероятностью появления заданной комбинации сигналов на растре.

Рассмотрим возможности перечисленных классов моделей для осуществления запросов в БДКИ.

1.1. Статистические модели

Известные текстурные характеристики, основанные на вычислении матриц смежности элементов [1], хотя и широко используются в современных технологиях анализа и обработки космических изображений (в частности, в ERDAS Imagine, ENVI ), не имеют аналогов в визуальном восприятии. Поэтому эффективность их применения к различным типам земной поверхности скорее случайна, чем регулярна. К тому же известно, что статистики различий сигналов, которые являются производными из матриц смежности, проще с вычислительной точки зрения и не уступают матрицам смежности в распознавании естественных объектов земной поверхности [2].

1.2. Пространственно-частотные модели

Общими недостатками пространственно-частотного моделирования остаются оптимизация обработки по всему набору элементов текстурного участка и учет только энергетических характеристик сигналов.

Хотя пространственно-частотное моделирование согласуется с психофизиологическими исследованиями зрительной системы, а фильтры Габора и вейвлет-анализ показывают хорошие результаты поиска в БДИ [4, 5], современных данных о стимуляции простых и сложных клеток коры головного мозга недостаточно, чтобы указать вид базовых функций, по которым клетками коры выделяются пространственно-частотные составляющие текстурного участка.

К тому же, пространственно-частотные признаки текстуры не имеют количественного соответствия известным признакам визуального восприятия [8].

Главный недостаток большинства вычислительных характеристик, используемых в текстурном анализе, состоит в том, что они имеют узкую область применения по сравнению с механизмом человеческого восприятия. В принципе, глаз человека способен различить практически все типы текстур на снимках земной поверхности. Распознавание на уровне психологии визуального восприятия чаще всего зависит от различий в статистиках второго порядка, и процесс распознавания текстур опирается только на парные соотношения признаков в элементах растра [9, 10].

Таким образом, модели, предназначенные для реализации содержательных запросов в современных БДКИ, должны принимать во внимание:

— характеристики текстурных участков, которые опираются на парные соотношения сигналов;

— выбор такой структуры соотношений сигналов, которая является значимой с точки зрения свойств визуального восприятия.

1.3. Модели, основанные на свойствах визуального восприятия

Сделано несколько попыток оценить характеристики восприятия, которые применялись бы ко всем типам текстур и которые, в принципе, могли бы быть не оптимальными с точки зрения выбора оптимальных признаков.

В качестве возможного компромисса между результатами исследованиями психологии восприятия и вычислительным подходом к описанию текстур были исследованы шесть признаков: направленность, шероховатость, контраст, неровность, регулярность и линейность [6]. Хотя на тестовых образцах по каждому отдельному признаку пред-

ложенные оценки показали правдоподобные результаты, остался открытым вопрос о выборе комбинации признаков для новых текстурных образцов.

Для снижения вычислительных затрат, связанных с оценкой признаков восприятия, в [6], включая дополнительные характеристики зернистости, сложности и энергии тестуры, использовался специальный метод, в основе которого лежит определение элементов матрицы различий сигналов в окрестностях элементов растра [7]. И хотя этот метод согласуется с основными принципами психологии восприятия, результаты его применения оказались недостаточно эффективными, а порой и противоречивыми.

Очевидно, что простое сведение результатов функционирования механизма зрительного восприятия к вычислению отдельных характеристик и/или их наборов приводят к ограниченности применения таких характеристик в текстурном анализе.

После выхода работы Марра [3] восприятие рассматривается как система обработки информации. Поскольку поиск в БДИ по заданному визуальному образцу предназначен заменить человека в процессе содержательного поиска, то не только результаты поиска должны быть согласованы с результатами восприятия, но и модели изображений должны быть созданы с учетом основных принципов восприятия зрительной информации.

Поэтому для реализации эффективных запросов в БДКИ необходимо использовать модели, учитывающие:

— локальные характеристики восприятия отдельных текстурных участков, оптимальные с вычислительной точки зрения;

— общие принципы восприятия целых кусочно-текстурных изображений.

1.4. СП-модели

Пусть R = [(m, n) : m = 0,... , M — 1; n = 0,... , N — 1] — конечная двумерная решетка (или растр), содержащая MN элементов. Случайное поле S на некотором растре R является массивом случайных переменных S = [Si : i G R] в элементах растра i G R.

Каждое случайное поле S определяется некоторым совместным распределением вероятностей Pr: S ^ [0, 1]:

V s G S, Pr(S = s) > 0, Pr(S = s) = 1.

s£S

Если Q = {0,1,... , qmax} — множество всевозможных значений сигналов в элементах растра, то |S| = |Q||R| — комбинаторное число всех возможных изображений на растре, и вероятность отдельного изображения Pr(S = s) является крайне малым значением. Поэтому СП-модели обеспечивают существенно более высокие вероятности заданных изображений по сравнению со всеми возможными на растре.

Для исследования свойств содержательного поиска в БДИ на основе СП-моделирования будем рассматривать четыре типа текстурных изображений:

— пространственно-однородные образцы альбома Бродатца, известные в текстурном анализе как de facto прототипы для моделирования [11];

— пространственно-однородные образцы, полученные из космических снимков;

— кусочно-однородные модельные изображения;

— кусочно-однородные реальные изображения (космические снимки).

Известно, что восприятие целого изображения не сводится к сумме восприятий отдельных его участков [12]. Скорее наоборот, интерпретация каждого участка зависит от содержания целого изображения. Это утверждение подтверждает тот факт, что один

и тот же космический снимок и отдельные его участки могут интерпретироваться по-разному специалистами различных направлений ("видение рисунка" космического снимка и отдельных его частей ландшафтоведами, геоморфологами, почвоведами, ботаниками и др.).

Поэтому для согласования глобального восприятия кусочно-текстурного космического изображения и восприятия локальных характеристик отдельных его участков нужна общая иерархическая модель, описывающая свойства целого изображения (модель участков) и свойства структур соотношений сигналов внутри участков (модели текстур на участках).

С точки зрения психологии восприятия все композиции текстурных участков можно разделить на два типа [9]:

— композиции, состоящие из образцов, допускающих мгновенное разделение (воспринимаемые мгновенно, т. е. за время, не превышающее 200 мс). В дальнейшем будем определять их как кусочно-текстурные изображения первого типа;

— композиции, состоящие из образцов, не поддающихся разделению без тщательного и часто продолжительного изучения (разделяемых на основе восприятия—изучения). В дальнейшем будем определять их как кусочно-текстурные изображения второго типа.

Поскольку задача распознавания текстур как одна из задач низкоуровневого зрения является некорректной по Адамару [13], для построения байесовских решений необходим такой класс моделей марковских случайных полей (МСП), который имел бы следующие характеристики [14]:

— явные зависимости локальных вероятностей элементов от значений сигналов в некоторой заданной окрестности;

— разнообразие представления различных текстурных образцов;

— явная зависимость между параметрами моделей и визуальными характеристиками текстурных образцов.

Такими свойствами обладают модели гиббсовских случайных полей (ГСП), которые позволяют описать текстурные образцы в терминах точной геометрической структуры и количественных характеристик взаимодействий сигналов на растре [15]:

Рг(в) = Z-1 ■ ехр Уг (вг = с : г € г, с € Q), (1)

тСЯ

где Рг(в) — совместное распределение марковского случайного поля Б = в; Уг(•••), г С Я — потенциалы гиббсовского распределения на заданных кликах г (рис. 1);

□ ■ □ □ □ □ □ □ ■ ■ □ □

□ ■ □ □ ■ ■ □ ■ □ □ ■ □

□ □ □ □ □ □ □ □ □ □ □ □

а

■ ■ □ ■ □ □ □ ■ □ ■ □ □ ■ ■ □ □ ■ ■

□ ■ □ ■ ■ □ ■ ■ □ ■ ■ □ ■ ■ □ □ ■ ■

□ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □

б

Рис. 1. Возможные типы клик г для окрестности из восьми ближайших соседей: а — парные, б — состоящие из трех и четырех элементов

Кусочно-текстурные изображения Карты участков

Щ

Рис. 2. Кусочно-текстурные изображения и соответствующие им карты участков

в, г Е г — переменные МСП, поддерживающие клику г; Z — нормирующая постоянная по пространству всех возможных состояний $:

Z = ^^ схр^ V= сг : г Е г). (2)

тся

Эти же модели могут быть использованы для описания кусочно-текстурных изображений на основе использования дополнительных потенциалов (модель участков), описывающих карты участков, соответствующих различным типам текстур (рис. 2). Такие потенциалы определяют взаимодействие меток различных участков и могут быть выбраны в предположении, что вероятность принадлежности соседних элементов к одному участку выше вероятности их принадлежности к разным участкам [16, 17].

2. Модель эскиза текстуры

Рассматривая систему зрительного восприятия на предварительном этапе обработки и распознавания изображений, Д. Марр разделил процесс обработки на два уровня представления информации — первоначальный эскиз (обнаружение изменений яркости, представление и анализ структуры образцов) и 2.5-мерный эскиз [3].

Для создания модели эскиза текстуры будем рассматривать естественные текстуры снимков высокого и сверхвысокого разрешения как обладающие свойством пространственного самоподобия (во многих случаях это верно и для снимков среднего разрешения) в смысле некой повторяемости парных элементов, поддерживаемых одной и той же комбинацией положений на растре.

Рис. 3. Текстурные образцы и соответствующие эскизы

Вероятностное самоподобие однородных текстурных образцов означает, что все возможные комбинации сигналов в парных кликах рассматриваются с различными вероятностями появления на текстурном образце. То есть если некоторая клика входит в состав клик, представляющих эскиз текстурного образца (рис. 3), то соответствующая ей вероятность пары сигналов имеет значение, отличающееся от нулевого.

На основе такого допущения два полутоновых образца относятся к визуальному представлению одного и того же класса естественных объектов (представляют текстуру одного и того же содержания), если они имеют одни и те же (или близкие) распределения матриц пар значений сигналов в кликах одного и того же типа.

Если в качестве гиббсовских потенциалов для модели (1),(2) использовать следующие функции различий сигналов для заданных типов парных клик:

К(в,, в, : (г, j) € г) = £ Уг(1) ■ ИТ(<11 в,, в,), г С Я, (3)

¿СО

где Б = {—qmax, • • •, 0,1, • • •, qmax} — множество возможных различий сигналов в парных кликах, Кг(<) — начальные значения потенциалов, Иг(<|в,, в,) — гистограмма различий значений сигналов в клике типа г заданного текстурного образца Б = в:

Иг(1| в,, в,)= £ 6(1, в, - в,), (4)

6(■) — функция Кронекера, то гистограммы (4) оказываются достаточными статистиками, а распределение (1)-(4) является унимодальным [15], что позволяет получить из заданного образца максимально правдоподобные оценки начальных значений потенциалов и все параметры, представляющие эскиз текстуры, для содержательного поиска в БДИ.

Предположим, что чем чаще повторяется одна и та же комбинация сигналов для некоторого типа парных клик г заданного текстурного образца Б = в, тем больше расстояние между маргинальными частотами этого образца и маргинальными частотами независимого случайного поля (НСП).

НСП И9 £77

НСП Б4 В55

Рис. 4. Визуальное сравнение однородных образцов альбома Бродатца с НСП

Тогда эскиз текстуры, соответствующей образцу £ = 5, можно определить следующим образом:

БкегеН(Б = ¿И = (г* е Я : Вгз^НгМ*). ЫЕ(4)) > ТЯЕЗИзшсН, г С Я], (5)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где ЫЕ(4) = (\^\ — аЪз(4))/\(^\2 — маргинальные частоты НСП, 4 е О; Бъз^, •) — заданный тип расстояния между распределениями; гш, ТЯЕБНвкеьсн — соответственно заданная окрестность (окно поиска) и заданная пороговая величина для выбора типов клик, образующих эскиз.

Использование модели (5) для получения основных характеристик текстуры в содержательных запросах означает также неявное использование характеристик восприятия. Очевидно, что чем больше линейность, регулярность, направленность и другие свойства текстурного образца, тем больше визуальное отличие этого образца от НСП (рис. 4).

3. Окно поиска эскиза и меры визуального различия текстур

Выбор окна ад поиска эскиза пространственно-однородной текстуры зависит от размера представленного текстурного образца. Очевидно, что, чем больше размер окна поиска, тем более точна оценка эскиза текстуры. Однако, чем больше окно, тем медленнее осуществляется поиск в БДИ. Поэтому выбор размеров окна является эмпирическим результатом разумного компромисса между вычислительной стоимостью и представительностью эскиза.

Так, для образцов размера 220 х 210 окно 9 х 9 уже показывает разумные результаты, а увеличение окна до 13 х 13 оптимально с точки зрения вычислительной стоимости и получения более подробного эскиза (рис. 5).

Были исследованы различные меры визуального несходства текстурных образцов, использующие относительные распределения различий сигналов в кликах эскизов соответствующих текстур.

Хи-квадрат:

БгзЬх (затр1е\, затр1е2)= ^^ ^^

(Е (5 \затр1е\) — Ег(5 \затпр1е2))'

reSket.Hu Е(з\затр1е1)

Текстурный образец (220x210) Окно поиска 9x9 Окно поиска 13x13

•Ь-

щ

Щ | - -

Щ щ 1Ш! щш

-Г -

1

Рис. 5. Зависимость детальности эскиза от окна поиска

Евклидова мера:

Вгв122 (вашр^, вашр^) = ^^ (в ^атр^х) — Рг (в\sample2))

г *

гЕЯкеЬскц вЕЯ

Расстояние Бхатачария: ВгвЬ^вашр^х, ватрЫ^) = ^^ — \/(в| вашр1е1) Гг(в| вашрЫ^)

гЕЯкеЬскц \ вЕЯ

Нормализованное пересечение:

ш1п {Гг(в| вашр1е1 ),Рг(в| вашр^)}

DгstЛsaшplel,saшple2)=y^ —-^-:-;—:-.

Е Fг (вашр1е2)

гЕЯкеЬскц

вЕЯ

Взвешенная евклидова мера:

Бгв^^ашр^твашр^) = ^^ (s|saшplel) — (в^ашр^))'

г

гЕЯкеЬскц вЕЯ

Рис. 6. Сравнение мер визуального различия текстурных образцов

Здесь Гг(-|-) — относительное распределение частот различий сигналов в кликах г € Sketchu, Sketchu — объединенный эскиз текстурных образцов:

Sketchu = Sketch(sошple1) и Sketch(sоmple2)•

Эксперименты по выбору подходящей меры визуального различия проводились на парах образцов, один из которых был образцом из альбома Бродатца (В3, Б14, Б23, Б65), другой — зашумленным образом первого (рис. 6).

Оказалось, что если подбирать весовые коэффициенты ^ для Dist5 таким образом, что наибольшие значения соответствуют кликам эскиза с наименьшим вкладом для восприятия текстуры, то расстояние Dist5(sоm,ple1 ^зошр^^ будет наиболее эффективной мерой визуального различия пространственно однородных текстурных образцов sоmple1 и sошple2. Поэтому во всех последующих экспериментах использовалась мера несходства Dist5(•, •).

4. Содержательные запросы в базах данных изображений

Эскиз текстурного образца, получаемый в соответствии с (5), является целостной характеристикой образца, позволяющей распознавать различные текстуры. Меру визуального несходства можно использовать для расположения всех изображений в БДИ в порядке возрастания сходства с запросным образцом следующим образом:

— ввести запросный пространственнооднородный образец s;

— найти эскиз образца в соответствии с (5);

— вычислить меры несходства Dist(st, s) между запросным образцом и изображениями [st : t = 1, 2,...] из БДИ;

— выбрать в качестве первого результата поиска изображение st* с наименьшим значением меры несходства:

Dist(st*,s)= min {Dist(st,s)}.

SteIDB

Выбрать последующие результаты поиска на основе ранжирования значений Dist(st, s) в порядке возрастания.

Эксперименты проводились с двумя БДИ.

БДИ-1, содержащая образцы текстур Бродатца. Для визуального сравнения результатов запросов в БДИ-1 за основу была взята классификация образцов на 32 класса, проведенная экспертами лаборатории вычислительного зрения [18] (табл. 1). Допускается, что классификация разных групп специалистов может несколько различаться, поэтому после проведения экспериментов мы внесли некоторые изменения в наборы классов как результат самообучения поисковой системы.

БДИ-2, содержащая 64 образца текстур естественных объектов, полученных 6 августа 2006 года в панхроматическом режиме со спутника Quickbird (табл. 2) и сгруппированных в 13 классов: кустарники (8 образцов), селитебные участки первого типа (дачи, 10), лес (7), покос (7), распаханные участки (14), селитебные участки второго типа (поселки, 7), кустарниковые болота (3), отстойники (2), кустарники с редколесьем (2), болото (1), речная отмель (1), пойма реки (1), засоленные участки (1 образец).

Таблиц а 1. БДИ-1

№ класса

Текстурные образцы классов БДИ-1

№ класса

Текстурные образцы классов БДИ-1

Р1. Рб. Р14. Р20. Р49

........

| «

1К1М1111

111И11111

17

18

Р8.Р56. Р64. Р65 -— —. ■■! ■- -

Р69.Р71 .Р72.Р9: 3 шшимя

ш ъяЖШШ ¡•'•ллл'А^;

Р4. Р29, Р57. Р92

■ёРШ м У

14

15

УШ

ЙШЙ | Р34, Р52, Р103, Р104

19

Р39. Р40. Р41.Р42

НИИ

Р24. Р80. Р81.Р105.Р106

-рт

»г

и

30

P9.P109.P110

D50.D51.D68.D70. Р76

гх:

Р107. Р108

31

Р25, Р26. Р96

Р12.Р13

16

Р94. Р95

32

Р15.Р97

Таблица 2. БДИ-2

№ класса

Текстурные образцы классов БДИ-2

Кустарники

шыш

шш шш

Ш. ШУКЗК1Ш

Селитебные участки (дачи)

Лес

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Покос

Распаханные участки

Отмель

т •ътжм

12

Пойма реки

Засоленные участки

1

2

3

4

5

Во всех экспериментах предполагалось, что если первый результат поиска относится к тому же классу, что и запросный образец, то результат получается корректным. (Если сам образец хранится в БДИ, то он и является первым результатом поиска. В последующем анализе этот факт не принимался во внимание как очевидный.)

В экспериментах с БДИ-1 мы запрашивали фиксированное число изображений для заданных образцов. В случае БДИ-2 поиск прекращался, как только были получены все изображения, относящиеся к тому же классу, что и запросный образец.

Таблица 3. Результаты поиска в БДИ-1

В табл. 3 приведены результаты первых пяти запросов в БДИ-1. Хотя сама база данных представляет достаточно сложный вариант для визуального поиска схожих образцов в силу неоднозначности деления объектов на классы, результаты поиска были весьма обнадеживающими. Большинство запросов (90 %) показывает правильный результат в качестве первого выбора поисковой системы. Первые два результата верны для более 65 % запросов. И более 40 % запросов показали верными первый, второй и третий результаты поиска.

Таблица 4. Результаты поиска в БДИ-2

Запросный образец, тип покрывающего класса земной поверхности Первый результат поиска, тип класса Второй и последующие результаты поиска, типы классов Комментарии

ШЯЮЯИЯШ щштш Кустарники Кустарники 2—7-й — кустарники Найдены все образцы класса в качестве первых результатов

Кустарники с редколесьем Кустарники с редколесьем То же

Дачи Дачи 2—9-й — дачи То же

Лес Лес 2—5-й — лес, 6—8-й — кустарники, 9-й — лес Найдены пять из шести возможных образцов класса в качестве первых результатов

Поселки Поселки 2—6-й — поселки Найдены все образцы класса в качестве первых результатов

Покос ■ ■ у 2—6-й — покос То же

Распаханные участки 2-й — речная отмель, 3-5-й — распаханные участки, 6-й — пойма реки, 7-13-й — распаханные участки

Отстойник (1-й образец) Кустарниковое болото 2-й — кустарниковое болото, 3-й — поселок, 4-й — отстойник (2-й образец)

Отстойник (2-й образец) Кустарниковое болото 2-й — кустарниковое болото, 3-й — отстойник (1-й образец)

Описанная поисковая система способна к обучению пользователя. Некоторые результаты поиска (помечены символом (*) в табл. 3), хотя формально и показывают некорректный результат в соответствии с исходной классификацией в табл. 1 (их классы отличаются от классов запросных образцов), фактически являются визуально сходными с запросным образцом по тому или иному визуальному признаку. Так, образец 0104(3) относится к 3-му классу в соответствии с исходной классификацией, но поиск продемонстрировал визуальную близость этого образца с образцом Б35(20) из 20-го класса, т. е. оба образца могут быть объединены в один класс по некоторым визуальным признакам, не учтенным в исходном варианте классификации.

Аналогично, для пар Б109(29) и Б107(30), Б109(29) и 0108(30), Б94(16) и Б96(15), Б6(1) и 021(6), 076(14) и Б85(23) система нашла новые признаки визуального сходства, не учтенные в первоначальной классификации и согласующиеся с восприятием.

Эксперименты с образцами, взятыми со снимков сверхвысокого разрешения (0.7 м) и представленные в табл. 4 оказались еще более оптимистичными, чем результаты с модельными образцами в БДИ-1. В 50% случаев система "выбирала" в качестве первых результатов поиска все возможные образцы соответствующего (верного) класса — кустарники, кустарники с редколесьем, дачи, поселки, покос.

5. Выделение участков на кусочно-однородных изображениях в соответствии с моделью эскиза текстуры

Важным этапом содержательного поиска в соответствии с заданными визуальными характеристиками является выделение соответствующих участков на изображениях. Модель эскиза текстурного образца обнаруживает более или менее регулярные парные

б

Рис. 7. Выделение однородных участков: а — на кусочно-однородных композициях первого и второго типов; б — на снимках со спутников Ткопов (1 м, слева) и Quickbird (0.7 м, справа)

изменения сигналов в соответствии с геометрическими характеристиками компонентов (пространственное самоподобие) образца. Будем предполагать, что для композиций первого типа соответствующие эскизы текстур различаются мгновенно, а в случае композиций второго типа различие соответствующих эскизов требует тщательного (поэлементного) изучения.

Эксперименты проводились с композициями обоих типов и с космическими снимками, полученными в панхроматическом режиме со спутников Quickbird (0.7 м) и Ikonos (1м). Примеры результатов по выделению однородных участков в соответствии с моделью (5) в качестве первого шага содержательного поиска в БДКИ высокого и сверхвысокого разрешения приведены на рис. 7.

Заключение

Современные БДКИ насчитывают терабайты информации. На орбиту выводятся новые и новые спутники с высоким и сверхвысоким разрешением. В этих условиях анализ каждого снимка занимает огромные временные ресурсы и особенно актуальным становится решение задачи содержательного поиска. Для этого предложена модель эскиза текстуры, которая позволяет выделять наиболее представительные структурные сочетания элементов запросного образца. На основе этой модели реализованы эффективные запросы в модельной и реальной базах данных. Эксперименты показали гибкость параметров и возможности обучения на основе применения модели, что позволит использовать ее в дальнейшем для наполнения визуального тезауруса искомых объектов заданного разрешения.

Список литературы

[1] Харалик Р.М. Статистический и структурный подходы к описанию текстур // ТИИЭР: Тр. Ин-та инженеров по электротехнике и радиоэлектронике. 1979. Т. 67, № 5. С. 98-20.

[2] Weszka J.S., Dyer C.R., Rosenfeld A. A comparative study of texture measures for terrain classification // IEEE Trans. on Systems, Man and Cybernetics. 1976. Vol. SMC-6, N 4. P. 269-285.

[3] Марр Д. Зрение. Информационный подход к изучению представления и обработки зрительных образов: пер. с англ. М.: Радио и связь, 1987. 400 с.

[4] Newsam S., Wang L., Bhagayathy S., Manjunath B.S. Using texture to analyze and manage large collections of remote sensed image and video data // J. of Applied Optics: Information Processing. 2004. Vol. 43, N 2. P. 210-217.

[5] Chen Y., James Z., Wang A. Region-based fuzzy feature matching approach to content-based image retrieval // IEEE Trans. on Pattern Analysis and Machine Intelligence. 2002. Vol. 24, N 9. P. 1252-1260.

[6] Tamura H., Mori S., Yamawaki T. Textural features corresponding to visual perception // IEEE Trans. on Systems, Man and Cybernetics. 1978. Vol. SMC-8, N 6. P. 460-473.

[7] Amadasun M., King R. Textural features corresponding to textural properties // IEEE Trans. on Systems, Man and Cybernetics. 1989. Vol. 19, N 5. P. 1264-1274.

[8] Bajcsy R.K. Computer identification of textured visual scene // A. I. Lab., Stanford Univ., Palo Alto, CA, Memo, AIM-180, Oct. 1972.

[9] JuLÉSZ B. Experiments in the visual perception of texture // Scientific American. 1975. P. 34-43.

[10] Julész B., Gilbert E., Shepp L. Inability of humans to discriminate between visual textures that agree in their second-order statistic-revisited // Perception. 1973. Vol. 2. P. 391-405.

[11] Brodatz. Texture: a Photographic Album for Artists. and Designers, N.Y.: Dover, 1966.

[12] КЁЛЕР В. Некоторые задачи гештальтпсихологии. Хрестоматия по истории психологии / Под ред. П.Я. Гальперина, А.Н. Ждан. М., 1980. С. 102-112.

[13] Hadamard J. Lectures on Cauchy's Problem in Linear Partial Differential Equations. N.Y.: Dover, 1952. 320 p.

[14] Marroquin J., Mitter S., Poggio T. Probabilistic solution of ill-posed problems in computational vision //J. Amer. Statist. Assoc. 1987. Vol. 82, N 397. P. 76-89.

[15] Gimel'farb G. Image Textures and Gibbs Random Fields. Dordrecht: Kluwer Academic Publishers, 1999. 250 p.

[16] Kovalevskaya N. Gibbs model of image as a tools for thematic analysis // Pattern Recognition and Image Analysis. 1999. Vol. 9, N. 2. P. 282-285.

[17] Kovalevskaya N. Landscape indication based on stochastic relaxation // From Laboratory Spectroscopy to Remotely Sensed Spactra of Terrestrial Ecosystems. Kluwer Academic Publishers, 2002. P. 121-147.

[18] Ma W., Manjunath B. Texture features and learning similarity // Proc. IEEE Intern. Conf. on Computer Vision and Pattern Recognition. San Francisco, 1996. P. 425-430.

Поступила в редакцию 29 ноября 2007 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.