БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Макаров Л.М. Холтеровское мониторирование. 2-е изд. - М.: ИД «Медпрак-тика-М». 2003. - 340 с.
2. Сорокин С. Системы реального времени. - СТА 2/97. - М.: СТА-ПРЕСС, 1997. - С. 28-29.
3. www.salvo.com.
4. www.embos.com.
5. www.uros.com.
Е.А. Башков, О.Л. Вовк
ОЦЕНКА ТОЧНОСТИ КОНТЕКСТНОГО ПОИСКА В КОЛЛЕКЦИЯХ КЛАСТЕРИЗИРОВАННЫХ ИЗОБРАЖЕНИЙ
Тенденция постоянного увеличения количества изображений, доступных в мировой паутине Іпіегпеї;, повышает интерес исследователей к разработке эффективных механизмов поиска изображений. На данный момент разработано множество систем поиска, основанных на текстовых описаниях изображений. Примерами могут служить такие системы, как система поиска коллекции живописи Национальной галереи искусств США [1], поисковая система АЬаУ^а [2, 3]. Однако технология поиска, основанная на текстовых описаниях, ассоциированных с изображением, может быть применена только при поиске внутри ограниченной коллекции, а не в вычислительной сети Іпіетеї;, так как неоднозначность соответствия между визуальным содержанием и текстовым описанием снижает показатели точности и полноты поиска [4]. Поэтому для решения задачи поиска изображений во всемирной сети принято использовать механизм контекстного поиска изображений.
Поиск изображений по контекстному содержимому [5] - набор технологий для извлечения семантически связанных изображений из базы данных, основанный на автоматическом выделении характеристик изображения. То есть в базе данных выполняется поиск изображений визуально сходных с заданным изображением (изображением-шаблоном, изображением-образцом) по заданному набору свойств (характеристик, визуальных примитивов). Одной из наиболее используемых технологий контекстного поиска является технология, основанная на сравнении характеристик отдельных регионов (кластеров, областей) изображений.
Цель данной работы - проверить устойчивость статистических методов кластеризации изображений к основным модификациям изображений-образцов поиска путем расчета характеристики точности контекстного поиска.
В рамках поставленной цели выделено решение следующих задач:
- постановка задачи контекстного поиска кластеризированных изображений;
- постановка задачи оценки результатов контекстного поиска;
- экспериментальная оценка характеристики точности контекстного поиска кластеризированных изображений.
Согласно [6] все методы оценки качества работы систем контекстного поиска изображений можно условно разделить на две основные группы: неавтоматические и автоматические оценки.
Неавтоматические (или экспертные) критерии предполагают участие в процессе оценки систем контекстного поиска группы экспертов. Каждый из экспертов для заданного числа запросов выставляет субъективную оценку визуальной схожести образца и результатов запросов. В результате усреднения оценок экспертов для каждого из анализируемых запросов получается обобщенная характеристика соответствия образца результатам контекстного поиска. К недостаткам данной группы критериев оценки качества систем содержательного поиска следует отнести большую длительность процесса оценки и необходимость наличия большого количества экспертов для установления истинной оценки качества систем поиска изображений.
Автоматические оценки поиска изображений [6-8] базируются на двух следующих характеристиках: отзыве и точности. Обозначим набор изображений анализируемой базы данных релевантных (близких семантически, значимых) для образца запроса д как Я(ф, а результаты запроса -Q(q). Тогда точность (Р) поиска определяется как доля среди найденных изображений релевантных для запроса поиска д:
р = \ ^Я) п К(Я)\ (1)
\Q(q)\ .
Отзыв (К) характеризует долю определенных для рассматриваемого тестового набора релевантных изображений:
К = \ ^д) п я(д)\ (2)
I К(д) I .
Кроме этих автоматических характеристик в работе [7] выделяют две
дополнительные оценочные метрики. Осадок (К) отражает долю нереле-
вантных изображений в результате запроса д:
К = ^(д)\-^(д) п К(д) |
N -1 К(д) | , ()
где N - общее количество изображений анализируемой коллекции. Метрика общности (О) характеризует долю релевантных изображений в рассматриваемой базе данных и определяется как:
О = \ К(д) \. (4)
N
Основным недостатком данной группы оценочных метрик можно считать сложность автоматического выделения групп релевантных изображений.
Также при оценке качества работы систем контекстного поиска используют критерий точности при поиске модифицированных изображений коллекции [5]. Среди основных модификаций - поворот, перенос, масштабирование объектов внутри изображений и изображений целиком.
Подсчет характеристики точности контекстного поиска проводился на коллекции изображений Ванга [9], содержащей изображения 10 классов: динозавры, цветы, памятники, пейзажи, пляж, автобусы, слоны, пища, люди, лошади. Анализируемый тестовый набор представлен в формате jpeg, размер изображений 256х384 пикселей, общим количеством 1000 изображений. В представленном выше перечислении изображения упорядочены по возрастанию показателя средней энтропии групп.
Необходимо отметить, что автоматические оценки качества содержательного поиска тесно связаны с качеством разделения изображений на группы, т.е. с качеством выделения релевантных для образца поиска изображений. К сожалению, на сегодняшний день не существует результативных методов автоматической оценки качества группировки изображений в семантические группы. Наиболее действенными считаются методы оценки эффективности выделения семантических групп изображений, основанные на экспертной оценке [6].
В данной работе предлагается необходимым, но не достаточным, условием правильности разделения изображений тестового набора на семантические группы считать максимально отличающиеся средние показатели энтропии созданных групп (при минимальной дисперсии энтропии в группах). В данном случае под энтропией понимается цветовая сложность изображений [10].
Проанализируем используемый тестовый набор с точки зрения рассмотренного критерия. На рис. 1 приведены средние показатели и дисперсии энтропии для каждой из анализируем групп.
16 -14 -12 -к 10 -
Ь-
н
с» 6
4 -2 -0 -
□ Среднее значение энтропии внутри группы □ Дисперсия энтропии внутри группы
О
.О
с
с
го
с
Название группы
го s s
^ 3 Е
S 2 го
— ь I
Рис. 1. Матожидание и дисперсия энтропии семантических групп
Как видно из полученных графических результатов, в качестве наиболее правильно выделенных групп с точки зрения минимального разброса значений энтропии можно назвать следующие: автобусы, трава, лошади, динозавры. Среди наименее эффективно выделенных можно выделить такие группы: цветы, пища и памятники.
Кроме того, если рассматривать весь тестовый набор в совокупности, то значения средней энтропии многих групп слишком близкие, что говорит о возможности двузначностей при автоматическом поиске.
Таким образом, в качестве наиболее эффективно выделенных семантических групп стоит отметить группу изображений динозавров и группу изображений лошадей - они содержат наиболее отличающиеся между собой изображения с точки зрения показателя энтропии.
Для кластеризации изображений используется статистический иерархический агломеративный алгоритм, описанный в [11]. Для контекстного поиска использовались формулы и методы, описанные в [5].
Как основной критерий качества контекстного поиска используется оценка характеристики точности. В качестве результатов поиска рассматривались 10 наиболее близких изображений, т.е. №(ф\=10, \Я(д)\=100, 0=0.1.
На рис. 2 представлены графические результаты оценки точности контекстного поиска кластеризированных изображений. По оси ординат показана усредненная характеристика точности поиска, по оси абсцисс произведена сортировка результатов по возрастанию средней энтропии внутри групп.
Рис. 2. Графические результаты оценки характеристики точности контекстного поиска кластеризированных изображений
Полученные графические подтверждают предположение о том, что изображения групп с близкой энтропией искажают показатели точности контекстного поиска.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Башков Е.А., Шозда Н.С. Поиск изображений в больших БД с использованием коэффициента корреляции цветовых гистограмм // GraphiCon’2002. -Нижний Новгород. - 2002. - C. 458-460.
2. Qui G., Palmer R.D. WISE: A Content-based Web Image Search Engine //// Proc. Multimedia Computing and Networking 2001. - San Jose, CA, USA. - January 2001. - vol. 4312, №4312. - P. 150-161.
3. http://images.altavista.com/.
4. Байгарова Н.С., Бухштаб Ю.А., Евтеева Н.Н. Современная технология содержательного поиска в электронных коллекциях изображений. - Институт прикладной математики им. М. В. Келдыша РАН, http://artinfo.ru/eva/ eva2000M/eva-papers/200008/Baigarova-R.htm.
5. Wang J. Z., Li J. Wiederhold G. SIMPLIcity: Semantics-Sensitive Integrated Matching for Picture Libraries // IEEE Transactions on Pattern Analysis and Machine Intelligence. - 2001. - vol. 23, №9. - P. 947-963.
6. Long F., Zhang H., Feng D.D. Fundamentals of Content-based Image Retrieval // Multimedia Information Retrieval and Management - Technological Fundamentals and Applications. - Springer. - 2002. - 69 p.
7. Edgar S.J., Holliday J.D., Willett P. Effectiveness of Retrieval in Similarity Searches of Chemical Databases: A Review of Performance Measures // Journal of Molecular Graphics and Modelling. - 2000. - №18. - Р. 343-357.
8. Schettini R., Ciocca G., Zuffi S. A Survey of Methods for Colour Image Indexing and Retrieval in Image Databases,
http://www.intelligence.tuc.gr/~petrakis/courses/multimedia/papers/color-
survey.pdf.
9. Коллекция изображений группы исследователей Ванга, http://wang.ist.psu.edu/~jwang/test1.tar.
10. Прэтт У. Цифровая обработка изображений. - М.: Мир, 1982. - Кн. 2. - 480с
11. Башков Е.А., Вовк О.Л. Оценка эффективности нового статистического иерархического агломеративного алгоритма кластеризации для распознавания регионов изображений // Системні дослідження та інформаційні технології.
- Інститут прикладного системного аналізу НАН України, Київ. - 2005. -№2. - С. 117-130.
С.В. Бирюков
АВТОМАТИЗАЦИЯ ФУНКЦИОНАЛЬНОГО ТЕСТИРОВАНИЯ
WEB-СЕРВИСОВ
В настоящее время все большее распространение получают серверные приложения, реализующие web-сервисы. Под web-сервисом здесь понимается любая программная система, доступная посредством сети и использующая стандартизованную систему ХМЬ-сообщений. Это приложение, к которому можно обратиться, используя специальный формальный