Таким образом, описанные алгоритмы позволяют проектировать разнообразные системы обработки многозональных изображений,
которые в зависимости от задачи могут обнаруживать сигналы произвольной формы на спутниковых снимках.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Прэтт, У. Цифровая обработка изображений / У. Прэтт. - М.: Мир, 1982. - Т. 1. - 3 ] 2 с.
2. Крамер, Г. Математические методы статистики / Г. Крамер. - М. : Мир, 1975. - 648 с.
3. Васильев, К. К. Обнаружение точечных аномалий на фоне мешающих изображений / К. К. Васильев, В. В. Балабанов // Радиотехника. - 1991. - № 10. - С. 86-89.
4. Васильев, К. К. Представление и быстрая обработка многомерных изображений / К. К. Васильев, В. Р. Крашенинников, И. Н. Синицын,
УДК 621.391
В. И. Синицын // Наукоёмкие технологии. - 2002. -Т. 3, № 3. - С. 4-24.
5. Васильев, К. К. Методы обработки сигналов. - Ульяновск : УлПИ, 1990. - С. 95.
6. Левин, Б. Р. Теоретические основы статистической радиотехники / Б. Р. Левин. - М. : Сов. радио, 1966. - 686 с.
Васильев Константин Константинович, доктор технических наук, профессор, заведующий кафедрой «Телекоммуникации» УлГТУ, заслу-женный деятель науки и техники РФ. Область научных интересов - статистические методы представления и обработки многомерных случайных сигналов и полей.
Дементьев Виталий Евгеньевич, аспирант кафедры «Телекоммуникации» УлГТУ. Имеет работы в области статистической обработки изображений
В. Р. КРАШЕНИННИКОВ, В. В. КУЗНЕЦОВ, Е. А. РАСПУТЬКО
АЛГОРИТМ ВЫБОРА ЭТАЛОНОВ В ЗАДАННОМ КОНЕЧНОМ МНОЖЕСТВЕ ЭЛЕМЕНТОВ
Рассматривается задача выбора определённого количества элементов из заданного конечного множества элементов. Выбор должен быть оптимальным по некоторому критерию. Такая задача возникает, например, при распознавании речевых сигналов и других образов, когда их класс нужно достаточно хорошо представить несколькими эталонами. Предложены экономные алгоритмы, дающие близкие к оптимальным решения.
Ключевые слова: множество элементов, алгоритм выбора эталонов.
Постановка задачи
Имеется конечное множество элементов Р = {р1,р2,...,рп}. Для любых элементов р1
и pJ из Р определена функция (квазиметрика)
с$(Р< »Р /)» которая из аксиом метрики, возможно, не удовлетворяет только аксиоме треугольника. В приложениях с1(рпр^ является степенью какого-то различия между элементами р1 и р;. Например, это может быть некоторая разница между спектрами звуковых сигналов, корреляционными функциями изображений и т. д.
Из Р требуется выбрать подмножество к
элементов Е = {е],е2,...,ек}с Р, которые будем
В. Р. Крашенников, В. В. Кузнецов, Е. А. Распутько, 2006
называть эталонами. При этом среднее квазирасстояние
1
п-к
£тіп {d(pl,eJ),eJєE} (1)
р,еР
от элементов Р до ближайших эталонов должно быть минимальным.
Таким образом, элементы из множества/3 разбиваются на к классов, в каждом из которых Р(е1) содержатся элементы, для которых е1 является ближайшим эталоном. На
рис. 1, а показано множество из 50 точек плоскости. На рис. 1, б показан выбор 5 эталонов, каждый из которых соединён линиями с элементами из своего класса.
Подобная задача возникает, например, при распознавании речевых сигналов (фо-
нем, слогов или слов) с использованием эталонов. Ввиду изменчивости речи обычно требуется несколько эталонов одного звука. Поэтому требуется из имеющихся вариантов произнесений выбрать представительный набор эталонов.
Л
# • •
*
^ • *
4
К
а
Рис. 1
Решение простым перебором
Сформулированная задача, очевидно, может быть решена простым перебором. Нужно перебрать все способы выбора к элементов из п, то есть все сочетания, и выбрать то из них, для которого (1) минимально. Однако технически выполнить этот перебор трудно или даже невозможно ввиду очень большого числа сочетаний п(п - - к + \) / к\ Например, при п = 60 и
к = 5 требуется около 10 минут работы ПК с тактовой частотой 2,5 гГц.
Квазиоптимальный алгоритм улучшения решения
Сначала случайным образом выбирается первоначальный набор эталонов £, = {е]9е2,...,ек}, для которого по формуле (1) вычисляется соответствующее значение ^ =с1(Е,). Затем производится перебор всех вариантов замены эталона е, на элемент из Р \ Ех. Лучший из Е{ и
этих вариантов (в смысле минимума с/ ) запоминается и принимается за
и принимается за Е2 = {е[,е2,...,ек}, где е\ - оптимальная замена эталона е].
Затем производятся пробы замены второго эталона е2 в Е2 на элементы из множества
Р \ Е2. И так далее, вплоть до получения набора
эталонов Ек+1.
Описанная процедура производится ещё два раза, принимая перед её началом достигнутое
ранее Ек+] за £,.
Эксперименты с данным алгоритмом показали, что получаемый набор эталонов оказывается обычно тупиковым (не улучшается описанной процедурой) и, если и не является оптимальным, то довольно близок к нему, уступая 2-5 процентов. Выполняется алгоритм быстро, например, при п — 60 и к - 5 вместо 10 минут полного перебора требуется только 0,2 секунды. Существенно, что затрачиваемое время растет примерно линейно с ростом п .
Результат, естественно, существенно зависит от
первоначального выбора набора Е:. Поэтому целесообразно испробовать несколько первоначальных случайных вариантов £,. На множестве примеров было установлено, что обычно оптимальное решение находилось после нескольких десятков попыток. На рис 1, б показано оптимальное решение, которое было получено за 10 секунд.
Гравитационный алгоритм
Пусть элементы множества Р являются точками /^-мерного Евклидова пространства с обычной метрикой. Примем их за материальные точки с единичной массой в вязкой среде. Тогда эти точки будут испытывать взаимное притяжение с сопротивлением среды. Точки, расположенные ближе друг к другу, притягиваются сильнее, быстрее сближаются и соединяются в кластеры. На рис. 2, а показано первоначальное положение точек на плоскости. На последующих рисунках рис. 2, б-д показаны следующие друг за другом фазы перемещения и слияния точек.
Между слиянием точек в кластеры и разбиением их на классы Р(е1) по принадлежности к эталонам имеется аналогия - в обоих случаях происходит разбиение множества точек на группы близких друг к другу точек. Если при этом в процессе движения точек отмечать к самых крупных кластеров, принимая в каждом из этих кластеров наиболее близкую к центру тяжести точку за эталонный элемент, то получаются хорошие решения задачи выбора эталонов. На рис. 2, е показано решение для рассматриваемого примера.
% «
%
д
а л
4
* 4
*» *
В
Этот эвристический алгоритм прост в реализации, требует немного памяти - требуется хранить только текущие координаты и скорости движущихся точек. Вязкость среды имитируется умножением достигнутой на каждой итерации скорости точки на коэффициент с < 1.
Заключение Предложенные два алгоритма позволяют получить хорошие решения задачи выбора эталонов за приемлемое время, существенно меньшее, чем этого требует прямой перебор. Первый из этих алгоритмов более универсален, так как в исходном множестве элементов не предполагается какая-то чёткая структура, требуется только задание квазиметрики.
Крашенинников Виктор Ростиславович, доктор технических наук, профессор, заведующий кафедрой САПР УлГТУ. Имеет публикации в области статистических методов обработки сигналов и изображений.
Кузнецов Вячеслав Владимирович, студент пятого курса экономико-математического факультета УлГТУ.
Распутько Евгения Анатольевна, студентка четвёртого курса экономико-математи-ческого факультета УлГТУ.