РАЗДЕЛ III
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ. СИСТЕМЫ АВТОМАТИЗАЦИИ ПРОЕКТИРОВАНИЯ
УДК 535.318.001
ПОДХОД К ВЫБОРУ ПРИЗНАКОВ ОБЪЕКТА В ЗАДАЧАХ ОБНАРУЖЕНИЯ И РАСПОЗНАВАНИЯ ОБРАЗОВ
Б.Н. Епифанцев, д-р техн. наук, проф. Сибирская государственная автомобильно-дорожная академия (СибАДИ)
Аннотация. Получено выражение для плотности ложных решений при расшифровке изображений в виде функций от вероятности пропуска объекта, отношения сигнал/помеха, спектральной плотности мощности флуктуаций помех, формы выбросов от объектов на регистрируемом поле. Продемонстрирована эффективность использования этого подхода к выбору признаков объекта в задачах обнаружения (распознавания) образов.
Ключевые слова: обнаружение сигналов, распознавание образов, признаки, ранжирование по информативности.
Введение
В течение последних 20 лет темп генерируемой человечеством информации существенно превосходит скорость перевода ее в знания. Примером может служить спутниковая программа «Лэнд Сат», нацеленная на получение точнейшей фотографии каждого квадратного дюйма земной поверхности за период в 18 дней. Однако более 95% отснятого материала никто и никогда не видел несмотря на крайнюю необходимость знать, что происходит на поверхности Земли [1]. Подобная ситуация характерна для большинства направлений человеческой деятельности: от микробиологии до проектирования транспортных коммуникаций стратегического назначения.
Одним из направлений по «переводу данных в знания» является разработка алгоритмов обнаружения (распознавания) образов на случайных полях. Основная проблема здесь заключается в ранжировании (на этапе проектирования систем) признаков по обеспечиваемому приросту вероятности обнаружения (распознавания). Суть проблемы поясняет рис.1.
Вероятность обнаружения (распознавания) объектов Рп в зависимости от числа используемых признаков (полноты описания об-
разов) меняется в соответствии с кривой, расположенной между кривыми 1,2. Первая из них отражает наилучший случай, когда использование очередного признака дает максимальный прирост dPп/dI по сравнению с неиспользованными признаками.
РпЗ*
Рис.1. Варианты зависимостей вероятности правильного распознавания объектов заданного множества от полноты описания (числа признаков при фиксированной вероятности ложных решений) Достижение приемлемого уровня Р1П (11П ) обеспечивается в этом случае при небольшом
числе признаков, чем достигается максимальная экономия ресурсов распознающего автомата. При необходимости увеличения
Рп (Рп > Р(...11п)) потребуется значительное приращение ресурсов dI: автомат работает с менее информативными признаками.
В наиболее неблагоприятном случае (кривая 2) процедура распознавания объектов начинается с использованием малоинформативных признаков. Поэтому достичь сходных результатов Рп (11п )^ Рп (12п ) удается при существенном увеличении ресурсов машины, направленных на достижение поставленной цели.
При решении прикладных задах реальная
траектория РП = ср(1) располагается между
кривыми 1,2, и ее выбор определяется опытом разработчика системы. В [2] для описания формы изображения объектов предлагается 11 групп признаков. Вопрос об их ранжировании по информативности не поднимается. Чрезмерная трудоемкость процедуры построения эталонов классифицируемых образов стимулирует поиск формализованных процедур предварительной сортировки признаков по эффективности при решении задач обнаружения (распознавания) образов. Один из вариантов такой процедуры излагается ниже.
Подход к решению задачи
Под изображением объекта будем понимать локальный выброс на исследуемом поле и(х.у) в окрестности произвольной точки (х0, у0):
и (х - х0. У - У о) =
и ф+Аи
при (х,у) є D(x- Хо,У -Уо),
7 (х - Хо )2 (у - Уо У
иф, при (х,У) £ D(x - Хо,У - Уо),
если выполняется условие
где Ли - приращение амплитуды от объекта по сравнению со средним значением фона иф ; гх,гу - параметры, характеризующие размеры области D выброса; е- коэффициент формы выброса (при е = 0), и(х,у) е D-параллелепипед, при е = 1 - эллипсоид); Ls, Lе- операторы определения параметров изображения объекта: площади 5 и коэффициента формы е соответственно;
ипр , Smn , ^пах , ешт , етах " пороги принятия
решений. Амплитудный порог ипр находится из решения интегрального уравнения
Рп о = \а(Аи / D) ёАи,
(2)
отражающего условие «вероятность правильного обнаружения минимального объекта Рпо должна быть не ниже допустимой», а>(Аи / D) - плотность распределения приращений амплитуд от искомых объектов.
Ограничение форм объектов простым набором конфигураций (є є о;1) не снижает общности в постановке задачи: любая сложная форма объектов может быть представлена суперпозицией простых.
При задании Рпо (ипр) плотность ложных
решений определяется через известные выражения
п ■ и
К ______ ' Лв пр
Л/2П
ст
ехР [о^ (ипр/стиф )2 ],
(3)
иф
д2х(х,о) д2х(x, У)
дх2
г&Х(х1У)_л 2
дх ■ дУ
дУ2 \2жа1ф ) -1
(4)
х_о У _о
где х(х, у) - корреляционная функция флуктуаций поля излучения (отражения) фоновых образований, х(0,0) = а1ф - дисперсия флуктуаций.
Для уменьшения числа ложных решений каждый выброс, по амплитуде превосходящий ипр анализируется (в соответствии с услови-
и
пр
є
ем (1)) по форме s и размерам S. Пороги S„;„, S„„ „,s„;„ ,s„„„ есть минимальные и
максимальные значения параметров выявляемых объектов. Результат сортировки выбросов по пространственным признакам представим в виде
S S
max max
К1 ж = Su • Клв | Ja(s,s/ AU) d s d s, (5)
min min
a
ЛВ
U
Y
ПР
1
2П
ЛВ
U
<JU
v иФ У Л3
2аиф • Ve
exp
ПР
V<Juф У
-1
ф
0,5
(6)
a
(Se )=Пл
Unp
exp
к°цФ У
Пл
U
ПР
S
<JT
. (7)
U *(x> У ) =
1 -
У
Y
2AU • rx 2AU • r
ограниченного сверху поверхностью (8), а снизу поверхностью и * (х, у )= 0,
V = 2яЛив^Гх • Гу /(е +1). (9)
Сделав несильное допущение: »(У )»), учитывая выражения (6), (9), а также извест-
^гх ■ гу = о1 /п ■ и,„
ное соотношение
' X ’ У w иф ' '! лв w Пр ’
после несложных преобразований получаем
где Su - площадь анализируемого изображения, а($,е/Ли)-условная плотность вероятностей распределения параметров выбросов.
Выражение для плотности со($,е / ли) можно получить следующим образом.
Известно, что для однородных случайных полей, корреляционные функции которых имеют четвертные производные, выбросы за
уровень л/зЖ0) представляют собой сегменты эллиптических параболоидов. Объемы Ув и площади сечений Sв этих параболоидов описываются распределениями вида
a(s) = -y/2(s +1) • (is +1 + 42)
. (10)
a
Если снять указанные выше ограничения на корреляционные функции, разнообразие форм выбросов возрастает. Это разнообразие можно учесть, используя выражение
у У
2 2 x у
при V(x,у):--------1---< 2AU.
• AU
(8)
В большинстве известных приложений модификации форм выбросов укладываются в интервал е е [0,2]. Выполнив необходимые преобразования по приведению плотности (10) к усеченной для указанного интервала, получим
(1 + 42 )• (л/э + 42)/ 2 • (л/3 -1)-(е ) = < е +1 • (л/е +1 + 42)
при £ е [0,2],
0, в противном случае .
В отличие от (о^в) плотность »(ев) не зависит от вида корреляционной функции поля. Поэтому
с»^, е/ЛUD )=®^в )-®(ев) • (12)
Выражения (2) - (5), (7), (11), (12) есть решение поставленной задачи по определению
ложных решений автомата К1 лв в общем виде. Для получения практических результатов рассмотрим пример.
Использование критерия (5) на практике требует знания корреляционной функции х(х, у). Процесс получения экспериментальных оценок х(х, у) не имеет каких-либо особенностей. Будем считать их известными, а для иллюстрационных целей остановимся на корреляционных функциях, часто встречающихся на практике:
(11)
Нетрудно проверить, что при е = 0 выражение (8) описывает эллиптический цилиндр, при е = 1 - эллиптический параболоид, при е = да - дельта-функцию и т.д. Объем тела,
X (х, У ) = &12exP(-Jp Х2 (X У) = &2 exP
х1 х 2 + р!\у 2
2 ~xp-(- pt.х х
pty У 2
);
(13) ), (14)
Функции (13), (14) отражают своего рода граничные случаи: поле, описываемое х (х,у),
2
Ф
2
X
х
не дифференцируемо, а х2(х,у)- дифференцируемо бесконечное число раз.
Дифференцируемость однородного случайного поля (тх, ту ) раз означает, что существует интеграл вида
ди
dxmx ду
ад ff
x _ o _(-1)
(2п)
(15)
m mv
m"mxmyy
G(mx ,ту ^)dm xdm у
<ад
где
G(mx У у ) -
где
h (mx ,ту ) -
комплексно-сопряженная
При выводе (18) и (19) принято ах = а2 = &ф , а также р1х = рх/л/2,
Р\у = Ру / л/2_ , р2 х = Рх , р2 у = Ру .
Последнее условие следует из выравнивания областей $ф пространственной корреляции
рассматриваемых случайных полей (13) и (14). Подставим (18), (19) в (15) вместо
и принимая для упрощения расче-
G(mx У у )
тов Px _ Ру _ Рф - rax _ ray _ Га , получим
пространственный спектр
мощности поля, связанный с корреляционной функцией соотношением Винера-Хинчина
ад
фу)_f fXx,у^^гі^+уЛ dxФ (16)
Спектральная плотность мощности регистрируемых изображений ограничена некоторой частотой среза. Это обусловлено тем, что процесс формирования информационного поля неизбежно сопряжен с подавлением верхних частот с помощью фильтра (апертуры) с передаточной характеристикой h {рх,ау):
Ga {®х У у )= G {®х ,ау ) Iй* {®х У у )|2, (17)
величина передаточной функции апертуры. Распространенный вид пространственного фильтра - гауссоидальный
и (»х»)=^и.5»2+г»)].
Выполним преобразование Винера-Хинчина (16) для функций (13), (14) и, применив к полученным спектрам операцию (17), получим
пРф
0,25ГаРф УП(ra 4Ї / рф) - т
1 - Г- P^^2nF (ra V2 / Рф ) ^
П =ПРФ [1 + (4Га2/ РФ )] •
При вычислениях производных корреляционных функций использовалось известное соотношение из [3]:
j еХР • (- CKZ к) ZK (1 + У* dz к =
0
= Г(v)U(v Мк + V + 1 ZK) ,
где Г (у) - гамма-функция, U(...) - вырожденная гипергеометрическая функция Куммера, выражаемая через интеграл вероятностей, который, в свою очередь, с погрешностью
2,5 • 10-5 можно представить в виде: erf (zf 1 - F (zf ^ exp -(- z f. }
F (zf ) = 0,348 • (1 + 0,477zf )-1 - 0,09588 •
• (1 + 0,47 zf )-2 + 0,74785 • (1 + 0,47 zf )-3.
Подставляя найденные выражения в (5) и выполнив интегрирование, получаем
x ■ у
2
m
у
ад
і
ад
у- идентификатор способа обработки: при
у = 0 информация о геометрических параметрах изображения не используется, при у = 1 реализуется схема размерного селектора выбросов.
По изложенной методике определяется
плотность ложных решений К/ЛВдля других
типов функций корреляции помех.
Для проведения конкретных вычислений примем плотность вероятностей в (2) гауссовой с математическим ожиданием Аио и дисперсией ав и приведем выражение (2) к виду:
1 ад
РПС = ехр(- 7 2/2) (21)
с
где с = (Ъ*ПР - ОСП) аф / (70, ОСП - отношение сигнал/помеха. Результаты вычислений приведены на рис. 2-4.
Рис.2. Зависимости приведенной плотности ложных решений от ОСП для различных схем обработки информации: амплитудной селекции (сплошные линии), размерной селекции (штриховые линии) и селекции по форме выбросов (штрих-пунктирные линии)-при выявлении объектов на фоне помех с экспоненциальной 1.л и гауссовой 2.п корреляционными функциями при различных значениях /л: л = 0,125 (п=1), /и=1 (п=2
Анализируя выражения (20) и (21) можно сделать вывод, что основными параметрами, определяющими выбор способа обработки информации в проектируемой системе обнаружения (распознавания) образов, являются ОСП, обобщенный параметр , харак-
теризующий взвешенное отношение площади изображения минимального объекта к площади области корреляции флуктуаций фона, и верхняя граница интервала значений коэффициента формы изображения объекта. При заданном числе ложных решений и вероятности правильного обнаружения, используя (20) и (21) несложно оценить требуемое значение ОСП для различных способов обработки информации.
На рисунке 2 показаны зависимости логарифма отношения числа ложных решений к числу минимальных объектов, изображения которых покрыли бы всю поверхность фрагмента изображения, от ОСП для различных способов обработки изображений фона с разными корреляционными функциями. Сопоставление кривых 1.2 и 2.2 показывает, что операция порогового ограничения сигналов на
уровне ипр более эффективна для полей с
гауссовой корреляционной функцией. Изменением характера пространственных помех можно на порядок изменять плотность ложных
решений при заданной вероятности РПО.
Кривые 1.1 и 1.2 отражают известный на практике факт: чем ближе размер «пятнистости» поля помех соответствует размеру объекта, тем сложнее его обнаружить. Учитывая заметное расхождение функций 1.1 и 1.2, следует при подборе корреляционной функции помех стремиться максимально увеличить (или уменьшить) отношение радиуса корреляции фона к радиусу объекта.
Эффект введения операции сортировки выбросов по площади сечений на уровне
ипр значителен (штриховые кривые) особенно
для фонов с экспоненциальной корреляционной функцией. Если форма выбросов от объектов характеризуется большим разнообразием, например, е е [0,1], то использование этого признака для минимизации ложных решений не оправдано (см. штрих - пунктирные кривые в сравнении со штриховыми на рисунке 1). При однотипных по форме объектах с малым разбросом е привлечение этого параметра для классификации может характеризоваться десятикратным сокращением ложных решений (рисунок 3).
£так
-0,5
-1
Igk
Рис.З. Зависимость логарифма коэффициента помехоподавления ложных выбросов фона от коэффициента формы изображения объекта (є є 0, є max)
На рисунке 4 приведены характеристические кривые, связывающие плотность ложных решений с вероятностью правильного обнаружения при различных ОСП (ОСП = 5, кривые m.1 и ОСП = 4, кривые m.2) для различных способов обработки изображений: амплитудной и размерной селекции. Зная К /в / Nd и PHo , по кривым можно оценить требуемое
( при выбранном способе обработки данных) ОСП и характеристики помех. Например, при
К!ЛВ /Nd = 10-5 и PHo = 0,999 решающей
схемой, обеспечивающей min ОСП
(ОСПт^б), является размерный селектор
(кривая 1.1), при KjB/ND = 10-2 и
Pm = 0,99 способ обработки выбирается,
исходя из затрат, необходимых для реализации решающего правила.
Заключение
Преимущество рассмотренного подхода к выбору признаков в задачах обнаружения и распознавания объектов состоит в том, что он позволяет по задаваемым к системе требованиям: вероятности правильного обнаружения (распознавания) и плотности ложных решений - оценить необходимое для их достижения входное отношение сигнал/ помеха, выбрать структурную схему устройства принятия решений с учетом статистических характеристик изображения фона, указать пути их коррекции для снижения риска принятия решений
Рис.4. Зависимость логарифма плотности ложных решений от логарифма вероятности пропуска объекта при обнаружении на фоне помех с экспоненциальной ((m=1). n) и гауссовой ((m=2). n) корреляционными функциями методами амплитудной (сплошные линии) и размерной (штриховые линии) селекции при Л =0,125, ОСП=5 (п=1) и ОСП=4 (п=2)
Библиографический список
1. Гор Э. Земля на чаше весов. Экология и человеческий дух. - М.: ППП, 1993. - 432с.
2. Ерош И.Л. Обработка и распознавание изображений в системах превентивной безопасности/ И.Л. Ерош, М.Б. Сергеев, Н.В. Соловьев - СПб.: СПбГУАП, 2005. - 154с.
3. Справочник по специальным функциям / Под ред. М. Абрамовица и И.Стиган - М.: Наука, 1979. - 830с.
The approach to a choice of signs of object in problems of detection and recognition of images
B.N. Epifancev
Expression for density of false decisions is received at decoding of images in the form of functions from probability of the admission of object, the relation a signal/hindrance, spectral density of capacity of fluctuations of hindrances, the form of emissions from objects on a registered field are also considered. Efficiency of use of this approach to a choice of signs of object in problems of detection (recognition) of images is shown.
Епифанцев Борис Николаевич - д-р техн. наук, проф., зав. кафедрой «Информационная безопасность» Сибирской государственной автомобильно-дорожной академии. Основное направление научных исследований - информационная безопасность. Имеет более 200 опубликованных работ. E-mail: epifancev_bn@sibadi. org.
Статья поступила 15.06.2008 г.