6. Точки множества EWN и только они являются
вершинами многогранников полиперестановок П(G(i1,i2,...,in),H) V є Ln .
Справедливость этого утверждения следует из соотношения (8) и из того, что точки множества ENk(G(ii,i2,...,in),H) совпадают с множеством вершин многогранника полиперестановок П (G(ii,i2,...,in),H).
7. Для множества EWN справедливы соотношения:
EWn с conv (Un(G(ii,i2,...,in),H), (ii,i2,...,in) є Ln), EWn = ( Un(G(ii,i2,...,in),H),(ii,i2,...,in) є Ln)П П SN-2 5
где Sn _2 — сфера, определяемая соотношениями
(3)-(4).
Доказательство этих соотношений непосредственно вытекает из выражений (3), (4) и (8).
Выводы
Таким образом, получены новые теоретические результаты, касающиеся свойств композиционных образов комбинаторных множеств.
В работе введены классы композиционных образов комбинаторных множеств, построенные с помощью конструктивных средств, описанных в [6]. Описание и исследование свойств сформированных классов k - образов комбинаторных множеств в рамках предложенного подхода позволяет получать результаты, менее громоздкие и более удобные для применения в математических моделях задач, чем результаты, получаемые в соответствии с общей комбинаторной схемой. Исследован класс k - образов комбинаторных множеств — композиции перестановок. На основе отображения в евклидово пространство сформулированы свойства композиции перестановок, касающиеся распределений по плоскостям, симметрии, представления в виде объединения множеств с известными свойствами.
УДК 681.3 + 519.65
ПОЛИГОНАЛЬНАЯ АППРОКСИМАЦИЯ ГРАНИЦ НЕВЫПУКЛЫХ ОБЛАСТЕЙ
ЛЕСНАЯ Н. С, СМЕЛЯКОВА А. С._________________
Предлагается метод полигональной аппроксимации границ звездчатых областей с заданной точностью, определяемой среднеквадратичным отклонением или метрикой Чебышева. Даются оценки трудоемкости метода.
1. Введение
Актуальную проблему в области обработки данных [husdal.com/index.htm] и решения задач распознавания и классификации в диапазоне от медицины
Научная ценность полученных результатов состоит в построении классификации k - образов комбинаторных множеств и формировании основы для разработки математических моделей многих задач, имеющих сложную комбинаторную природу.
Практическая значимость заключается в том, что результаты могут быть использованы при моделировании и решении дискретных оптимизационных задач геометрического проектирования.
Дальнейшие исследования в данном направлении могут быть связаны с постановкой и решением на основе описанных результатов классов задач оптимизации на композиционных образах комбинаторных множеств.
Литература: 1. Сергиенко И.В. Математические модели и методы решения задач дискретной оптимизации. К.: Наук. думка, 1988. 472 с. 2. Стоян Ю.Г., Яковлев С.В. Математические модели и оптимизационные методы геометрического проектирования. К.: Наук. думка, 1986. 268 с. 3. Сачков В.Н. Комбинаторные методы дискретной математики. М.: Наука, 1977. 320 с. 4. Стоян Ю.Г., Ємець О. О. Теорія і методи евклідової комбінаторної оптимізації. К.: Інститут системних досліджень освіти, 1993. 188 с. 5. Емец О.А., Роскладка А.А., Роскладка Е.В. Применение евклидовых поликомбинаторных множеств к построению моделей оптимизационных задач // Abstracts Second International School on Actuarial and Financial Mathematics (June, 812, 1999, Kyiv). Kyiv, 1999. P 20. 6. СтоянЮ.Г, Гребенник И.В. Специальные классы комбинаторных множеств в геометрическом проектировании. // В кн.: Сборник тезисов докладов по материалам 10-й юбилейной меж-дунар. конф. “Теория и техника передачи, приема и обработки информации”. Харьков-Туапсе, 2004. С. 253-254.
Поступила в редколлегию 12.07.2005
Рецензент: д-р техн. наук, с.н.с. Романова Т.Е.
Гребенник Игорь Валериевич, канд. физ.-мат. наук, доцент, докторант кафедры системотехники ХНУРЭ. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. (057)702-10-06.
до наук о земле [1, 2, 3] представляет векторизация границ объектов по их цифровым снимкам. Ее возникновение связано с тем, что использование растровых изображений, занимающих до 12 МБ, снижает эффективность как самого анализа, так и хранения и использования его результатов. Поэтому после сегментации изображений земной поверхности, облачности, солнечных пятен, радужки и иных объектов образы анализируемых объектов представляют в виде замкнутых контуров или линий [1]. Однако их попиксельное описание также обладает чрезмерной избыточностью, в связи с чем возникает задача их аппроксимации ломаными [4] и реже, из-за сложности их использования, — гладкими кривыми. Выдвигаемое при этом требование оперативной автоматизации обусловлено ограниченной возможностью привлечения специалистов для оперативного анализа больших объе-
РИ, 2005, № 3
73
мов данных и необходимостью получения решения, как правило, в реальном масштабе времени.
При аппроксимации используют различные подходы, которые, в основном, носят эвристический характер и связаны с разбиением исходного контура на фрагменты, исходя из некоторых рациональных соображений, к которым применяются различные методы аппроксимации. Поэтому решение проблемы векторизации требует привлечения специальных методов вычислительной геометрии [ics.uci.edu/~eppstein/geom.html], прежде всего — методов полигональной аппроксимации, ориентированных на учет разнообразных ограничений, определяющих особенности прикладных задач.
Важнейшими в этом отношении являются задачи аппроксимации линий и построения диаграмм Вороного (Тиссена). Вместе с тем, даже тип линий может существенно варьироваться от задачи к задаче — от ломаных и линий, составленных из дуг окружностей и отрезков [cosy.sbg.ac.at/~held/held], до кубических сплайнов [5, 6]. В этом отношении полигональное представление изображений объектов тем более актуально, что в геоинформационных системах используется именно эта модель данных.
С точки зрения целей и ограничений можно выделить два класса задач векторизации — аппроксимации контуров и незамкнутых линий. В первом случае ряд важных ограничений формулируется в отношении положения точек относительно внутренности контура, где экстремальные свойства точек зависят от их удаленности от центра объекта [7]. Ограничения оказывают существенное влияние на результат решения, задавая условия на размещение узлов аппроксимантов: только с одной стороны от исходной линии (например, в задачах наблюдения [8]), на исходной линии (в картографии, для замены фрагмента отрезком при допуске на его отклонение от кратчайшей [9]), ортогонально к некоторым сечениям [esd.ornl.gov/~hnw] и др.
В качестве критерия точности аппроксимации, как правило, рассматривается отклонение в среднем [9, 10] (в смысле ско, є -полосы и др.), а также эвристические соображения[3, 10], что не всегда адекватно отражает особенности прикладных задач. Поэтому выбор метрики и оценку точности результата целесообразно производить по этапам: так, если для фильтрации шума предпочтительна аппроксимация в среднем, то для сохранения локальных особенностей трасс — использование метрики Чебышева. Использование же аппроксимантов, получаемых в є -полосе, по сути, не представляет ни одну из них. Эту ситуацию наглядно иллюстрирует актуальная задача анализа выступов “игольчатой” формы, рассматриваемых в картографии, иридодиагностике и др. При использовании критериев типа ско они срезаются, а построение аппроксиман-та в є -полосе ведет к неоправданному росту трудоемкости и получению решения с большей точностью там, где это не требуется. Для этого случая адекватным является построение полигона с анализом отклонения в метрике Чебышева. Однако из-
за сложности задач полигональной чебышевской аппроксимации для границ невыпуклых областей развитие эффективных численных методов для задач этого класса не получило эффективного развития.
Цель исследования состоит в разработке метода полигональной аппроксимации границы звездчатой области, применение которого в реальном масштабе времени позволяет решать широкий класс прикладных задач сокращения избыточности описания границ невыпуклых объектов, достаточно общей моделью которых и являются области такого типа. При этом минимизация числа вершин полигонального аппроксиманта должна производиться с заданной точностью, которая может определяться различными критериями, при различных ограничениях на расположение его вершин. В иллюстративных целях и для оценки эффективности этого метода рассматривается возникающая в иридодиагностике [7] задача аппроксимации автономного кольца (АК) — звездообразной замкнутой линии раздела зрачкового и цилиарного поясов, которая обладает достаточной общностью в отношении размерности, ограничений на положение узлов интерполяции и требований по точности.
2. Постановка основной задачи и ее декомпозиция на систему базовых задач
Рассмотрим основные требования, которые возникают при решении задач рассматриваемого класса, поясняя их численно на примере аппроксимации АК.
Считаем, что задана погрешность д представления исходныхданных—вершин g; ломаной у = (gi)i=i,m с координатами (xi ,yi), а также допуск Д* (предельно допустимая погрешность векторизации), в пределах которого отклонения аппроксиманта не влияют на результат (например, в целях визуальной или численной оценки объектов). В этом отношении допуск Д * может определяться соответственно разрешающей способности глаза или из иных соображений.
Поскольку изображение радужки, в конечном счете, анализируется экспертом визуально, с увеличением в 20 — 30 раз, естественно потребовать, чтобы при этом не возникало искажений, обусловленных аппроксимацией. При среднем увеличении в 25 раз это соответствует отображению радужки на весь экран 17-дюймового монитора при среднем разрешении 1152 х 864 пикселей, или ее фрагментов — при максимальном разрешении 1800 х1800 пикселей, соответствующем увеличению исходного изображения в KF = 50 раз.
Такая точность требует порядка Ф = 1800 х 1800 х 3 байт в формате RGB, т.е. порядка П = 9 МБ. В то же время разрешающая способность глаза не превышает 1' дуги, что при среднем расстоянии l = 50 см до изображения такого же размера соответствует величине порядка 0.15 мм, или 0.5 пикселя. Иначе
74
РИ, 2005, № 3
говоря, для разрешения KF естественная погрешность представления данных (с точностью до пикселя) соответствует максимальной разрешающей способности глаза человека при рассмотрении изображения радужки в формате ф с расстояния і.
В то же время, поскольку границы объектов на радужке получены в результате сегментации, погрешность положения элементов, определяющих границу, составляет несколько пикселей, что при наибольшем разрешении по порядку величины не меньше ДIN « 1 мм. Поэтому величину Д* > Д IN можно назвать предельной погрешностью для ап-проксиманта границы (соответственно значениям параметров l, Kf и ф ), поскольку в рамках этой величины отклонения, обусловленные аппроксимацией, не воспринимаются визуально и, в общем, адекватны точности сегментации.
Вместе с тем, не все вершины из У = {gi}i=1,m одинаково значимы. Некоторые из них, прежде всего те, что определяют экстремумы по выпуклости (вогнутости), могут быть приняты за полюса интерполяции, поскольку их смещение нежелательно, так как может существенно исказить форму аппроксиманта. Положение же промежуточных вершин не столь критично.
Это позволяет представить исходную задачу как задачу интерполяции по нескольким полюсам, между которыми решаются однотипные задачи аппроксимации. Эта декомпозиция позволяет существенно понизить размерность рассматриваемых задач аппроксимации без ущерба для точности решения исходной задачи, а значит—и значительно повысить вычислительную эффективность метода.
Так, поскольку зубцы автономного кольца считаются иридознаками, а место и уровень их выбухания в сторону цилиарного пояса определяют тип и степень предрасположенности к заболеванию [7], искажение положения экстремальных точек наружных и внутренних зубцов нежелательно, а положение промежуточных — гораздо менее критично. Использование этого фактора позволяет, в условиях фиксирования полюсов, существенно снизить требования по точности аппроксимации в целях понижения размерности аппроксимантов.
Из тех же соображений актуально введение меры (или критерия) точности аппроксимации. Так, в случае, когда отдельные “значимые” отклонения несущественны (в силу погрешностей сегментации или малой практической значимости), что имеет место, например, при аппроксимации границы зрачка, имеет смысл минимизировать средний квадрат отклонения. Но в тех случаях, когда подобные отклонения несут значимую информацию, как в случае зубцов автономного кольца, не включенных в состав полюсов, положение которых значимо для диагностики, имеет смысл минимизировать меру отклонения по Чебышеву.
Так, пусть на плоскости дана последовательность точек у = {gi }i=i,m , определяющая фрагмент грани-
цы некоторого объекта, который в системе координат E{O,x,y} может быть расположен так, что x -координаты точек gi лежат на интервале (-a, a), причем gix = -a , gmx = a . Заметим, что если фрагмент допускает такое каноническое представление (вопрос существования рассматривается ниже), то
система E{O,x,y} находится простым сдвигом и поворотом исходной системы координат.
В этих условиях аппроксимирующим полигоном hk порядка k назовем ломаную hk = H0Hi...Hk с концами в точках H0 (-a,0), H (a,0), которая определяет однозначную функцию y = hk (x). Тогда принятые к рассмотрению меры точности аппроксимации — среднеквадратическое и чебышевское уклонения — примут вид
Pr(y,hk) = ^-1 Еp(gi,hk)2 , (1)
PC(y,hk) = maxp(gi,hk), (2)
p(gi,hk) = minP(gi,t), tehk
где p(gi,hk) — евклидово расстояние от точки gi до ломаной hk.
Важная особенность рассматриваемой задачи определяется тем, что вычисление расстояния p(gi, hk) требует выполнения определенных затрат и, в отличие от функциональной аппроксимации, расстояние p(gi,hk), в общем, не равно разности ординат | giy - hk (gix) I , а определяется длиной кратчайшего отрезка, соединяющего точку gi с ломаной hk.
Поэтому построение эффективного метода нахождения уклонений p(gi,hk) точек от полигона, используемых как при чебышевской, так и при среднеквадратичной аппроксимации, представляет базовую задачу 1. Она является вспомогательной для решения задачи 2, состоящей в нахождении аппроксиманта hk, т.е. его порядка k и промежуточных узлов H1,...,Hk-1 для последовательности точек у = {gi }i=1,m . В свою очередь, исходные данные для задачи 2 получаем в результате решения задачи 3, состоящей в выборе узлов интерполяции, т.е. тех вершин исходного контура Г , полученного при сегментации, которые принимаются в качестве конечных вершин фрагментов типа у .
В этих условиях основная задача аппроксимации сводится к построению правила выбора полюсов, соответственно особенностям прикладной задачи, и решению задачи 3. Однако, если полюсов недостаточно для получения канонического представления всех фрагментов границы г , возникает задача 4 о выборе промежуточных полюсов и задача 5 оптимизации положения промежуточных узлов.
РИ, 2005, № 3
75
3. Определение уклонений точек от полигона
Пусть дана точка g; є у и отрезок HjHj+1 некоторого hk -полигона, определяющий прямую lj . Рассмотрим три вектора т = HjHj+i , v = Hjg; и w = Hj+ig; . Тогда, если проекция точки g; на прямую lj лежит на отрезке HjHj+i , то P(gi, НjHj+i) = |т х V /т| , или
p(giHjHj+i)
xvy -тyvx
c
c =
г2 + т2 •
(3)
иначе
P(giHjHj+l) = min {p(gi ,Hj), P(gi,Hj+i^. (4)
Углы между парами векторов т, v и т, w в случае (4) либо оба больше % /2 , либо меньше % /2 , а в случае (3) — один больше, а другой — меньше % /2 . Поэтому в первом случае произведение скалярных произведений
v = (т, V) • (т, w) = (т xvx +Т yVy)(T xwx +Т yWy) (5)
отрицательно, а в случае (4) — положительно. С учетом того, что вычисление компонент вектора т производится один раз для достаточно большой группы точек типа gi, трудоемкость расчета v составит
жv= ll (оп). (6)
При v < 0 расчет уклонения (3), c учетом пред вычисления параметров из (5), совместно с (6) составляет к і = 8 + ll = 19(оп). При v> 0 расчет двух расстояний (4) c учетом (5) и (6) требует также порядка кe = 4 + 4 + ll = 19(оп). Таким образом, в общем случае трудоемкость вычисления расстояния P(giHjHj+i) равна
к g = 19 (оп) . (7)
Замечания. Если k = l и полигон hi = Н0Н задан в каноническом виде — отрезком на оси ox, то вычисление расстояний {p(gi,hi)}i=km тривиально:
p(gi,hi) = |gi^ . Прямой поиск расстояний (3), (4)
имеет в 1.5 раза большую трудоемкость ввиду необходимости нахождения самой точки пересечения прямой lj с нормалью, проходящей через gi, и проверки ее принадлежности отрезку HjHj+i.
Если рассматривается k отрезков полигона hk, трудоемкость вычисления расстояний p(gi, Н jH j+i) для всех точек gi є у составляет величину порядка
кgh = k• m-кg(оп). (8)
Вместе с тем, при достаточно точной аппроксимации границы точками из у имеет место неравенство m >> k , что позволяет существенно понизить трудоемкость нахождения расстояний p(gi,HjHj+i) за счет распределения точек из у на подмножества Пj, соответствующие отрезкам НjHj+i. Построим
подобную процедуру, исходя из следующих геометрических соображений, где, для кратности, рассмотрим случай полигона h2.
Пусть Но,Ні,Н2 — вершины рассматриваемого полигона (рис.1), где Н0Ні,Н2Ні — перпендикуляры к соответствующим отрезкам, а ЩВ — биссектриса угла Н0Н1Н2 . Пусть gix є [Hox,H2x]; тогда из очевидных геометрических соображений следует, что для точек gefi3 , лежащих в области угла Н0НіН2 , выполняется p(g, у) = p(g,Hi). Поэтому точки из Q3 можно отнести или к Пі, или к П2 .
Также ясно, что точки, лежащие в области Qi (Q2), определяемой углом Н0Н1Н0 (Н0Н1Н2) , следует отнести к Пі (соответственно, к П2 ). Покажем, что точки, лежащие в областях Qi и Q2 определяемые углами Н0Н1В и Н2Н1В, следует отнести к Пі и к П 2, соответственно. Действительно, пусть g eQ'2, и gAi и gA2 — перпендикуляры на Н0Н и Н1Н2, а C — точка пересечения отрезков НіВ и gAi. Опустим из C перпендикуляр CF на Н1Н2 . Тогда длины отрезков CAi и CF равны и из рассмотрения сторон треугольника CFg следует, что длина отрезка gAi больше длины отрезка gF, являющегося гипотенузой треугольника gFA2, а значит и катета gA2. В итоге получаем, что все точки, которые в рассматриваемой области лежат левее биссектрисы ВНі , можно отнести к множеству Пі, а правее — к П 2. Для проведения этой дискриминации поступим следующим образом.
Пусть ті = Н0Н1, т 2 = Н1Н2 — направляющие векторы соответствующих отрезков, а q,C2 — их нормирующие множители (это те же параметры, что используются в (3) для вектора т). Тогда направляющий вектор т = (xc,yc) биссектрисы задается разностью единичных векторов т = ті /ci - т2 /c2 с компонентами
т(тx,Тy) = (Tlx/ci - т2x/c2, Tiy/ci - Т2y/c2)
и уравнение прямой ВНі имеет вид
1В (x, y) = Тy(х - Hix ) - Tx (y - Hiy ) = 0. (9)
76
РИ, 2005, № 3
Обозначим ю0 = signlB(H0). Тогда дискриминацию точек gi можно произвести по правилу
Igi ^Пь если ю0 • signl(gi)>0,
[gi —у П2, в противном случае. (10)
Трудоемкость определения знака signlB(x,y) можно уменьшить, если вместо вычисления (9) сравнивать значения (x - Hlx) и (y - Hjy)x х/ т у, что, с учетом предвычисления параметров векторов т, ті, т 2, требует порядка к в = 3(оп).
В случае полигона hk более высокого порядка выделяем Пі, затем — П 2, используя биссектрису в точке H2, а затем П3, и оставшиеся точки относим к П 4. Поэтому оценка (8) для метода биссектрис принимает вид
кп= m(kg + кв) (оп). (11)
В итоге, рассматривая отношение оценок Kgh и кп по (8) и (21), получаем, что использование метода биссектрис позволяет примерно в k раз уменьшить трудоемкость расчета искомых расстояний {p(gi, hk ))i=1,m и оценить ее величиной порядка
кп ~20 • m (оп). (12)
4. Нахождение вершин аппроксиманга
В целях нахождения первого, но достаточно точного приближения для промежуточных вершин аппроксимирующего hk -полигона заданного порядка (k = 1,2,3,4) поступим следующим образом. Для точек gi(x;,yi), (i = 1,2,...,m), расположенных в каноническом представлении, на основе МНК найдем уравнение полиномиальной регрессии k -го порядка на интервале A = [-a, a], а затем выберем точки его экстремумов на A в качестве промежуточных узлов Hj, (j = 1,..., k -1) для искомого полигона hk . Для краткости далее в суммах предполагается изменения индекса i от 1 до m .
В случае полигона h1 рассматриваем отрезок H0H1. В случае полигона h2 рассматриваем квадратичную параболу, проходящую через точки (-a,0), (a,0). В этом случае ее уравнение имеет вид
y = f2(x) = k(x2 - a2) . (13)
Параметр k будем искать из условия
D = — £[Уі - k(x2 - a2)]2 ^ min , mk
что дает оценку
k Zyi(xi2 ~a2)
Z(x2 - a2)2
с трудоемкостью порядка кh2 = 5m .
Поскольку экстремум в (13) достигается при x = 0 , для H1 получаем оценку вида H1 = (0,-ka2).
РИ, 2005, № 3
В случае полигона h3 рассмотрим кубическую параболу с неизвестными параметрами k,b , которая в рассматриваемых условиях принимает вид
y = f3(x) = k(x2 -a2)(x -b) , (14)
или f3(x) = kx3 -kbx2 -ka2x + kba2. (15)
Использование кубической параболы (14) позволяет аппроксимировать асимметричные относительно точки x = 0 (рис.2,а) и волнообразные (рис.2,б) распределения точек из у .
H1
а
H1
Н3
Рис. 2. Выбор промежуточных узлов аппроксиманта
В первом случае получаем h2 -полигон с узлами H0H1H2, где H1 отвечает экстремуму функции y(x) на интервале (-a,a); во втором — h3 -полигон H0H1H2H3 , где вершины H1 и H2 соответствуют экстремумам на интервалах (-a, b) и (b,a).
В общем представлении полином f3(x) имеет вид
f3(x) = a3x3 + a2x2 + a1x + a0 . (16)
Тогда с учетом (15) получим
a3 = k, a2 = -kb, a1 = -ka2, a0 = ka2b , (17)
a1 a0
откуда a3 = —^ a2 = —2 aa
и полином (16) приобретает вид
f3(x) = -2[(a2 -x2)xa1 + (a2 -x2)a0]. a2
Поэтому достаточно оценить коэффициенты a0 и a1. Используя для этого МНК, из условия
1 2 D = — Z(Уі -f(xi))2 ^ min
m a0,a1
получаем систему уравнений
[a0a11 + a1a12 = b1,
[a0a21 + a1a22 = b2. (18)
77
где
b1 = ЕУі(а2 - X2), b2 = ЕУі(а2 - х2)х;;
1 /2 2,2 1 /2 2,2 іаіі =-уЕ(a -хі) , аі2 =—2Е(а -хі) хі; а а
а21 - а12.
1 ^ , 2 2,2 2 а 22 =-т Е(а - хі ) хі •
Решая систему (18) по правилу Крамера и подставляя полученные значения ао,а1 в (17), получим
а
b _ Ь1а22 ~Ь2а12
Ь1а12 _ b 2а11
к _ Ь1а12 ~Ь2а11
2 2 ’ а (а11а22 _ а12)
с трудоемкостью порядка к3 = 12 m (оп).
Экстремумы функции (14) определим, приравни-
22
вая к нулю ее производную 3х - 2Ьх - а = 0 . Корни этого уравнения имеют вид
х1 =-
b-4 b2 + 3а2
х2 =-
b + 4 b2 + 3а2
33 В случае |b > а (см. рис.2,а) получаем аппроксимант типа h2 с одним экстремумом на интервале (-а, а) в точке |х*| < а ; именно
х* =
b-4 b2 + 3а2
3
b +
4b
2 + 3а2
при b > 0, при b < 0.
3
Тогда координаты H1 имеют вид (х*ф3(х*)).
В случае |b < а (рис. 2,6) получаем аппроксимант типа h3 с экстремумами в точках хьх2, определяющих вершины Н1(х1Т3(х1)) и Н2(х2Т3(х2)) .
В случае полигона h4 рассматриваем полином
І4(х) = а4х4 + а3х3 + а2х2 + а1х + ао, (19)
который, по условию, можно представить в виде І4(х) = к(х2 -а2)(х2 + Ьх + с), (20)
х4 х3 х4
f4(x) =(—2 + х2)а2 + (—2 + х)а1 + (—4 + 1)а0 . а2 а2 а4
Приравнивая к нулю частные производные по
аі (і = 1,2,3), получаем линейную систему вида
(Л Еаі2Р2)а0 + (Е хі«іРі2)а1+(Е хі2«іРі2)а2 = а2 Е У№Рь
0-2 ^ xi«iP2)a0+(Е хі2Р2)а1 + (Е х3Р2)а2 = а2 Е уіхіРі,
0-2 Е хі2аіР2)а0 + (Е х3Р2)а1 + (Е хі4Р2)а2 = а2 Е уіхі2Рі; а2
где аі = х2 + а2, рі = а2 - х2 .
а
Решая эту систему, найдем а0,а1,а2 , а по ним, на основе (21), получим
12
k =-4(а0 + а а2) ,
а4
b = —ШІ-
а0 + а а2
с= а0а2 а0 +а а2
(22)
Трудоемкость данного метода расчета параметров уравнения регрессии при условии запоминания повторяющихся значений составляет величину порядка к 4 = 20 m.
При использовании традиционного подхода для вычисления коэффициентов а0 - а4 необходимо
вычислить суммы вида £ хк , ЕУіх- , (к = 1,...,8;
1 = 0,...,4), что также требует порядка 20m операций. Но при этом еще следует вычислить шесть определителей пятого порядка, что требует порядка
к' ~2160(оп); при интерполяции одним звеном
h4 -полигона, в среднем от 5 до 10 вершин ломаной у , величина m составляет от 20 до 40. В этом случае величина к' эквивалентна значению от 108 m до 54 m ; взяв среднее к" = 80 m, получим, что предло-
женный подход имеет в 5 раз ((20 + 80)m/20m) меньшую трудоемкость аппроксимации полигоном 4 степени.
а4 = к, а3 = №,
< а2 = кс -ка2 а1 =-kba2, а0 = -ка2с.
(21)
Поскольку а4 = —4 —2, а3 = —2, то для опреде-а4 а2 а2
ления коэффициентов уравнения (19) достаточно найти МНК-оценки для параметров а0,а1 и а2 исходного уравнения в следующем представлении: 78
Рассмотрим теперь ситуацию с корнями производной f4 (х) полинома (20):
f4 (х) ^ 4к[х3 + ^Ьх2 + -—— 4У ' L 4 2
2
—2ь1 0
- х-----1 = 0 .
4
(23)
Заменой переменной
х = У - ^ (24)
приводим уравнение (23) к каноническому виду y3 + py + q = 0, где
p = — [8(с- а2) - 3b2], 16
q =
b[b2
4(с + а2)] 32
РИ, 2005, № 3
Пусть R = (sign ^3, D = j + |j-j . Тогда возможны две ситуации с корнями [11] .
1) При p < 0, D < 0 имеем три действительных корня
Уі = -2R cos( ^ + ^——); ф = arccos q 3 ; i = 1,2,3
3 2R3
отображения (24) которых обозначим xi, x2, Х3 .
2) При D > 0 имеем один действительный корень:
у4 = -2Rch-3; ф = arcch^R3, при p < 0, у4 =-2Rsh-3; ф = агс^-\, При p > 0 .
3 2R
Отображение (24) корня У4 обозначим x* .
По построению полином 64 (x) имеет экстремум на интервале А. Поэтому во втором случае экстремум единственный и достигается в точке x * , а наилучшая интерполяция — полигон h2 — определяется точками H0(-a,0), H1(x*,f4(x*)), H2(a,0) .
В первом случае возможны три исхода: один (пусть x'), два (пусть x' < x") и все три (x' < x" < x) корня лежат в А. Соответственно этим ситуациям полигональные аппроксиманты имеют вид
Звездчатое представление области обеспечивает возможность однозначной параметризации границ невыпуклых множеств для большинства объектов, встречающихся на практике (например, границ АК и всех типов иридознаков), является инвариантом при аффинных преобразованиях. При этом нахождение полюса для иридознаков и границ зон радужки не представляет труда: с достаточной точностью его можно определить центром тяжести объекта.
Для обширного класса прикладных задач представление границы звездчатой области гладкой кривой (или сплайнами) нецелесообразно по причине высокой трудоемкости их построения и использования, хотя построение полигонального аппрокси-манта для границы F также не является тривиальным. Общая задача в данном случае состоит в следующем. Имеется полигональное представление У = {g!,g2v,gm} границы F , о котором известно, что уклонение точек {gJi в среднем (или по Чебышеву) не превышает д. Искомое полигональное приближение Л = {ХЬX2,...,Xn} для у должно минимизировать число вершин n при ограничении на величину отклонения (в среднем (1) или максимального (2)) вершин ломаной у от полигона д :
h2 :H0(—a,0),H1(x^(x'),H2(a,0);
pk(y,A) < Д*; k є {E,C}, Д* >Д . (25)
h3 : H0(-a,0), H1(x'^(x')), ^(x^x")), H3(a,0); h4 :H0(-a,0),H1(x',f4(x')), ^(x'^x")),
H3(x'",f4(x"')), H4(a,0).
После получения аппроксиманта требуемого порядка для оценки фактического уклонения в смысле (1) или (2) используем подход, описанный в предыдущем разделе. Если требуется, производим уточнение его вершин, как описано в разделе 6.
5. Полярная модель звездчатой области
Пусть на плоскости задана односвязная область г с границей, представленной непрерывной кривой f (рис. 3). Тогда г называется звездчатой областью, если существует такая полярная система координат Е = {0,X,р,ф}, O єГ, что всякому углу фє [Ъ,2л] взаимно-однозначно соответствуют точка F^) границы F. Точку О назовем полюсом области г .
X
При этом часто требуется, чтобы аппроксимант л с заданной точностью Д** > Д* сохранял локальные особенности границы у — экстремумы на участках выпуклости и вогнутости; в этом отношении экстремальные (по полярному радиусу) вершины ломаной у целесообразно рассматривать как узлы интерполяции для л . Считаем, что при получении границы F в результате сегментации расстояния
между точками gi,gi+1 также близки к д.
Важным объектом, при анализе которого эта задача проявляется во всей полноте возможных ситуаций, является АК. При аппроксимации его границы у , полученной при сегментации, требуется отфильтровать не значимые экстремумы («шероховатости»), сохранив неизменными для последующего анализа наиболее значимые максимумы (пики) и минимумы (каньоны) отклонений относительно центра глаза.
Не теряя общности положим, что полюс О объекта Г совпадает с центром декартовой системы координат E{O,x,y}, а E{O,Ox, р, ф} - соответствующая ей полярная система (рис. 4,а). Тогда разверткой границы у назовем ее представление ру = f у (ф) в
декартовой системе n(O, р, ф) (рис. 4,б). Полагаем, что вершины ломаной у пронумерованы в положительном направлении (при обходе у область остается слева).
Рис. 3. Звездчатая область с границей F РИ, 2005, № 3
79
Заметим, что прямая l в системе £ переходит [11] в кривую вида р = p/cos(<p-a) в системе п , где p = p(O,1), а ф — угол к нормали. Обратно, прямая р = кф + c в системе п имеет вид спирали в системе 2 .При этом строгие максимумы функции fy (ф) достигаются в вершинах ломаной у , а минимум может достигаться во внутренней точке ребра, соединяющего некоторую пару вершин gigi+і (например, вершины 6 и 7 на рис. 4,б). Поскольку расстояние между вершинами по порядку величины близко к д и достаточно мало по отношению к радиусу p(gj), с требуемой точностью будем считать, что минимум функции fу (ф) также достигается в вершинах ломаной у .
Рис. 4. Полигональная граница звездчатой области и ее развертка. Вершины даны цифрами от 1 до 7
Пусть у'= {gi}ieI, I = (i,i + 1,...,i + k), k > 2 - фрагмент границы у , а p(gi) и ф^) - полярные координаты вершины gi. Назовем ломаную у' выпуклой (вогнутой), если угол поворота в вершинах (gjljeJ, J = {i + 1,i + 1,...,i + k-1} положителен (отрицателен). Вершину gj, j є J , назовем экстремальной (по выпуклости) на у', если
|p(gj) ^P(giX i єI,
|p(gj) >P(gj-1) и/или p(gj) >p(gj+1). (26)
Соответственно определим экстремальность по вогнутости:
|p(gj) ^P(giX i Є I,
|p(gj) <P(gj-1) и/или p(gj) <p(gj+1). (27)
При выполнении обоих строгих неравенств будем говорить о максимуме (минимуме) в точке gj .
Введение условия (26) определяется необходимостью выделения действительно «крайних» точек в условиях возможного распределения вершин из у вдоль дуги окружности. Кроме того, ввиду отклонений вершин из у от F, порождающих малозначимые по размеру экстремумы, число экстремальных вершин может существенно возрастать, не неся полезной информации. Поэтому в рассмотрение вводится порог фильтрации экстремальных отклонений — величина Д**, в окрестности которой
экстремумы считаем незначимыми, за исключением одного, который и принимаем за экстремальную вершину в этой окрестности.
Не теряя общности допустим, что все вершины ломаной у не лежат на одной окружности. Тогда из очевидных геометрических соображений следует, что необходимое условие экстремальности (26) является и достаточным, причем для выявления экстремальной вершины gj достаточно рассматривать цепочки типа у- = (g;,gi+1,gi+2). Однако необходимое условие экстремума (27) на участке вогнутости не является достаточным (например, вершина 1 на рис. 4,б), но становится таковым, если для угла поворота 9j в вершине gj выполняется
9j < 0 . (28)
Поскольку знак соответствующей компоненты векторного произведения vj = [gj-1gj х gjgj+1 ] определяется величиной sin9j, то условие (28) эквивалентно следующему:
(xj “ xj-1)(yj+1 -yj) -(xj+1 - xj)(yj -yj-1) < 0,
для проверки которого требуется xs = 6 операций.
Таким образом, последовательный анализ цепочек типа yj , i е I, на соответствие условиям (25)-(27) позволяет выделить все экстремальные вершины на участках выпуклости и вогнутости, которые, ввиду низкой вероятности распределения вершин из у по дуге одной окружности, будут представлены максимумами и минимумами на соответствующих им участках выпуклости, вогнутости.
Например, для случая ломаной, представленной на рис. 4,а, получим 5 экстремальных вершин — три максимума (2,4,7) и два минимума (3 и 6), причем выпуклая вершина 5 в силу нарушения (25) не относится к экстремальным, а вершина 1 — при выполнении (26) не является экстремальной (по вогнутости) ввиду невыполнения (27).
6. Интерполяция границы звездчатой области
Пусть Д * — погрешность аппроксимации в смысле (25). Чтобы основная задача имела смысл, эта величина, как правило, должна на порядок (не менее чем в 5 -10 раз) превышать погрешность д исходной аппроксимации для у .
Если граница у значимо (в смысле Д*) отличается от окружности, наиболее существенные для приложений особенности ее формы определяются, в первую очередь, экстремальными точками (точнее — строгими максимумами и минимумами) Pk, к = 1,2,...,N, и соответствующими им выпуклыми и вогнутыми фрагментами границы. Поэтому при аппроксимации контура у изменение этих точек, определяющих кардинальные особенности расположения границы, нежелательно. В таком случае выберем эти вершины в качестве узлов интерполяции; тогда общая задача приближения (25) сводится к N задачам аппроксимации (25) для
80
РИ, 2005, № 3
пар узлов интерполяции Pk,Pk+1 в условиях, когда определяемый ими фрагмент уkуk+i границы имеет каноническое представление, а искомый интер-полянт представляется однозначной функцией одного аргумента.
Соответственно этому подходу, для поиска наилучшего приближения границы у , предлагается метод, состоящий в применении процедур поиска узлов интерполяции {pk},k=1,...;N и построения аппрокси-мантов на интервалах PkPk+i.
Процедура 1 (выбор полюсов интерполяции).
1. Последовательным просмотром вершин из у выделяем все экстремальные вершины V соответственно условиям (25)-(27).
2. Выполняем над V следующую операцию выделения полюсов, пока это множество не станет пустым: находим в V вершину v с наибольшим значением радиуса p(v), относим ее к множеству P и удаляем из V все вершины, попавшие в Д** — окрестность вершины V .
3. Упорядочиваем вершины из P = {P;};=1N по полярному углу 9(P;). Назовем их основными полюсами интерполяции. В случае, если полярный
угол Дф i =| 9(P; ) - 9(Pi+l) I для некоторой пары вершин из P превышает %, вводим в P дополнительный полюс (из числа экстремальных, или средней между ними вершины).
Замечание. Операцию 2, в зависимости от требований прикладной задачи, можно проводить, выбирая минимальный радиус, или чередуя выбор вершин с минимальным и максимальным радиусом. В случае АК выбор минимального радиуса позволяет «не усилить» значимость малого наложения этого фрагмента АК на схеме проекционных зон [7].
После применения этой процедуры решаем N независимых задач аппроксимации границы у для узлов {Pi, Pi+i}i_i,n . Для этого применяется процедура 2, где (для краткости) у обозначат цепочку вершин, лежащих между полюсами p,q є P.
Процедура 2 (аппроксимация границы между основными полюсами).
Для каждой цепочки у решаем задачу полигональной аппроксимации, увеличивая порядок аппрок-симанта hk от 1 до 4, пока не будет достигнута требуемая точность Д* . Если эта задача не имеет решения, разбиваем цепочку у на две (например, по числу точек) и ищем для каждой из них аппрокси-манты минимального порядка hki, hk2 , и т.д. В итоге получим последовательность цепочек уі,у2,...,уk с попарно общими концами (дополнительными полюсами), для каждой из которых существует аппроксимант hki степени не выше 4.
В этих процедурах отношения величин Д *, Д** к Д определяют степень “сглаживания” границы у при сохранении положения кардинальных точек — полюсов интерполяции, причем если Д„ определяет частоту появления пиков и каньонов, то Д* — порог их значимости по степени шероховатости.
Поскольку дополнительные полюса, в отличие от основных, выбраны в некотором смысле произвольно, можно изменить их положение, как и остальных узлов интерполянтов, в целях повышения точности аппроксимации (1) и (2), поскольку при их определении по МНК уклонения определялись не по кратчайшим уклонениям (нормалям) от полигона или полинома, а по разностям ординат (т.е. по гипотенузам). Для этого воспользуемся методом локальных вариаций в следующей модификации.
Пусть Д = {Hj}j=0,k+i — последовательность вершин hs -полигонов между основными полюсами H0 = A , Hk+i = B (каноническое представление для л не требуется). Для каждой вершины Hi(xi,yi), iє I = (i,2,...,k), определим множество альтернатив
Hi1 = (xi +A 0>УіХ Hi2 = (xiAi +A oX
Hi3 = (xi -ДOAiX Hi4 = (xiAi -Д0). (29)
Тогда множество вариаций {^ }^є^ аппроксиман-та л с параметром варьирования До < Д* образовано цепочками Kv= HOH1i1 H2i2 . Hkim Hk+1 , iлє{1,2,3,4} , число которых равно NЛ= 4k , а трудоемкость оценки качества аппроксиманта ^ по (1) либо (2), согласно (12), составляет
~ 12 • m (оп), (30)
где m — число вершин исходного контура на фрагменте л . Тогда оценивание всех NЛ вариаций имеет трудоемкость порядка
кл ~ ' Nл= 12 m• 4k (оп). (31)
Оценка (31) показывает неэффективность коррекции аппроксиманта л по вершинам на основе полного перебора локальных вариаций при достаточно большом k. С учетом предшествующей оптимизации промежуточных узлов полигонов в этом случае имеет смысл ограничиться коррекцией дополнительных полюсов на основе варьирования (31) их положения в полном объеме. В общем случае также можно варьировать величину Д о и строить вариации на основе методов случайного поиска [12].
Для анализа практической эффективности предложенного метода рассмотрим задачу полигональной аппроксимации автономного кольца. При анализе АК число k не менее чем на порядок меньше числа аппроксимируемых точек m (пикселей), полученных при сегментации границы. В этом случае уже при k = 7 , что соответствует объединению двух h4 -полигонов (т.е. 8 отрезков), на экране размером 50
РИ, 2005, № 3
81
см (2000 пикселей) цепочка л будет иметь длину
порядка 8 х 10 х = 2 (см), что не менее чем на порядок превышает среднее расстояние между основными полюсами. Это означает, что вхождение в состав цепочки Л hs -полигона порядка выше 4 практически исключено, что и означает нецелесообразность использования hs -полигонов более высокого порядка.
Если между основными узлами интерполяции используется, в среднем, полином hs порядка 2 — 3, то для коррекции (29) требуется порядка 4 — 16, или, в среднем, n Л = 10 вариаций. Поэтому коррекция аппроксиманта л (между основными полюсами) по всем вершинам лишь на порядок увеличивает трудоемкость (12) расчета параметров самого начального приближения л . При длине АК в 2 — 2.5 см число пикселей m составляет от 80 до 120, что в соответствии с (30) дает ~ 1200 (оп) и, с учетом всех вариаций внутренних узлов, потребует порядка nЛ-к^ = 12000 (оп). Ввиду малой значимости этого объема вычислений приходим к выводу о возможности, если того требует достижение высокой точности, применения известных методов случайного поиска [12].
Таким образом, предложенный метод полигональной аппроксимации, включающий процедуру коррекции положения вершин, обеспечивает получение аппроксимантов с требуемой точностью, причем в режиме реального времени.
7. Выводы
Предложен метод полигонального приближения замкнутого многоугольного контура, ограничивающего невыпуклое звездчатое множество, который обеспечивает минимизацию порядка ломаной при ограничении на точность аппроксимации, определяемую среднеквадратичным или чебышевским отклонением. Метод обеспечивает сведение основной задачи к построению системы полигонов до четвертого порядка, для получения которых используется аналитический подход.
Научная новизна предложенного метода определяется возможностью применения различных критериев точности и ограничений для аппроксимации границ невыпуклых объектов, рассмотрением фактических уклонений вершин интерполянта от исходного контура в отличие от построения решения в є -полосе, а также тем, что положение вершин определяется на основе оптимизации в окрестности границы в отличие от существующих подходов, где выбор этих вершин производится на множестве исходных узлов границы. Подобная гибкость метода актуальна для многих прикладных задач, где различные критерии и ограничения рассматриваются в рамках одной базы данных. Линейные оценки трудоемкости аппроксимации показывают, что вычислительная эффективность предложенного метода не ниже существующих аналогов.
Практическая значимость предложенного метода определяется тем, что он позволяет существенно повысить качество решения прикладных задач в
отношении минимизации числа вершин аппроксиманта при обеспечении требуемой точности (в отношении как критерия, так и оценки уклонений), причем в режиме реального времени. При этом для задания требуемого критерия точности достаточно лишь определить вид функции, определяющей уклонение точек контура от аппроксиманта. Метод также позволяет сохранять вершины исходного контура, отражающие особенности прикладных задач в отношении экстремальности, в качестве узлов интерполяции. На примере высокоинформативной задачи аппроксимации автономного кольца радужки глаза показана возможность введения узлов интерполяции, между которыми порядок аппроксимирующих полигонов, как правило, не превышает 4, что подтверждает вычислительную эффективность метода.
Предложенный подход к декомпозиции основной задачи позволяет распространить предложенный метод на аппроксимацию контуров, заданных аналитически, посредством выбора узлов аппроксиманта в экстремумах кривой, а также на незамкнутые кривые за счет выделения в них фрагментов, допускающих каноническое представление.
Литература: 1. Бобков В.А., Казанский А.В., Морозов М.А., Щебенькова А.А. Релаксационно-контурный алгоритм определения векторов морских течений по спутниковым изображениям и его синоптическая верификация // Автометрия. 2003. № 1. С. 73-81.2. Злобин В.К., Еремеев В.В., Новоселов В.Г. Алгоритм высокоточного фотометрического совмещения разновременных космических изображений / / Автометрия. 2000. №
3. С. 71-76. 3. Недзьведь А.М. Сегментация слабоконтрастных изображений гистологических объектов: Авто-реф. дисс. канд. техн. наук: 15.03.2000 / Минск: ИТК НАН Беларуси, 2000. 21 с. 4. Бессарабов И.И. Использование ориентационной сегментации контуров с целью описания объектов на изображении в терминах отрезков // Автометрия. 2002. № 2. С. 67-72. 5. Грибов М.Г., Хачумов В.М. Определение геометрических параметров объектов по растровым изображениям // Автометрия. 2001. № 1. С. 40-49. 6. Воскобойников Ю.Е., Колкер А.Б. Адаптивный алгоритм фильтрации и преобразование изображений в векторный формат // Автометрия. 2002. № 4. С. 3-11. 7. Вельховер Е.С., Ананин В.Ф. Иридология: теория и методы. М.: Биомедин-форм, 1992. 296с. 8. Ben-Moshe B, Carmi P, Katz M.J. Approximating the Visible Region of a Point on a Terrain // Proc. Algorithm Engineering and Experiments (ALENEX’04). 2004. Р. 120-128. 9. Ebbers-Baumann A, Klein R., Langetepe E, Lingas A. A fast algorithm for approximating the detour of a polygonal chain // Computational Geometry. 2004, Vol. 27. № 2. Р. 123-134.
10. De BergM, Bose P, Cheong O, Morin P. On simplifying dot maps // Computational Geometry. 2004, Vol. 27. №1. P. 43-62. 11. Бронштейн И.Н., Семендяев К.А. Справочник по математике. М.: Наука, 1981. 720с. 12. Сергиенко И.В. Математические модели и методы решения задач дискретной оптимизации. К.: Наук. думка, 1985. 382с.
Поступила в редколлегию 02.07.2005
Рецензент: д-р техн. наук, проф. Путятин В.П.
Лесная Наталья Советовна, канд. техн. наук, профессор, проректор по научно-педагогической работе ХНУ-РЭ. Научные интересы: технология создания ПО ЭВМ. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 70-21-492.
Смелякова Анастасия Сергеевна, студентка ХНУРЭ. Научные интересы: математическое моделирование. Адрес: Украина, 61166, Харьков, пр. Ленина, 14. тел. 7190542.
82
РИ, 2005, № 3