А. Н. ФЛОРЕНСОВ Д. А. ФЛОРЕНСОВ
Омский государственный технический университет
УДК 681.3
О ПОСТРОЕНИИ АЛГОРИТМОВ ТОПОЛОГИЧЕСКОГО РАСПОЗНАВАНИЯ ЛИНЕЙНЫХ ОБРАЗОВ
ПРЕДЛАГАЕТСЯ НОВЫЙ ПОДХОД К ПОСТРОЕНИЮ АЛГОРИТМОВ РАСПОЗНАВАНИЯ ЛИНЕЙНЫХ ОБРАЗОВ, ОСНОВАННЫЙ НА ТОПОЛОГИЧЕСКОЙ ТЕОРИИ ПЛОСКИХ КОНТУРНЫХ ФИГУР. РАССМАТРИВАЮТСЯ БАЗОВЫЕ ПОЛОЖЕНИЯ ТЕОРИИ И ОСНОВНЫЕ ПРИНЦИПЫ КОНСТРУИРОВАНИЯ АЛГОРИТМОВ.
Линейным образом называют зрительный образ, который образуется некоторой совокупностью линий. В математической модели под такими линиями понимаются геометрические линии, в техническом представлении -линии, образованные точками растровой картины изображения. Целесообразность ограничиться только линейными образами для практических целей следует из подтвержденного экспериментами наблюдения, что в условиях слабой освещенности глаза воспринимают изображение только как монохромное (из-за более низкой чувствительности цветовых биологических анализаторов чем монохромные) и способностей человека распознавать большинство изображений только по их контурам, на чем, собственно, и основана графика как вид изобразительного искусства.
Классические методы распознавания линейных образов восходят к задачам распознавания растрового изображения, формируемого техническими датчиками, и могут быть разделены на статистические методы и комбинаторно-логические [1]. Обе эти разновидности методов распознавания неявно основаны на конечном и существенно ограниченном числе исходных данных, задающих для целей распознавания исходную задачу [2]. В конечном счете они решают задачу распознавания дискетных наборов данных, характеризующих изображение [3].
В то же время линейный образ как геометрическая абстракция теоретически представляет собой континуальную конструкцию, к исследованию которой можно подойти с позиций математического анализа, общей и комбинаторной топологии. В указанном подходе вначале выполняется отвлеченное абстрагирование от реальной дискретной картины, с переходом на чисто геометрические абстракции, а затем задача исследуется, опираясь на континуальные свойства полученных абстракций.
Линейный образ представляет собой изображение, которое может быть описано как конечный набор гладких непересекающихся кривых, имеющих возможно общие концевые точки. При рукописном построении стараются представить символ минимальным числом кривых, имеющих возможно точки пересечения или самопересечения, и гладких за исключением конечного числа точек, где имеют место изломы кривой. При этом прямые линии или прямолинейные отрезки считают частным случаем кривой линии. Для большей выразительности изложения будем использовать также название контурная плоская фигура как синоним линейного образа. Термин линейный образ характерен для технической области распознавания образов, а термин контурная фигура - для математики.
Из определения линейного образа вытекает, что незначительные растяжения или сжатия части изображения этого образа не выводят геометрический объект изображения из класса образов, представляющих тот же символ. Поэтому задачу распознавания линейного образа
можно разложить в композицию двух этапов: определение топологического класса этого образа и дальнейшее уточнение на основе ориентации и других более тонких характеристик конкретного вида образа.
Для определения топологического класса линейного образа следует выделить те его особенности, которые не изменяются при преобразовании проектирования, если это проектирование не вырожденное. При невырожденном проектировании кривые переходят в кривые, общие точки отдельных кривых сохраняются, не возникает никаких новых особенностей, точки нарушения гладкости сохраняют свою особенность (остаются точками нарушения гладкости). Поэтому в качестве глобальной характеристики класса линейных образов можно взять набор перечисленных особенностей: количество образующих кривых, число точек их соприкосновения с указанием, сколько кривых соприкасаются в точке и число точек нарушения гладкости [4].
Учитывая ориентацию на распознавание произвольных линейных образов, целесообразно при построении теории опереться на наиболее общие свойства таких образов, а именно на свойства, не изменяющиеся при выполнении определенного класса преобразований. Выберем в качестве преобразований геометрического пространства, которые будут определять интересующие нас свойства контурных фигур, гладкие непрерывные преобразования.
Произвольную контурную фигуру на плоскости можно рассматривать сточки зрения математики как соединение в особых точках некоторого конечного множества дуг, под которыми в общем случае понимаем гладкие кривые, задаваемые параметрическими уравнениями. Если D такая дуга, то существуют уравнения x=x0(t), y=yD(t), Cte t ¿1, задающие координаты (х,у) этой дуги, причем функции x^t), y0(t) имеют на отрезке Os t непрерывные первые производные. Таким образом, контурной фигурой будем далее называть множество точек плоскости, удовлетворяющее данном определению.
Концевыми точками дуги D, определяемой уравнениями x=x0(t), y=yD(t), Ostsl, будем называть точки (xo(0),yD(0)) и (xD(1),yD(1)).
Точка самопересечения дуги D, определяемой уравнениями x=xD(t), y=y0(t), Qst<1, определяется как точка, для координат х,у которой имеем x=x0(t1)=x0(tJ), у= yD(t1)=yD(t2), где t,*tj и Ost,, 1. Точку самопересечения назовем точкой граничного самопересечения, если в ее определении имеет место один из следующих вариантов:
t,=0, 0<Ц<1 или t,=1. 0<t,<1; Ц=0,0<t,<1 или£=1,0<t,<1.
Точку самопересечения назовем точкой внутреннего самопересечения, если в ее определении имеет дополнительное условие 0<t,<1 и 0<Ц<1.
Точка самопересечения М=(х,у) дуги D будем называть точкой многократного самопересечения, если существует более двух различных значений параметра t, Oi t , для которых x=x0(t), y=yD(t).
Точку М=(х,у) будем называть особой точкой первого порядка данной контурной фигуры, если она является конечной точкой некоторой дуги О, составляющей эту фигуру, не служит точкой самопересечения этой дуги и не принадлежит никакой другой дуге этой фигуры.
Точку М=(х,у) будем называть особой течкой второго порядке данной контурной фигуры, если она является общей конечной точкой двух и только двух дуг 01 и 02 этой фигуры, причем касательные к этим дугам в общей точке не совпадают. Более формальное определение последней части гласит, что если х=хО(0), у=уш(0 и х=хог(0, у=уО20), 0< 1 <1 такие параметрические уравнения этих дуг, что общей точной данных дуг служит точка, задаваемая нулевым значением параметра, то
ДХР1 (0 _ <»Ур2 (0 ^ <|ХР2 (0 _ ДуР| (I) при^о, (]1 сН <И ' сИ
где в общем случае имеется в виду правосторонние производные для точки 1=0.
Точку М=(х,у) будем называть особой точкой третьего порядка данной контурной фигуры, если она является конечной точкой трех и только трех различных дуг, общей точкой двух дуг, причем для одной и только одной из них она является конечной точкой, или точкой граничного самопересечения одной дуги.
Точку М=(х,у) будем называть особой точкой четвертого порядка данной контурной фигуры, если она является конечной точкой четырех и только четыре различных дуг, общей внутренней точкой двух дуг, точкой внутреннего самопересечения одной дуги или общей точкой одной дуги и концевыми точками двух других дуг.
С учетом указанной выше практической ориентации рассматриваемого подхода ограничимся введенными порядками особых точек, хотя без заметных проблем введенную классификацию можно продолжить на произвольный М-й порядок особой точки контурной кривой.
Положим в качестве элементов дальнейшего описания контурных фигур три следующих простейших геометрических компонента описания:
■ особые характеристические точки,
■ путь по дуге контурной фигуры из концевой точки по гладкой дуге до конца этой дуги,
■ путь по дуге контурной фигуры из концевой точки до следующей особой точки на данной дуге,
■ множество особых точек, до которых можно пройти по гладким дугам контурной фигуры из данной особой точки, не проходя при этом другие особые точки.
Определим топологический дескриптор гладких путей контурной фигуры как тройку (а,Ь,с) отображений особых точек Р={р,, р2,..., рт} этой фигуры,
а:Р->Рв, Ь:Р->Р„, сРн-ЭР, Ре = Ри{е},
где е - вспомогательный элемент, не принадлежащий Р. ЭР - множество подстановок особых точек из Р, т.е. множество автоморфизмов на множестве Р, причем отображения а,Ь,с задаются следующим образом [5].
Отображение а переводит особую точку р первого порядка в ту особую точку р\ в которую можно пройти по гладкой кривой контурной фигуры, соединяющей р и р', причем гладкость этой кривой нарушается в точке р' или же точка р' имеет первый порядок. Если же особой точки Р', удовлетворяющей перечисленным условиям в фигуре нет, то отображение переводит точку р в элемент е.
Отображение Ь переводит особую точку р первого порядка в ту особую точку р', в которую можно пройти по гадкой кривой контурной фигуры, соединяющей р и р\ причем других особых точек на таком пути между точками Р и р' нет. Если же особой точки р', удовлетворяющей перечисленным для отображения Ь условиям в фигуре нет, то отображение переводит точку р в элемент е.
Отображение с переводит особую точку р в подстановку (рм ри ри р^) по следующему правилу. Для ¡-го элемента этой подстановки рк1=р1> если р, = р или в данной контурной фигуре не существует особых точек, которые достижимы из точки р по гладким кривым контура фигуры таким образом, что по пути прохождения таких кривых не встречаются другие особые точки. В противном случае ри имеет значением ту из таких особых точек рт, достижимых по указанным путям, которая определяется следующим образом.
Выберем достаточно малую круговую окрестность точки р таким образом, что в нее не попадает ни одна из остальных особых точек контурной фигуры, причем дополнительно потребуем, чтобы каждая из рассматриваемых отрезков дуг пересекалась с границей такой окрестности только в одной точке. Можно доказать, что условия построения обеспечивают существования требуемой круговой окрестности с указанными свойствами [5]. Описанное построение дает множество точек {гк1 ги гк3 г^} границы окрестности, лежащих на дугах к особым точкам {рк1 ри рк] р^}, непосредственно достижимым по путям данных дуг, без прохождении других особых точек. Построим теперь подстановку (ри рц ркз р^), служащую значением с - отображения для точки р, по следующему правилу. Для ¡-го элемента этой подстановки РЫ=Р(, если р1 = р или в данной контурной фигуре не существует особых точек, которые достижимы из точки р по гладким кривым контура фигуры таким образом, что по пути прохождения таких кривых не встречаются другие особые точки. В противном случае рм имеет значением ту из таких особых точек "ртО{рм рц р„3 р^}, которая по ее дуге соответствует точке гы, являющейся следующей при обходе по построенной окружности в положительном направлении за точкой г.
Можно показать корректность такого определения в связи с независимостью указанного выбора дуги от построения вспомогательной малой круговой окрестности особой точки р.
В общем случае следует усовершенствовать определение топологического дескриптора гладких путей на случай произвольного числа дуг, соединяющих особые точки. Для такого усовершенствования следует перейти от особых точек, представляющих отдельные пути, которые непосредственно достижимы из данной точки, к обозначениям дуг, используя при этом идеи классического подхода к определению графа с помощью различных исходных множеств -вершин и ребер. Такое определение можно ввести следующим расширением отображения с. Определим расширенное отображение с для обобщенного топологического дескриптора как отображение с: Р —> БО,
где ЭЭ - множество подстановок (<1к1 с^ с!кз с!^) гладких дуг, образующих контурную фигур в соответствии с определением, причем образ этого отображения для произвольного элемента р определим следующим правилом.
Для ¡-го элемента этой подстановки <^=(1, если точка р не принадлежит дуге <1. В противном случае с^ имеет значением ту гладкую дугу с!т, которая на границе достаточно малой круговой окрестности точки р (такой окрестности, что все рассматриваемые дуги <1т с ней имеют не более одной общей точки гт ) имеет с этой окружностью пересечение следующее в положительном направлении за точкой г, пересечения дуги «1, с этой окружностью. Показывается, что все описанные выше свойства, позволяющие обеспечить корректность определения обобщенного топологического дескриптора, имеют место и в указанном расширенном определении. Анализ показывает, что последнее определение позволяет учитывать даже одиночные петли у особых точек, но множественные петли у особой точки не отображаются в структуре обобщенного топологического дескриптора.
Для классификации контурных фигур введем понятия изоморфизма описанных выше структур.
Обобщенные топологические дескрипторы А={Р, (а,Ь,с)} и В={Р', (а',Ь',с')} изоморфны, если существуют такие биекции /: Р-»Р', д: 0-»0' множеств особых точек этих дескрипторов и множеств гладких их дуг, что коммутативны следующие диаграммы
а Ь с
Р -> Р , Р -> Ре, Р 8(0),
I/ 4-/' I/ I/' 1/
Р' Р'е, Р' -> Р'с> Р' 8(0'),
а' Ь' с'
где Рв = Ри{е}, Р'е = Р'и{е'}, /'/ '(е)=е\ отображение д,
определено соотношениями д,((<^,, с)0_____ с^))) = (д(с)|1),
9(^а)> д(су.....д(^)).
Значение обобщенных топологических дескрипторов определяет следующая фундаментальная теорема [6].
Теорема. Если две размеченные контурные фигуры на плоскости могут быть переведены одна в другую с помощью гладких непрерывных преобразований картинной плоскости, не изменяющих ее ориентации, то они имеют изоморфные обобщенные топологические дескрипторы гладких путей.
Изложенная теория позволяет использовать в качестве базовых инструментальных средств для распознавания сложных линейных образов обобщенные топологические дескрипторы. Заметим, что при наличия библиотеки обобщенных топологических дескрипторов для ряда заданных линейных образов и уже построенного обобщенного топологического дескриптора распознаваемого линейного образа классификация последнего требует применения комбинаторных алгоритмов определения эквивалентности дискретных структур. С учетом хорошей изученности последней проблемы технические пути ее решения рассматривать здесь не будут.
Специфическим и крайне важным этапом в применении рассмотренной теории оказывается задача построения указанных дескрипторов по заданному линейному образу. Существом последней задачи является переход между предполагаемой континуальной конструкцией к дискретной структуре [7]. Для ее решения предлагается использовать отдаленный аналог метода сеток, широко применяемого в качестве структурной основы при решении уравнений в частных производных.
В качестве предпосылки рассматриваемой промежуточной задачи будем использовать предположение о геометрических линиях, лежащих в основе технической информации о линейном образе. В прикладном плане отсюда вытекает постулируемая возможность рассматривать изображение линейного образа не только в некотором заданном разрешении растровой картины, но и изменять это разрешение переходя к более детальному техническому растру. Наложение сетки с некоторым фиксированным шагом ячеек на изображение линейного образа приводит к разбиению анализируемой области плоскости на конечное множество квадратных ячеек. Использование этих ячеек, аналогично краевым условиям, заключается в анализе точек пересечения границ ячеек с точками линейного образа.
При достаточно малом размере ячеек и в предположении о геометрическом характере исследуемой линии или ширине линии в один пиксел число точек пересечения линейного образа с границей ячейки, содержащей особую точку линейного образа, равно порядку этой особой точки. Но такая эталонная ситуация имеет место только для тех случаев, когда ни одна из дуг не проходит по границе используемой ячейки. Будем называть вариант, в котором каждая дуга линейного образа имеет только одну точку пересечения с границей используемой ячейки, каноническим положением этой ячейки. Ввиду того, что в общем случае невозможно задать сеточное разбиение области линейного образа, которое не порождает не канонических
положений ячеек, приходится переходить от некоторого начального сеточного разбиения к производным от него. Такие производные разбиения строятся отталкиваясь от неканонических положений отдельных ячеек, определяемых текущим разбиением. Наиболее простое из полученных решений заключается в увеличении размера ячейки путем переноса от центра ячейки ее границы, на которой определяется нарушение канонического свойства. Если это свойство нарушается более чем на одной границе, то производится перенос каждой из таких границ. Такое преобразование назовем канонизирующим.
Для заключения о возможности проведения канонизирующих преобразований ячеек требуются дополнительные допущения о характере дуг, образующих линейный образ. Учитывая прикладную направленность рассматриваемых построений достаточно предположить, что дуги задаются алгебраическими кривыми с порядками, не превышающими третий, при необходимости развития теории переходя к кубическим сплайнам. В этих предположениях, дополненных предположением о конечном числе особых точек отдельного линейного образа и предположением о известной величине минимального расстояния между особыми точками и непересекающимися дугами линейного образа, нетрудно доказать, что канонизирующее преобразование для каждой ячейки существует. Более того, из тех же исходных данным можно получить формальные требования к построению перемещения такого канонизирующею перемещения, определяемого указанными минимальными расстояниями.
В результате канонизирующих преобразования строится модифицированное покрытие линейного образа совокупностью ячеек, среди которых анализом границ этих ячеек выделяются кандидаты на ячейки, содержащие особые точки всех порядков, кроме второго. Вторичным разбиением каждой такой ячейки на четыре одинаковые составные ячейки уточняется предположение о наличии и характере особой точки. В случае не подтверждении предположений, в частности когда производное разбиение ведет к заключению о возможном вхождении в ячейку предыдущего разбиения более чем одной особой точки, процесс повторяется применительно к указанным ячейкам. В указанных выше предположениях доказывается, что такой процесс должен завершится после конечного числа шагов
Последовательностью разбиений ячеек, содержащих особые точки на четыре составляющие производные ячейки уточняется положение этих особых точек. Рассматриваемая последовательность обрывается на основе анализа размера получаемых ячеек, вытыкающих из минимальных расстояний, в технических приложениях вытекающих из размера растра.
В начальном разбиении на ячейки и в полученных модифицированных покрытиях ячейками строятся вспомогательные структуры данных, задающие соседние ячейки для текущего покрытия.
Для нахождения особых точек второго порядка делаются последовательные предположения о их наличии в каждой из построенных ячеек, содержащих на своей границе только две точки пересечения с линейным образом. При этом, исходя из структур определения соседних ячеек, находятся соседние ячейки последнего из полученных покрытий и координаты пересечения их границ предполагаемыми отдельными дугами, которые должны завершаться с нарушением гладкости в анализируемой ячейке. По найденным координатам строятся аналитические представления этих предполагаемых отдельных дуг и определяется угол их пересечения в анализируемой ячейке. Если этот угол заметно отличается от я, считается, что найдена особая точка второго порядка. Найденные координаты всех особых точек второго порядка могут быть использованы для окончательного уточнения решения о наличии и числе таких особых точек.
Изложенные конструктивные и аналитические приемы определения особых точек, а также ряда промежуточных
точек дуг, соединяющих эти особые точки, служат базовыми элементами конкретных алгоритмов перехода от абстрактного геометрического линейного образа к дискретным структурам обобщенных топологических дескрипторов. Возможные модификации таких алгоритмов при их сочетании с алгоритмами утоньшения линий, введенными либо как предварительный этап, либо в процессе сеточного разбиении и канонизирующих преобразований, дают целый спектр технически реализуемых методов практического распознавания линейных образов. Потребность в таких алгоритмах чрезвычайно высока в области разработок искусственного интеллекта, перспективных систем машинного зрения и распознавания рукописных текстов.
Литература
1. Горелик А.Л., Скрипкин В.А. Методы распознавания. -М.: Высш. шк., 1989. -232 с.
2. Ту Дж„ Гонсапес Р Принципы распознавания образов. -М.: Мир, 1978, -411 с
3. Загоруйко Н.Г. Прикладные методы анализа данных и знаний. -Новосибирск: Изд-во Ин-та. математики, 1999, -270 с.
4 Флоренсов А Н., Флоренсов Д А. Топологический метод распознавания линейных образов. / Омский гос. техн. ун-т. -Омск, 1999. -11 с. -Деп. в ВИНИТИ 18.11.99 №3405-В99.
5. Флоренсов А.Н. Метод дескрипторов гладких путей для распознавания линейных образов. / Омский гос. техн. ун-т. -Омск, 1999. -23 с -Деп. в ВИНИТИ 30.12.99 №3971-В99.
6. Флоренсов А. Н. Топологический метод распознавания линейных образов // Четвертый Сибирский конгресс по прикладной и индустриальной математике. Тез. докл. ч.Ш. -Новосибирск, Изд-во Ин-та математики СО РАН, 2000, С. 104-105.
7. ФлоренсовА.Н., Флоренсов Д.А. Разработка технологии топологического распознавания линейных образов / Современное образование: управление и новые технологии: Тез. докл. научно-методической конференции. -Омск, Изд-во ОмГТУ, 2000. Кн. 1. С. 102-103.
ФЛОРЕНСОВ Александр Николаевич, к.т.н., доцент кафедры информатики и вычислительной техники. ФЛОРЕНСОВ Денис Александрович, аспирант кафедры информатики и вычислительной техники.
Омский Центр Научно-Технической информации предлагает:
1. Электронную библиотеку нормативных документов по строительству:
ГОСТы
- грунты
- здания и сооружения изделия (сантехника, замки)
- конструкции (арматура, балки, двери и окна, панели, плиты) материалы (бетоны, кирпичи и камни, кровельные и гидроизоляционные, лакокрасочные, линолеум, мастики, плитки, покрытия, стекло, теплоизоляционные трубы, цемент, щебень, песок)
- Оснастка и оборудование
- СПДС (система проектной документации для строительства) ■ СПКП (система показателей качества продукции)
СНИПы
Строительные нормы и правила
Организация. Управление. Экономика. Нормы проектирования Организация производства. Приемка работ. Сметные нормы.
ВСН (ведомственные строительные нормы) СН (строительные нормы) РД (руководящие документы)
и др. нормативные документы по строительству.
2. Электронная библиотека по противопожарной безопасности
ГОСТы: раздел "Пожарная безопасность", "Пожарная техника", "Прочие"
НПБ (нормы противопожарной безопасности)
ППБ (правила пожарной безопасности)
РД (руководящие документы)
СНИПы
МДС
Промышленные каталоги
3. Электронный каталог ТУ, зарегистрированных Госстандартом.
4. Электронный каталог ГОСТов, зарегистрированных Госстандартом.
Запрашивайте интересующую Вас информацию, мы поможем бам решить многочисленные
производственные вопросы. ,,u*„nu!1„uu
Омский Центр Научно-Техническои информации
Россия 644010, г. Омск, ул., Масленникова, д.2
Тел. (3812) 31-79-61. Факс (3812) 31-80-55 E-mail: [email protected]