Распознавание плоских двуцветных изображений на основе адресной сортировки

Гуревич М.Ю.

Раздел 5

Информационно-вычислительные комплексы нового поколения

УДК 681.324

М.Ю. Гуревич РАСПОЗНАВАНИЕ ПЛОСКИХ ДВУЦВЕТНЫХ ИЗОБРАЖЕНИЙ НА ОСНОВЕ АДРЕСНОЙ СОРТИРОВКИ

В работе описывается использование внутренней сортировки по ключу для распознавания графических образов. В предлагаемом подходе сортировка играет роль базовой алгоритмической схемы и является опорным моментом конструируемого метода распознавания. В рамках подхода исследуются аспекты построения алгоритмических схем распознавания и идентификации плоских статических двуцветных изображений. В частности, анализируются возможности сведения распознавания к обработке входных и выходных индексов массивов, представляющих координаты изображения, которые снимаются в определенном порядке. Для обработки индексов применяются алгоритмические условия локализации дискретных экстремумов. С помощью этих условий непосредственно выполняется поиск и нахождение экстремальных особенностей изображения.

Построение условий локализации для вычисления экстремумов и нулей аналитических функций рассмотрено в [1-3]. Ниже мы остановимся на использовании вариантов этих условий для числовых последовательностей, точнее, для целочис-, .

Исходный вариант условия локализации минимума аналитической функции, дискретно заданной на равномерной сетке с шагом к, представляется неравенством

I I £

Е(К - Ь ) - Е (К ) >- , Ь = 1, 2, ..., К-1, к

где К - текущий номер элемента в отсортированном массиве, Е(К) - поставленный ему во взаимно однозначное соответствие и хранимый в таком соответствии номер этого же элемента во входном массиве; £ - априори, заданный и зафиксированный , , ближайшими соседними минимумами, Ь - текущий номер элемента, сравниваемого с данным.

Смысл этого неравенства заключается в том, что среди номеров элементов, , , номерами элементов из £-окрестности данного элемента, взятого во входном дис.

массиве соответствуют элементам, не большим данного. Таким образом, неравен-

ство означает, что Е(К) оказывается входным номером единственного наименьшего элемента в рассматриваемой £-окрестности, что и влечет искомую локализацию .

к, -

ный шаг считывания, может быть принят равным единице. Параметр £, в свою очередь, характеризующий длину промежутка локализации на оси абсцисс, в случае дискретного представления данных, будет измеряться количеством элементов в , -

мами координат контура растрового изображения. В этом случае возможен переход в условии локализации от отношения £/к к целочисленному параметру. Таким способом представленное условие локализации минимумов можно перенести на случай поиска минимумов координат контура дискретно заданного изображения. В общем случае аналогично можно локализовать все минимумы среди элементов массива произвольного типа, если элементы связаны отношением порядка <.

В случае локализации минимумов в конечной целочисленной последователь,

их окончательное значение без дополнительных операций.

Под минимумом (локадьным) среди элементов числового массива здесь и ниже понимается элемент, меньший предыдущего и не больший последующего .

Аналогично можно организовать поиск и локализацию максимумов во всех массивах допустимого типа.

, -вом массиве достаточно взять £ = 1. В этом случае условие локализации примет вид

|Е ( к ) - Е ( к -1) |= 1.

Далее будет рассмотрено применение сортировки и условия локализации непосредственно для распознавания плоских двуцветных изображений. При этом используются три вида преобразования изображения в числовые массивы, соответственно называемые односторонним сканированием, вертикальным сечением, ор.

Одностороннее сканирование используется при распознавании графиков однозначных аналитических функций в декартовой системе координат и понимается как снятие ординат точек контура при последовательном проходе слева направо, сверху вниз до первой встречи с точкой контура. Снятые значения ординат рассматриваются как элементы дискретного массива, сортировка этого массива с применением условия локализации выявляет последовательность экстремальных , . -сиву конечных разностей ординат, включая разности высших порядков. В результате обнаруживаются все характерные особенности графиков функций. С использованием обратной адресности применяемых сортировок (входные индексы запо-( )) .

, , -, .

описанный процесс распознавания математических зависимостей по графическому изображению представлен в [4].

Вертикальное сечение. Фигура рассекается равноотстоящими вертикалями, расстояние между которыми принимается за шаг h = const считывания ординат

ее точек. Считывание производится в точках пересечения контурной линии с вер.

вниз по каждой вертикали и слева направо при переходе от одной вертикали к другой. Считанные ординаты образуют массив, который подвергается сортировке. В результате ординаты упорядочиваются, изменение их входных номеров образует .

набора и может рассматриваться как признак этого изображения [1, 2, 4, 5].

Ортогональное сканирование используется для распознавания рукопечатных символов. Распознавание шрифтового символа, как и любой плоской фигуры в общем случае при ограничениях, которые оговариваются в дальнейшем, может быть сведено к случаю канонического расположения в декартовой системе координат с образованием соответствующих подстановок. Конкретно ортогональное сканирование определяется следующим образом. Пусть дан контур плоского изображения. С шагом, пропорциональным максимальному размеру фигуры, измеряемому в направлении, ортогональном направлению прямолинейного перемещения на плоскости, при условии перемещения до встречи с контуром, снимаются координаты контура с сохранением порядка обхода контура. Пусть для определенности перемещение выполняется как при вертикальном сечении - слева направо, , , . Ординаты каждой такой точки нумеруются и заносятся в одномерный массив. Затем аналогичный массив ординат формируется по направлению слева направо, .

при перемещении по горизонтали - сверху вниз, слева направо и сверху вниз, .

Каждый из четырех массивов подвергается адресной сортировке с поиском максимумов и минимумов на основе условий локализации. То же выполняется для , . необходимости процесс возобновляется для массивов конечных разностей более , . и конечным разностям упорядоченный набор экстремумов, нулей и их индексных адресов образуют систему первичных признаков распознаваемой фигуры.

Если фигура содержит прямолинейные участки контура, то соответствующие им конечные разности постоянны, устойчивая адресная сортировка расположит значения постоянных разностей последовательно друг за другом, задает аналогичное расположение их индексов и зафиксирует границы каждого прямолинейного отрезка. Отношение значения конечной разности к шагу составит тангенс угла наклона прямой к горизонтальной оси. Преобразование координат по формулам поворота на данный угол определит новые координаты расположения фигуры в декартовой системе, такое расположение принимается за каноническое (прямолинейный отрезок контура параллелен оси абсцисс). Отсюда следует возможность

выполнить вертикальное сечение и сформировать описанную выше дополнительную систему признаков для канонического расположения фигуры.

Если фигура не содержит прямолинейных участков, то ортогональное сканирование производится с фиксированным шагом угла поворота координат, на каждом шаге определяется максимальный размер фигуры вдоль направления, ортогонального линии перемещения на плоскости. Наибольший из полученных размеров определяет две крайние точки фигуры, через которые проводится прямая. Последняя принимается за ось повернутых координат. Остается преобразовать поворотом расположение фигуры на угол между новой осью и осью абсцисс, принимая ее новое положение за каноническое, после чего можно сформировать первичные признаки и перейти к вертикальному сечению. Так, в частности, получается контур эллипса в каноническом положении.

Отсюда вытекает возможность единого для всех фигур формирования системы первичных признаков и признаков на основе вертикального сечения. Совокупная система признаков позволяет идентифицировать плоские двуцветные изображения произвольных фигур в зафиксированном конечном наборе.

С помощью изложенной схемы не только идентифицируется конкретная фигура из конечного набора, но как упоминалось, определяется математический тип ; , -су, например, - символам латинского алфавита с указанием шрифта. В частности, по количеству прямолинейных участков контура с учетом соотношений их длин, а также с идентификацией вершин как скачков конечных разностей ординат, производимых на основе условия локализации, с учетом изменений тангенсов углов наклона прямолинейных отрезков (на основе их соответствия конечным разностям ), , -, . считать амплитуду колебания в ту или иную сторону входных индексов, соответствующих экстремальным особенностям фигуры, включая особенности конечных разностей высших порядков.

На основе охарактеризованного метода можно учитывать искажения образа, если они носят ограниченный характер. С этой целью ортогональное сканирование видоизменяется следующим образом. Контур изображения покрывается квадрата-к,

, ,

имеют общую сторону. Каждая пара квадратов примыкает друг к другу теми сторонами, которые пересекает линия контура. Квадрат, включающий хотя бы одну , . -ная часть плоскости (экран графического редактора) покрывается такими же квадратами (квадратной сеткой), по вертикали и по горизонтали продолжающими своими сторонами стороны квадратов, покрывших контур. Квадрат, не включающий ни одной точки контура, считается не закрашенным. Координаты точки контура измеряются по числу незакрашенных квадратов по вертикали и по горизонта, -, . -нальное сканирование по полученной сетке квадратов с формированием массивов измеряемых координат контура распознаваемого изображения. При этом может

использоваться описанная ранее схема поворота координат. Затем формируются первичные признаки и выполняется переход к вертикальному сечению с формированием признаков на основе подстановок. Признаки на основе ортогонального сканирования и вертикального сечения не будут различаться для изображений, имеющих одинаковое расположение закрашенных квадратов. В границах этих квадратов допустимы любые искажения контура. В частности, таким способом можно обойти искажения, вносимые алгоритмом построения прямых линий или же масштабированием растрового изображения при его увеличении или уменьшении в .

переходе к большему шагу сканирования. По данной схеме удается уйти от мелких (в рамках укрупненного пикселя) искажений контура и выявить наиболее характерные особенности изображения, обусловленные, например, почерком, при этом целесообразно использовать меры отклонения от эталонных массивов на основе условий локализации максимумов и минимумов.

Для уточнения распознавания можно использовать систему вложенных сеток с последовательным переходом от более крупных к более мелким квадратам, включающим точки контура; каждой отдельной сетке вложения должна соответствовать собственная система эталонных признаков.

В рамках рассматриваемой схемы можно определить принадлежность заданного фрагмента произвольному контуру из конечного набора изображений. Для этого из контура канонически расположенной фигуры последовательно со сдвигом на один квадрат, начиная с фиксированной точки, вырезаются фрагменты размера, совпадающего с размером заданного фрагмента. При этом необходимо учесть что и искомый фрагмент и текущий должны принадлежать фигурам одного масштаба. Каждый вырезанный фрагмент подвергается сканированию по стороне, содержа, . разность элементов текущего массива и массива, соответствующего заданному .

минимумов полученной последовательности на основе условий локализации с подсчетом числа нулей (совпадений) и определения меры отклонений. В более сложном варианте могут использоваться первичные признаки и подстановки на основе . -

ляется как минимальное среднее отклонение по всем используемым системам признаков всех текущих фрагментов всего множества рассматриваемых изображений.

Аспекты экономии памяти в рамках данного подхода на основе свертки векторов распознавания в скалярные произведения на вектора из заданных весовых коэффициентов обсуждаются в [6]. Собственно для распознавания эти свертки не , -

вательности уже выражают характерные особенности распознаваемого образа и сами по себе достаточны для идентификации.

Отметим в заключение, что обычно используемые для целей информационнологической обработки методы сортировок и поиска при данном подходе находят применение как конструктивные алгоритмические схемы для решения задач распознавания. Представленные схемы распознавания эффективно распараллеливаются.

, -

лучения систем признаков для изображений достаточно общего вида. Данный под-

ход к распознаванию на основе адресной сортировки и условия локализации по

построению отличают изложенный метод от известных, в которых сортировка не

является базовой алгоритмической схемой [7-12].

ЛИТЕРАТУРА

1. Ромм Я.Е. Параллельная сортировка слиянием. Приложение к вычислению нулей, экстремумов функций и распознаванию образов. Таганрог: Изд-во ТГПИ. 1998. 190с.

2. . .

обработки / Диссертация на соискание ученой степени доктора технических наук. Таганрог: Изд-во ТРТУ. 1998. 546с. ВНТИ Центр. №05.990.001006

3. Ромм Я.Е., Гуревич ММ., Витиска Н.И. Вычисление экстремумов функции методом спуска при помощи адресной сортировки Таганрог: Изд-во ТГПИ. 1998. 46с. ДЕП в ВИНИТИ 18.12.98, № 3756 - В 98.

4. . ., . . -

раллельной сортировки слиянием Таганрог: Изд-во ТГПИ. 2000. 47с. ДЕП в ВИНИТИ 23.10.00, № 2678-В00.

5. Ромм Я.Е. Параллельная сортировка слиянием по матрицам сравнений. II // Кибернетика и системный анализ. 1995. № 4. С.13-37.

6. Гуревич ММ., Ромм Я.Е. Применение адресной сортировки к распознаванию оптических спектров Таганрог: Изд-во ТГПИ. 2000. 17с. ДЕП в ВИНИТИ 13.03.00, №619-В00.

7. Guerra Concettina. 2D object recognition on a reconfigurable mesh // Pattern Recogn. 1998. 31, №1. pp. 83-88.

8. Wunsh Patrick, Lathe Andrew F. Wavelet descriptors for multiresolution recognition of

handPrint ed characters // Pattern recognition. 1995. 25, №8. pp. 1237-1249.

9. Park Jeong-Seon, Lee Seong-Whan. Adaptive nonlinear shape matching for unconstrained handwritten characters recognition // Pattern recognition. 1995. 28, №8. pp. 1223-1228.

10. Куссуль Jl.M., Лукович В.В. Нейросетевые классификаторы для распознавания рукописных символов // Управл. системы и машины. 1999. №4. С.77-86.

11. Zhu Y., Seneviratne L.D. On the recognition and location of partially occluded objects // J. Intell. and Rob. Syst. 1999. 25, № 2. pp. 133-151.

12. Lee Hyeon-Kyu, Kim Jin H. An HMM-based threshold model approach for gesture recognition // IEEE Trans. Pattern Anal. and Mach. Intell. 1999. 21, №10. pp. 961-973.

УДК 658.512

..

ОБ АНАЛИЗЕ ОПЕРАЦИОННЫХ СИСТЕМ НА ПРЕДМЕТ РАСПАРАЛЛЕЛИВАНИЯ ПРОЦЕССА ВЫЧИСЛЕНИЯ

Параллельные вычисления представляют собой одну из самых трудных задач программирования. Это и синхронизация процессов для взаимообмена данными, это и появление семафоров для блокирования взаимоисключающих участков кода, это и проблема неразделяемых ресурсов, и ещё целый ряд различных проблем. В связи с неэффективностью распараллеливания процесса вычисления на единственном центральном процессоре компьютера (появляются системные затраты на переключение контекста задачи, в результате общее время решения задачи только увеличивается) и высокой сложностью (а следовательно и ценой) многопроцессор-

Распознавание плоских двуцветных изображений на основе адресной сортировки Текст научной статьи по специальности «Математика»

Похожие темы научных работ по математике , автор научной работы — Гуревич М. Ю.

Текст научной работы на тему «Распознавание плоских двуцветных изображений на основе адресной сортировки»