Инженерно-технические науки Engineering and technical sciences
УДК 004.931
СЕГМЕНТАЦИЯ СИМВОЛОВ В ИЗОБРАЖЕНИИ МОДИФИЦИРОВАННЫМ МЕТОДОМ ЖУКА
А.Ю. Андреев, С.П. Бобков
Ивановский государственный химико-технологический университет
В данной статье рассматривается проблема сегментации символов в изображении. Основное содержание исследования составляет анализ подхода к сегментации изображения методом жука. Авторы раскрывают ряд недостатков существующего метода и предлагают собственное решение данной проблемы.
Ключевые слова: монохромное изображение, оптическое распознавание, cегментация, метод жука, контур изображения.
Распознавание текстов - очень сложная задача как с теоретической, так и с практической точек зрения. Человек, например, задействует для этого полный комплект знаний и опыта. Он определяет значение текста из совокупности сигналов, реакций органов чувств, выделяет каждый отдельный символ, их характерные признаки, и, на основании своего опыта, приходит к выводу о значении символа в частности, и всего текста в целом.
Одной из основных задач обработки и анализа изображений [3] является сегментация [4], т.е. разделение изображения на области, для которых выполняется определенный критерий однородности, например, выделение на изображении областей приблизительно одинаковой яркости. Понятие области изображения используется для определения связной группы элементов изображения, имеющих определенный общий признак (свойство). Один из основных и простых спо-
собов — это построение сегментации с помощью порога. Порог - это признак (свойство), которое помогает разделить искомый сигнал на классы. Операция порогового разделения заключается в сопоставлении значения яркости каждого пикселя изображения с заданным значением порога.
Операция порогового разделения, которая в результате дает бинарное изображение, называется бинаризацией. Целью данной операции является радикальное уменьшение количества информации, содержащейся на изображении [2]. В процессе бинаризации исходное полутоновое изображение, имеющее некое количество уровней яркости, преобразуется в черно-белое изображение, пиксели которого имеют только два значения -0 и 1.
Один из методов сегментации - так называемый метод жука (рис. 1).
Рис. 1. Стандартный алгоритм жука
Данный метод напоминает поведение жука, обходящего препятствие. В случае бинарного изображения, воображаемый жук начинает свой путь на белом фоне с граничной точки выбранного участка изображения и движется по направлению к области черных элементов изображения. После того, как жук пересечет черный элемент, он поворачивается налево и переходит к следующему элементу. Если этот элемент черный, жук снова поворачивает налево, если же элемент оказывается белым, то жук поворачивает направо. Эта процедура повторяется до тех пор, пока жук не вернется в исходную точку [1]. Декартовы координаты точек перехода с черного на белое или с белого на черное дают местоположение границы.
Однако, у данного метода есть и недостатки. Основные недостатки заключаются в двух пунктах:
1) в ситуации, когда в объекте будет последовательность черных пикселей по диагонали друг от друга, то может возникнуть такая ситуация, при
которой жук упрется в одну финальную - стартовую точку и закончит выполнение, так и не пройдя по всему контуру символа;
2) наличием «дыр» (областей белых пикселей) внутри объекта, которые жук может пропустить.
При решении проблем первого рода для задачи сегментации изображения нами предлагается модифицированный метод жука, который может избежать возникновения недочетов.
Рисунок 1 показывает, что при использовании обычного метода жука при переходе с белого пикселя на черный и, сразу же, с черного на белый, по диагонали от черного символа, обязательно образуется непроверенный жуком пиксель. При этом, обработка изображения происходит следующим образом:
1. Вначале выполняется
бинаризация изображения с верхним порогом с использованием зависимости (1).
Го < £
} |1( f'{x,y) > £ , (1)
где 1 - черный цвет, 0 - белый цвет, t - порог, х, у - координаты пикселя.
Данная операция необходима для того, чтобы чётко отделить фон от букв и определить, какие из пикселей изображения могут служить стартовой точкой для метода жука.
2. Далее воображаемый жук начинает свой путь на белом фоне и движется по направлению к области черных элементов изображения. После того, как он находит первый черный пиксель, алгоритм жука начинает работать.
Рассмотрим ситуацию, когда нам необходимо получить контур символа с изображения. Допустим, у нас есть уже подготовленное к сегментации изображение, напоминающее символ «С» на белом фоне.
Попробуем найти границы символа, используя обычный метод жука (рис. 2а). Находим начальный черный пиксель, после следуем по контуру и, наконец, возвращаемся в исходную точку. Однако, как мы видим на рисунке, при прохождении контура изображения образуются непроверенные пиксели по диагонали от черного (эти пиксели на рисунке выделены крестиком). Так как жук не затронул эти пиксели, то мы не можем знать, какого они цвета. В этом случае, полезна следующая модификация применяемого метода, использующая «память» жука.
Суть модификации метода состоит в следующем. В процессе обработки изображения следует записывать координаты непроверенного пикселя в память, чтобы после он стал новой точкой отсчета движения жука, для последующей верификации этих пикселей на наличие скрытых областей черного цвета. После проверки пикселя на цвет он удаляется из «памяти» жука и проверяется следующая точка (если она есть). Если пиксель был белым, то ничего не происходит, а если был черным - то с него начинается новый этап прохода дополнительного контура жука, далее на нем опять определяются возможные пропущенные пиксели, и следом проверяется следующая точка.
Как видно из рис. 2а, после прохода по контуру символа обычным жуком, остаются 13 пикселей (отмеченных крестиком), координаты которых записаны в память и которые необходимо проверить. Дополнительная проверка показывает, что один из непроверенных пикселей является черным. Этот черный пиксель становится новой начальной точкой для жука. Для новой проверки используется алгоритм абсолютно идентичный тому, который
использовался при обходе основного контура. Во время прохождения ранее не проверенной области черных пикселей мы можем увидеть еще точки, которые ранее жук не затронул и которые надо проверить (рис. 2б). Алгоритм завершает свою работу в тот момент, когда в памяти не остается более ни одной записи о дополнительных проверочных точках.
а) б)
Рис. 2. Работа модифицированного метода жука: а - первоначальная проверка; б - дополнительная проверка
Таким образом, предложенное усовершенствование алгоритма жука позволяет повысить точность
определения границ областей (в частности, символов) на изображении. Из недостатков алгоритма можно отметить небольшое увеличение потребления ресурсов и времени, что, однако, компенсируется наглядностью и простотой в реализации. Все вышесказанное говорит о высокой степени возможности применения предлагаемого метода для сегментации при обработке изображений. Область использования метода: разработка компьютерных программных продуктов сканирования и распознавания текстов.
ЛИТЕРАТУРА
1. Вовк, Е.Л. Разработка автоматизированной системы поиска и обработки выделенных объектов на изображениях с помощью методов контурного анализа [Текст]: Автореф. маг. дис./ Е.Л. Вовк. — Донецк: Донецкий национальный технический университет. М., 2006.
2. Гонсалес, Р., Вудс, Р. Цифровая обработка изображений [Текст]; Пер. с англ. под ред. П.А. Чочиа. - 2-е изд. / Рафаэль Гонсалес, Ричард Вудс
- М.: Техносфера, 2005. - 1072 с. : ил. - ISBN 594836-028-8.
3. Дуда, Р. Распознавание образов и анализ сцен [Текст]: Пер. с англ. под ред. Г. Г. Вайнштейна / Р. Дуда, П. Харт. — М.: Мир, 1978 — 507с.
4. Прэтт, У. Цифровая обработка изображений [Текст]: Пер. с англ. / У. Прэтт — М: Мир, 1982.
— Кн. 2 — 480с.
Рукопись поступила в редакцию 12.11.13.
SYMBOLS SEGMENTATION IN PICTURE BY MODIFICATED BEETLE METHOD
A. Andreev, S. Bobkov
In the article the problem of symbols segmentation in picture is carried out. The main content of the research is the analysis of the approach to picture segmentation by beetle method. The authors reveal shortcomings of existing method and offer their own solving of this problem.
Key words: monochrome picture, optical recognition, segmentation, beetle method, picture edge.