БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Litva J., Lo T.K.-Y. Digital beamforming in wireless communications. - Artech House., 1996.
- 301 p.
2. Джиган В.И. Многолучевая адаптивная антенная решетка // Известия ЮФУ. Технические науки. - 2012. - № 2 (127). - C. 23-29.
3. Chen Y., Le-Ngoc T., Champagne B., Xu C. Recursive least squares constant modulus algorithm for blind adaptive array // IEEE Trans. Signal Processing. - 1985. - Vol. 33. - № 2.
- P. 1452-1456.
4. Resende L.S., Romano J.M.T., Bellanger M.G. A fast least-squares algorithm for linearly constrained adaptive filtering // IEEE Trans. Signal Processing. - 1996. - Vol. 44. - № 5.
- P. 1168-1174.
5. Джиган В.И. Многоканальные RLS- и быстрые RLS-алгоритмы адаптивной фильтрации // Успехи современной радиоэлектроники. - 2004. - № 11. - С. 48-77.
6. Huarng K.-C., Yeh C.-C. Adaptive beamforming with conjugate symmetric weights // IEEE Trans. Antennas and Propagation. - 1991. - Vol. 39, № 7. - P. 926-932.
7. Джиган В.И. Вычислительно эффективный линейно-ограниченный комплексный RLS-алгоритм в арифметике действительных чисел // Доклады 14-й Международной конференции «Цифровая обработка сигналов и ее применения (DSPA-2012)» (Российская академия наук: Институт проблем управления им. В.А. Трапезникова, 28-30 марта 2012 г.).
- М., 2012. - Т. 1. - С. 77-81.
8. Джиган В.И. Алгоритм с пониженной вычислительной сложностью для управления адаптивной антенной решеткой радиосистем цифровой связи // Вопросы радиоэлектроники. Серия «Общетехническая». - 2012. - № 2. - C. 97-106.
9. Djigan V.I. Multy-beam constant modulus adaptive arrays in real-valued arithmetic // Proceedings of the 10-th IEEE East-West Design & Test Symposium (EWDTS) (Kharkov National Technical University, September 14 - 17, 2012). - Kharkov, Ukraine. - P. 54-59.
Статью рекомендовал к опубликованию д.т.н. А.В. Гуреев.
Джиган Виктор Иванович - Открытое акционерное общество Научно-производственный центр «Электронные вычислительно-информационные системы» (ОАО НПЦ «ЭЛВИС»); e-mail: [email protected]; 124460, г. Москва, Зеленоград, Южная промышленная зона, пр. 4922, стр. 2; тел.: +74997311961; лаборатория перспективных исследований; д.т.н.; главный научный сотрудник.
Djigan Victor Ivanovich - Open Join Stock Company ELVEES R&D Center of Microelectronics; e-mail: [email protected]; Bld. 2, Pas. 4922, Southern Industrial Park, Zelenograd, Moscow, Russia, 124460; phone: +74997311961; advanced development laboratory; dr. of eng. sc.; principal researcher.
УДК 681.3.06
С.К. Буханцева
РАЗРАБОТКА АЛГОРИТМА РАСПОЗНОВАНИЯ РУКОПИСНЫХ СИМВОЛОВ НА ОСНОВЕ РАСТРОВОЙ ГРАФИКИ
Рассмотрены методы распознавания плоских изображений с использованием эталонных последовательностей. Предложенная распознающая система отличается от применяемых ранее подходом, при котором на стадии сегментации для представления границ объекта используется метод прослеживания контура, а на стадии распознавания символа происходит распознавание по его скелету. Данный подход позволяет увеличить производительность распознавания образов и может быть использован в реализации нейронных сетей путем изменения ее входных параметров на признаки изображения символа. Предложенная система позволяет добавлять различные системы признаков с целью повышения качества распознавания образов.
Алгоритм; растровая графика; эталонные последовательности; сегментация; распознавание символа.
S.K. Bukhantseva
DEVELOPMENT OF HANDWRITING RECOGNITION ALGORITHM BASED
ON RASTER GRAPHICS
Flat images recognition methods using reference sequences were considered. The proposed recognition system is different from the previously used by approach that method of tracing the contour was used at the stage of segmentation for object bounds re-presentation, and the stage of character recognition is recognition by its skeleton. Using this approach can improve the performance of pattern recognition and can be used in the implementation of neural networks by changing its input parameters for signs of fonts. Furthermore, this system allows to add a variety of features that will increase the quality of pattern recognition.
Algorithm; bitmapped graphics; the reference sequence; segmentation; character recognition.
Постановка задачи. Необходимо распознать дефектный символ из некоторого алфавита, изображенный на исходном бинарном изображении. Алгоритм распознавания должен удовлетворять следующим требованиям:
1) высокое качество распознавания;
2) высокая производительность процесса распознавания.
Методы распознавания плоских и объемных изображений востребованы во многих областях научных, технических, промышленных исследований, а также в области компьютерных и производственных технологий. Одними из главных требований, предъявляемых к распознающим системам, являются повышение точности алгоритмов распознавания и идентификации изображений. Использование формы контура представляет собой основу многих способов распознавания рукописных и печатных символов, так как при незначительных его искажениях анализ контурных представлений объектов дает устойчивый вариант распознавания символа. Существующие методы сталкиваются с трудностями как при построении схем распознавания, так и при выборе эталонных последовательностей. При этом многие методы характеризуются существенной вычислительной и временной сложностью и либо не адаптированы к параллельным вычислительным системам, либо ориентированы на узкий класс идентифицируемых изображений. В распознавании рукописного выражения обычно выделяют следующие стадии:
1) сбор и предварительная обработка данных;
2) сегментация;
3) распознавание отдельных символов;
4) распознавание структуры выражения.
С учетом этих особенностей для распознавания предполагается использовать нейронную сеть, поэтому синтезируемый ниже алгоритм ориентирован для применения в нейросетевых системах.
Предварительное описание метода сегментации изображения. Для простоты первоначально рассматриваются черно-белые изображения. Известный метод распознавания символов “алгоритм жука”[1] основан на том, что на изображении отыскивается объект (первая встретившаяся точка объекта) и контур объекта отслеживается и векторизуется. Достоинством разновидностей алгоритмов данного метода является их простота, к недостаткам можно отнести их последовательную реализацию и некоторую сложность при поиске и обработке внутренних контуров. Проблему такого характера представляется возможным преодолеть, реализовав в алгоритме дополнительный прием, который позволит запоминать предыдущие шаги и возобновлять прослеживание, если текущий путь оказывается ошибочным. На этапе сегментации [1] выделения объекта растровое изображение сканируется сверху вниз и слева направо до нахождения объекта - первой точки, которая имеет цвет, отличный от цвета фона (обозначим ее (x, y)). В качестве алго-
ритма выступает автомат, блуждающий по клеткам плоскости и имеющий возможность обозревать «ближайших соседей» клетки, в которой он находится. Алгоритм определения контура состоит из следующих шагов:
1) поиск «соседей» точки (х, у); «соседями» считаются черные клетки с координатами (х—1, у), (х, у—1), (х—1, у—1), (х+1, у), (х, у+1), (х+1, у+1), (х+1, у-1);
2) поиск наиболее подходящего «соседа»; поиск начинается с точки, которая является следующей (по ходу часовой стрелки) по предварительной контурной точке;
3) добавление кода направления, по которому пошел «жук», для описания контура изображения.
Алгоритм заканчивает свою работу после достижения начальной точки. Декартовы координаты точек перехода с черного на белое и с белого на черное, которые задают границу объекта. При нахождении новой точки контура рассчитывается расстояние между предыдущей найденной точкой и новой. Если оно превышает некоторую границу, тогда в качестве начальной запоминается новая точка. На рис. 1 выступающий элемент в нижнем правом углу объекта, обладающий восьмисвязностью со своим ближайшим соседом, не включен в границу.
Рис. 1. Пример отслеживания внешнего контура, где начальная точка расположена вверху слева
На рис. 2 выступающий элемент не включен в границу объекта, но в данном случае начальная точка передвинута. Таким образом, определение границы зависит от начала движения.
Рис. 2. Пример отслеживания внешнего контура, где начальная точка расположена внизу справа
Данный алгоритм может быть реализован в виде конечного автомата. Когда автомат находится в ячейке (і, ]), і = 1, ..., п, ] = 1, ..., т, то осматривает окрестность этой ячейки, которая включает ячейки с координатами (і - 1, ] - 1), (і - 1, Д (і, ] - 1), (і + 1, Д (і,] + 1), (і + 1,] + 1), (і - 1,] + 1), (і + 1,] - 1) [2]. Задачей векторизации является уменьшение количества точек, с которыми в дальнейшем оперирует алгоритм распознавания, что влечет за собой существенное увеличение показателя скорости работы программы. В процессе выполнения алгоритма выделяются две основные подзадачи:
1) переход от растрового изображения к векторному;
2) выделение контура путем удаления внутренних точек и определение четкого.
Для дальнейшего эти два аспекта предполагаются стандартно реализованными. Ниже излагается непосредственно этап распознавания образа.
Описание метода распознавания изображения по скелетной основе при помощи контурно-матричного алгоритма. Предлагается модифицировать метод распознавания, который проводиться не по множеству точек символа, а по скелету контура. Скелетизация образа выполняется либо с помощью аппарата математической морфологии [2], либо на основе геометрических построений [3]. Таким образом, обучающая выборка формируется из признаков скелетного изображения. Признаки определяются исходя из следующих соображений [1]:
1) рассчитывается центр тяжести скелета относительно оси ОХ по следующей формуле:
IIі
с = •
где хг - расстояние от левой границы символа до г-й точки скелета, х - ширина символов в пикселях, I - количество скелетных точек;
2) рассчитывается центр тяжести скелета относительно оси ОУ по следующей формуле:
Су =-
Л
I
где уг - расстояние от верхней границы символа до г-й точки скелета; у - ширина символов в точках; I - количество скелетных точек;
3) вычисляется среднеквадратичное отклонение относительно оси ОХ по формуле
СКО =1
I
4) вычисляется среднеквадратичное отклонение относительно оси О У по формуле
СКОу = ‘
I (у. - Су
I
5) определяется отношение количества скелетных точек, связанных с соседними по горизонтали, к общему количеству скелетных точек по формуле
Рх = ^ ,
х I
где 1Х - количество скелетных точек, связанных с соседними по горизонтали;
6) находится отношение количества скелетных точек, связанных с соседними по вертикали, к общему количеству скелетных точек по следующей формуле:
р= Ь-,
у I
где Ц - количество скелетных точек, связанных с соседними по вертикали;
7) вычисляется отношение количества скелетных точек, связанных с соседними по главной диагонали, к общему количеству скелетных точек по формуле
- 01
где ID1 — количество соседних точек, связанных с соседними по главной диагонали;
8) определяется отношение количества скелетных точек, связанных с соседними по побочной диагонали, к общему количеству скелетных точек по следующей формуле:
Р = 2
г0 2 I ’
где О - количество скелетных точек, связанных с соседними по побочной диагонали.
По окончании данных вычислений формируется список найденных признаков скелетного изображения для дальнейшего этапа сравнения символа с эталонным множеством. Распознавание и идентификация относятся к символам, приводимым к одному масштабу и каноническому положению в декартовых координатах. Предлагаемый алгоритм заключается в следующем. Для начала нужно разбить исходное изображение на матричные прямоугольники размерностью 9x8 (рис. 3):
' 0 0 0 0 0 0 0 0'
0 1 0 0 1 0 0 0
0 0 0 0 1 0 0 0
0 0 0 1 1 0 0 0
0 0 1 0 1 0 0 0
0 1 0 0 1 0 0 0
0 0 0 0 1 0 0 0
0 0 0 0 1 0 0 0
,0 0 0 0 1 0 0 0 У
Рис. 3. Матричное представление плоского изображения, содержащего цифру
один
Далее необходимо использовать принцип “алгоритма жука”, только в данном случае определяется интенсивность каждого пикселя контура и затем он векторизуется. Составляется матрица “насыщенности” изображения (рис. 4):
'0 0 0 0 0 0 0 0 '
0 0.3 0 0 0.9 0 0 0
0 0 0 0 0.8 0.1 0 0
0 0 0 0.1 0.8 0 0 0
0 0 0.8 0 0.8 0 0 0.2
0 0.7 0 0 0.7 0 0 0
0 0 0 0 0.7 0 0 0
0 0 0 0 0.8 0 0 0
0 0 0 0 0.8 0 0 0 У
Рис. 4. Матричное представление “насыщенности ” плоского изображения,
содержащего цифру один
Генерируется еще одна матрица следующим образом: выполняется цикл для прохода элементов массива, где на каждой итерации цикла сравнивается значение
переменной со значением ^ , равным 0,5. Если сравниваемое число меньше ^ , то в новую матрицу записывается число 0, в противном случае, значение переменной остается без изменений. Затем выполняется скелетизация и определяются признаки скелетного изображения. В результате получается следующий список признаков: центры тяжести относительно осей координат; отношение количества скелетных точек, связанных с соседними по горизонтали и вертикали, к общему количеству скелетных точек; отношение количества скелетных точек, связанных с соседними по главной диагонали, к общему количеству скелетных точек; отношение количества скелетных точек, связанных с соседними по побочной диагонали, к общему количеству скелетных точек. Массивы эталонных образцов символов сформированы на основе матриц размерностью 9x8 и расположены в базе данных. Сравниваются признаки исходного объекта с эталоном. В стек заносятся значения процентов совпадения с эталонами. Затем из него происходит выборка эталона с наибольшим процентным значением [4].
Заключение. Изложен метод распознавания плоских контурно представленных изображений с использованием эталонных последовательностей. К достоинствам предложенного метода относятся устойчивое распознавание дефектных символов, простота и высокая скорость распознавания. За счет уменьшения объема математических вычислений сокращается временная сложность совокупности алгоритмов, составляющих метод. Предложенный базовый алгоритм ориентирован на применение в нейросетевых системах распознавания.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Sanjay Sengupta and Hyun S. Yang. Morphological Shape epresentation and Recognition of Binary Images // Proceedings of SPIE. - Jan. 1987. - Vol. 0848. - P. 51-56.
2. Рейер И., Петровцева М. Язык гранично-скелетного представления бинарных изображений // Доклады международной конференции Graphicon. - М., 2003. - C. 6.
3. Саймон Хайкин. Нейронные сети. Полный курс. - M.: Изд-во “Вильямс, 2006. - 1104 с.
4. Plamondon R., Srinari S. On-Line and Off-Line Handwriting Recognition: A Comprehensive Survey // IEEE Transactions on Pattern Analysis and Machine Intelligence. - January 2000.
- Vol. 22, № 1. - P. 4-20.
Статью рекомендовал к опубликованию д.т.н., профессор Я.Е. Ромм.
Буханцева Софья Константиновна - Таганрогский государственный педагогический институт; e-mail: [email protected]; 347926, г. Таганрог, ул. Инициативная, 48; тел.: 88634601807; аспирантка.
Bukhantseva Sophia Constantinovna - Taganrog State Pedagogical Institute; e-mail: [email protected]; 48, Initsiativnaya street, Taganrog, 347926, Russia; phone: +78634601807; postgraduate student.