УДК 681.3
А.А. ДЕРЕВЯНКИНА
СТРУКТУРНО-ПАРАМЕТРИЧЕСКАЯ ОПТИМИЗАЦИЯ ПОЛУТОНОВЫХ ИЗОБРАЖЕНИЙ МЕТОДОМ S-АППРОКСИМАЦИИ В ЗАДАЧАХ РАСПОЗНАВАНИЯ ОБРАЗОВ
В статье рассматриваются этапы структурно - параметрической оптимизации полутоновых изображений при распознавании графических образов. Приводятся описание алгоритмов S - аппроксимации и нахождение среди них оптимального. Для косвенного доказательства того, что один из приведенных алгоритмов оптимален, используются генетические алгоритмы. После аппроксимации изображения необходимо привести к общему спектру яркостей, т.е. выполнить нормировку. В результате получается итоговое изображение в форме, наиболее подходящей для дальнейшего структурного анализа.
Ключевые слова: S - аппроксимация, оптимизация, символьно-числовая модель, графическое изображение, распознавание образов, полутоновое изображение, спектр серого.
Введение. Зрение - это основной источник получения информации человеком. Таким образом, разработка аналогов зрительно - мыслительного комплекса человека является одним из важных направлений развития информационных технологий.
В большом числе информационных систем применяется представление результатов обработки данных в виде изображения, выводимого на экран для использования наблюдателем. Процедуру, обеспечивающую такое представление, называют визуализацией. Желательно, при помощи обработки придать выводимому изображению такие качества, благодаря которым его восприятие человеком было бы по возможности комфортным.
Например, в настоящее время одной из областей, где происходит визуализация изображений, является синергетика: анализ особенностей морфологической картины таких биожидкостей, как сыворотка крови, желчь, спинномозговая и слезная фракции, слюна, желудочный сок, позволяет доступными методами определить тенденции к развитию определенного патологического состояния и предотвратить его возникновение еще на стадии предрасположенности [3].
Морфологическая картина биожидкости представляет собой графическое изображение, которое является наиболее совершенным и информативным видом представления информации, но в то же самое время наиболее трудно распознаваемым образом. Сочетание тысяч и миллионов форм, яркостей, цветностей, границ и полутонов создаёт неповторимый образ. Но не все многочисленные черты этого образа являются информативными: некоторые признаки полезно подчеркнуть, усилить, а какие-то наоборот сделать незаметными.
Постановка задачи. Ввиду высокой размерности любого изображения при его достаточном разрешении одним из приёмов его подготовки к визуализации является поэлементная обработка, которая приводит к упрощению исходного изображения.
Графическое изображение характеризуется множеством как качественных, так и количественных характеристик: ВИДОМ, формами и размерами Рис. 1. Фация сыворотки изображённых предметов, их взаимным расположе- крови
нием, яркостью, контрастностью, спектром цвета (при этом для каждого пикселя цвет представляется несколькими составляющими) и пр. [1].
Для поэлементной обработки изображения достаточной и необходимой является количественная (числовая) модель изображения, которая представляет собой матрицу пикселей.
В упрощенном представлении цветного изображения матрица пикселей - это массив, содержащий три монохромных изображения, соответствующих яркости трех цветов: красного, зеленого и синего. То есть в каждом элементе массива на самом деле три элемента: строка яркости красного, строка яркости зеленого и строка яркости синего. Например, для изображения на рис.1 только исходного - цветного, размер которого составляет 2,5х3,42 см, матрица пикселей получается 295х403, т.е. 118885 элемента. При этом каждый элемент массива (длина массива - 295 элемента) представляет три соответствующие строки (длина строки - 403 элемента) матриц для каждого составляющего цвета (рис.2).
Несмотря на то, что рассмотренное на рис. 2 представление цветного графического изображения является одним из упрощенных (существуют представления, при которых каждый элемент массива состоит из шести элементов), полученная матрица пикселей оказывается большой размерности, а это затрудняет дальнейшую обработку.
0,298 0,329 0,208 0,196 строки
0,404 0,678 0,482 0,384
0
0,631 0,404 0,4 0,227
295 столбца
0,227 0,235 0,208 0,196 ЮЮСІ10
0,259 0,588 0,267 0,314
т 0
0,565 0,569 0,302 0,243
295 столбца
удёГ пси
Яркость зеленого
Рис.2. Матрица пикселей цветного изображения (см. окончание на с.42)
0,212 0,204 0,141 0,137 я и о £ с
0,427 0,435 0,192 0,153
т о 4
0,502 0,498 0,2 0,212
295 столбца
Учитывая, что при визуализации важен набор только информативных признаков, нужно выполнить структурно - параметрическую аппроксимацию и оптимизацию числовой модели исходного изображения, в результате которой будет построена символьно - числовая модель полутонового изображения в упрощенной форме, позволяющей выделить набор тех информативных признаков, которые помогут перейти к оценке качественного содержания модели.
Такая аппроксимированная модель будет представлять собой матрицу, состоящую либо из вещественных значений, каждое из которых будет соответствовать одному аппроксимирующему уровню яркости, либо из символьных констант, обозначающих различные идентифицируемые уровни яркости.
Построение символьно-числовой модели. При решении многих задач цвет не является основным информативным признаком, поэтому, зачастую, возможно преобразование цветного изображения в полутоновое, которое имеет единственный «цветовой» канал, называемый черным, а все оттенки, видимые в изображении, представлены 2, 256 и 16777216 различными интенсивностями черного цвета - уровнями яркости в зависимости от принятого разрешения. Тогда матрица пикселей получается значительно меньшей размерности.
В связи с вышесказанным первым этапом построения СЧ модели является преобразование цветного изображения в полутоновое с широким спектром серого цвета (большой диапазон яркости).
Но даже такое, значительно уменьшенное, множество значений яркости полутонового изображения затрудняет распознавание основных ин-
формативных признаков из-за необходимости учёта мелких незначимых областей яркостей, соответствующих несущественным признакам. Поэтому необходимо выполнять дальнейшее упрощение.
На втором этапе происходит аппроксимация исходного изображения, в результате которой снижается размерность описания образа до S полутонов. Этап назван S-аппроксимацией. На данном этапе возникает альтернатива между простотой и точностью, что позволяет поставить задачу целочисленной оптимизации тоновой размерности изображения S.
Первый шаг самой грубой S-аппроксимации, который производится над спектром серого цвета для изображения, - это двутоновая ^=2), т.е. упрощение изображения до двух яркостей. Фактически же размерность аппроксимации определяется решаемой задачей, при этом уменьшение числа тонов снижает размерность описания образа. Пример, показывающий различие между различными уровнями Б-аппроксимации полутонового изображения фации, приведён на рис.3, к которому присоединены таблицы с элементами символьных матриц. Ниже дана количественная расшифровка символов.
А А А А А А
А А А В А А
В В А В А А
В В В А В А
В В С С В А
Б Б А Б А В
а - ^ =2 - образуется 2 яркости: б - ^ =4 - образуется 4 яркости:
А - 0,285; В - 0,5006 А -0,1771; В - 0,3116;
С -0,4547; D - 0,5993
Рис.3. Дву- и четырехтоновая аппроксимация полутонового изображения
Б - аппроксимация изображения может выполняться по нескольким алгоритмам, в связи с чем возникла задача их исследования для нахождения наиболее эффективного - дающего минимальную потерю точности.
После каждого алгоритма для полученного упрощенного изображения вычислялись такие статистические характеристики сопоставления исходного и аппроксимированного изображений, как средняя яркость всей картинки и средняя дисперсия яркостей в каждой её точке. По этим параметрам определялось, какой алгоритм аппроксимации дает наилучшие результаты, т.е. в каком случае результирующее изображение статистически ближе к исходному.
Первый исследованный алгоритм аппроксимации заключался в том, что для исходного изображения строилась гистограмма яркости (рис.4), активный диапазон оси яркости делится на две части, для каждой из которых вычислялось среднее значение. Исходное изображение сканировалось попик-сельно, и для каждой точки рисунка принималось значение яркости, соответ-
ствующее среднему значению той части диаграммы яркости, к которой относится по яркости аппроксимируемый пиксель. В результате получалось двутоновое изображение, характеризуемое оценкой точности в виде среднеквадратичного отклонения (СКО) яркости каждого пикселя аппроксимированной картинки от её действительного значения на исходной. Для приведённого на рис.1 примера СКО составилоА23<054й1 яркост иол икселей.
Гистограмма яркости
яркостьи Рис.4. Гистограмма яркости
Второй исследуемый алгоритм аналогичен первому, но в качестве активного диапазона изменения яркости принимается участок диаграммы (рис.5), получаемый отбрасыванием крайних участков заданной площади р , доля которой от общей площади диаграммы Р составляет a = р/Р . Оптимальное значение а определяется на основе метода роящихся частиц, который является одним из самых простых среди адаптивных эвристических алгоритмов, но, несмотря на это, дает хорошие результаты: происходит варьирование а в некотором диапазоне и определяется такое, которое наиболее близко к оптимальному. Такой приём приводит к более точной аппроксимации (СКО -23,228 яркости пикселей).
До нормализации
После нормализации
Яркости А - О В - 1
А - О В - 1
С - О,4О28777 D - О,733813
Рис. 5. Нормированные изображения
Третий алгоритм строится на основе второго, но следующим образом: для каждой точки вычислялось, к какой средней яркости (первой или второй части диаграммы) она ближе, и этим координатам присваивается соответству-
ющее значение яркости. В результате такого преобразования аппроксимация становится еще более точной (СКО - 23,079 яркости пикселей).
Четвёртый проверяемый алгоритм аппроксимации отличался от первого тем, что деление на две части происходило относительно объема фигуры и вычислялись взвешенные средние для каждой части. В результате проведения аппроксимации по четвертому алгоритму получаются изображения с худшими статистическими характеристиками (СКО - 23,818 яркости пикселей) по сравнению с предыдущими алгоритмами.
Исследования показали, что результаты двутоновой аппроксимации по третьему алгоритму дают наилучшую точность аппроксимации и возможно соответствуют как минимум локальному оптимуму. Для косвенного доказательства того, что данный алгоритм наиболее оптимален, было решено использовать так называемый генетический алгоритм, который относится к эвристическим адаптивным методам поиска. В последнее время он часто используется для решения задач экспериментальной оптимизации.
Важнейшей составляющей конструирования генетического алгоритма под решаемую задачу является построение предметно-обусловленных генов и состоящей из них хромосомы. В исследуемом случае ген можно представить п -й (в наиболее простом 2-аппроксимационном варианте) парой пикселей, которые отличаются по яркости, т.е. образуют границу тонового перехода. Для построения хромосомы производится построчное сканирование исходного изображения с целью выявления граничных пикселей, которые образуют переход, каждая такая пара пикселей принимается за исходный ген, а вся граничная цепочка генов за исходную хромосому. Для изображения, например, фации на рис.1, была получена хромосома, состоящая из 6932 генов.
Для построения популяции выполнялась мутация исходной хромосомы. При этом применялись следующие виды мутации: пиксели в гене менялись яркостями, т.е. обоим присваивалась либо большая, либо меньшая яркость. Отбор результата мутации производился способом рулетки. Колесо рулетки содержит по одному сектору для каждого вида мутации. Для определения процента генов, подвергающихся мутации, задавалось значение вероятности мутации.
После построения стартовой популяции, полученной мутацией базовой хромосомы, представляющей собой реальную границу раздела полутонов, был запущен механизм естественного обора с формированием новых популяций. Для каждой популяции вычислялись дисперсия и среднеквадратичное отклонение - мутированные пиксели подставлялись в аппроксимированное изображение и вычислялись вероятностные характеристики. Затухание процесса оптимизации было получено на 10 популяции, при этом СКО конечной популяции все равно хуже (СКо - 23,83 яркости пикселей), чем СКО, полученное для изображения, аппроксимируемого по третьему алгоритму (СКО -23,079 яркости пикселей) [4].
На третьем этапе процесса построения «рабочей» СЧМ происходит сравнение различных СЧМ как образов, т.е. сопоставимость входящих в модель численных оценок. Например, на рис. 3 видно, что значения яркостей для одного и того же изображения при различных уровнях s - аппроксимации получились не сопоставимые. Еще больший разброс яркостей происходит при аппроксимации нескольких изображений. Поэтому на третьем этапе построения СЧМ необходимо нормирование аппроксимированного изображения, целью которого является приведение графического изображения к общему условному спектру сопоставимых яркостей.
4Б
Поскольку нормировка нужна для этапа структурного анализа изображений (сопоставимости яркости на различных изображениях), то ее целесообразно проводить для результирующего изображения, а не исходного. Нормировка производится по следующей формуле
пикселя исходного изображения; Н^п - минимальная яркость исходного изображения; Н^ - максимальная яркость исходного изображения.
Так, например, после нормировки изображений на рис.3, получаем сопоставимые значения яркостей, сохраняем алфавит кодировки (А, В) и расширяем его (С, D), которые далее могут использоваться для идентификации информативных признаков на множестве изображений (см. рис. 5). Заключение. Таким образом, структурно - параметрическая оптимизация полутоновых изображений состоит из нескольких обязательных этапов: аппроксимация спектра ограниченным числом S тонов (S -аппроксимация) с целью снижения размерности описания образа и приведение графического изображения к общему условному спектру яркостей, позволяющему корректную численную оценку и структурное сопоставление изображений, т.е. нормировку. Кроме этого оптимизация может включать в себя дальнейшую обработку изображения в зависимости от решаемой задачи. Заключительная обработка полученных в результате аппроксимации полутоновых изображений СЧ моделей включает в себя сравнение и их классификацию, а затем распознавание информативных признаков.
Библиографический список
1. Барлит А.В. Исследование и разработка алгоритмов интеллектуальной поддержки классификации графической информации. / А.В.Барлит. - Таганрог: ТРТУ, 2005.
2. Журавель И.М. Краткий курс теории обработки изображений. / И.М. Журавель. - М., 1999.
3. Шабалин В.Н. Морфология биологических жидкостей человека. / В.Н.Шабалин, С.Н.Шатохина. - М.: Хризотом, 2001.
4. Darrel Whitley. A Genetic Algorithm Tutorial // Statistics and Computing (4), 1993. - S.65-85.
Материал поступил в редакцию 10.07.09.
(1)
где Hjn - яркость пикселя нормированного изображения; Hj
- яркость
A.DEREVJANKINA
THE STRUCTURALLY - PARAMETRICAL OPTIMIZATION OF THE HALF-TONE IMAGE WITH THE HELP OF THE METHOD OF APPROXIMATION IN THE TASK OF PATTERN RECOGNITION
The article deals with stages of the structurally - parametrical optimization of the half-tone image in the process pattern recognition. Give the description of the approximation algorithms and existence of the best of them. Genetic algorithms using for founding of the optimal algorithm. After approximation of image it's important to lead it to the general spectrum of brightness, i.e. making normalization. As the result we have the finishing image in the form which is the most profitable for further structural analysis.
ДЕРЕВЯНКИНА Анна Анатольевна, аспирант кафедры «Программное обеспечение вычислительной техники и автоматизированных систем» Донского государственного технического университета. Окончила ДГТУ (2005).
Область научных интересов: методы распознавания образов, аппроксимация полутоновых изображений.
Количество публикаций - 15.