Секция «Информатика и автоматизированные системы»
УДК 004.932
Д. А. Фурашев Научный руководитель - М. Н. Фаворская Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Красноярск
МЕТОДЫ УЛУЧШЕНИЯ КАЧЕСТВА ИЗОБРАЖЕНИЙ
Рассматриваются проблемы улучшения качества изображений в различных приложениях. Анализируются сложные методы фильтрации, позволяющие повысить качество изображений.
Обработка изображений широко применяется во многих отраслях, например для распознавания объектов ландшафта, прогнозирования погоды и.т. д. При распознавании объектов ландшафта и атмосферы редактирование изображений крайне нежелательно. Также, например, в медицине с помощью обработки изображений улучшаются системы визуализации для процесса диагностики, обработка и анализ данных дистанционного зондирования Земли со спутников, объемные изображения объектов, полученные с помощью голографических устройств, разработка «органов зрения» роботов. Для успешного решения задач поиска и идентификации объектов, определения различного рода их количественных характеристик необходимо, чтобы первичные изображения характеризовались высоким визуальным качеством, которое теряется из-за неудовлетворительных условий получения изображений, несовершенства систем передачи видеоинформации и ее отображения, влияния помех и т. п.
В этой области широко используются методы обработки изображений (Image Processing), позволяющие визуальное улучшать качество изображения (коррекция яркости и контраста, цветокорреция и т. п.). Рассмотрим применение сложных методов фильтрации. Фильтр Unsharp Mask (нерезкая маска) используется для тонкой цветовой коррекции, он является очень полезным инструментом и предназначается для увеличения резкости. Unsharp masking - это технологический прием обработки изображения, который позволяет добиться эффекта ощущения большей его резкости за счет усиления контраста тональных переходов. Важно отметить, что нерезкое маскирование не повышает резкость изображения на самом деле. Оно не может восстановить потерянные детали на разных этапах обработки изображения. Нерезкое маскирование усиливает локальный контраст изображения на тех участках, где изначально присутствовали резкие изменения градаций цвета. Благодаря этому изображение визуально воспринимается как более резкое. Также существуют и проблемы нерезкого маскирования. При неверном или «избыточном» использовании нерезкое маскирование может создавать впечатление «искусственности» изображения. После применения фильтра нерезкой маски края с большим наклоном (подобно темному зданию на фоне светлого неба) часто обнаруживают дефект ступенчатости. Для решения этой задачи используются фильтры шумоподавления.
Сглаживание с помощью гауссиана. Этот подход можно обосновать качественно: сглаживание подавляет шум, поддерживая требование, чтобы пиксели были похожи на своих соседей.
Следующим эффективным методом является метод преобразования гистограмм. Гистограмма - это диаграмма, построенная в столбиковой форме, в которой величина показателя изображается графически в виде столбика. Гистограмма наглядно характеризует, как величина показателя изменяется во времени. Оптимальным с точки зрения зрительного восприятия человеком является изображение, элементы которого имеют равномерное распределение яркостей. Улучшение изображений путем выравнивания гистограммы - это процесс, в котором пытаются достичь равномерности распределения яркостей обработанного изображения. Процедура выравнивания гистограммы состоит из следующих действий:
- Вычисляется гистограмма распределения яркостей элементов изображения И(Ь).
- Строится нормированная кумулятивная гистограмма СИ(Ь).
- Формируется новое изображение Ь' = Я*СИ(Ь).
Это преобразование эффективно для улучшения
визуального качества низко контрастных деталей. Описанный метод преобразования гистограммы может быть глобальными, то есть использовать информацию обо всем изображении, и скользящими, когда для преобразования используются локальные области изображения. Глобальные методы гисто-граммных преобразований являются, в сущности, табличными методами, основное их преимущество состоит в быстродействии. Для более детальной обработки изображений используют скользящие методы. Они обеспечивают качественное контрастирование мелких деталей изображения [2]. Вместе с тем, они более объемны по вычислительным затратам. Поэтому при использовании методов класса гистограммных преобразований нужно искать компромисс между качеством и быстродействием обработки изображений [1].
Одной из наиболее удобных форм представления информации при диагностировании материалов и изделий в неразрушающем контроле, органов человека в медицине и иных областях является изображение. Это приводит к необходимости развития способов диагностики с использованием разнообразных методов. Однако одним из существенных недостатков этих методов является то, что в боль-
Актуальные проблемы авиации и космонавтики. Информационные технологии
шинстве своем они обеспечивают формирование низкоконтрастных изображений. Поэтому основная цель методов улучшения состоит в преобразовании изображений к такому виду, что делает их более контрастными и, соответственно, более информативнее. Довольно часто на изображении присутствуют искажения в определенных локальных окрестностях, которые вызваны дифракцией света, недостатками оптических систем или расфокусировкой. Это приводит к необходимости выполнения локальных преобразований на изображении. Иными словами, такой адаптивный подход дает возможность выделить информативные участки на изображении и соответствующим образом их обработать. Изложенным требованиям отвечают методы адаптивного преобразования локального контраста. Основные шаги реализации методов адаптивного преобразования локальных контрастов следующие.
- для каждого элемента изображения Ь(ц) вычисляют значение локального контраста С(ц) в текущей окрестности W с центром в элементе с координатами (1,]);
- вычисляют локальную статистику для текущей скользящей окрестности W;
- преобразуют (усиливают) локальный контраст С(у), употребляя для этого нелинейные функции и учитывая локальную статистику текущей скользящей окрестности W;
- восстанавливают значение яркости изображения Ь'(у) с усиленным локальным контрастом.
Таким образом, метод усиления контраста с использованием функции протяженности гистограммы эффективно используется в обработке широкого класса изображений. При использовании характеристики скользящих окрестностей удается идентифицировать участки изображения по уровню контрастности и соответствующим образом на них реагировать. Благодаря этому достигается более тонкая обработка мелких деталей.
Библиографические ссылки
1. Ярославский Л. П. Введение в цифровую обработку изображений. М. : Сов. радио, 1979.
2. Гонсалес Р., Вудс Р. Цифровая обработка изображений. М. : Техносфера, 2006.
© Фурашев Д. А., Фаворская М. Н., 2010
УДК 004.932
Е. В. Чанчикова Научный руководитель - М. Н. Фаворская Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Красноярск
ИСПОЛЬЗОВАНИЕ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ ДЛЯ РАСПОЗНАВАНИЯ РУКОПИСНЫХ СИМВОЛОВ
Рассматриваются сверточные нейронные сети, позволяющие устранить недостатки полносвязных нейронных сетей, при распознавании рукописных символов.
Среди проблем перевода рукописных источников в машиночитаемый формат к наиболее сложным и трудоемким относится создание версий рукописных книг в формате электронного текста. Чтобы получить полноценный электронный текст, как правило, используется его ручной компьютерный набор с помощью специальных редакторов. Представляется, что решение указанной задачи может лежать в плоскости создания специализированных программных продуктов на основе наиболее перспективных видов современных информационных технологий. К таковым относятся технологии, при создании которых используются приемы и методы искусственного интеллекта.
В настоящее время накоплен значительный опыт разработки и внедрения интеллектуальных информационных систем, среди которых немалое место занимают системы, предназначенные для распознавания сложных в техническом отношении текстов (нечетких, загрязненных, с множеством помарок, написанных с использованием разных шрифтов), таких, как автомобильные номерные знаки, подписи технической документации. В основе таких систем, как правило, лежат нейросетевые технологии, до-
полненные алгоритмами предварительной обработки изображений (контрастирование, бинаризация, удаление посторонних фрагментов и др.) и средствами дораспознавания, включающими орфографический, синтаксический и семантический виды анализа.
В традиционной полносвязной нейронной сети имеется ряд недостатков, понижающих эффективность их работы. Прежде всего, это большой размер изображений, который может достигать нескольких сотен. Еще одним недостатком классических полносвязных сетей является то, что они игнорируют топологию входного изображения.
Сверточные сети являются одним из подвидов нейронных сетей, который в значительной мере устраняет вышеописанные недостатки полносвязных нейронных сетей и гарантирует быстрое обучение и распознавание образов. Далее будет подробно рассмотрена архитектура такой сети, особенности ее слоев и принцип действия. В основе сверточных сетей лежат три механизма, используемые для достижения инвариантности к переносу, масштабированию, незначительным искажениям: Локальное извлечение признаков. Формирование слоев в виде