УДК 004.932.2
Б01: 10.24412/2071-6168-2024-12-65-66
БИНАРИЗАЦИЯ ИЗОБРАЖЕНИЙ В ЗАДАЧЕ ОБНАРУЖЕНИЯ ПРЕПЯТСТВИЙ СИСТЕМОЙ
ТЕХНИЧЕСКОГО ЗРЕНИЯ
С.В. Кузнецова
Статья посвящена обзору методов бинаризации изображений. Бинаризация применяется в качестве предварительной обработки в системах технического зрения для выделения области интереса на изображении. Приведен обобщенный алгоритм бинаризации изображения. Представлены результаты работы следующих методов бинаризации: глобальная бинаризация, адаптивная бинаризация, двойная пороговая бинаризация, бинаризация на основе цветовых признаков. Выполнен сравнительный анализ перечисленных методов.
Ключевые слова: бинаризация изображения, выбор порога, гистограмма яркости, результаты бинаризации, система технического зрения, сравнительный анализ методов.
Бинарные изображения используются в качестве входных данных для алгоритмов обработки в системах технического зрения. Бинаризация изображения предполагает разделение изображения на фон и объекты, которые представляют интерес для последующих этапов работы с изображением. Процесс бинаризации необходим для выделения объектов на изображении, что упрощает дальнейшую обработку и анализ. Бинаризация часто используется для распознавания объектов, сегментации и других задач компьютерного зрения.
Согласно [1], бинаризация - это процесс, представляющий собой перевод цветного изображения или изображения в градациях серого в двухцветное черно-белое. Бинарное изображение - это цифровое изображение пиксели которого имеют значения 0 или 1. Основной параметр данного преобразования - порог, со значением которого затем сравнивается яркость всех пикселей. Порог (англ. threshold) - это признак (свойство), которое помогает разделить искомый сигнал на классы [2]. Операция порогового разделения заключается в сопоставлении значения яркости каждого пикселя изображения с заданным значением порога.
1. Обобщенный алгоритм бинаризации изображения. Дадим краткую характеристику этапов бинаризации изображения.
1) Преобразование изображения в оттенки серого, если оно не было в таком формате; 2) Определение порогового значения, по которому будет происходить бинаризация; 3) Перебор всех пикселей изображения и сравнение их яркости с пороговым значением; 4). Если яркость пикселя выше порогового значения, то ему присваивается белый цвет, а если ниже - черный цвет. Общая схема бинаризации представлена на рисунке 1 [3].
Рис. 1. Общая схема бинаризации
Бинаризация изображения выполняется согласно правилу:
[1, f (x, y) > T
B( x, y) = -,
'0, f (x, y) < T.
где f (x, y) - яркость пикселя (x, y) исходного изображения, B( x, y) - значение пикселя результирующего изображения, T - порог бинаризации.
2. Методы бинаризации изображения
Существуют различные методы бинаризации, которые можно использовать в зависимости от задачи и характеристик изображения:
1) Глобальная бинаризация (англ. Global Thresholding) [4].
В глобальных методах бинаризации вычисляется одно значение порога T , которое используется при обработке всех пикселей исходного изображения. Пиксели с интенсивностью, превышающей порог, становятся белыми, а пиксели ниже порога — черными.
Алгоритм Оцу (Otsu's Method) [5] является наиболее используемым методом глобальной бинаризации. Осуществляет автоматический выбор порога, основанный на анализе гистограммы изображения. Порог выбирается таким образом, чтобы минимизировать дисперсию между классами пикселей (черные и белые).
2) Адаптивная (локальная) бинаризация (англ. Adaptive Thresholding) [6].
В этих методах значение порога бинаризации T вычисляется для каждого пикселя исходного изображения или для пикселей из локальной области исходного изображения, основываясь на значениях соседних пикселей. Это позволяет учитывать локальные особенности изображения, такие как освещенность. Наиболее известными алгоритмами адаптивной бинаризации являются: Mean Adaptive Thresholding - порог устанавливается как среднее значение яркости в локальной области; Gaussian Adaptive Thresholding - порог устанавливается как взвешенное среднее с использованием Гауссового фильтра.
3) Двойная пороговая бинаризация (англ. Below and Above Thresholding) [7].
Для бинаризации задаются два порога: нижний и верхний. Пиксели, находящиеся в интервале между ними, остаются белыми, остальные черные. Полезен для выделения объектов, которые должны соответствовать определенному диапазону интенсивностей, например, объектов определенной текстуры.
4) Бинаризация на основе цветовых или текстурных признаков [7].
Использует информацию о цвете или текстуре объекта для бинаризации. Например, можно преобразовать цветное изображение в пространство цветовых каналов (RGB, HSV) и выполнить бинаризацию на основе отдельного канала или комбинации каналов.
Ученые, которые внесли существенный вклад в развитие методов бинаризации [3]: Отсу (Otsu) [5], Гон-салес (Gonzalez) [8], Вудс (Woods), Эйквил (Eikvil), Бредли (Bradley) [9], Рут (Roth), Вернсен (Bernsen), Ннблэк (Niblack), Саувола (Sauvola), Сингх (Singh), Волф (Wolf) и др.
3. Оценка возможностей методов бинаризации.
Проверим методы бинаризации для обнаружения областей изображения, применительно к распознаванию препятствий в системе технического зрения беспилотного транспортного средства. Рассмотрим некоторые методы бинаризации. В качестве оценки возможностей применения бинаризации возьмем цветное изображение с маршрута транспортного средства (см. рис. 2). На тестовом изображении представлено несколько потенциальных препятствий - других транспортных средств. Задача - выбрать метод бинаризации, наиболее подходящий для задачи обнаружения объектов (препятствий на маршруте).
а б
Рис. 2. Исходное цветное изображение (а), оно же в градациях серого (б) для оценки возможности применения
бинаризации для обнаружения препятствий
Результаты применения пороговой бинаризации представлена на рис. 3, а). Для выделения объекта на фоне мы подбирали пороговое значение методом "проб и ошибок". Для ускорения процедуры мы предлагаем использовать гистограмму яркости изображения (рис. 3, б). Пиксели, количество которых больше всего на изображении, обычно соответствуют фону (при условии, что фон относительно однороден). Наметив максимум на гистограмме в некоторых случаях удается отделить объект от фона.
Histogram
а б
Рис. 3. Пороговая бинаризация изображения (порог Т = 100 задан вручную): а - результат бинаризации;
б - гистограмма яркости изображения
Следующий метод, который мы опробовали - метод Otsu. Результат преобразования исходного изображения в бинарное и гистограмма с отмеченным порогом бинаризации показаны на рис. 4. Как уже было сказано ранее, порог бинаризации выбирается автоматически.
Histogram
« "{
Q
О 50 100 150
Pixel Value
а б
Рис. 4. Бинаризация изображения методом Отсу: a - результат бинаризации; б - гистограмма яркости изображения
Метод Otsu дает хорошие результаты на бимодальных изображениях (проще говоря, бимодальное изображение — это изображение, гистограмма которого имеет два пика). Метод автоматически вычисляет пороговое значение на основе гистограммы изображения для бимодального изображения. Для изображений, которые не являются бимодальными, бинаризация не будет точной. Алгоритм ищет значение в середине двух пиков в качестве порогового значения.
Примеры бинаризации с двойным порогом показаны на рис. 5. Порог настраивался вручную.
Использование глобального значения в качестве порогового значения не всегда может давать хорошие результаты, особенно в тех случаях, когда изображение имеет различное освещение в разных областях. В этом случае мы выбираем адаптивное пороговое определение. При этом алгоритм рассчитывает порог для небольших областей изображения. Таким образом, мы получаем разные пороги для разных областей одного и того же изображения, и это дает лучшие результаты для изображений с разным освещением.
/
..¿I
и__J
б
Рис. 5. Бинаризация изображения с двойным порогом: а - результат бинаризации для диапазона: Т1 = 100, Т2 = 160; б - результат бинаризации для диапазона: Т1 = 60, Т2 = 80
Результаты работы алгоритмов адаптивной бинаризации представлены на рис. 6: Mean Adaptive Thresholding (рис. 6, а) ; Gaussian Adaptive Thresholding (рис. 6, б). Как мы можем видеть данный метод бинаризации позволяет выделить множество элементов (контуров и областей) на изображении, однако уверенно определить область объекта не удается. Зато хорошо просматривается дорожная разметка и текстура фона.
Рис. 6. Адаптивная бинаризация: а - пороговое значение Mean ( среднее значение площади окрестности); б - пороговое значение Gaussian ( взвешенная сумма значений окрестности, где веса представляют собой окно
Гаусса)
Рис. 7. Бинаризация по цветовой маске HSV: диапазон параметров нижняя граница - (70,0,10);
верхняя граница - (255,255,80)
При исследовании адаптивных методов бинаризации было обнаружено существенное влияние шума, искажающего результат. По этой причине к входному изображению был дополнительно применен фильтр размытия Гаусса с ядром 5 X 5, чтобы удалить шум. Метод может быть полезен для разделения изображения на сегменты по текстуре.
Бинаризация по цвету (цветовой маске HSV) представлена на рис. 7. Подбор параметров цветового фильтра для выделения областей, соответствующих препятствиям на маршруте, осуществляется вручную и представляется нам трудоемким и малоэффективным в условиях, когда цветовые характеристики препятствий непредсказуемы.
4. Сравнительный анализ методов бинаризации изображения. Тестирование различных алгоритмов бинаризации изображений позволило провести их сравнение. В табл. 1 представлены результаты сравнительного анализа методов бинаризации изображений.
Таблица 1
Сравнение методов бинаризации__
№ п/п Метод Преимущества Недостатки Область применения
1 Глобальная бинаризация Простота; низкая вычислительная сложность Плохо работает при неравномерном освещении; может не подходить для изображений с множеством градаций интенсивности; ручная настройка порогов Простой фон, равномерная освещенность
2 Алгоритм Otsu Автоматический выбор порога; высокая точность Ограниченная применимость для сложных изображений Однородные изображения
3 Адаптивная бинаризация Простота реализации; учет локальных особенностей; работает при неравномерном освещении эффективен для изображений с однородной освещенностью Сложнее реализовать в сравнении с глобальной бинаризацией; требует больше ресурсов, чувствителен к шуму Изображения с неравномерным освещением
4 Двойная пороговая бинаризация Точное выделение объектов в диапазоне интенсивностей Ручная настройка порогов Специфические объекты с заданной интенсивностью
4 Двойная пороговая бинаризация Точное выделение объектов в диапазоне интенсивностей Ручная настройка порогов Специфические объекты с заданной интенсивностью
Заключение. Анализ методов бинаризации изображений для задач обнаружения препятствий в системах технического зрения наземных беспилотных транспортных средств выполнен с применением компьютерных технологий. Для написания программы, выполняющей бинаризацию изображений, применен язык программирования Python, редактор кода - Visual Studio Code, библиотека компьютерного зрения Open-CV (Open Source Computer Vision Library).
Выбор метода бинаризации зависит от типа изображения, характера задачи и условий освещенности. Глобальная бинаризация (например, алгоритм Оцу) эффективна для простых изображений, в то время как адаптивная бинаризация предпочтительна для изображений с неравномерным освещением. Для сложных изображений, где стандартные пороговые методы бинаризации могут не справиться, разработаны более сложные методы, основанные на кластеризации и признаках [8], а также технологии нейронных сетей.
Исследование выполнено в рамках субсидии из федерального бюджета на финансовое обеспечение выполнения государственного задания на оказание государственных услуг (выполнение работ) №075-00101-24-02 от 14.05.2024 г.
Список литературы
1. Визильтер Ю.В., Желтов С.Ю., Бондаренко А.В., Ососков М.В., Моржин А.В. Обработка и анализ изображений в задачах машинного зрения: Курс лекций и практических занятий. М.: Физматкнига, 2010. 672 с.
2. Chaki N., Shaikh S.H., Saeed K. A Comprehensive Survey on Image Binarization Techniques. In: Exploring Image Binarization Techniques. Studies in Computational Intelligence, vol 560. Springer, New Delhi. DOI: 10.1007/978-81-322-1907-1_2.
3. Горитов А.Н. Предварительная обработка изображений в системах технического зрения // Доклады ТУСУР, 2018. Том 21. № 4-1. C. 53-58.
4. Snyder Wesley E., Hairong Qi. Machine Vision: Algorithms, Architectures, and Systems / Wesley E. Snyder, Hairong Qi. 1st publ. Cambridge (UK): Cambridge University Press, 2004. 452 p.
5. Otsu N. A Threshold Selection Method from Gray-Level Histograms // in IEEE Transactions on Systems, Man, and Cybernetics, vol.9, №.1. 1979. P. 62-66. DOI: 10.1109/TSMC.1979.4310076.
6. Pattnaik T., Kanungo P. GMM Based Adaptive Thresholding for Uneven Lighting Image Binarization. J Sign Process Syst 93, 2021. P. 1253-1270. DOI: 10.1007/s11265-021-01700-z.
7. Тумаков Д.Н. Алгоритмические методы сегментации изображений [Электронный ресурс]: учебное пособие / Д.Н. Тумаков, З.Д. Каюмов, А.А. Егорчев и др. Электронные текстовые данные (1 файл: 2 Мб). Казань: Издательство Казанского университета, 2023. 40 с.
8. Gonzalez R.C. Digital Image Processing / R.C. Gonzalez, R.E. Woods // Hardcover from Prentice Hall. 2002.
9. Bradley D. Adaptive Thresholding Using the Integral Image / D. Bradley, G. Roth // Journal of Graphics Tools. 2007. №12. P. 13-21.
Кузнецова Светлана Владимировна, канд. техн. наук, доцент, svkyznecova@dksta. ru, Россия, Ковров, Ковровская государственная технологическая академия имени В. А. Дегтярева
BINARIZATION OF IMAGES IN THE PROBLEM OF OBSTACLE DETECTION BY A TECHNICAL VISION SYSTEM
S. V. Kuznetsova
The article is devoted to a review of image binarization methods. Binarization is used as a pre-processing step in machine vision systems to highlight the region of interest in an image. A generalized algorithm for image binarization is presented. The results of the following binarization methods are presented: global binarization, adaptive binarization, double threshold binarization, binarization based on color features. A comparative analysis of the listed methods was carried out.
Key words: image binarization, choosing the threshold, brightness, histogram, image processing results, machine vision system, comparative analysis of methods.
Kuznetsova Svetlana Vladimirovna, candidate of technical sciences, docent, [email protected], Russia, Kovrov, Degtyarev State Technological Academy
УДК 533.69.01
DOI: 10.24412/2071-6168-2024-12-69-70
АНАЛИЗ МЕТОДИКИ РАСЧЕТА АЭРОДИНАМИЧЕСКИХ ХАРАКТЕРИСТИК КРЫЛЬЕВ НА
КРИТИЧЕСКИХ УГЛАХ АТАКИ
М.К. Куркова, Д.С. Михайлов, Д.Ю. Тищенко, Л.А. Лаптева
В статье рассмотрена эмпирико-аналитическая методика расчета коэффициента максимальной подъемной силы и критического угла атаки изолированного крыла дозвукового летательного аппарата. Представлено сравнение рассчитанных по эмпирико-аналитической методике значений коэффициента максимальной подъемной силы и критических углов атаки крыльев с дозвуковыми профилями серии NACA с результатами экспериментальных исследований и численного моделирования.
Ключевые слова: коэффициент максимальной подъемной силы, критический угол атаки, дозвуковое изолированное крыло, дозвуковой профиль крыла, численное моделирование.
Коэффициент максимальной подъемной силы cyamax является важной характеристикой летательных аппаратов. Данному коэффициенту соответствует критический угол атаки акр , при котором происходит срыв потока, что приводит к потере несущей способности крыла и, как следствие, происходит сваливание летательного аппарата.
Эмпирико-аналитическая методика. Приближенные значения cyamax и акр можно определить с помощью методики [1], основанной на использовании зависимостей, полученных по экспериментальным данным [2].
В соответствии с методикой [1], дозвуковые изолированные крылья можно разделить на две группы в зависимости от соотношения удлинения крыла X и эффективного удлинения ^эфф , рассчитываемого по формуле[1]
i 3
Хэфф - !п , - > О)
С1 +1) cos Х0
где C1 - коэффициент, учитывающий влияние сужения крыла и определяемый по графической зависимости [1]; х0 -угол стреловидности по передней кромке крыла, радианы.
69