Научная статья на тему 'АВТОМАТИЗАЦИЯ ВИЗУАЛЬНОГО КОНТРОЛЯ ТЕХНОЛОГИЧЕСКОГО СОСТОЯНИЯ ТРУБ С ПОМОЩЬЮ МЕТОДОВ РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИЙ'

АВТОМАТИЗАЦИЯ ВИЗУАЛЬНОГО КОНТРОЛЯ ТЕХНОЛОГИЧЕСКОГО СОСТОЯНИЯ ТРУБ С ПОМОЩЬЮ МЕТОДОВ РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИЙ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
2
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
кмпьютерное зрение / YOLOv7 / обработка изображений / анализ труб / автоматизация. / сomputer Vision / YOLOv7 / image processing / pipe analysis / automation.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Мамкин Е. Д., Терехова А. А., Чернышов Д. Р.

В статье описывается разработка системы автоматизации визуального контроля труб с использованием моделей компьютерного зрения на базе алгоритма YOLOv7. Также рассмотрен процесс обработки данных, структура программы, настройка гиперпараметров и этапы обучения. Работа демонстрирует эффективность предложенного подхода для идентификации труб. Цель исследования: разработка системы автоматического анализа изображений труб для определения их количества, интеграции в производственные процессы и повышения точности за счет исключения человеческого фактора. Метод исследования: включает подготовку и аннотацию изображений труб, обучение модели YOLOv7 с настройкой гиперпараметров и аугментацией данных, оптимизацию модели для повышения скорости и точности, тестирование на валидационном наборе и интеграцию системы в производственный процесс. Результаты тестирования модели: в выборке из 31 тестовых изображений корректно были идентифицированы 30 из них, что соответствует 99 % точности.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

AUTOMATION OF VISUAL CONTROL OF THE TECHNOLOGICAL CONDITION OF PIPES USING IMAGE RECOGNITION METHODS

The article describes the development of an automation system for visual inspection of pipes using computer vision models based on the YOLOv7 algorithm. The data processing process, program structure, hyperparameter tuning and training stages are also discussed. The work demonstrates the effectiveness of the proposed approach for identifying and analyzing the technological characteristics of pipes. The purpose of the study: to develop a system for automatic analysis of pipe images to determine their quantity, integration into production processes and increase accuracy by eliminating the human factor. Research method includes preparing and annotating pipe images, training the YOLOv7 model with hyperparameter tuning and data augmentation, optimizing the model to improve speed and accuracy, testing on a validation set, and integrating the system into the production process. Results. When processing 31 test images, 30 pictures were correctly identified, which is 99 %.

Текст научной работы на тему «АВТОМАТИЗАЦИЯ ВИЗУАЛЬНОГО КОНТРОЛЯ ТЕХНОЛОГИЧЕСКОГО СОСТОЯНИЯ ТРУБ С ПОМОЩЬЮ МЕТОДОВ РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИЙ»

- Прогнозирования распространения загрязнения: Оценка динамики изменения зон загрязнения во времени.

Необходимые для исследования данные:

- Геохимические данные: Результаты анализа проб подземных вод на содержание различных загрязняющих веществ.

- Данные дистанционного зондирования: Спутниковые снимки высокого разрешения, данные лидарных съемок, гиперспектральные данные.

- Геофизические данные: Результаты электроразведки, магнитометрии, сейсмических исследований.

- Геологические данные: Литологические разрезы, гидрогеологические разрезы, данные о тектонических нарушениях.

Выбор архитектуры нейронной сети: Выбор подходящей архитектуры нейронной сети (например, сверточные нейронные сети, рекуррентные нейронные сети, или их комбинации).

Используются метрики точности (точность, полнота, F1-мера) для оценки качества модели. В результате визуализации результатов создаются карты загрязнения и сравнивают их с реальными данными.

Применение нейронных сетей для идентификации и картирования зон загрязнения подземных вод открывает новые перспективы в области гидрогеологии и охраны окружающей среды. Данный подход позволяет более точно и детально оценивать состояние подземных вод и принимать более обоснованные решения в области управления водными ресурсами. Список использованной литературы:

1. Глухов В.В., Орлов А.И. Нейронные сети в гидрогеологии. - М.: Изд-во МГУ, 2005.

2. Салугин А.Н., Балкушкин Р.Н. О применении искусственных нейронных сетей для моделирования водопотребления // Научно-практический журнал. 2021. № 1

3. Глухов В.В., Орлов А.И. Использование искусственных нейронных сетей для прогнозирования уровня грунтовых вод // Вестник Московского университета. Серия 5: География. 1998. № 3.

© Магтымов Р., Нурлиев Б., Ораков Н., Геоков Б., 2024

УДК 004.8

Мамкин Е.Д.

студент 4 курса, гр. ИСТНб-21-2 Терехова А.А. студент 4 курса, гр. ИСТНб-21-2 Чернышов Д.Р.

студент 4 курса, гр. ИСТНб-21-2 Тюменский индустриальный университет

г. Тюмень, РФ

АВТОМАТИЗАЦИЯ ВИЗУАЛЬНОГО КОНТРОЛЯ ТЕХНОЛОГИЧЕСКОГО СОСТОЯНИЯ ТРУБ С ПОМОЩЬЮ

МЕТОДОВ РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИЙ

Аннотация

В статье описывается разработка системы автоматизации визуального контроля труб с

использованием моделей компьютерного зрения на базе алгоритма YOLOv7. Также рассмотрен процесс обработки данных, структура программы, настройка гиперпараметров и этапы обучения. Работа демонстрирует эффективность предложенного подхода для идентификации труб.

Цель исследования: разработка системы автоматического анализа изображений труб для определения их количества, интеграции в производственные процессы и повышения точности за счет исключения человеческого фактора.

Метод исследования: включает подготовку и аннотацию изображений труб, обучение модели YOLOv7 с настройкой гиперпараметров и аугментацией данных, оптимизацию модели для повышения скорости и точности, тестирование на валидационном наборе и интеграцию системы в производственный процесс.

Результаты тестирования модели: в выборке из 31 тестовых изображений корректно были идентифицированы 30 из них, что соответствует 99 % точности.

Ключевые слова:

кмпьютерное зрение, YOLOv7, обработка изображений, анализ труб, автоматизация.

AUTOMATION OF VISUAL CONTROL OF THE TECHNOLOGICAL CONDITION OF PIPES USING IMAGE RECOGNITION METHODS

Abstract

The article describes the development of an automation system for visual inspection of pipes using computer vision models based on the YOLOv7 algorithm. The data processing process, program structure, hyperparameter tuning and training stages are also discussed. The work demonstrates the effectiveness of the proposed approach for identifying and analyzing the technological characteristics of pipes.

The purpose of the study: to develop a system for automatic analysis of pipe images to determine their quantity, integration into production processes and increase accuracy by eliminating the human factor.

Research method includes preparing and annotating pipe images, training the YOLOv7 model with hyperparameter tuning and data augmentation, optimizing the model to improve speed and accuracy, testing on a validation set, and integrating the system into the production process.

Results. When processing 31 test images, 30 pictures were correctly identified, which is 99 %.

Keywords:

ramputer Vision, YOLOv7, image processing, pipe analysis, automation.

Современная промышленность активно внедряет автоматизацию и компьютерное зрение для повышения эффективности реализации производственных процессов. Технологии компьютерного зрения играют важную роль в создании интеллектуальных систем контроля и управления, способных анализировать и обрабатывать большие объемы разнородных данных.

Технологии компьютерного зрения позволяют создавать системы, способные обрабатывать графическую информацию бизнес-процессов для решения практических задач [1, 2]. Особую значимость приобретает применение компьютерного зрения для контроля качества промышленных материалов, включая трубы, используемые в различных отраслях РФ. Визуальный контроль исследуемых объектов позволяет определять первичные характеристики материала, проверять геометрические параметры структурных кластеров и выявлять в них возможные дефекты.

Традиционные методы контроля, основанные на ручных измерениях и визуальной инспекции, зачастую не обеспечивают необходимой точности и скорости сравнительного анализа материалов, а

также подвержены ошибкам, связанным с человеческим фактором. Именно поэтому внедрение компьютерного зрения является важным шагом в улучшении процессов контроля качества в соответствии с Индустрией 4.0.

Актуальность работы обусловлена необходимостью разработки прикладных решений, способных работать с большими объемами данных в реальных условиях, включая изменяющееся освещение, углы съемки и наличие пространственного шума на изображениях.

В данной работе рассматривается применение модели YOLOv7 для реализации компьютерного зрении при автоматизации контроля структурных параметров труб.

Технология YOLOv7 была выбрана из-за своей высокой скорости работы и точности в распознавания графических объектов разной детализации. YOLO (You Only Look Once) представляет собой архитектуру обучения, специально разработанную для одновременного определения местоположения объектов и их классификации [3]. На вход модели подается изображение, а на выходе формируется массив данных с координатами графических объектов, их размерами и классификацией.

Основу YOLOv7 формирует сверхточная нейронная сеть, которая выполняет обнаружение графических объектов в реальном времени. Основные этапы работы модели включают [4-6]:

1. Выделение качественных и количественных признаков: слои свёрток анализируют разномасштабное изображение, выделяя ключевые особенности структуры объектов;

2. Прогнозирование: модель формирует координаты секторов объектов в виде прямоугольников, а также классы объектов и метрики уверенности;

3. Постобработка: удаляются дублирующие прогнозы с помощью метода подавления не максимумов (кепструмов - локальные максимумы/минимумы в общей закономерности), что повышает точность результатов.

Преимущества использования модели YOLOv7 включают [7, 8]:

- Возможность работы в режиме реального времени благодаря оптимизированной архитектуре;

- Высокая точность обнаружения графических объектов различных размеров и форм;

- Универсальность модели, позволяющая обучать её на пользовательских наборах данных.

Разработанная информационная система на базе YOLOv7 предполагает использование интуитивно

понятного интерфейса, в котором пользователь сможет загрузить изображение труб, получить визуализацию результатов нейросетевого анализа их структуры-текстуры и сохранить данные для последующей обработки.

Работа информационной системы по визуальному контролю труб включает несколько ключевых этапов.

1. Сбор изображений. Работа начинается с загрузки фотографий труб через пользовательский интерфейс. Изображения могут быть сняты при разном освещении и под разными углами, что позволяет учитывать возможные искажения. После загрузки изображения передаются на сервер для первичной обработки.

2. Предобработка данных. На этапе предобработки улучшается качество входных изображений, что обеспечивает точность дальнейшего нейросетевого анализа. Обработанные изображения масштабируются, нормализуются и приводятся к единому формату. Эти шаги необходимы для стабильной работы модели глубокого обучения.

3. Обнаружение объектов. После предобработки изображения анализируются моделью YOLOv7, которая отвечает за обнаружение всех кластеров графических объектов. На этом этапе:

- Модель делит изображение на сетку ячеек, в каждой из которых оценивает наличие различных структурно-текстурных меток (в том числе дефектов);

- Для каждой обнаруженной области формируются:

о Координаты прямоугольников, обрамляющих трубы;

о Характеристики объектов, такие как диаметр и толщина стенки трубы;

о Уровень уверенности в прогнозах (Confidence Score);

- Применяется метод подавления не максимумов (Non-Maximum Suppression) для устранения дублирующих областей графических объектов и получения наиболее точных результатов.

Для реализации информационной системы был использован язык программирования Python. Основой разработки стала модель глубокого обучения YOLOv7. В качестве инструмента для обучения использовалась библиотека PyTorch [9], обеспечивающая гибкость при настройке архитектуры модели и выполнении операций обучения. Для мониторинга процесса обучения и дальнейшей визуализации результатов применялись инструменты TensorBoard [10]. Для удобства отслеживания выполнения операций распознавания графических объектов использовалась библиотека TQDM [11].

Нейросетевая модель обучалась на пользовательском наборе данных, состоящем из 699 изображений. Для обеспечения качественного обучения генеральная совокупность данных была разделена на три части: обучающая выборка (624 изображения), валидационная выборка (44 изображения) и тестовая выборка (31 изображение), рис. 1.

Рисунок 1 - Изображения, используемые для обучения модели

Функция потерь учитывала три основные компонента: точность координат графических объектов, корректность их классификации и уровень уверенности нейросетевой модели в текущих прогнозах.

Для повышения устойчивости нейросетевой модели использовалась аугментация данных: изображения подвергались изменениям, таким как повороты, изменения масштаба и яркости. Эти методы позволили создать модель, устойчивую к изменяющимся условиям съемки.

На рис. 2-3 представлены изображения труб, каждая из которых автоматически выделяется «синими прямоугольниками» (Bounding Boxes), с классификацией отдельных объектов как «Класс '0'».

Для оценки точности модели на этапе тестирования была построена матрица ошибок (Confusion Matrix), рис. 4. Она иллюстрирует распределение правильных и ошибочных предсказаний для двух классов: 'Pipe' (трубы) и 'Background' (фон).

IMG—202002|13j|\|lia^fcg.rf.55866f4

Ш-: I

р1реж

pip^.pepr-¿op . ;Irieoipe P'fpifpirPJ .<^'rf?mnePePePe

r inp:^' e r0;pi К--",г>е>е г -_.—-i—ое-чо

I r e " •" "Kr

fr ■

r #

Рисунок 2 - Изображение, полученное обученной модели

Рисунок 3 - Изображение, полученное обученной модели

Рисунок 4 - Матрица ошибок

Анализируя рис. 4 видно, что значение 0,87 в «верхнем левом квадранте» указывает на долю случаев, когда модель правильно идентифицировала трубы.

Значение 1,00 в верхнем правом квадранте показывает отсутствие ложных срабатываний для «фона» как трубы.

Значение 0,13 в нижнем левом квадранте представляет собой долю случаев, когда трубы были ошибочно классифицированы как «фон» (ложные отрицания, FN - false negative).

Данная матрица демонстрирует, что модель достигает высокой точности при классификации, однако минимальные ошибки остаются в случае недообнаружения объектов на изображении.

После были получены метрики обучения и валидации (проверки) модели YOLOv7, применённой для задачи автоматизации визуального контроля технологического состояния труб с помощью методов распознавания изображений (рис. 5).

Рисунок 5 - Метрики обучения и метрики валидации

На графиках видно, что модель YOLOv7 успешно обучается и демонстрирует стабильные результаты на этапе валидации. Это подтверждает её пригодность для автоматизации визуального контроля труб.

Метрики (такие как высокая mAP и снижение ошибок локализации) показывают, что модель может точно эффективно обнаруживать и классифицировать графические объекты в практических условиях. Основные выводы

В результате выполненного исследования разработана первичная информационная система для автоматизации визуального контроля труб на основе модели YOLOv7 с точностью нейросетевого анализа (95 %) и устойчивостью к различным условиям съемки. Данный методический подход позволил повысить скорость и качество обработки изображений различной детализации, минимизировав влияние человеческого фактора.

Информационная система способна эффективно выполнять задачи анализа геометрических характеристик труб, выявления их структурно-текстурных дефектов и формирования соответствующих отчетов, что делает её перспективной для применения в нефтегазовой, строительной и других отраслях.

Ключевые преимущества решения включают возможность работы в режиме реального времени, универсальность модели и экономическую эффективность, достигаемую за счет снижения временных и трудозатрат.

В перспективе информационная система может быть дополнена новыми функциональными модулями, включая вывод результата распознавания в виде текстового документа, усовершенствованную детекцию различных типов дефектов и интеграцию с автоматизированными линиями контроля качества бизнес-продукции. Это сделает её ещё более востребованной и адаптивной к решению прикладных задач в современных производственных процессов.

Список использованной литературы: 1. Катанов Ю.Е., Аристов А.И., Ягафаров А.К. Цифровой керн: исследование текстурных неоднородностей в горной породе // Известия Томского политехнического университета. Инжиниринг георесурсов. 2023. Т. 334. № 12. С. 196-208.

2. Катанов Ю.Е., Ягафаров А.К., Аристов А.И., Шлеин Г.А. Гравитационное течение газожидкостных смесей в пористых средах // Естественные и технические науки. 2023. № 3 (178). С. 155-167.

3. Yuan W. Accuracy comparison of YOLOv7 and YOLOv4 regarding image annotation quality for apple flower bud classification // AgriEngineering. 2023. V. 5. No 1. P. 413-424.

4. Gallo I. et al. Deep object detection of crop weeds: Performance of YOLOv7 on a real case dataset from UAV images // Remote Sensing. 2023. V. 15. No. 2. P. 539.

5. Wang R. et al. BPN-YOLO: A Novel Method for Wood Defect Detection Based on YOLOv7 // Forests. 2024. V. 15. No. 7. P. 1096.

6. Yang J. et al. A detection method for dead caged hens based on improved YOLOv7 // Computers and Electronics in Agriculture. 2024. V. 226. P. 109388.

7. Liu S. et al. CEAM-YOLOv7: Improved YOLOv7 based on channel expansion and attention mechanism for driver distraction behavior detection // IEEE Access. 2022. V. 10. P. 129116-129124.

8. Катанов Ю.Е. Анализ и синтез информационных систем (обработка разнородных данных, геология): учебное пособие. Тюмень, 2020. - 159 с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

9. Tutorials // PyTorch URL: https://pytorch.org/tutorials/ (дата обращения: 25.11.2024).

10. TensorBoard // TensorFlow URL: https://www.tensorflow.org/tensorboard?hl=ru (дата обращения: 25.11.2024).

11. Обновляемый progressbar для программ на Python // Документация по языку Python3 URL: https://docs-python.ru/packages/tqdm-progressbar/ (дата обращения: 25.11.2024).

© Мамкин Е.Д., Терехова А.А., Чернышов Д.Р., 2024

УДК 67.05

Мишина Ю.В.

Аспирант

Саратовский государственный технический университет имени Гагарина Ю.А., г. Саратов, РФ

К ВОПРОСУ ДИНАМИКИ И КАЧЕСТВА ПРОЦЕССА РЕЗАНИЯ В УСЛОВИЯХ СОВРЕМЕННОГО ИССЛЕДОВАНИЯ МЕХАНИЧЕСКОЙ ОБРАБОТКИ И СОЗДАНИЯ ВЫСОКОТЕХНОЛОГИЧНОГО ПРОИЗВОДСТВА

Аннотация

Статья посвящена выявлению основных условий повышения качества деталей при механической обработке. Рассматриваются вопросы присутствия источников возмущения в технологическом оборудовании. Анализируются концепции оптимальной настройки систем резания при современном исследовании состава и свойств колебательного процесса, сопровождающего процесс резания по критерию минимизации закономерной составляющей.

Ключевые слова:

механическая обработка, резание, материал, производство, колебательный процесс.

i Надоели баннеры? Вы всегда можете отключить рекламу.