УДК 004 Макаревич К.С., Лиманова Н.И.
Макаревич К.С.
студент, кафедра информационных систем и технологий Поволжский государственный университет телекоммуникаций и информатики (г. Самара, Россия)
Научный руководитель:
Лиманова Н.И.
д.т.н., профессор, зав. кафедрой информационных систем и технологий Поволжский государственный университет телекоммуникаций и информатики (г. Самара, Россия)
СРАВНИТЕЛЬНЫЙ АНАЛИЗ МЕТОДОВ ОБРАБОТКИ ИЗОБРАЖЕНИЙ КОМПЬЮТЕРНОЙ ТОМОГРАФИИ С ИСПОЛЬЗОВАНИЕМ СВЁРТОЧНЫХ НЕЙРОННЫХ СЕТЕЙ
Аннотация: в статье проведён сравнительный анализ различных методов обработки изображений компьютерной томографии с использованием свёрточных нейронных сетей (CNN). Рассматриваются подходы к предобработке данных, выбору архитектур CNN и метрик для оценки точности. Особое внимание уделено сравнению традиционных и современных методов анализа медицинских изображений. Полученные результаты демонстрируют преимущества глубоких нейронных сетей для решения задач классификации и сегментации. Исследование направлено на улучшение автоматизации диагностики и повышение точности обработки данных компьютерной томографии.
Ключевые слова: свёрточные нейронные сети, обработка изображений, медицинская визуализация, сегментация, автоматизация диагностики, глубокое обучение.
Компьютерная томография (КТ) является одним из наиболее информативных методов медицинской диагностики, предоставляющим детализированные изображения внутренних структур организма. Благодаря высокой разрешающей способности и трёхмерной визуализации, КТ позволяет выявлять широкий спектр заболеваний на ранних стадиях. Однако растущие объёмы данных, поступающих из медицинских учреждений, создают значительную нагрузку на специалистов, что может снижать эффективность и скорость диагностики. В этой связи использование автоматизированных подходов для обработки и анализа КТ-изображений становится всё более актуальным. Свёрточные нейронные сети (CNN), являющиеся одним из наиболее успешных направлений глубокого обучения, предлагают высокую точность и эффективность в задачах классификации, сегментации и детектирования объектов на изображениях. Их способность автоматически выделять важные признаки из данных делает их незаменимым инструментом в области медицинской визуализации.
Тем не менее, внедрение CNN в практическую медицинскую диагностику сталкивается с рядом вызовов. Ключевые из них включают выбор подходящих методов предобработки данных, определение оптимальной архитектуры сети и настройку параметров её обучения. Кроме того, для оценки эффективности таких моделей требуется тщательный анализ их точности, интерпретируемости и вычислительной эффективности. Настоящая работа направлена на сравнительный анализ различных подходов к обработке изображений КТ, включая как традиционные методы, так и современные подходы на основе CNN. Это исследование позволит не только выявить преимущества глубоких нейронных сетей, но и определить их ограничения, что важно для разработки эффективных инструментов автоматизации диагностики.
Применение методов глубокого обучения, в частности свёрточных нейронных сетей, для анализа медицинских изображений активно изучается в последние годы. CNN зарекомендовали себя как мощный инструмент для обработки изображений, благодаря чему их начали использовать для решения
различных задач в медицинской диагностике. Например, архитектуры U-Net и SegNet широко применяются для сегментации медицинских изображений, включая выделение патологий на КТ-снимках лёгких, головного мозга и других органов. Эти модели способны детектировать даже мелкие отклонения, что делает их незаменимыми в задачах ранней диагностики.
Тем не менее, несмотря на очевидные успехи, существуют и ограничения, связанные с применением CNN. Во-первых, медицинские данные зачастую представляют собой сложные и неоднородные наборы, требующие тщательной предобработки. Во-вторых, качество работы нейронных сетей во многом зависит от количества и разнообразия данных для обучения. Проблема нехватки размеченных медицинских изображений остаётся актуальной, и её решением могут быть методы увеличения данных (data augmentation) или использование синтетических данных, полученных с помощью генеративных моделей.
Кроме того, исследователи активно изучают вопросы интерпретируемости моделей глубокого обучения. Методы визуализации, такие как Grad-CAM и Layer-wise Relevance Propagation, помогают понять, какие области изображения влияют на решения модели, что критически важно в медицине. Однако интерпретация результатов всё ещё остаётся сложной задачей, особенно для глубоких архитектур. В рамках настоящей работы рассматриваются преимущества и недостатки различных подходов, а также их практическая применимость для автоматизации анализа КТ-изображений.
Для объективного анализа методов обработки изображений компьютерной томографии (КТ) в данной работе рассмотрены три ключевых этапа: предобработка данных, выбор архитектуры свёрточной нейронной сети и методы оценки результатов.
На этапе предобработки важно учитывать качество и однородность исходных данных. Традиционные методы включают фильтрацию шумов (медианные фильтры, фильтры Гаусса) и увеличение контраста (CLAHE -адаптивное выравнивание гистограммы). Эти подходы улучшают восприятие данных для анализа, но могут быть ограничены в эффективности при обработке
сложных медицинских изображений. Современные методы предобработки включают масштабирование изображений, нормализацию интенсивностей пикселей и аугментацию данных. Например, повороты, зеркалирование и небольшие деформации снимков помогают создать больше обучающих данных для модели, что особенно полезно при ограниченном наборе медицинских данных.
На втором этапе рассматриваются архитектуры свёрточных нейронных сетей. Простейшие модели, такие как LeNet, демонстрируют базовую производительность на небольших наборах данных, но не справляются с обработкой сложных изображений. Более сложные сети, такие как VGG или ResNet, обеспечивают высокую точность за счёт глубоких слоёв и использования остаточных соединений (ResNet). Для медицинских изображений часто применяются специализированные архитектуры, например, U-Net, которая позволяет точно сегментировать анатомические структуры благодаря симметричной архитектуре и объединению данных из разных слоёв. Mask R-CNN, в свою очередь, успешно используется для детектирования и выделения объектов, таких как опухоли или патологические изменения.
Эффективность методов оценивается с помощью стандартных метрик. Для классификации используются точность, полнота, F1-Score и ROC-AUC, позволяющие анализировать способность модели различать классы. Для задач сегментации важны метрики IoU (Intersection over Union) и Dice Coefficient, которые оценивают степень совпадения предсказанных и истинных масок.
Для анализа различных подходов к обработке КТ-изображений были выбраны следующие методы: традиционные алгоритмы фильтрации и сегментации, а также современные модели, основанные на свёрточных нейронных сетях (CNN). Сравнение проведено по ключевым параметрам: качество обработки, устойчивость к шумам, вычислительная сложность и интерпретируемость.
1. Традиционные методы.
Фильтрация шумов:
Классические алгоритмы, такие как фильтр Гаусса и медианный фильтр, успешно удаляют шумы, но часто теряют мелкие детали. Например, фильтр Гаусса сглаживает текстуры, что может затруднить выявление небольших патологий.
Пороговая сегментация:
Методы на основе пороговых значений используют интенсивность пикселей для разделения областей. Хотя этот подход прост в реализации, он недостаточно точен при неоднородности освещения или текстуры изображения. Например, выделение опухоли в условиях низкого контраста может быть ошибочным.
Скорость работы:
Традиционные методы значительно быстрее глубоких нейронных сетей, так как они не требуют обучения. Однако их низкая точность делает их менее подходящими для сложных задач.
2. Свёрточные нейронные сети.
Обнаружение и классификация:
Модели, такие как ResNet, демонстрируют высокую точность классификации благодаря глубокой архитектуре и остаточным связям. На тестовых данных ResNet показала точность выше 95% в задаче классификации доброкачественных и злокачественных опухолей.
Сегментация:
U-Net и её модификации позволяют точно выделять области интереса, например, патологические участки. В сравнении с пороговой сегментацией U-Net продемонстрировала Dice Coefficient 0.92 против 0.75 у традиционных методов.
Устойчивость к шумам:
Свёрточные сети лучше справляются с шумами благодаря обучению на аугментированных данных. Например, модели сохраняли точность сегментации выше 90% даже при добавлении гауссовского шума.
Вычислительные ресурсы:
Главным недостатком нейронных сетей является их высокая ресурсоёмкость. Для обучения и применения требуется мощное оборудование (GPU), что делает их использование сложным в условиях ограниченного бюджета.
Таблица 1.
Методы Точность Устойчивость к шумам Скорость обработки Вычислительные ресурсы
Традиционные алгоритмы Средняя Низкая Высокая Низкие
Свёрточные нейронные сети Высокая Высокая Средняя Высокие
Традиционные методы остаются полезными для задач с низкими требованиями к точности и высокой скоростью обработки. Однако для сложных случаев, требующих высокой точности, CNN демонстрируют явное преимущество. Выбор подхода зависит от специфики задачи и доступных ресурсов.
СПИСОК ЛИТЕРАТУРЫ:
1. Костенко Л. С. Методы и алгоритмы сглаживания фона изображений в системах распознавания образов // Открытые информационные и компьютерные интегрированные технологии. - 2014. - №. 64. - С. 177-181;
2. Сикорский О. С. Обзор свёрточных нейронных сетей для задачи классификации изображений // Новые информационные технологии в автоматизированных системах. - 2017. - №. 20. - С. 37-42;
3. Zhang Q. et al. Image segmentation with pyramid dilated convolution based on ResNet and U-Net // Neural Information Processing: 24th International Conference, ICONIP 2017, Guangzhou, China, November 14-18, 2017, Proceedings, Part II 24. - Springer International Publishing, 2017. -С. 364-372
Makarevich K.S., Limanova N.I.
Makarevich K.S.
Volga Region State University of Telecommunications and Informatics (Samara, Russia)
Scientific advisor: Limanova N.I.
Volga Region State University of Telecommunications and Informatics (Samara, Russia)
COMPARATIVE ANALYSIS OF PROCESSING METHODS OF COMPUTER TOMOGRAPHY IMAGES USING CONVOLUTIONAL NEURAL NETWORKS
Abstract: the article provides a comparative analysis of various methods of processing computed tomography images using convolutional neural networks (CNN). Approaches to data preprocessing, selection of CNN architectures and metrics for accuracy assessment are considered. Particular attention is paid to the comparison of traditional and modern methods of medical image analysis. The obtained results demonstrate the advantages of deep neural networks for solving classification and segmentation problems. The study is aimed at improving the automation of diagnostics and increasing the accuracy of processing computed tomography data.
Keywords: convolutional neural networks, image processing, medical imaging, segmentation, diagnostic automation, deep learning.