УДК 004.8
Информационные технологии
Дин Но, магистрант, Московский государственный технический университет
им. Н.Э. Баумана
Афанасьев Геннадий Иванович, кандидат технических наук, доцент, Московский государственный технический университет им. Н.Э. Баумана
СОСТОЯНИЕ И ПЕРСПЕКТИВЫ ПРИМЕНЕНИЯ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА В ВИЗУАЛИЗИРУЮЩЕЙ ДИАГНОСТИКЕ ЗАБОЛЕВАНИЙ ЛЕГКИХ
Аннотация: Существует много типов заболеваний легких, различные проявления визуализации и множественные совпадения которых нелегко диагностировать. Скрининг на наличие крошечных поражений на большом количестве изображений только невооруженным глазом часто приводит к ошибочному диагнозу. Искусственный интеллект использует свои функции распознавания изображений и глубокого обучения для быстрого извлечения ценной информации, которая не может быть распознана человеческим глазом из изображений, что имеет уникальные преимущества в диагностической специфичности и чувствительности заболеваний легких. С созданием различных моделей данных визуализации заболеваний легких его роль в диагностике изображений и скрининге заболеваний легких становится все более заметной, что может значительно повысить точность диагностики. В статье анализируется применение технологии искусственного интеллекта, а также перспективы и проблемы, с которыми сталкиваются при визуализации диагностики заболеваний легких.
Ключевые слова: искусственный интеллект, туберкулез, нейронные сети, визуализация Omics, глубокое обучение, легочные заболевания.
Abstract: There are many types of lung disease, with varying imaging
presentations and multiple overlaps that are not easy to diagnose. Screening for tiny lesions on a large number of images with the naked eye alone often leads to a misdiagnosis. Artificial intelligence uses its image recognition and deep learning features to quickly extract valuable information that cannot be recognized by the human eye from images, which has unique advantages in the diagnostic specificity and sensitivity of lung diseases. With the establishment of various lung disease imaging data models, its role in imaging diagnosis and lung disease screening is becoming more prominent, which can greatly improve the accuracy of diagnosis. The article analyzes the application of artificial intelligence technology, as well as the prospects and challenges faced in imaging the diagnosis of lung diseases.
Key words: artificial intelligence, tuberculosis, neural networks, Omics visualization, deep learning, lung diseases.
Введение
В последние годы технология искусственного интеллекта с глубоким обучением в качестве ее ядра совершила ряд крупных прорывов и широко используется в различных областях, включая производство и сферу услуг. Технология искусственного интеллекта используется в технологиях распознавания лиц и распознавания речи. Технология искусственного интеллекта также постепенно применяется в области медицины, включая медицинскую визуализацию (такую как компьютерная томография), что в основном отражается в использовании методов, представленных глубоким обучением, для сбора, поиска и извлечения соответствующей информации из данных больших изображений. Визуализация Omics является представителем этого типа работы [5]. Одним из развивающихся направлений в медицине является применения искусственного интеллекта в диагностике заболеваний легких, в частности, туберкулеза.
Создание и развитие медицинской визуализации с искусственным интеллектом
Начиная с первого определения «искусственного интеллекта» на
Дартмутской конференции в 1956 году, исследования в области искусственного интеллекта пережили множество взлетов и падений. Нынешний исследовательский бум в области искусственного интеллекта в основном связан с прорывами в разработке и практического применения методов обработки больших данных (Big data). Благодаря решению проблемы обучения глубоких нейронных сетей в сочетании с поддержкой в виде высокопроизводительных вычислительных платформ Big Data (облачные вычисления, графические процессоры и т.д.) исследования и применение искусственного интеллекта обрели реальность [1; 2].
Успешные примеры применения глубокого обучения в практических приложениях в первую очередь способствуют развитию распознавания изображений. В настоящее время методы распознавания изображений, основанные на глубоком обучении, по качеству превзошли людей. Суть медицинской визуализации заключается в основном в анализе и распознавании изображений. Концепция медицинской визуализации с искусственным интеллектом была предложена в 1960-х годах [4], но только после появления нового поколения медицинских изображений в сочетании с искусственным интеллектом, представленным глубоким обучением, она была применена в клинической практике. Различные заболевания имеют разные характеристики изображения. Искусственный интеллект использует технологию распознавания медицинских изображений для определения характеристик изображений заболеваний, поиска информации, которая не может быть распознана человеческим глазом. И далее для извлечения этой информации для создания диагностических и дифференциально-диагностических моделей, что приводит к Omics изображениям.
Imagomics - это применение высокопроизводительных вычислений для быстрого извлечения большого количества количественных характеристик изображения из изображений слоев тела (MRI, CT, PET) и преобразования их в обнаруживаемые цифровые данные высокой точности. Благодаря количественному анализу изображений различные патофизиологические
процессы, содержащиеся в изображениях, и их взаимосвязи могут быть обнаружены. быть проанализированным. В настоящее время визуализация Omics имеет много практических применений в области медицины, включая выявление рака молочной железы, анализ изображений рака кожи [5], выявление диабетической ретропатии, картирование целей лучевой терапии и трехмерную реконструкцию органов. Технология искусственного интеллекта также обладает большим потенциалом и ценностью в визуальной диагностике заболеваний легких, в том числе и туберкулеза.
Статус применения искусственного интеллекта в визуализации диагностики заболеваний легких
В последние годы исследования в области искусственного интеллекта в области заболеваний легких быстро развивались. Более зрелым применением является диагностика заболеваний легких с помощью рентгенографии грудной клетки и компьютерной томографии на ранней стадии рака легких. Существует относительно мало исследований, связанных с компьютерной диагностикой других заболеваний легких. Достоверность полученных результатов нуждается в дальнейшей проверке.
Применение искусственного интеллекта при рентгенографии грудной клетки
В настоящее время искусственный интеллект в основном используется для сегментации рентгеновских снимков грудной клетки и подавления костной ткани. Для сложных рентгеновских снимков грудной клетки исследователям требуется много времени, чтобы найти набор функций, которые могут помочь улучшить производительность автоматизированной диагностики (computer aided diagnosis, CAD). В последние годы, благодаря широкому применению глубокого обучения в различных задачах распознавания изображений таких как классификация изображений и семантическая сегментация, а также быстрому прогрессу технологии глубокого обучения и созданию крупномасштабных баз данных, его диагностический уровень превзошел уровень обычного врачебного персонала.
Метод явного получения интересов и предпочтений представляет собой простой и понятный подход, который может относительно точно отражать потребности пользователей. В то же время получаемая информация является более конкретной, всеобъемлющей и объективной, а результаты часто более надежными. Недостатком этого метода является то, что трудно получить практические результаты, основная причина заключается в том, что немногие пользователи готовы тратить время или не желают выражать свои предпочтения системе. Кроме того, этот метод обладает низкой гибкостью. Когда меняется тема, представляющая интерес для пользователя, необходимо вручную изменять интерес пользователя к системе и возникают многие другие проблемы, что затрудняет гарантию работоспособности этого метода в режиме реального времени.
Ценность искусственного интеллекта заключается в том, что он помогает выявлять поражения легких на ранней стадии, анализировать характеристики визуализации множественных респираторных инфекций, определять и измерять характеристики заболевания с помощью CAD и предлагать стратегии лечения. Например, туберкулез является девятой по значимости причиной смерти в мире и основной причиной смерти от единственного источника инфекции (выше, чем СПИД). Его характеристики визуализации сложны и изменчивы. В некоторых исследованиях туберкулез выявлялся на основе формы, текстуры и местных характеристик поражения. Чтобы имитировать визуальную диагностику текстурных характеристик изображений заболеваний легких рентгенологами, существуют исследования, которые используют текстурные характеристики в качестве дескрипторов для классификации изображений на туберкулезные и нетуберкулезные. Результаты показывают, что использование статистических признаков в гистограмме изображения может обнаруживать легочные ядра. В другом исследовании [6] был предложен индекс туберкулеза, основанный на характеристиках текстуры сегментированных участков легких, и использовалось дерево решений для классификации нормальных и аномальных рентгеновских снимков грудной клетки с точностью 94,9%. Недавно было
доказано, что глубокое обучение играет эффективную роль в классификации туберкулеза. Ряд исследователей предложили первую автоматическую систему обнаружения туберкулеза, основанную на сверточных нейронных сетях (convolutional neural networks, CNN). Они определили стратегию для повышения производительности системы и преодоления трудностей обучения нейронной сети [4]. Другие исследователи использовали метод глубоких сверточных нейронных сетей для дальнейшего повышения точности диагностики (AUC 0,99) [4]. Что касается выявления интерстициального заболевания легких, в ранней литературе [7] использовалась система CAD для выявления интерстициального заболевания легких на рентгенограммах грудной клетки с помощью анализа текстуры. Система CAD делит легкие на несколько ROI (region of interest) и анализирует ROI легких, чтобы определить, являются ли они ненормальными. С применением глубокого обучения при выявлении заболеваний легких, поскольку нет большого набора данных рентгенографии грудной клетки, в настоящее время нет соответствующей литературы по наборам рентгеновских данных для выявления интерстициальных заболеваний легких. В большинстве литературы используются наборы данных компьютерной томографии для выявления интерстициальных заболеваний легких. В дополнение к легочным узлам, туберкулезу и интерстициальным заболеваниям легких, рентген грудной клетки также может контролировать другие заболевания, такие как гипертрофия сердца, пневмония, отек легких, эмфизема и т.д. Но соответствующих исследований мало.
Если обнаружена гипертрофия сердца, часто необходимо проанализировать размер сердца и рассчитать кардиоторакальный коэффициент (CTR, cardiothoracic ratio). Ряд исследователей охарактеризовали 1d-CTR и 2d-CTR и использовали метод опорных векторов для классификации 250 изображений дилатации сердца и 250 нормальных изображений с точностью 76,5%.[10] Тем не менее, некоторые исследователи использовали несколько CNN для обнаружения гипертрофии сердца, точно настроили сеть Flow Engineering на 560 образцах изображений, проверили 100 изображений и
получили максимальную точность 93% [10]. Пневмонию и отек легких можно классифицировать, извлекая характеристики текстуры. Например, ряд исследователей [8] используют алгоритм кластеризации нечетких C-средних (fuzzy C-means, FCM) для обнаружения пневмонии. Результаты Flow Engineering Network показывают, что грудная клетка и легкие черные или темно-серые, а пневмония увеличивает плотность из пораженной области из-за отека и экссудации. Этот метод помогает легко и точно определить степень инфицирования. Другие исследователи использовали алгоритмы машинного обучения для анализа текстуры рентгеновских снимков грудной клетки, использовали функциональные фильтры и метод опорных векторов SVM, чтобы отличить нормальную структуру рентгеновских снимков грудной клетки от отека легких, и получили AUC 0,96, но не проверили точность диагностики других заболеваний легких [6]. Ряд исследователей использовали CNN для выявления и локализации отека легких с лучшими результатами [9].
Значение искусственного интеллекта в CT и диагностике туберкулеза и рака легких
В последние годы заболеваемость раком легких постепенно росла, и он стал одним из самых смертоносных видов рака в мире. Компьютерная томография обладает высокой чувствительностью к диагностике заболеваний легких. Глубокая интеграция обработки изображений, распознавания образов и других технологий с компьютерной томографией способствовала быстрому развитию методов визуализации. Объемное сканирование компьютерной томографии охватывает все легкое без интервалов. Большое количество тонкослойных изображений обеспечивает основу для получения всех характеристик, а также значительно повышается скорость обнаружения мелких узелков.
Основным этапом скрининга узелков в легких является использование алгоритма сегментации изображения для обработки последовательности сканирования легких, создания карты области легких, а затем создания изображения легких на основе карты области легких. Изображение области
легкого и стандартная информация об узелках, генерируемая сегментацией части легкого, используются для создания изображения области узелков, и обучается разделитель узелков легкого на основе CNN, а затем изображение разделяется на узелки легкого для получения предполагаемых узелков легкого. область. После обнаружения предполагаемых легочных узлов используется 3D CNN для классификации легочных узлов, чтобы определить местоположение и достоверность реальных легочных узлов.
Основной процесс системы обнаружения легочных узлов: Обработка исходного изображения компьютерной томографии; Предварительная обработка изображения; Сегментация легочной паренхимы; Сегментация ROI; извлечение признаков ROI; Машинное обучение; классификаторы; Результаты диагностики и т.д.
Среди них наиболее важным является автоматический процесс сегментации ROI узловой паренхимы легкого на основе обработки изображений. Основными шагами являются: сегментация по алгоритму оптимальной пороговой сегментации; сегментация центральной соединенной области; фильтрация фонового шума; маскирование сегментации по шаблону туловища и алгоритму OTSU; предварительная сегментация области легкого; сегментация области легкого контура паренхиматозного фона; сегментация паренхимы легкого; извлечение ROI.
После получения одного фрагмента данных о паренхиме легких можно обнаружить, что большинство областей имеют низкие значения серого, в то время как другие области с высоким содержанием серого также могут содержать узелки, кровеносные сосуды и края органов. Следовательно, при определении, ROI должны быть полностью разделены, насколько это возможно, и локальное конечное пороговое значение существенной области должно быть рассчитано для получения двоичного изображения. После этого извлекаются характеристики для каждого ROI, обучается модель и, наконец, получаются результаты диагностики.
Данные визуализации, полученные с помощью искусственного
интеллекта, имеют большое значение для прогнозирования гистологического типирования, экспрессии генов и прогностической оценки рака легких. При идентификации карциномы легких и инвазивной аденокарциномы легких ряд исследователей доказали [9], что анализ текстуры в сочетании с клиническими и компьютерными характеристиками, по сравнению с использованием только клинических и компьютерных характеристик, значительно улучшил способность различать, а AUC увеличился с 79,0% до 92,9%. Другое исследование 86 случаев твердых и мелющих стеклянных узелков [10] успешно выявило не инфильтрирующую аденокарциному легких и инфильтрирующую аденокарциному легких. Ряд исследователей [7] использовали 440 функций визуализации От^ для предварительной обработки КТ-изображений 350 пациентов с опухолями легких.
Было замечено, что 53 функции визуализации От^ были явно связаны с гистологией опухоли. В сочетании с использованием подтипов гистологии опухоли, основанных на анализе вейвлет-признаков, это можно предсказать (АиС составляет 72%). Другие исследователи разработали программное обеспечение для кластерного анализа, которое использовало неинвазивную визуализацию От^ для размышлений о патологической характеристике аденокарциномы легких. Было обнаружено, что легочные узлы имеют геномную гетерогенность, которая проявляется в виде тонких различий в материале узлов, которые нелегко обнаружить невооруженным глазом. Однако, эта неоднородность может быть использована. Признаки, извлеченные с помощью визуализации От^, могут быть использованы для статистической оценки изображений компьютерной томографии, и соответствующие признаки могут быть извлечены для создания моделей данных для диагностики и прогнозирования аденокарциномы легких.
Перспективы применения
Заболевания легких сложны и разнообразны, но искусственный интеллект обладает преимуществами распознавания изображений. Различные точные модели и обучение на основе искусственного интеллекта значительно улучшат
его способность получать и уплотнять информацию, а также могут значительно повысить точность диагностики заболеваний легких.
Перспективы применения искусственного интеллекта: значительное повышение эффективности работы и диагностического уровня врачей, а также способствовать развитию клинического лечения; извлечение информации из огромных объемов данных, чтобы обнаружить больше закономерностей; убирание барьеров относительно опыта врачей и способствование повышению уровня врачей низкого уровня; возможность прорывных работ в диагностике и выявлении других заболеваний легких; способствование развитию и прогрессу методов медицинской визуализации.
Существующие проблемы и пути их решения
Хотя искусственный интеллект имеет хорошие перспективы и потенциал развития в визуализации диагностики заболеваний легких, он также сталкивается с некоторыми проблемами: параметры сканирования в разных больницах различны, что приводит к различиям в данных изображений; существует регионализация при извлечении собственных значений и создании моделей, а объем данных ограничен, который нуждается в дальнейшем укреплении; различные алгоритмы опробованы разными медицинскими учреждениями для диагностики при отсутствии надежной теоретической поддержки и объяснении результатов; по-прежнему существуют дефекты в распознавании сложных изображений; большая часть исследований посвящена обработке изображений, и меньше исследований по моделированию диагностического мышления врачей, занимающихся визуализацией; для множественных, изменчивых и многоплощадочных воспалительных поражений общие аналитические способности искусственного интеллекта ограничены, и цельно трудно очертить необходимые области. Данные изображений должны быть стандартизированы, правовая система должна быть улучшена, информационная безопасность должна быть гарантирована, обязанности должны быть уточнены, технический уровень должен быть повышен, и он должен быть постепенно интегрирован с системой медицинской документации.
Для многозначных заболеваний каждый признак может быть набросан и проанализирован, а также может быть создана модель данных. После обучения общие характеристики заболевания могут быть обобщены и извлечены; также может быть собран достаточный объем данных изображения заболевания, и огромные объемы данных могут быть обработаны с использованием глубокого обучения для непосредственного извлечения необходимых характеристик.
Таким образом, получение и использование визуализации для медицинских данных сыграло активную роль в продвижении медицины в цифровую эпоху. С углубленным развитием технологии искусственного интеллекта ценность искусственного интеллекта в медицинской визуализации станет более заметной, и его применение в визуализации диагностики заболеваний легких будет становиться все более и более широким.
Библиографический список:
1. Афанасьев Г.И., Абулкасимов М.М., Сурикова О.В. Алгоритмы оптимизации, используемые в нейронных сетях, и градиентный спуск // Аспирант и соискатель. 2019. № 6 (114). С.81- 86.
2. Галичий Д.А., Афанасьев Г.И., Нестеров Ю.Г., Распознавание эмоций человека при помощи современных глубокого обучения методов // E-SCIO. 2021. №5. С.317-331.
3. Xu X., Chen P., Wang J. et al. Evolution of the novel coronavirus from the ongoing Wuhan outbreak and modeling of its spikeprotein for risk of human transmission // Sci China Life Sci. 2020. 63 (3). P.457-460.
4. Shi H., Han X., Jiang N., et al. Radiological findings from 81 patients with COVID-19 pneumonia in Wuhan, China: a descriptive study // Lancet Infect Dis. 2020. 20(4). P.425-434.
5. Ferrari A., Bertolaccini L., Solli P., et al. Digital chest tomosynthesis:the 2017 updated review of an emerging application //Ann Transl Med. 2018, 6(5). P.91-95.
6. Wu W., Parmar C., Grossmann P., et al. Exploratory study to identify radiomics classifiers for lung cancer histology //Front Oncol. 2016. 6. P.71-76.
7. Coroller T. P., Grossmann P., Hou Y., et al. CT-based radiomic signature predicts distant metastasis in lung adenocarcinoma // Radiother Oncol.
2015. 114(3). P.345-350.
8. Liu Y., Kim J., Balagurunathan Y., et al. Radiomic features are associated with EGFR mutation status in lung adenocarcinomas// Clin Lung Cancer.
2016. 17(5): P. 441-448.
9. Islam M. T., Aowal M .A., Minhaz A. T., et al. Abnormality detection and localization in chest x-rays using deep convolutional neural networks. //URL: https://arxiv.org/abs/1705.09850.