Научная статья на тему 'ПОДХОДЫ К ИСПОЛЬЗОВАНИЮ МАШИННОГО ОБУЧЕНИЯ ДЛЯ РАЗРАБОТКИ КЛИНИЧЕСКИХ РЕКОМЕНДАЦИЙ'

ПОДХОДЫ К ИСПОЛЬЗОВАНИЮ МАШИННОГО ОБУЧЕНИЯ ДЛЯ РАЗРАБОТКИ КЛИНИЧЕСКИХ РЕКОМЕНДАЦИЙ Текст научной статьи по специальности «Медицинские науки и общественное здравоохранение»

CC BY
22
1
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
машинное обучение / искусственный интеллект / клинические рекомендации / акушерство и гинекология. / machine learning / artificial intelligence / clinical guidelines / obstetrics and gynecology.

Аннотация научной статьи по медицинским наукам и общественному здравоохранению, автор научной работы — Бурыкин И. М., Бадертдинов И. И., Юпатов Е. Ю.

В здравоохранении в последние годы регистрируется большое число проектов использования искусственного интеллекта для решения медицинских проблем, и, несомненно, данные технологии начинают оказывать существенное влияние на систему здравоохранения. Использование машинного обучения (МО) в решении медицинских задач – одно из направлений внедрения искусственного интеллекта в медицину. В рамках существующего правового поля в целях содействия врачу в принятии клинически значимых решений используются клинические рекомендации – набор положений и суждений, сформированных на осно ве доказательной медицины. Цель: разработка подходов к использованию инструментов искусственного интеллекта для построения прогностических моделей и формирования критериев принятия клинических решений у беременных женщин с начальными формами хронических заболеваний вен. Исследование было построено на данных, полученных в результате обследования 221 беременной женщины с признаками стадии С1 хронической венозной недостаточности по классификации CEAP и 98 беременных без визуальных и клинических признаков хронических заболеваний вен. Модель, полученная в настоящем исследовании, учитывает разнородные факторы, касающиеся материнского организма – а именно состояние венозной системы, отраженного в показателе индекса эластичности, связанного с ним состояния капиллярной крови у пациенток с повышенной массой тела и имевших артериальную гипертензию. В целом объединение показавших свою значимость факторов демонстрирует роль эндотелиопатии в развитии преждевременных родов. На основе полученной информации можно рекомендовать использование машинного обучения для совершенствования качества оказания медицинской помощи в акушерстве и гинекологии. Разработанная методология позволяет использовать результаты машинного обучения для совершенствования действующих клинических рекомендаций. Перспективны дальнейшие исследования в данной области, направленные на использование искусственного интеллекта для повышения качества и безопасности медицинской помощи.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по медицинским наукам и общественному здравоохранению , автор научной работы — Бурыкин И. М., Бадертдинов И. И., Юпатов Е. Ю.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

USE OF MACHINE LEARNING TO DEVELOP CLINICAL GUIDELINES

Recently, a large number of projects using artificial intelligence to solve medical problems have been registered. Undoubtedly, these technologies are significantly contributing to modern-day healthcare. The use of machine learning (ML) in solving medical problems is one of the directions for introducing artificial intelligence into medicine. Clinical guidelines, a set of evidencebased recommendations, are used to assist the doctor in making clinically significant decisions. The main goal is to develop approaches to the use of artificial intelligence for prognostic modelling and developing criteria for making clinical decisions about the care of pregnant women with initial forms of chronic venous disorders (CVeD). 221 pregnant women with the signs of stage C1 CVeD and 98 pregnant women without any visual or clinical signs of the disease. The model takes into account different factors, such as: functional state of the venous system, elasticity index, and capillary blood flow in patients with increased body weight and arterial hypertension. In general, a number of significant factors has demonstrated the role of endothelial dysfunction in the development of preterm birth. Based on the data obtained, the use of machine learning may be recommended to improve the quality of medical care in obstetrics and gynecology. The developed methodology makes it possible to use the results of machine learning to improve current clinical guidelines. Further research in this area is needed aimed at using artificial intelligence to improve the quality and safety of medical care.Keywords: children, medical examination, preventive medical examination, primary disease incidence, newly diagnosed pathology.

Текст научной работы на тему «ПОДХОДЫ К ИСПОЛЬЗОВАНИЮ МАШИННОГО ОБУЧЕНИЯ ДЛЯ РАЗРАБОТКИ КЛИНИЧЕСКИХ РЕКОМЕНДАЦИЙ»

общественное здоровье и организация здравоохранения, социология и история медицины

УДК 614.2:616-082 DOI 10.24412/2220-7880-2024-4-43-48

подходы к использованию машинного обучения для разработки клинических рекомендаций

13Бурыкин И.М., 2Бадертдинов И. И., 3,4Юпатов Е. Ю.

1Центр экспертизы и контроля качества медицинской помощи Минздрава России, Москва, Россия

(109028, Хохловский переулок, вл. 10, стр. 5), e-mail: [email protected]

2ООО «Сбердевайсы», Москва, Россия (121165, Москва, Кутузовский проспект, д. 32)

3Казанская государственная медицинская академия - Филиал ФГБОУ ДПО РМАНПО Минздрава России, Казань, Россия (420012, Казань, ул. Бутлерова, 36)

4Институт фундаментальной медицины и биологии Казанского (Приволжского) федерального университета, Казань, Россия (420012, г. Казань, ул. К. Маркса, д. 74)

В здравоохранении в последние годы регистрируется большое число проектов использования искусственного интеллекта для решения медицинских проблем, и, несомненно, данные технологии начинают оказывать существенное влияние на систему здравоохранения. Использование машинного обучения (МО) в решении медицинских задач - одно из направлений внедрения искусственного интеллекта в медицину. В рамках существующего правового поля в целях содействия врачу в принятии клинически значимых решений используются клинические рекомендации - набор положений и суждений, сформированных на основе доказательной медицины. Цель: разработка подходов к использованию инструментов искусственного интеллекта для построения прогностических моделей и формирования критериев принятия клинических решений у беременных женщин с начальными формами хронических заболеваний вен. Исследование было построено на данных, полученных в результате обследования 221 беременной женщины с признаками стадии С1 хронической венозной недостаточности по классификации CEAP и 98 беременных без визуальных и клинических признаков хронических заболеваний вен.

Модель, полученная в настоящем исследовании, учитывает разнородные факторы, касающиеся материнского организма - а именно состояние венозной системы, отраженного в показателе индекса эластичности, связанного с ним состояния капиллярной крови у пациенток с повышенной массой тела и имевших артериальную гипертензию. В целом объединение показавших свою значимость факторов демонстрирует роль эндотелиопатии в развитии преждевременных родов. На основе полученной информации можно рекомендовать использование машинного обучения для совершенствования качества оказания медицинской помощи в акушерстве и гинекологии. Разработанная методология позволяет использовать результаты машинного обучения для совершенствования действующих клинических рекомендаций. Перспективны дальнейшие исследования в данной области, направленные на использование искусственного интеллекта для повышения качества и безопасности медицинской помощи.

Ключевые слова: машинное обучение, искусственный интеллект, клинические рекомендации, акушерство и гинекология.

use of machine learning to develop clinical guidelines

13Burykin I.M., 2Badertdinov1.1., 3 4Yupatov E. Yu.

1Center for Expertise and Quality Control of Medical Care of the Ministry of Health of Russia, Moscow, Russia (109028, Khokhlovsky Lane, ter. 10, bldg. 5), е-mail: [email protected] 2OOO Sberdevices, Moscow, Russia (121165, Moscow, Kutuzovsky Ave., 32)

3Kazan State Medical Academy - Branch of the Institution of Further Professional Education, Kazan, Russia (420012, Kazan, Butlerov St., 36)

4Institute of Fundamental Medicine and Biology Kazan (Volga Region) Federal University, Kazan, Russia (420012, Kazan, K. Marx St., 74)

Recently, a large number of projects using artificial intelligence to solve medical problems have been registered. Undoubtedly, these technologies are significantly contributing to modern-day healthcare. The use of machine learning (ML) in solving medical problems is one of the directions for introducing artificial intelligence into medicine. Clinical guidelines, a set of evidence-based recommendations, are used to assist the doctor in making clinically significant decisions. The main goal is to develop approaches to the use of artificial intelligence for prognostic modelling and developing criteria for making clinical decisions about the care of pregnant women with initial forms of chronic venous disorders (CVeD). 221 pregnant women with the signs of stage C1 CVeD and 98 pregnant women without any visual or clinical signs of the disease. The model takes into account different factors, such as: functional state of the venous system, elasticity index, and capillary blood flow in patients with increased body weight and

arterial hypertension. In general, a number of significant factors has demonstrated the role of endothelial dysfunction in the development of preterm birth. Based on the data obtained, the use of machine learning may be recommended to improve the quality of medical care in obstetrics and gynecology. The developed methodology makes it possible to use the results of machine learning to improve current clinical guidelines. Further research in this area is needed aimed at using artificial intelligence to improve the quality and safety of medical care.Keywords: children, medical examination, preventive medical examination, primary disease incidence, newly diagnosed pathology.

Keywords: machine learning, artificial intelligence, clinical guidelines, obstetrics and gynecology.

Введение

Искусственный интеллект - синтетическая технология на основе информатики (computer science) и машинного обучения (machine learning), которая воспроизводит человеческий процесс принятия решений. Данная технология существенно меняет наш мир и человеческое общество. Возможности искусственного интеллекта (ИИ) начали использоваться во многих сферах человеческой деятельности для решения самых разных проблем: распознавание образов, прогноз экономических показателей, анализ шаблонов поведения потребителей и др. Здравоохранение не является исключением, и в последние годы регистрируется большое число проектов использования искусственного интеллекта для решения медицинских проблем, и, несомненно, данные технологии начинают оказывать существенное влияние на систему здравоохранения.

Использование машинного обучения (МО) в решении медицинских задач - одно из направлений внедрения искусственного интеллекта в медицину. В основе машинного обучения лежит синтез методов математики, статистики, информационных технологий и алгоритмов. В рамках данного раздела искусственного интеллекта используется большое число методов и подходов: нейронные сети, генетические алгоритмы, кластерный анализ, индукция правил, логистическая регрессия [1]. Прогресс в этой области связан с повышением производительности компьютеров, разработки нелинейных методов анализа, формированием больших массивов данных. В медицине машинное обучение используется для решения различных прикладных задач, связанных с диагностикой заболеваний, подбора оптимального лечения, повышения эффективности медицинской организации [2]. Алгоритмы машинного обучения используются для выявления патологии на рентгеновских снимках, ранней диагностики нарушений работы сердца на основе анализа кардиограммы [3, 4, 5].

Однако попытки внедрения машинного обучения в реальную медицинскую практику сопровождаются рядом проблем. Результаты прогноза, полученного на основе моделирования, существенно зависят от качества обучающей выборки. Поэтому ошибки и дефекты в наборах данных для обучения существенно искажают результаты прогноза построенной модели. Полученные модели часто достаточно сложно интерпретировать. В частности, результаты обучения нейронных сетей представляют собой «черный ящик» - сеть определенной архитектуры с набором весовых коэффициентов, которые определяют прогностические свойства модели. Соответственно, практикующему врачу сложно понять, на основе каких принципов нейронная сеть выносит те или иные клинические решения.

Это также порождает проблему ответственности за получаемые в рамках машинного обучения рекомендации для врача и пациента, правовой статус которых до конца не установлен. Соответственно, возникает правомерный вопрос: возможно ли полностью отдать на откуп искусственного интеллекта принятие решений

во врачебной сфере? Соответственно, вопрос о степени содействия искусственного интеллекта врачу в принятии обоснованных клинических решений, от которых зависит жизнь пациента остается открытым.

В рамках существующего правового поля в целях содействия врачу в принятии клинически значимых решений используются клинические рекомендации -набор положений и суждений, сформированных на основе доказательной медицины [6]. Основу разработки клинических рекомендаций составляют клинические исследования, в рамках которых оценивается достоверность различных гипотез или суждений [7]. Ограничением подобного подхода являются высокая стоимость и длительность проведения исследований. Клинические исследования проводятся на гомогенной выборке пациентов, поэтому в реальной клинической практике эффект не всегда воспроизводим и соответствует результатам первоначальных рандомизированных клинических исследований.

Учитывая, что в настоящий момент собирается большой объем данных, который содержит большое число «потенциально» полезных закономерностей, одним из актуальных направлений исследований является формализация решений, получаемых в ходе обработки данных с использованием инструментов машинного обучения, в формат, пригодный для включения в клинические рекомендации. Однако методология разработки клинических рекомендаций с использованием результатов машинного обучения на текущий момент не разработана должным образом.

Цель настоящей работы: разработка подходов к использованию инструментов ИИ для построения прогностических моделей и формирования критериев принятия клинических решений у беременных женщин с начальными формами хронических заболеваний вен.

Материал и методы

Тренировочная выборка пациенток. Исследование проводилось на клинических базах кафедры акушерства и гинекологии КГМА - филиала ФБГОУ ДПО РМАНПО Минздрава России в сотрудничестве с кафедрой биохимии, биотехнологии и фармакологии Института фундаментальной медицины и биологии Казанского федерального университета. Всего за период с 2015-го по 2019-й г. были обследованы 319 беременных женщин в I, II и III триместрах гестации в возрасте от 19 до 40 лет.

Обследование беременных проводили в соответствии с действовавшими на тот период регламентирующими документами: руководствами и клиническими рекомендациями [8, 9]. Критерием включения в исследование было: одноплодная беременность живым жизнеспособным плодом. Критериями невключения были: сердечная недостаточность высокого функционального класса, дерматит, периферическая нейропатия, аллергическая реакция на лекарственные препараты или компоненты трикотажа, наличие хронических заболеваний вен более высокого класса, чем С1, по классификации СЕАР.

Исследование было построено на данных, полученных в результате обследования 221 беременной женщины с признаками стадии С1 хронической венозной недостаточности по классификации CEAP и 98 беременных без визуальных и клинических признаков хронических заболеваний вен [10].

Исходом в настоящем исследовании явилась угроза преждевременных родов на сроке 22-36,6 недели в соответствии с критериями, установленными клиническими рекомендациями [8].

Перечень прогностических переменных включал в себя: сочетание симптомов хронических заболеваний вен, индекс массы тела (ИМТ), наличие артериальной гипертензии в анамнезе (АГ), индекс эластичности в 1-м, 2-м и 3-м триместре, среднее артериальное давление (САД), частота сердечных сокращений (ЧСС), уровень экспрессии HIFla, вязкость крови при скорости сдвига 153 C-1, уровень экспрессии ICAM, уровень экспрессии ppbp.

Во всех случаях было получено добровольное информированное согласие пациенток для участия в исследовании. Исследование одобрено в рамках этического комитета организации.

Статистический анализ. Исследование проходило в два этапа. На первом этапе была проведена сравнительная оценка различных моделей машинного обучения: многослойный персептрон (multilayer perceptron), логистическая регрессия (logistic regression), градиентный бу-стинг над деревьями решений (gradient boosting decision tree), алгоритмы случайного леса (random forest) [11,12].

Многослойный персептрон (multilayer perceptron) -это класс искусственных нейронных сетей прямого распространения, состоящих как минимум из трех слоев: входного, скрытого и выходного. За исключением входных, все нейроны используют нелинейную функцию активации. При обучении MLP использовались обучение с учителем и алгоритм обратного распространения ошибки.

Логистическая регрессия, или логит-модель (англ. logit model), - статистическая модель, используемая для прогнозирования вероятности возникновения некоторого события путем его сравнения с логистической кривой. Эта регрессия выдает ответ в виде вероятности бинарного события (1 или 0).

Градиентный бустинг над решающими деревьями -это метод машинного обучения, который использует композицию решающих деревьев для улучшения предсказательной способности модели. Градиентный бустинг строит каждое следующее дерево таким образом, чтобы исправить ошибки, сделанные предыдущими деревьями. Таким образом, модель постепенно улучшается и достигает более высокой точности [13].

Алгоритм случайного леса (random forest) - универсальный алгоритм машинного обучения, суть которого состоит в использовании ансамбля решающих деревьев. Само по себе решающее дерево предоставляет крайне невысокое качество классификации, но из-за большого их количества результат значительно улучшается [13].

Для формирования формализованных критериев все переменные, включенные в модель, были трансформированы исходя из клинической интерпретации нормы и патологии на основе бинарной трансформации. Анализ проводили с использованием языка python 3.10 и библиотеки scikit-learn [14].

На втором этапе была построена детальная модель прогноза на основе логистической регрессии. На первом

этапе в модель включались все переменные. Оценивалась достоверность модели. При p<0,05 модель считалась значимой. В рамках анализа первоначальной модели оценивали значимость каждой переменной. На втором этапе в рамках пошаговой регрессии модель пересматривали и оставляли только те переменные, которые имели статистическую значимость. Для итоговой модели оценивали эффективность прогноза на основе оценки коэффициентов точности, специфичности и чувствительности. Все статистические расчеты были проведены с использованием программы JAMOVI.

Результаты исследования

В рамках проведенного исследования были определены параметры моделирования. Часть параметров моделей машинного обучения была выбрана опытным путем, часть использована на основе общепринятых подходов и включенных в состав использованного программного обеспечения.

Формирование модели на основе нейронных сетей носило итеративный (циклический) характер. Для проведения моделирования нами была выбрана следующая структура нейронной сети. Сеть имела два скрытых слоя по 300 нейронов с функцией активации «relu». Последний слой имел два нейрона и функцию активации «softmax». Общее число параметров в сети составило 95 102. Оптимизация параметров сети была проведена с использованием алгоритма «adam». В качестве регуляризации был использован Dropout. Модели логистической регрессии, GBDT, RF были использованы со стандартными параметрами из библиотеки scikit-learn.

На основе анализа литературы нами были выбраны следующие метрики (табл. 1) оценки качества получаемых моделей [15].

Таблица 1

Выбранные метрики для оценки моделей, полученных в ходе машинного обучения [15]

Критерий, краткое обозначение Показатель

f1-macro f1 на классах с макроусреднением

roc_auc значение метрики ROC AUC (Area under the ROC Curve)

pres_pos precision на положительном классе

recall_pos recall на положительном классе

f1_pos f1 на положительном классе

accuracy точность

Метрики были измерены на основе кросс-валидации с размером фолдов 5, что соответствует 5 итерациям с размером тестовой выборки, равным 20% от общей выборки. Разделение выборки было проведено со стратификацией по целевой переменной для обеспечения соответствия распределения в каждой подвыборке распределению целевой переменной. Результаты усредненных значений метрик представлены в таблице 2.

Как видно из таблицы 2, градиентный бустинг представил наилучший результат по метрикам f1-macro, pres_pos, f1_pos, accuracy. Модель на основе логистической регрессии показала лучший результат по метрике roc_auc. Следует отметить, что все алгоритмы показали хорошие результаты по разным метрикам. Однако, если учитывать малый размер датасета, различия между моделями можно полагать незначительными.

Таблица 2

Оценка моделей по метрикам классификации («+» отмечены наиболее высокие показатели среди проанализированных моделей)

Критерий Модель lr Модель gb Модель rf Модель mlp

f1-macro 0,872 0,903+ 0,885 0,894

roc auc 0,926+ 0,916 0,885 0,914

pres_pos 0,814 0,903+ 0,858 0,879

recall_pos 0,8 0,8 0,785 0,8

f1_pos 0,801 0,846+ 0,818 0,833

accuracy 0,912 0,937+ 0,924 0,930

№ Показатель Оценка

11 Индекс эластичности общей бедренной вены в 1-м триместре 0,023971476

12 Медиана среднего артериального давления в 1-м, 2-м, 3-м триместре 0,018606615

По нашему мнению, полученные результаты свидетельствуют о том, что различные алгоритмы машинного обучения в целом обладают хорошей прогностической ценностью. Однако эффективность прогноза будет определяться качеством и объемом данных. Сравнительная оценка позволяет выбрать модель наиболее эффективную с точки зрения качества прогноза. Вместе с тем имеются допущения, связанные с тем, что часть исходных параметров моделей устанавливается экспертным путем, что приведет к низкой воспроизводимости результатов. К сожалению, на текущий момент стандартизация моделей машинного обучения не установлена, поэтому результаты моделирования разными исследователями на различных исходных положениях будут отличаться.

Для оценки утилитарности получаемых моделей мы предприняли попытку проинтерпретировать полученные модели. Несомненно, разные критерии имеют различную степень влияния на результирующую переменную, поэтому определение предикторов, имеющих существенное влияние на исследуемую переменную, крайне актуально.

Для интерпретации модели на основе градиентного бустинга над решающими деревьями был использован метод «Feature Importance» [16]. Результаты в виде перечня показателей, ранжированных по степени значимости на зависимую переменную, представлены в таблице 3.

Таблица 3

Результаты оценки значимости признаков, полученных на основе метода «Feature Importance» для модели градиентного бустинга над решающими деревьями

Как видно из таблицы 3, наиболее значимыми оказались признаки «наличие артериальной гипертензии по данным анамнеза», «сочетание симптомов хронических заболеваний вен нижних конечностей», «экспрессия ГСАМ». Применение методики позволило оценить вклад каждого фактора в результирующую переменную. Это полезно с точки зрения дальнейших исследований для оценки роли данных факторов в развитии невынашивания беременности.

Для интерпретации логистической регрессии было проведено упрощение модели на основе пошагового исключения незначимых факторов. В результате регрессионное уравнение было пересмотрено и оставлены только статистически значимые факторы (табл. 4).

Таблица 4

Результаты оценки значимости и влияния исследуемых факторов на риск развития преждевременных родов на втором этапе итерации после пошагового исключения незначимых

предикторов регрессионной модели

Значимость модели Xi2 p<0.001 Вес

Предиктор Уровень значимости, p

Индекс массы тела (ИМТ) в 1-м триместре 0,02 1,27

Наличие артериальной гипертензии у пациентки по данным анамнеза <0,001 5,07

Индекс эластичности общей бедренной вены в 3-м триместре 0,01 1,37

Вязкость крови при скорости сдвига 153 С-1 0,02 2,01

На основе проведенной бинаризации факторов была проведена формализация модели, которая может быть интерпретирована медицинскими работниками в реальной клинической практике для принятия клинически значимых решений (табл. 5).

Таблица 5

Критерии риска, сформулированные на основе проведенного математического моделирования с использованием бинарной логистической регрессии

№ Показатель Оценка

1 Наличие артериальной гипертензии у пациентки по данным анамнеза 0,273143198

2 Наличие сочетания симптомов хронических заболеваний вен нижних конечностей 0,135095329

3 Экспрессия ГСАМ 0,110309719

4 Индекс эластичности общей бедренной вены во 2-м триместре 0,076563232

5 Индекс эластичности общей бедренной вены в 3-м триместре 0,072432855

6 Вязкость крови при скорости сдвига 153 С-1 0,069803326

7 Экспрессия РРВР 0,057393409

8 Медиана частоты сердечных сокращений в 1-м, 2-м, 3-м триместре 0,0541892

9 Индекс массы тела (ИМТ) в 1-м триместре 0,039760296

10 Экспрессия НШа 0,0396061

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

№ Условие (критерий) Да / нет

1 Имеется ли повышение ИМТ у пациентки выше 25? Да - 1 балл/ нет - 0

2 Индекс эластичности в 3-м триместре был больше, чем 1,11? Да - 1 балл/ нет - 0

3 Есть ли АГ у пациентки по данным анамнеза? Да - 5 баллов / нет - 0

4 Есть ли замедление скорости сдвига по данным вискозометрии выше 1,5 см/с? Да - 2 балла / нет - 0

Интерпретация полученных результатов: 0 баллов - минимальный риск, 9 баллов - максимальный риск

На основе результатов моделирования сформулированы четыре суждения, которые помогают врачу оценить риск преждевременных родов. При положительном ответе на каждый вопрос определяется количество баллов, пропорциональное риску возникновения события. Подобная шкала может быть использована в реальной практике и при дальнейшей валидации включена в состав клинических рекомендаций.

Обсуждение

Попытки использования искусственного интеллекта в акушерстве и гинекологии не являются новыми. В частности, инструменты искусственного интеллекта были использованы для оценки и отбора эмбрионов с высоким имплантационным потенциалом. Это позволяет прогнозировать успех развития эмбриона и увеличивать индекс их выживаемости, что, в свою очередь, улучшает исходы ведения пациенток с нарушениями репродуктивной функции [17]. На основе инструментов ИИ разрабатываются подходы к оптимизации терапии пациенток с эндометриозом [18]. Определенный успех достигнут в использовании ИИ для улучшения скрининга рака шейки матки [19].

К сожалению, единого подхода к использованию инструментов ИИ не существует, различными исследователями используются различные инструменты машинного обучения: деревья решений, логистическая регрессия, нейронные сети [20, 21]. Для решения этой проблемы оптимальным направлением является стандартизация разработки и применения инструментов ИИ в системе здравоохранения. Необходима унификация подходов к разработке и обучению моделей, чтобы повысить устойчивость получаемых моделей. Определенный оптимизм внушает то, что данному вопросу в Российской Федерации уделяется особое внимание [22].

Другой не менее значимой проблемой является интерпретации получаемых моделей. Если модели на основе нейронных сетей представляют собой «черный ящик», то на основе моделей деревьев решений и логистической регрессии исследователи получают набор правил [21, 23]. Например, на основе логистической регрессии были созданы номограммы, позволяющие врачам прогнозировать послеоперационные осложнения у женщин с эндоме-триозом и содействовать оптимальной тактике их лечения [24]. Следует отметить и ограничения построения моделей машинного обучения, связанных с малым объемом выборок и отсутствием данных для сравнения [20]. Проблема ответственности за принимаемые решения также должна быть рассмотрена в этом контексте. Если получаемая модель не может быть интерпретирована с клинической точки зрения, то врач затруднен в полноценном использовании модели для решения клинических

Литература/References

1. Crossnohere N. L., Elsaid M., Paskett J. et al. Guidelines for Artificial Intelligence in Medicine: Literature Review and Content Analysis of Frameworks. J. Med. Internet Res. 2022; 24 (8): e36823.

2. Wang F., Preininger A. AI in Health: State of the Art, Challenges, and Future Directions. Yearb Med. Inform. 2019; 28 (1): 16-26.

3. Emmert-Streib F., Dehmer M. A Machine Learning Perspective on Personalized Medicine: An Automized, Comprehensive Knowledge Base with Ontology for Pattern Recognition. MAKE. 2018; 1 (1): 149-156.

4. Johnson K. W., Torres S.J, Glicksberg B. S. et al. Artificial Intelligence in Cardiology. Journal of the American College of Cardiology. 2018; 71 (23): 2668-79.

5. Yang H., Lee E. K. Healthcare analytics: from data to knowledge to healthcare improvement. Hoboken, New Jersey: Wiley, 2016. 641 p.

6. Омельяновский В. В., Сура М. В., Деркач Е. В., Авксентьева М. В. Клинические рекомендации: от разработки к вне-

задач. Подобные результаты могут являться обоснованием дополнительных исследований по поиску реальных биохимических и физиологических механизмов, лежащих в основе выявленных закономерностей. Наоборот, если модель может быть интерпретирована с позиции клинического смысла, ее ценность существенно увеличивается и она улучшает существующие подходы к лечению и диагностике заболеваний.

Модель, полученная в настоящем исследовании, также учитывает разнородные факторы, касающиеся материнского организма, а именно состояние венозной системы, отраженное в показателе индекса эластичности, связанного с ним состояния капиллярной крови у пациенток с повышенной массой тела и имевших артериальную гипертензию. В целом объединение показавших свою значимость факторов демонстрирует роль эндотелиопатии в развитии преждевременных родов. Это согласуется с данными ранее проведенных исследований, в которых показана взаимосвязь факторов, ведущих к эндотелиальной дисфункции и преждевременным родам [25, 26].

Использованная бинаризация факторов (предикторов) позволяет перейти к набору клинических суждений, удобных для использования в реальной клинической практике. Формирование формализованных правил, имеющих определенную степень достоверности, позволяет внедрять их в действующие клинические рекомендации [6]. Формализуемые правила также могут быть использованы в медицинской информационной системе при построении систем поддержки принятия врачебных решений. Предложенная модель масштабируема, и по мере увеличения объема наблюдений и переобучения модели прогноз предложенной модели может быть существенно улучшен.

Заключение

На основе полученной информации можно рекомендовать использование машинного обучения для повышения качества оказания медицинской помощи в акушерстве и гинекологии. Разработанная методология позволяет использовать результаты машинного обучения для совершенствования действующих клинических рекомендаций. Перспективны дальнейшие исследования в данной области, направленные на использование искусственного интеллекта для повышения качества и безопасности медицинской помощи.

Конфликт интересов. Авторы заявляют об отсутствии явного или потенциального конфликта интересов, связанного с публикацией статьи.

Финансирование. Исследование не имело спонсорской поддержки.

дрению // Медицинские технологии. Оценка и выбор. 2020. № 4 (42). С. 45-50 [Omel'yanovsky V. V., Sura M. V., Derkach E. V., Avksent'yeva M. V. Clinical guidelines: from development to implementation. Meditsinskie tekhnologii. Оtsenka i vybor. 2020; (4-42): 45-50 (In Russ.)]

7. National Health and Medical Research Council (Australia). A guide to the development, implementation and evaluation of clinical practice guidelines. Canberra: National Health and Medical Research Council, 1999.

8. Преждевременные роды. Клинические рекомендации (письмо Министерства здравоохранения Российской Федерации от 17.12.2013 № 15-4/10/2-9480). Москва: Российское общество акушеров-гинекологов, 2013. 32 с. [Prezhdevremennye rody. Clinical recommendations. (letter of the Ministry of Health of the Russian Federation dated 17.12.2013 N 15-4/10/2-9480). Moscow, 2013. 32 p. (In Russ.)]

9. Выкидыш в ранние сроки беременности: диагностика и тактика ведения. Клинические рекомендации (протокол лечения) (письмо Министерства здравоохранения Российской Федерации от 07.06.2016. № 15-4/10/2-3482). Москва: Российское общество акушеров-гинекологов, 2016. 32 с. [Vykidysh v rannie sroki beremennosti: diagnostika i taktika vedeniya. Klinicheskie rekomendatsii (protokol lecheniya) clinical recommendations (treatment protocol) (letter from the Ministry of Health of the Russian Federation dated 06/07/2016 N 15-4/10/2-3482). Moscow, 2016. 32 p. (In Russ.)]

10. Юпатов Е. Ю. Особенности центральной гемодинамики, функционального состояния вен нижних конечностей и перинатальные исходы у беременных женщин с начальными формами флебо-патий // Вопросы гинекологии, акушерства и перинатологии. 2022. Т. 21. № 1. С. 29-35. [Yupatov E. Yu. Features of central hemodynamics, functional state of veins of the lower extremities and perinatal outcomes in pregnant women with initial forms of phlebopathy. Voprosy ginekologii, akusherstva i perinatologii. 2022; 21 (1): 29-35. (In Russ.)]

10 Хафизьянова Р. Х., Бурыкин И. М., Алеева Г. Н. Математическая статистика в экспериментальной и клинической фармакологии. Казань: Медицина, 2006. 374 с. [Khafiz'yanova R. Kh., Burykin I. M., Aleeva G. N. Matematicheskaya statistika v eksperimental'noi i klinicheskoi farmakologii. Kazan: Medicine; 2006. 374 p. (In Russ.)]

12. Bozdogan H. Statistical data mining and knowledge discovery. Boca Raton, FL: Chapman & Hall/CRC, 2004. 624 p.

13. Hastie T., Tibshirani R., Friedman J. H. The elements of statistical learning: data mining, inference, and prediction. New York, NY: Springer, 2009. 758 p.

14. Pedregosa F., Varoquaux G., Gramfort A. et al. Scikit-learn: Machine learning in Python. The Journal of machine Learning research. 2011; 12: 2825-30.

15. Bishop C. M. Pattern Recognition and Machine Learning. New York: Springer, 2006. 738 p.

16. Friedman J. H. Greedy function approximation: a gradient boosting machine. Annals of statistics. 2001; 29 (5): 1189-1232.

17. Bhaskar D., Chang T. A., Wang S. Current trends in artificial intelligence in reproductive endocrinology. Curr Opin Obstet Gynecol. 2022; 34 (4): 159-163.

18. Sivajohan B., Elgendi M., Menon C. et al. Clinical use of artificial intelligence in endometriosis: a scoping review. NPJ Digit Med. 2022; 5 (1): 109.

19. Hou X., Shen G., Zhou L. et al. Artificial Intelligence in Cervical Cancer Screening and Diagnosis. Front Oncol. 2022; 12: 851367.

20. Akazawa M., Hashimoto K. Artificial intelligence in gynecologic cancers: current status and future challenges -a systematic review. Artif IntellMed. 2021; 120: 102164.

21. Wang Y. F., Chang M. Y., Chiang R. D. et al. Mining medical data: a case study of endometriosis. J. Med. Syst. 2013; 37(2): 9899.

22. Морозов С. П., Зинченко В. В., Хоружая А. Н., Шарова Д. Е., Ахмад Е. С., Андрейченко А. Е., Владзимирский А. В. Стандартизация искусственного интеллекта в здравоохранении: Россия выходит в лидеры // Врач и Информационные Технологии. 2020 № 2. С. 12-9. [Morozov S. P., Zinchenko V. V., Khoruzhaya A. N., Sharova D. E., Akhmad E. S., Andreichenko A. E., Vladzimirsky A. V. Standardization of artificial intelligence in healthcare: Russia is becoming a leader. Doctor and Information Technologies. 2021; 2: 12-9 (in Russ.)]

23. Kong L., Nilsson I. A. K, Gissler M., Lavebratt C. Associations of Maternal Diabetes and Body Mass Index with Offspring Birth Weight and Prematurity. JAMA Pediatr. 2019; 173 (4): 371-8.

24. Vesale E., Roman H., Abo C. et al. Predictive approach in managing voiding dysfunction after surgery for deep endometriosis: a personalized nomogram. International Urogynecology Journal. 2021; 32 (5): 1205-12.

25. Chen X., Scholl T. O. Maternal biomarkers of endothelial dysfunction and preterm delivery. PLoS One. 2014; 9 (1): e85716.

26. Lane-Cordova A. D., Gunderson E. P., Carnethon M. R. et al. Prepregnancy endothelial dysfunction and birth outcomes: The Coronary Artery Risk Development in Young Adults (CARDIA) Study. Hypertens Res. 2018; 41 (4): 282-9.

УДК 616.89 DOI 10.24412/2220-7880-2024-4-48-54

валидизация анкеты для выявления маркеров психических расстройств у лиц призывного возраста

'Вишняков А. В., 'ЗлоказоваМ. В., 2Соловьёв А. Г.

'ФГБОУ ВО «Кировский государственный медицинский университет» Минздрава России, Киров, Россия (610027, г. Киров, ул. К. Маркса, 112), e-mail: [email protected]

2ФГБОУ ВО «Северный государственный медицинский университет» Минздрава России, Архангельск, Россия (163069, г. Архангельск, Троицкий пр-т, 51).

На сегодняшний день важнейшей государственной задачей является комплектование вооруженных сил Российской Федерации психически здоровыми кадрами. Для обеспечения безопасности жизнедеятельности населения, а также предупреждения чрезвычайных ситуаций необходимы мероприятия, направленные на улучшение диагностики психических расстройств у лиц призывного возраста. Трудности выявления группы риска по психическим расстройствам среди призывников обусловлены недостаточной изученностью этиопатогенетически значимых биопсихосоциальных факторов в данной категории, а также отсутствием валидизированных дополнительных диагностических тестов. Авторами разработана анкета из 29 пунктов, направленных на выявление маркеров психических расстройств у лиц призывного возраста. Проведена процедура валидизации анкеты среди призывников, проходивших врачебную комиссию в психиатрическом стационаре в 2022-2023 гг. (n=384). Обоснована содержательная и внешняя валидность, доказаны надежность-устойчивость, надежность-согласованность и высокая разделительная способность анкеты. Оценена возможность прогнозирования наличия расстройств личности и умственной отсталости у призывников при помощи анкеты. Критериальная валидность анкеты составляет 89,3%. Разработанную анкету рекомендуется использовать при обследовании призывников на предмет наличия психических расстройств.

Ключевые слова: лица призывного возраста, призывники, психические расстройства, валидизация анкеты.

validation of the questionnaire for identification of mental disorder markers in persons of military age

'Vishnyakov A. V., 'ZlokazovaM. V., 2Solov'yov A. G.

1Kirov State Médical University, Kirov, Russia (610027, Kirov, K. Marx St., 112), e-mail: [email protected]

i Надоели баннеры? Вы всегда можете отключить рекламу.