анализ эффективное внутригоспитдльной леталы у вольных инфарктом миокард с подъемом сегмента st на основе в категориальной и непрерывной форм)
DOI: 10.17691/stm2024.16.1.02 УДК 616.127-005.8-089.168.8 Поступила 5.10.2023 г.
К.И. Шахгельдян, д.т.н., доцент, директор института информационных технологий1; зав. лабораторией анализа больших данных в медицине и здравоохранении2; Н.С. Куксин, аспирант Института математики и компьютерных технологий2;
И.Г. Домжалов, аспирант Школы медицины и наук о жизни2;
Б.И. Гельцер, д.м.н., профессор, член-корреспондент РАН, зам. директора по науке
Школы медицины и наук о жизни2
1 Владивостокский государственный университет, ул. Гоголя, 41, Владивосток, 690014;
Дальневосточный федеральный университет, п. Аякс, 10, Владивосток, о. Русский, 690922
Цель исследования — оценить эффективность прогностических моделей, разработанных на основе предикторов в непрерывной и категориальной формах, для предсказания вероятности внутригоспитальной летальности (ВГЛ) у больных инфарктом миокарда с подъемом сегмента ST (ИМ^Т) после чрескожного коронарного вмешательства (ЧКВ).
Материалы и методы. Проведено одноцентровое ретроспективное исследование, в рамках которого анализировали данные 4674 историй болезни пациентов с ИМ^Т после ЧКВ, находившихся на лечении в Региональном сосудистом центре г. Владивостока. Выделено 2 группы больных: 1-ю составили 318 человек (6,8%), умерших в стационаре; 2-ю — 4356 пациентов (93,2%) с благоприятным исходом лечения. Прогностические модели ВГЛ были разработаны методами многофакторной логистической регрессии (МЛР), случайного леса (СЛ) и стохастического градиентного бустинга (СГБ). Для оценки точности моделей использовали 6 метрик качества. Пороговые значения предикторов ВГЛ определяли методами поиска на сетке оптимальных точек отсечения, расчета центроидов и аддитивного объяснения Шепли. С помощью последнего оценивали степень влияния предикторов на конечную точку.
Результаты. По результатам многоступенчатого анализа показателей клинико-функционального статуса больных ИМпST были выделены и валидированы новые предикторы ВГЛ, дополняющие факторы шкалы GRACE, выполнена их категоризация и разработаны прогностические модели с непрерывными и категориальными переменными на основе МЛР, СЛ и СГБ. Данные модели имели высокую (AUC — от 0,88 до 0,90) и сопоставимую точность прогноза, но их предикторы отличались различной степенью влияния на конечную точку. Сравнительный анализ показал, что метод аддитивного объяснения Шепли имеет преимущества при категоризации предикторов по сравнению с другими методами и позволяет детализировать структуру их взаимосвязей с ВГЛ.
Заключение. Использование современных методов интеллектуального анализа данных, включающих алгоритмы машинного обучения, категоризацию предикторов и оценку степени их влияния на конечную точку, позволяет разрабатывать прогностические модели, обладающие высокой точностью и свойствами объяснения генерируемых заключений.
Ключевые слова: прогностические модели; категоризация данных; инфаркт миокарда с подъемом сегмента ST; летальность; факторы риска; метод аддитивного объяснения Шепли.
Как цитировать: Shakhgeldyan K.I., Kuksin N.S., Domzhalov I.G., Geltser B.I. Performance of the models predicting in-hospital mortality in patients with ST-segment elevation myocardial infarction with predictors in categorical and continuous forms. Sovremennye tehnologii v medicine 2024; 16(1): 15, https://doi.org/10.17691/stm2024.16.1.02
Для контактов: Шахгельдян Карина Иосифовна, e-mail: [email protected]
Performance of the Models Predicting In-Hospital Mortality in Patients with ST-Segment Elevation Myocardial Infarction with Predictors in Categorical and Continuous Forms
K.I. Shakhgeldyan, DSc, Associate Professor, Director of the Institute of Information Technologies1;
Head of the Laboratory of Big Data Analysis in Medicine and Healthcare2;
N.S. Kuksin, PhD Student, Institute of Mathematics and Computer Technologies2;
I.G. Domzhalov, PhD Student, School of Medicine and Life Sciences2;
B.I. Geltser, MD, DSc, Professor, Corresponding Member of the Russian Academy of Sciences,
Deputy Director of School of Medicine and Life Sciences2
Vladivostok State University, 41 Gogolya St., Vladivostok, 690014, Russia;
2Far East Federal University, 10 Ayaks Village, Russkiy Island, Vladivostok, 690922, Russia
The aim of the study is to assess the performance of predictive models developed on the basis of predictors in the continuous and categorical forms to predict the probability of in-hospital mortality (IHM) in patients with ST-segment elevation myocardial infarction (STEMI) after percutaneous coronary intervention (PCI).
Materials and Methods. A single-center retrospective study has been conducted, within the framework of which data from 4674 medical records of patients with STEMI after PCI, treated at the Regional Vascular Center of Vladivostok (Russia), have been analyzed. Two groups of patients were identified: group 1 consisted of 318 (6.8%) individuals who died in the hospital, group 2 included 4356 (93.2%) patients with a favorable outcome of treatment. IHM prognostic models were developed using multivariate logistic regression (MLR), random forest (RF), and stochastic gradient boosting (SGB). 6-metric qualities were used to evaluate the accuracy of the models. Threshold values of IHM predictors were determined using a grid search to find the optimal cut-off points, calculating centroids, and Shapley additive explanations. The latter helped evaluate the degree to which the model predictors influence the endpoint.
Results. Based on the results of the multi-stage analysis of indicators of clinical and functional status of the STEMI patients, new predictors of IHM have been identified and validated, complementing the factors of the GRACE scoring system, their categorization has been carried out and prognostic models with continuous and categorical variables based on MLR, RF, and SGB have been developed. These models had a high (AUC — 0.88 to 0.90) and comparable predictive accuracy, but their predictors differed in various degrees of influence on the endpoint. The comparative analysis has shown that the Shapley additive explanation method has advantages in categorizing predictors compared to other methods and allows for detailing the structure of their relationships with IHM.
Conclusion. The use of modern data mining methods, including machine learning algorithms, categorization of predictors, and assessment of the degree of their effect on the endpoint, makes it possible to develop predictive models possessing high accuracy and the properties of explanation of the generated conclusions.
Key words: prognostic models; data categorization; ST-segment elevation myocardial infarction; mortality; risk factors; method of Shapley additive explanation.
English
Введение
На сегодняшний день одним из эффективных методов лечения инфаркта миокарда с подъемом сегмента ST (MMnST) является реваскуляризация миокарда посредством чрескожного коронарного вмешательства (ЧКВ) [1]. Однако внутригоспитальная летальность (ВГЛ) после выполнения ЧКВ по экстренным показаниям остается высокой и варьирует от 4 до 7%, что актуализирует необходимость прогнозирования неблагоприятных событий [2].
К наиболее востребованным инструментам риско-метрии относят шкалу GRACE (Global Registry of Acute Coronary Events), совершенствование которой является целью ряда исследований последних лет [3-6]. В большинстве случаев для разработки прогностических моделей базовые факторы данной шкалы дополняют новыми предикторами. Важным
при этом остается корректное выделение их пороговых значений.
В настоящее время для решения данной задачи могут быть использованы методы предиктивной аналитики на основе машинного обучения, которые все шире применяются в различных областях медицины [7-10]. Вместе с тем из-за «непрозрачности» моделей машинного обучения их внедрение в клиническую практику довольно ограничено. Решение этой проблемы возможно с помощью категоризации непрерывных переменных, применяемых в прогностических алгоритмах. Категоризация данных позволяет определять пороговые значения анализируемых показателей, отклонения от которых могут быть использованы для выявления факторов риска и клинического обоснования предсказанной вероятности неблагоприятных событий [11, 12]. Кроме того, при комбинировании факторов риска реализуется возможность характеристики
особенностей комплексного воздействия различных признаков на результирующую переменную [13]. Вместе с тем, по мнению ряда авторов, показатели в категориальной, в частности дихотомизированной, форме могут приводить к потере информации, искажению результатов анализа [14-16], увеличению доли ложноположительных [17] и ложноотрицательных [18] заключений. Несмотря на обозначенные недостатки, рекомендации STROBE (Strengthening the reporting of observational studies in epidemiology) подтверждают целесообразность использования категоризации данных при условии указания методов, которыми она проводилась [19].
Цель исследования — оценить эффективность прогностических моделей, разработанных на основе предикторов в непрерывной и категориальной формах, для предсказания вероятности внутригоспиталь-ной летальности у больных инфарктом миокарда с подъемом сегмента ST после чрескожного коронарного вмешательства.
Материалы и методы
Характеристика пациентов. Проведено одно-центровое когортное ретроспективное исследование, в рамках которого проанализированы данные историй болезни 4674 пациентов (3200 мужчин и 1474 женщины) с ИМпST в возрасте от 26 до 93 лет (медиана — 63 года, 95% доверительный интервал (ДИ): 62-63), поступивших в Региональный сосудистый центр «Приморская краевая клиническая больница №1» (Владивосток) с 2015 по 2021 г [20]. Всем больным выполнено экстренное ЧКВ. Пациенты были разделены на две группы: 1-я — 318 человек (6,8%), умерших в стационаре; 2-я — 4356 пациентов (93,2%) с благоприятным исходом заболевания. Исследование проведено в соответствии с принципами Хельсинкской декларации и одобрено локальным этическим комитетом Дальневосточного федерального университета (протокол №8 от 8.06.2023 г)
Критерии включения в исследование: больные с подтвержденным ИМпST и выполнением ЧКВ в 1-е сутки стационарного лечения. Критерии невключения: нестабильная стенокардия, инфаркт миокарда без подъема сегмента ST и отсутствие показаний для ЧКВ.
Клинико-функциональный статус больных оценивали в 1-е сутки стационарного лечения с помощью 136 факторов, основные из которых представлены в табл. 1. Данные включали 5 признаков шкалы GRACE: возраст больных, класс острой сердечной недостаточности (ОСН) по T. Killip, частоту сердечных сокращений (ЧСС), систолическое артериальное давление (САД), концентрацию креатинина в сыворотке крови. Анализировали лабораторные показатели: содержание эритроцитов (RBC), лейкоцитов (WBC), лимфоцитов (LYM), нейтрофилов (NEUT) и эозинофилов (EOS), гемоглобин (Hb), тромбоциты
(PLT) и тромбокрит (PCT), международное нормализованное отношение (МНО), тромбиновое время (ТВ), протромбиновый индекс (ПТИ), активированное частичное тромбопластиновое время (АЧТВ), уровни фибриногена и глюкозы в сыворотке крови. Послеоперационное эхокардиографическое исследование включало определение поперечного и продольного размеров левого (LA1 и LA2) и правого (RA1 и RA2) предсердий, конечного систолического (КСР) и диастолического (КДР) размеров левого желудочка (ЛЖ), фракции выброса (ФВ) ЛЖ методом Тейхольца, среднего давления в легочной артерии (СДЛА). Оценивали расчетные показатели: относительный индекс массы миокарда ЛЖ (ОИММ ЛЖ), индекс относительной толщины (ИОТ) задней стенки ЛЖ, индекс массы тела (ИМТ).
Конечная точка исследования была представлена показателем ВГЛ у больных ИМпST после ЧКВ от всех причин в форме категориального бинарного признака («отсутствие» или «развитие»).
Методы статистического анализа и машинного обучения. Распределение данных по тесту Колмогорова-Смирнова отличалось от нормального, в связи с чем использовали непараметрические методы статистики. Показатели были представлены медианой (Me) и межквартильными интервалами [Q1; Q3]; для межгрупповых сравнений непрерывных переменных применяли тест Манна-Уитни, а для категориальных — х2. Отношение шансов (ОШ) и их 95% ДИ рассчитывали точным тестом Фишера. Статистически значимыми считали различия при р<0,01.
Модели разрабатывали методами многофакторной логистической регрессии (МЛР), случайного леса (СЛ) и стохастического градиентного бустинга (СГБ). Их качество оценивали по шести метрикам: площадь под ROC-кривой (AUC), чувствительность (Sen), специфичность (Spec), балл F1 (F1-score), предсказательная ценность положительного теста (positive predictive value, PPV), предсказательная ценность отрицательного теста (negative predictive value, NPV).
Для выделения пороговых значений потенциальных предикторов использовали методы оптимизации на сетке с шагом A=(max-min)/100: минимизацию p-значения — Min(p), максимизацию ОШ — Maxell) и AUC — Max(AUC), а также метод центроидов и аддитивного объяснения Шепли (SHAP) [21, 22]. Последний применяли также для оценки степени влияния предикторов модели на конечную точку.
Датасет был разделен на 2 выборки: для обучения и кросс-валидации (80%), для итогового тестирования (20%). Процедуру обучения и кросс-валидации выполняли методом стратификации в k-Folders на 10 выборках. Усредненные метрики качества AUC, Sen и Spес использовали для выбора лучшей модели, отбора и валидации предикторов и подбора оптимальных гиперпараметров путем перебора по сетке допустимых значений. Для заключительного тестирования лучшие модели МЛР, СЛ и СГБ с
оптимальными параметрами и гиперпараметрами обучали на 80% датасета, а проверяли на подгруппе для итогового тестирования. Для доверительной оценки метрик качества процедуру повторяли 500 раз, выполняя первоначальное разделение случайным образом по методу Монте-Карло. Анализ дан-
ных и построение моделей проводили в Python с открытым исходным кодом, версии 3.9.16.
Дизайн исследования включал 4 этапа. На первом из них с помощью тестов межгрупповых сравнений формировался пул потенциальных предикторов ВГЛ (см. табл. 1).
Таблица 1
Клинико-функциональная характеристика больных инфарктом миокарда с подъемом сегмента ST
Предиктор 1-я группа (n=318) 2-я группа (n=4356) ОШ (95% ДИ) P
Женский пол, n (%) 142 (44,65) 1332 (30,58) 1,8 (1,5-2,3) <0,000001
Возраст, лет, Me [Q1; Q3] 71 [63; 78] 62 [55; 69] — <0,000001
Рост, см, Me [Q1; Q3] 168 [164; 174] 170 [165; 176] — 0,000001
Масса тела, кг, Me [Q1; Q3] 78 [70; 85] 80 [71; 90] — 0,000012
ИМТ, Me [Q1; Q3] 27,04 [26,10; 27,68] 27,68 [27,46; 27,70] — 0,082
САД, мм рт.ст., Me [Q1; Q3] 110 [90; 130] 130 [120; 150] — <0,000001
ДАД, мм рт.ст., Me [Q1; Q3] 70 [60; 80] 80 [75; 90] — <0,000001
ПАД, мм рт.ст., Me [Q1; Q3] 40 [40; 42] 50 [50; 50] — <0,000001
ЧСС, в минуту, Me [Q1; Q3] 86 [72; 100] 72 [65; 80] — <0,000001
Креатинин, мкмоль/л, Me [Q1; Q3] 130,0 [96,0; 193,3] 97,0 [81,0; 114,8] — <0,000001
Класс ОСН по T. Killip, n (%): без ОСН I II III IV III-IV 0 71 (22,33) 58 (18,2) 66 (20,75) 123 (38,7) 189 (59,4) 15 (0,34) 2726 (62,58) 867 (19,9) 479 (11,0) 269 (6,18) 748 (17,2) 0,17 (0,13-0,23) 0,90 (0,67-1,20) 2,1 (1,6-2,8) 9,6 (7,4-12,4) 7,1 (5,6-9,0) 0.59 <0,000001 0,50 <0,000001 <0,000001 <0,000001
ФВ ЛЖ, %, Me [Q1; Q3] 46,5 [38,0; 54,8] 56,0 [50,0; 61,0] — <0,000001
КДР ЛЖ, см, Me [Q1; Q3] 5,0 [4,6; 5,5] 5,0 [4,7; 5,3] — 0,35
КСР ЛЖ, см, Me [Q1; Q3] 3,7 [3,2; 4,0] 3,4 [3,1; 3,8] — <0.000001
ИОТ, Me [Q1; Q3] 0,408 [0,340; 0,470] 0,417 [0,380; 0,470] — 0.554
ОИММ ЛЖ, Me [Q1; Q3] 1,06 [0,84; 1,28] 0,96 [0,80; 1,14] — 0.0003
СДЛА, мм рт.ст., Me [Q1; Q3] 35,0 [28,25; 46,0] 28,0 [25,0; 30,0] — <0.000001
LA1, см, Me [Q1; Q3] 4,10 [3,80; 4,50] 3,9 [3,6; 4,2] — <0,000001
LA2, см, Me [Q1; Q3] 5,2 [4,8; 5,7] 4,9 [4,6; 5,2] — <0,000001
RA1, см, Me [Q1; Q3] 3,8 [3,5; 4,2] 3,6 [3,4; 3,9] — <0,000001
RA2, см, Me [Q1; Q3] 4,8 [4,5; 5,3] 4,7 [4,4; 5,0] — 0,00004
WBC, 109/л, Me [Q1; Q3] 14,5 [10,9; 19,2] 9,8 [7,9; 12,3] — <0,000001
NEUT, %, Me [Q1; Q3] 81,30 [75,75; 86,50] 66,70 [59,10; 74,90] — <0,0001
LYM, %, Me [Q1; Q3] 10,7 [7,7; 15,9] 19,6 [13,5; 27,0] — <0,000001
EOS, %, Me [Q1; Q3] 0,1 [0; 0,3] 0,9 [0,3; 1,9] — <0,000001
RBC, 1012/л, Me [Q1; Q3] 4,2 [3,8; 4,6] 4,5 [4,1; 4,8] — <0,000001
Hb, г/л, Me [Q1; Q3] 130 [114; 142] 141 [128; 152] — <0,000001
PLT, 109/л, Me [Q1; Q3] 228 [187; 288] 221 [185; 266] — 0,02
Окончание табл. 1
Предиктор 1-я группа (n=318] 2-я группа (n=4356] ОШ (95% ДИ] Р
Глюкоза, ммоль/л, Me [Q1; Q3] 7,90 [6,30; 10,31] 5,8 [5,1; 7,0] — <0,000001
Мочевина, мкмоль/л, Me [Q1; Q3] 12,12 [8,70; 17,30] 6,70 [5,24; 8,84] — <0,000001
PCT, %, Me [Q1; Q3] 0,22 [0,17; 0,28] 0,20 [0,16; 0,24] — 0,0012
ПТИ, %, Me [Q1; Q3] 75,5 [57,6; 87,0] 89,3 [79,7; 97,0] — <0,000001
МНО, ед., Me [Q1; Q3] 1,26 [1,10; 1,65] 1,06 [1,0; 1,16] — <0,000001
ТВ, с, Me [Q1; Q3] 21,9 [19,9; 30,4] 21,4 [19,5; 25,7] — 0,012
АЧТВ, с, Me [Q1; Q3] 39,7 [32,7; 58,2] 36,5 [32,2; 42,7] — 0,000026
Передний инфаркт миокарда, n (%) 177 (55,66) 2017 (46,30) 1,50 (1,16-1,83) 0,001
ФП, n (%) 129 (40,57) 772 (17,72) 3,20 (2,51-4,02) <0,000001
СД 2, n (%) 100 (31,45) 830 (19,05) 1,90 (1,50-2,46) <0,000001
ХБП, n (%) 83 (26,1) 677 (15,5) 1,97 (1,50-2,60) <0,000001
ХОБЛ, n (%) 25 (7,9) 354 (8,1) 0,96 (0,63-1,47) 0,95
На втором этапе исследования с помощью методов машинного обучения разрабатывали прогностические модели ВГЛ c предикторами в непрерывной форме, включающие 5 базовых факторов шкалы GRACE. Для повышения точности прогноза структуру моделей пошагово дополняли новыми предикторами, выделенными на первом этапе исследования, при условии статистически значимого различия на уровне p<0,01. Прогностическая значимость предиктора подтверждалась, если после его включения в модель значение AUC возрастало. На этом этапе методом SHAP анализировали степень влияния предикторов лучшей модели на конечную точку исследования.
На третьем этапе непрерывные предикторы кате-горизировали с помощью различных методов для выделения пороговых значений, отклонение от которых позволяет отнести их к факторам риска ВГЛ.
На четвертом этапе исследования разрабатывали прогностические модели ВГЛ на основе категориальных предикторов и оценивали степень их влияния на конечную точку.
Результаты
На первом этапе исследования был проведен межгрупповой анализ клинико-демографических и лабораторных показателей. Большинство из них, в том числе все предикторы шкалы GRACE, имели статистически значимые различия (см. табл. 1). Среди умерших преобладали лица старшего возраста, женского пола и более низкого роста. Кроме того, для пациентов 1-й группы было характерно наличие III и IV класса ОСН по T. Killip; меньшие значения САД, ДАД, ФВ ЛЖ, LYM, EOS, ПТИ, RBC, Hb; более высокие уровни ЧСС, СДЛА, КСР ЛЖ, креатинина, NEUT, АЧТВ, МНО, мочевины, глюкозы; увеличение размеров пред-
сердий и показателя ОИММ ЛЖ. У них же чаще фиксировали передний инфаркт миокарда, сахарный диабет 2-го типа (СД 2), фибрилляцию предсердий (ФП) и хроническую болезнь почек (ХБП).
На втором этапе исследования были разработаны прогностические модели ВГЛ, где помимо пяти базовых показателей шкалы GRACE в непрерывной форме использовали новые факторы. Последние были выделены в результате итерационного тестирования пула потенциальных предикторов, полученных на первом этапе. Для выполнения процедур тестирования каждый из потенциальных предикторов поочередно включали в базовую модель шкалы GRACE и оставляли в модели только тот, который обеспечивал максимальное увеличение метрики AUC. На следующих итерациях процедуру повторяли для оставшихся потенциальных предикторов. Таким образом, было выделено 5 новых прогностических факторов, к которым относились показатели ФВ ЛЖ, NEUT, EOS, PCT и глюкоза. Необходимо также отметить, что сопоставление значений AUC модели, разработанной нами ранее [23], на этой же выборке больных с использованием только предикторов шкалы GRACE и модели, дополненной новыми предикторами, демонстрировало более высокую точность последней (AUC — 0,836 vs. 0,9).
Сравнение предсказательной ценности моделей, разработанных методами МЛР СГБ и СЛ, показало, что они обладают высокой прогностической способностью и имеют близкие значения метрик качества при кросс-валидации и итоговом тестировании (AUC варьировала от 0,884 до 0,900). Это свидетельствует об отсутствии их переобучения и хороших обобщающих свойствах (табл. 2).
Оценка степени влияния непрерывных предикторов на конечную точку методом SHAP показала, что наиболее тесную ассоциацию с ВГЛ имеют ФВ ЛЖ и
Таблица 2
Оценка точности прогностических моделей внутригоспитальной летальности у больных инфарктом миокарда с подъемом сегмента ST после чрескожного коронарного вмешательства с использованием предикторов в непрерывной форме, Ме [01; Q3]
Метрики Кросс-валидация Итоговое тестирование
МЛР СГБ СЛ МЛР СГБ СЛ
AUC 0,9 [0,885; 0,916] 0,891 [0,871; 0,911] 0,885 [0,870; 0,900] 0,900 [0,841; 0,959] 0,892 [0,834; 0,951] 0,884 [0,824; 0,944]
Sen 0,843 [0,810; 0,877] 0,825 [0,779; 0,872] 0,796 [0,749; 0,843] 0,843 [0,715; 0,972] 0,824 [0,692; 0,957] 0,798 [0,672; 0,925]
Spec 0,836 [0,824; 0,849] 0,816 [0,797; 0,835] 0,806 [0,784; 0,828] 0,838 [0,807; 0,868] 0,819 [0,783; 0,855] 0,806 [0,766; 0,846]
PPV 0,165 [0,152; 0,178] 0,115 [0,131; 0,161] 0,136 [0,124; 0,148] 0,168 [0,141; 0,194] 0,150 [0,125; 0,175] 0,138 [0,101; 0,167]
NPV 0,993 [0,992; 0,995] 0,992 [0,990; 0,994] 0,991 [0,989; 0,993] 0,993 [0,987; 0,999] 0,992 [0,986; 0,998] 0,991 [0,985; 0,996]
F1-score 0,275 [0,256; 0,295] 0,248 [0,226; 0,27] 0,231 [0,214; 0,249] 0,278 [0,239; 0,317] 0,253 [0,215; 0,291] 0,235 [0,189; 0,28]
Нейтрофилы — 1535 фракция выброса левого желудочка — 2,10 Возраст — 0,83 Креатинин — 1,94 Частота сердечных сокращений — 1,35 Эозинофилы — 1,01 Глюкоза —1,31 Тромбокрит — 0,57 Класс ОСН по Т. КИНр — 0,41 Систолическое артериальное давление — 0,91
High
ф э
•а >
9>
а ф Й-,
0 1 2 SHAP valué (impact on model output)
Low
Рис. 1. Оценка важности предикторов внутригоспитальной летальности в непрерывной форме в модели многофакторной логистической регрессии
креатинин. Менее заметное воздействие на данную точку оказывали ЧСС, NEUT и глюкоза крови, а наименьшее влияние на конечную точку демонстрировали показатели EOS, САД, возраст больных, PCT и класс ОСН по T. Killip (рис. 1).
На третьем этапе исследования выполняли категоризацию предикторов ВГЛ в непрерывной форме методами поиска оптимального порога отсечения на сетке, методом SHAP и с помощью расчета центроида. Использование пороговых значений, отклонение от которых ассоциируется с увеличением вероятности ВГЛ, позволяет рассматривать катего-ризованные данные как факторы риска неблагоприятных событий. Фактор риска кодируется как «1», если значение предиктора превышает порог с постфиксом «+» или не достигает порога с постфиксом «-», в остальных случаях, когда значение предикто-
ра находится в другом диапазоне, фактор риска кодируется как «0».
Результаты исследования показали, что пороговые значения, полученные различными методами, часто отличались между собой. Так, например, порог отсечения для показателя ФВ ЛЖ по версии SHAP составлял <45%, в то время как при максимизации ОШ и АиС точка отсечения фиксировалась на уровне 31 и 51% соответственно (табл. 3). В то же время пороговые значения, определенные алгоритмом SHAP, были ближе всего к критериальным границам, верифицированным методом Мт(р). Пороговые значения, полученные методом Мах(ОШ), имели экстремальный порог отсечения и позволяли идентифицировать только узкую группу лиц с высокой вероятностью ВГЛ. Необходимо отметить, что метод SHAP дает возможность не только определить пороговые границы, но и
Таблица 3
Категоризация непрерывных предикторов внутригоспитальной летальности с помощью различных методов
Предиктор Метод Фактор риска Р ОШ (95% ДИ) AUC
Мах(ОШ) 46+ <0,00001 10,7 (3,4-33,6) 0,542
Мт(р) 70+ <0,00001 4,11 (3,26-5,19) 0,655
Возраст Мах(АиС) 65+ <0,00001 3,73 (2,92-4,77) 0,658
Центроид 66,5+ <0,00001 3,65 (2,87-4,63) 0,650
SHAP 71 + <0,00001 4,11 (3,26-5,19) 0,655
Мах(ОШ) 60- <0,00001 31,5 (10,9-91,4) 0,523
Мт(р) 92- <0,00001 11,0 (8,3-14,7) 0,613
САД Мах(АиС) 112- <0,00001 5,3 (4,2-6,8) 0,685
Центроид 120- <0,00001 4,8 (3,8-6,0) 0,676
SHAP 95- <0,00001 11,6 (8,7-15,4) 0,638
Мах(ОШ) 150+ <0,00001 41,60 (4,32-401,16) 0,506
Min(p) 95+ <0,00001 6,17 (4,82-7,89) 0,65
ЧСС Мах(АиС) 82+ <0,00001 4,54 (3,60-5,73) 0,669
Центроид 79+ <0,00001 3,96 (3,13-5,02) 0,665
SHAP 89+ <0,00001 5,5 (4,3-7,0) 0,663
Мах(ОШ) 4 <0,00001 9,60 (7,41-12,40) 0,662
Min(p) 4 <0,00001 9,60 (7,41-12,40) 0,662
Класс ОСН Мах(АиС) 3+ <0,00001 7,08 (5,59-8,99) 0,711
Центроид 3+ <0,00001 7,08 (5,59-8,99) 0,711
SHAP 3+ <0,00001 7,08 (5,59-8,99) 0,711
Мах(ОШ) 427,0+ <0,00001 30,5 (10,2-91,7) 0,518
Min(p) 188,6+ <0,00001 13,1 (9,4-18,0) 0,625
Креатинин, Мах(АиС) 122,9+ <0,00001 5,8 (4,5-7,4) 0,701
Центроид 113,3+ <0,00001 4,6 (3,6-6,0) 0,693
SHAP 166+ <0,00001 10,0 (7,5-13,4) 0,645
Мах(ОШ) 94,2+ <0,00001 23,0 (4,6-114,8) 0,513
Min(p) 78,8+ <0,00001 9,1 (6,6-12,5) 0,730
NEUT, % Мах(АиС) 75+ <0,00001 11,3 (7,8-16,2) 0,774
Центроид 74,0+ <0,00001 9,9 (6,9-14,4) 0,751
SHAP 77+ <0,00001 11,3 (7,8-16,2) 0,774
Мах(ОШ) 1,3- <0,00001 9,8 (5,3-18,1) 0,666
Min(p) 0,3- <0,00001 7,9 (5,6-11,0) 0,741
EOS, % Мах(АиС) 0,3- <0,00001 7,9 (5,6-11,0) 0,741
Центроид 0,5- <0,00001 7,6 (5,2-11,1) 0,722
SHAP 0,2- <0,00001 6,9 (5,0-9,4) 0,712
Мах(ОШ) 31,0- <0,00001 19,7 (12,1-32,1) 0,594
Min(p) 31,0- <0,00001 19,7 (12,1-32,1) 0,594
ФВ ЛЖ, % Мах(АиС) 51- <0,00001 4,9 (3,5-6,7) 0,69
Центроид 51- <0,00001 4,9 (3,5-6,7) 0,69
SHAP 45- <0,00001 5,9 (4,3-8,1) 0,648
Мах(ОШ) 0,36+ <0,00001 4,5 (2,7-7,4) 0,524
Min(p) 0,36+ <0,00001 4,5 (2,7-7,4) 0,524
PCT, % Мах(АиС) 0,22+ 0,00002 1,8 (1,4-2,4) 0,598
Центроид 0,21 + 0,0009 1,6 (1,2-2,1) 0,576
SHAP 0,32+ 0,00002 1,8 (1,4-2,4) 0,598
Окончание табл. 3
Предиктор Метод Фактор риска p ОШ (95% ДИ) AUC
Мах(ОШ) 31+ 0,002 , 44,8 (4,0-496,5) 0,505
Min(p) 8,4+ <0,00001 5,2 (3,9-7,1) 0,62
ЛЮК03,а' Max(AUC) 6,5+ <0,00001 4,9 (3,6-6,8) 0,689
Центроид 6,9+ <0,00001 5,0 (3,6-6,7) 0,688
SHAP 8,9+ <0,00001 4,7 (3,5-6,4) 0,631
3
та о,5 >
IX < 0,0 к
<Л
ihjiiüifi
дач
.1 . 11 ' :'ilimil|Hflf!tt ■ ■ ■ > i ' ■ ■ ' . . , . ...... i, , , , ■'
в) 3
■я
<
я
сл
<11 3
та
>
< х
(Л
0,0
50 60 70
Возраст, лет
ф
о. <
к
сл
r^- * ™
1М
40 60 80 100 120 140 160
Частота сердечных сокращений в минуту
i 1 í ill l Ф 3 та 0,25 ■ > & 0,00 ■ X Iл
■! k lu. -1- !
—i—i— i .....i Sr'1"11' —1—.—1—1—í—1—1—.—1— ■i l ■ 1 ■ 1 ■ 1
50 100 150 200 250
Систолическое артериальное давление, мм рт.ст
0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0
Класс ОСН по T. Killip
<u 3 2-
■у
> \ -
о.
< 0:
(Л
■ 1
*МИЙМИ*М ..... —А
41 3
та
>
а. <
X
•
1
20 30 40 50 60 70 80
фракция выброса левого желудочка, %
О 200 400 600 800 1000 1200 1400
Креатинин, мкмоль/л
№
<
К
сл
i н ЦП м '
Нейтрофилы, %
О 2 4 6 8 10 12 14 16
Эозинофилы, %
Ф "к -
т* : • 1 1 Ъ о- А
-л < и I сл 1 1 1 1 гГ М ' ■ ■ 1 ■ ' ■ ■ 1
0,0 0,2 0,4 0,6 0,8
Тромбокрит, %
О 5 10 15 20 25 30 35 40
Глюкоза, ммоль/л
Рис. 2. Оценка влияния непрерывных показателей и их пороговых значений на конечную точку по методу SHАР
Пунктирная линия обозначает порог отсечения
оценить интенсивность влияния на ВГЛ показателей, значения которых находятся в «зоне риска». К категориальным факторам, выделенным этим методом, относились следующие признаки: возраст >70 лет, ЧСС >89 в минуту, САД <95 мм рт.ст., класс ОСН по Т. Killip >II, креатинин >166 мкмоль/л, ФВ ЛЖ <45%, NEUT >77%, EOS <0,2%, PCT >0,32%, глюкоза >8,9 ммоль/л (рис. 2). На примере диаграммы ФВ ЛЖ видно, что вероятность ВГЛ последовательно увеличивается в диапазоне значений 44-31% и резко возрастает при уровне данного показателя <30%. Повышение кон-
центрации глюкозы в крови более 8,9 ммоль/л увеличивает риск ВГЛ, но вероятность фатального исхода значительно возрастает при ее уровне более 17 ммоль/л.
На четвертом этапе исследования на основе МЛР были разработаны прогностические модели ВГЛ с предикторами в категориальной форме (табл. 4). Сравнительный анализ показал, что большинство моделей обладают высокой предиктивной способностью вне зависимости от метода определения пороговых значений. Исключение составила модель, в которой
Таблица 4
Оценка точности прогностических моделей внутригоспитальной летальности на основе предикторов в категориальной форме, Me [Q1; Q3]
Метрики SHAP Мшф) Мax(AUC) М^ОШ) Центроиды
AUC 0,885 [0,882; 0,887] 0,876 [0,873; 0,879] 0,896 [0,893; 0,898] 0,662 [0,658; 0,666] 0,888 [0,885; 0,890]
Sen 0,815 [0,809; 0,821] 0,815 [0,809; 0,821] 0,815 [0,809; 0,821] 0,296 [0,289; 0,304] 0,815 [0,808; 0,821]
Spec 0,825 [0,823; 0,826] 0,826 [0,824; 0,828] 0,821 [0,819; 0,822] 0,962 [0,961; 0,962] 0,823 [0,822; 0,825]
PPV 0,149 [0,148; 0,150] 0,147 [0,116; 0,178] 0,148 [0,147; 0,149] 0,240 [0,235; 0,245] 0,150 [0,149; 0,151]
NPV 0,991 [0,991; 0,992] 0,991 [0,991; 0,992] 0,991 [0,991; 0,992] 0,973 [0,973; 0,973] 0,991 [0,991; 0,992]
F1-score 0,250 [0,248; 0,252] 0,251 [0,250; 0,253] 0,251 [0,250; 0,253] 0,271 [0,265; 0,277] 0,254 [0,252; 0,256]
Нейтрофилы >77% (1,20) Эозинофилы <0,2% (0,58) Частота сердечных сокращений >89 в мивуту (1,28) фракция выброса левого желудочка <45% (1,02) Возраст >71 год (0,62) Глюкоза >8,9 ммоль/л (1,10) Креатинин >166мкмоль/л (1,27) Класс ОСН по T. Killip >з (0,98) Систолическое артериальное давление <95ммрт.ст. (0,82)
Тромбокрит >0,32% (0,14)
ч *
ч
I
t
High
-0,5 0,0 0,5 1,0 SHAP value (impact on mode] output)
Low
Рис. 3. Оценка важности предикторов внутригоспитальной летальности в категориальной форме в модели многофакторной логистической регрессии
категоризация предикторов выполнялась методом Мах(ОШ), что не обеспечивало приемлемую точность прогноза (АиС — 0,662). Оценка метрик качества моделей с категориальными и непрерывными предикторами демонстрировала отсутствие статистически значимых различий. Например, 95% ДИ для медиан АиС
в анализируемых моделях составлял 0,882-0,887 и 0,841-0,959 соответственно при р=0,172, что указывает на их сопоставимую прогностическую точность.
Анализ влияния категориальных переменных на ВГЛ методом SHAP показал, что наибольшее воздействие на ВГЛ оказывают следующие факторы риска:
ЧСС >89 в минуту, креатинин >166 мкмоль/л и содержание нейтрофилов >77% (значения SHAP — 1,28; 1,27 и 1,20 соответственно) (рис. 3). Меньшая ассоциация с конечной точкой наблюдалась у показателей глюкозы >8,9 ммоль/л, ФВ ЛЖ <45%, III и IV класса ОСН по T. Killip, САД <95 мм рт.ст. (SHAP — 1,10; 1,02; 0,98; 0,82 соответственно), а наименее заметное влияние на ВГЛ оказывали возраст >71 год, содержание эозинофилов <0,2% и тромбокрит >0,32% (SHAP — 0,62; 0,58 и 0,14).
Обсуждение
В последние годы на основе методов машинного обучения разрабатываются прогностические модели, структура которых представлена факторами с более высоким предиктивным потенциалом, чем в классических шкалах рискометрии. Перспективными инструментами для их отбора являются алгоритмы объяснимого искусственного интеллекта (ОИИ), к элементам которого относят определение пороговых значений анализируемых факторов и оценку степени их влияния на конечную точку исследования. Концепция ОИИ базируется на возможности обоснования и интерпретации тех или иных решений, полученных в результате моделирования, оценке их значимости и точности генерируемых заключений [24]. Одним из барьеров для реализации указанных принципов является многофакторность и нелинейность прогностических моделей, когда на конечную точку влияет совокупность разнородных данных, ассоциированных с различными причинами фатальных событий. Непрозрачность взаимосвязей различных факторов с ВГЛ может быть частично преодолена за счет их категоризации, что позволяет детализировать соотношения показателей клинико-функционального статуса больных ИМпST с результирующей переменной. По данным литературы, наиболее доступным методом категоризации является дескриптивная статистика с расчетом медиан, квартилей или квантилей [16, 25, 26]. Вместе с тем большая часть критических замечаний по категоризации связана именно с этим подходом, что обусловлено прежде всего зависимостью таких пороговых значений от конкретной выборки, отсутствием взаимосвязи с клиническим контекстом, игнорированием возможных нелинейных отношений и др. Другой подход основан на выделении порогового значения, известного из практики как выход за пределы нормы [26]. Альтернативным методом является поиск оптимальных пороговых значений на основе минимизации или максимизации целевых функций. По нашему мнению, категоризация переменных должна рассматриваться только в рамках решения конкретной клинической задачи, хотя выделенные предикторы могут представлять интерес для реализации других прогностических исследований. Каким бы методом ни определялись их пороговые значения, с одной стороны, они могут приводить к потере информации, а с другой — при-
вносить новые знания. В настоящей работе пороговые значения определяли методами поиска на сетке оптимальных точек отсечения, расчета центроидов и аддитивного объяснения Шепли ^НАР). Отклонение показателей от пороговых значений повышало их пре-диктивный потенциал и позволяло отнести к факторам риска ВГЛ у больных ИМпST после ЧКВ. Было установлено, что метод аддитивного объяснения Шепли, который рассматривают как технологию ОИИ, является перспективным инструментом категоризации за счет точного определения порогов отсечения и анализа взаимосвязи предикторов в непрерывной и категориальной формах с конечной точкой исследования. Несмотря на сопоставимую точность прогностических моделей ВГЛ с непрерывными и категориальными предикторами, имели место определенные различия в интенсивности их влияния на конечную точку. Так, наибольшую взаимосвязь с фатальным исходом среди непрерывных предикторов демонстрировали показатели ФВ ЛЖ и креатинин, а наименьшую — класс ОСН по Т. КННр и возраст больных. Среди категориальных предикторов более заметной была ассоциация ВГЛ с ЧСС >89 в минуту, креатинином >166 мкмоль/л и уровнем нейтрофилов >77%, а минимальная — с тромбо-критом >32% и содержанием эозинофилов <0,2%. Эти различия могут объясняться конечной точкой исследования, представленной в форме ВГЛ от всех причин, что не позволяет верифицировать предикторы, связанные с конкретным вариантом неблагоприятного исхода (повторный инфаркт миокарда, фатальные аритмии, кровотечения и др.). Другая причина несовпадения важности предикторов могла быть связана с тем, что в нашем исследовании их категоризация выполнялась с выделением только одного порога отсечения. Наличие единственной критериальной границы ограничивает возможности для оценки нелинейных взаимосвязей ВГЛ со значениями предикторов, находящихся в «зоне риска». Убедительным примером такой ситуации является резкое повышение вероятности ВГЛ при ФВ ЛЖ менее 30% по сравнению с диапазоном ее значений 31-44% (см. рис. 2). В нашем случае предиктор ФВ ЛЖ <45% уступал по важности показателям ЧСС >89 в минуту и креатинину >166 мкмоль/л в прогностической модели ВГЛ с категориальными факторами, при этом данный предиктор указывал, что преодоление выделенной в процессе дихотоми-зации критериальной границы ассоциируется с возрастающим риском неблагоприятного исхода. В последние годы с целью повышения точности прогноза категоризацию переменных рекомендуют проводить с использованием нескольких порогов отсечения, что конкретизирует нелинейные взаимосвязи предикторов с конечной точкой [19]. Результаты нашего исследования свидетельствуют о том, что несмотря на определенные проблемы, связанные с дихотомизацией непрерывных переменных прогностических моделей, ее проведение является целесообразным, так как расширяет возможности для объяснения и клинической
оригинальные исследования
интерпретации генерируемых заключений. При этом очевидна необходимость совершенствования данного подхода за счет применения технологий многоуровневой категоризации.
Ограничения исследования связаны с его ретроспективным характером, использованием для категоризации непрерывных переменных только метода ди-хотомизации, необходимостью валидации моделей на данных из других лечебных учреждений.
Заключение
В настоящем исследовании были выделены и ва-лидированы новые предикторы внутригоспиталь-ной летальности у больных инфарктом миокарда с подъемом сегмента ST после чрескожного коронарного вмешательства, выполнена их категоризация и разработаны прогностические модели с непрерывными и категориальными переменными на основе методов многофакторной логистической регрессии, случайного леса и стохастического градиентного бустинга. Данные модели имели высокую и сопоставимую точность прогноза, но их предикторы отличались различной степенью влияния на конечную точку. Сравнительный анализ показал, что метод аддитивного объяснения Шепли имеет преимущества при категоризации предикторов и позволяет детализировать структуру их взаимосвязей с внутригоспитальной летальностью. Для совершенствования прогностических моделей с категориальными предикторами целесообразно использование многоуровневых порогов отсечения, повышающих качество и объяснимость генерируемых заключений.
Источник финансирования. Исследование выполнено при финансовой поддержке гранта Российского научного фонда №23-21-00250, https://rscf.ru/ project/23-21-00250/.
Конфликт интересов. Авторы декларируют отсутствие явных и потенциальных конфликтов интересов, связанных с публикацией настоящей статьи.
Литература/References
1. Ibanez В., James S., Agewall S., Antunes M.J., Bucciarelli-Ducci C., Bueno H., Caforio A.L.P., Crea F., Goudevenos J.A., Halvorsen S., Hindricks G., Kastrati A., Lenzen M.J., Prescott E., Roffi M., Valgimigli M., Varenhorst C., Vranckx P., Widimsky P.; ESC Scientific Document Group. 2017 ESC Guidelines for the management of acute myocardial infarction in patients presenting with ST-segment elevation: The Task Force for the management of acute myocardial infarction in patients presenting with ST-segment elevation of the European Society of Cardiology (ESC). Eur Heart J 2018; 39(2): 119-177, https://doi. org/10.1093/eurheartj/ehx393.
2. Pfuntner A., Wier L.M., Stocks C. Most frequent procedures performed in U.S. hospitals, 2011. In: Healthcare Cost and Utilization Project (HCUP) Statistical Briefs.
Rockville (MD): Agency for Healthcare Research and Quality (US); 2014.
3. Wang J.J., Fan Y., Zhu Y., Zhang J.D., Zhang S.M., Wan Z.F., Su H.L., Jiang N. Biomarkers enhance the long-term predictive ability of the KAMIR risk score in Chinese patients with ST-elevation myocardial infarction. Chin Med J (Engl) 2019; 132(1): 30-41, https://doi.org/10.1097/ cm9.0000000000000015.
4. Liu X.J., Wan Z.F., Zhao N., Zhang Y.P., Mi L., Wang X.H., Zhou D., Wu Y., Yuan Z.Y. Adjustment of the GRACE score by HemoglobinA1c enables a more accurate prediction of long-term major adverse cardiac events in acute coronary syndrome without diabetes undergoing percutaneous coronary intervention. Cardiovasc Diabetol 2015; 14: 110, https://doi.org/10.1186/s12933-015-0274-4.
5. Chen X., Shao M., Zhang T., Zhang W., Meng Y., Zhang H., Hai H., Li G. Prognostic value of the combination of GRACE risk score and mean platelet volume to lymphocyte count ratio in patients with ST-segment elevation myocardial infarction after percutaneous coronary intervention. Exp Ther Med 2020; 19(6): 3664-3674, https://doi.org/10.3892/ etm.2020.8626.
6. Wenzl F.A., Kraler S., Ambler G., Weston C., Herzog S.A., Räber L., Muller O., Camici G.G., Roffi M., Rickli H., Fox K.A.A., de Belder M., Radovanovic D., Deanfield J., Lüscher T.F. Sex-specific evaluation and redevelopment of the GRACE score in non-ST-segment elevation acute coronary syndromes in populations from the UK and Switzerland: a multinational analysis with external cohort validation. Lancet 2022; 400(10354): 744-756, https:// doi.org/10.1016/s0140-6736(22)01483-0.
7. Li R., Shen L., Ma W., Yan B., Chen W., Zhu J., Li L., Yuan J., Pan C. Use of machine learning models to predict inhospital mortality in patients with acute coronary syndrome. Clin Cardiol 2023; 46(2): 184-194, https://doi.org/10.1002/ clc.23957.
8. Zack C.J., Senecal C., Kinar Y., Metzger Y., Bar-Sinai Y., Widmer R.J., Lennon R., Singh M., Bell M.R., Lerman A., Gulati R. Leveraging machine learning techniques to forecast patient prognosis after percutaneous coronary intervention. JACC Cardiovasc Interv 2019; 12(14): 1304-1311, https://doi. org/10.1016/j.jcin.2019.02.035.
9. Du X., Wang H., Wang S., He Y., Zheng J., Zhang H., Hao Z., Chen Y., Xu Z., Lu Z. Machine learning model for predicting risk of in-hospital mortality after surgery in congenital heart disease patients. Rev Cardiovasc Med 2022; 23(11): 376, https://doi.org/10.31083/j.rcm2311376.
10. Zhao P., Liu C., Zhang C., Hou Y., Zhang X., Zhao J., Sun G., Zhou J. Using machine learning to predict the inhospital mortality in women with ST-segment elevation myocardial infarction. Rev Cardiovasc Med 2023; 24(5): 126, https://doi.org/10.31083/j.rcm2405126.
11. MacCallum R.C., Zhang S., Preacher K.J., Rucker D.D. On the practice of dichotomization of quantitative variables. Psychol Meth 2002; 7(1): 19-40, https://doi.org/10.1037/1082-989x.7.1.19.
12. Gupta R., Day C.N., Tobin W.O., Crowson C.S. Understanding the effect of categorization of a continuous predictor with application to neuro-oncology. Neurooncol Pract 2021; 9(2): 87-90, https://doi.org/10.1093/nop/npab049.
13. Гельцер Б.И., Шахгельдян К.И., Рублев В.Ю., Дом-жалов И.Г., Циванюк М.М., Шекунова О.И. Фенотипи-рование факторов риска и прогнозирование внутригоспи-
тальной летальности у больных ишемической болезнью сердца после коронарного шунтирования на основе методов объяснимого искусственного интеллекта. Российский кардиологический журнал 2023; 28(4): 5302, https://doi.org/ 10.15829/1560-4071-2023-5302.
Geltser B.I., Shakhgeldyan K.I., Rublev V.Yu., Domzhalov I.G., Tsivanyuk M.M., Shekunova O.I. Phenotyping of risk factors and prediction of inhospital mortality in patients with coronary artery disease after coronary artery bypass grafting based on explainable artificial intelligence methods. Rossijskij kardiologiceskij zurnal 2023; 28(4): 5302, https://doi. org/10.15829/1560-4071-2023-5302.
14. Dawson N.V., Weiss R. Dichotomizing continuous variables in statistical analysis: a practice to avoid. Med Decis Making 2012; 32(2): 225-226, https://doi. org/10.1177/0272989x12437605.
15. Salis Z., Gallego B., Sainsbury A. Researchers in rheumatology should avoid categorization of continuous predictor variables. BMC Med Res Methodol 2023; 23(1): 104, https://doi.org/10.1186/s12874-023-01926-4.
16. Altman D.G., Royston P. The cost of dichotomising continuous variables. BMJ 2006; 332(7549): 1080, https://doi. org/10.1136/bmj.332.7549.1080.
17. Austin P.C., Brunner L.J. Inflation of the type I error rate when a continuous confounding variable is categorized in logistic regression analyses. Stat Med 2004; 23(7): 1159-1178, https://doi.org/10.1002/sim.1687.
18. Streiner D.L. Breaking up is hard to do: the heartbreak of dichotomizing continuous data. Can J Psychiatr 2002; 47(3): 262-266, https://doi.org/10.1177/070674370204700307.
19. von Elm E., Altman D.G., Egger M., Pocock S.J., G0tzsche P.C., Vandenbroucke J.P.; STROBE Initiative. The Strengthening the Reporting of Observational Studies Epidemiology (STROBE) statement: guidelines for reporting observational studies. Lancet 2007; 370(9596): 1453-1457, https://doi.org/10.1016/s0140-6736(07)61602-x.
20. Гельцер Б.И., Шахгельдян К.И., Домжалов И.Г., Куксин Н.С., Кокарев Е.А., Пак Р.Л. Прогностическая оценка клинико-функционального статуса пациентов с инфарктом миокарда с подъемом сегмента ST после чре-скожного коронарного вмешательства. Свидетельство о регистрации базы данных 2023622740, 10.08.2023. Заявка №2023622516 от 28.07.2023.
Bel'tser B.I., Shakhgel'dyan K.I., Domzhalov I.G.,
Kuksin N.S., Kokarev E.A., Pak R.L. Prognosticheskaya otsenka kliniko-funktsional'nogo statusa patsientov s infarktom miokarda s pod"emom segmenta ST posle chreskozhnogo koronarnogo vmeshatel'stva. Svidetel'stvo o registratsii bazy dannykh 2023622740, 10.08.2023. Zayavka No.2023622516 ot 28.07.2023 [Prognostic assessment of the clinical and functional status of patients with ST-segment elevation myocardial infarction after percutaneous coronary intervention. Database registration certificate 2023622740, October 8, 2023. Application No.2023622516 dated August 28, 2023].
21. Valente F., Henriques J., Paredes S., Rocha T., de Carvalho P., Morais J. A new approach for interpretability and reliability in clinical risk prediction: acute coronary syndrome scenario. Artif Intell Med 2021; 117: 102113, https://doi. org/10.1016/j.artmed.2021.102113.
22. Lundberg S.M., Lee S.I. A unified approach to interpreting model predictions. In: Advances in neural information processing systems. arXiv; 2017, https://doi. org/10.48550/arxiv. 1705.07874.
23. Гельцер Б.И., Шахгельдян К.И., Домжалов И.Г., Куксин Н.С., Кокарев Е.А., Котельников В.Н., Рублев В.Ю. Прогнозирование внутригоспитальной летальности у больных острым инфарктом миокарда с подъемом сегмента ST после чрескожного коронарного вмешательства. Российский кардиологический журнал 2023; 28(6): 5414, https://doi.org/10.15829/1560-4071-2023-5414.
Geltser B.I., Shahgeldyan K.I., Domzhalov I.G., Kuksin N.S., Kokarev E.A., Kotelnikov V.N., Rublev V.Yu. Prediction of inhospital mortality in patients with ST-segment elevation acute myocardial infarction after percutaneous coronary intervention. Rossijskij kardiologiceskij zurnal 2023; 28(6): 5414, https://doi. org/10.15829/1560-4071-2023-5414.
24. Molnar C. Interpretable machine learning. A guide for making black box models explainable. 2023. URL: https:// christophm.github.io/interpretable-ml-book/.
25. Mabikwa O.V., Greenwood D.C., Baxter P.D., Fleming S.J. Assessing the reporting of categorised quantitative variables in observational epidemiological studies. BMC Health Serv Res 2017; 17(1): 201, https://doi. org/10.1186/s12913-017-2137-z.
26. Turner E.L., Dobson J.E., Pocock S.J. Categorisation of continuous risk factors in epidemiological publications: a survey of current practice. Epidemiol Perspect Innov 2010; 7: 9, https://doi.org/10.1186/1742-5573-7-9.
/ту/ттту/тттттту/ттту/ттту/ттттт^.