Научная статья на тему 'Многофакторный анализ в клинической медицине'

Многофакторный анализ в клинической медицине Текст научной статьи по специальности «Клиническая медицина»

CC BY
11
3
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Анестезиология и реаниматология
Scopus
ВАК
CAS
PubMed
Область наук
Ключевые слова
многофакторный анализ / отношение шансов / относительный риск / отношение рисков / регрессионный анализ / номограмма / multivariate analysis / odds ratio / relative risk / hazard ratio / regression analysis / nomogram

Аннотация научной статьи по клинической медицине, автор научной работы — М Я. Ядгаров, Л Б. Берикашвили, К К. Каданцева, А Н. Кузовлев, С Н. Переходов

Чтобы оценить влияние множества взаимодействующих факторов на изучаемый исход, правильно выделить независимые предикторы и интерпретировать полученные результаты, необходимо использовать методы многофакторного статистического анализа. Настоящая работа посвящена обоснованию важности проведения многофакторного анализа и описанию основных параметров, используемых для оценки влияния предикторов в многофакторном анализе. Статья предназначена врачам и научным сотрудникам, делающим первые шаги на научном поприще.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по клинической медицине , автор научной работы — М Я. Ядгаров, Л Б. Берикашвили, К К. Каданцева, А Н. Кузовлев, С Н. Переходов

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Multivariate analysis in clinical medicine

Multivariate analysis is used to assess the influence of multiple factors on certain outcome, correctly identify independent predictors and interpret scientific results. In this manuscript, the authors emphasize an importance of multivariate analysis and describe the main parameters of this statistical approach. The article is intended for physicians and young researchers.

Текст научной работы на тему «Многофакторный анализ в клинической медицине»

Анестезиология и реаниматология 2021, №5, с. 64-70

https://doi.org/10.17116/anaesthesiology202105164

Russian Journal of Anaesthesiology and Reanimatology

2021, No. 5, pp. 64-70 https://doi.org/10.17116/anaesthesiology202105164

Многофакторный анализ в клинической медицине

© М.Я. ЯДГАРОВ1, Л.Б. БЕРИКАШВИЛИ1, К.К. КАДАНЦЕВА1, А.Н. КУЗОВЛЕВ1, С.Н. ПЕРЕХОДОВ2, В.В. ЛИХВАНЦЕВ1

'Научно-исследовательский институт общей реаниматологии им. В.А. Неговского ФГБНУ «Федеральный научно-клинический центр реаниматологии и реабилитологии» Минобрнауки России, Москва, Россия; 2МГМСУ им. А.И. Евдокимова, Москва, Россия

Чтобы оценить влияние множества взаимодействующих факторов на изучаемый исход, правильно выделить независимые предикторы и интерпретировать полученные результаты, необходимо использовать методы многофакторного статистического анализа. Настоящая работа посвящена обоснованию важности проведения многофакторного анализа и описанию основных параметров, используемых для оценки влияния предикторов в многофакторном анализе. Статья предназначена врачам и научным сотрудникам, делающим первые шаги на научном поприще.

Ключевые слова: многофакторный анализ, отношение шансов, относительный риск, отношение рисков, регрессионный анализ, номограмма.

ИНФОРМАЦИЯ ОБ АВТОРАХ:

Ядгаров М.Я. — https://orcid.org/0000-0003-3792-1682; e-mail: [email protected] Берикашвили Л.Б. — https://orcid.org/0000-0001-9267-3664; e-mail: [email protected] Каданцева К.К. — https://orcid.org/0000-0002-6593-8580;e-mail: [email protected] Кузовлев А.Н. — https://orcid.org/0000-0002-5930-0118; e-mail: [email protected] Переходов С.Н. — https://orcid.org/0000-0002-6276-2305; e-mail: [email protected] Лихванцев В.В. — https://orcid.org/0000-0002-5442-6950; e-mail: [email protected] Автор, ответственный за переписку: Ядгаров М.Я. — e-mail: [email protected]

КАК ЦИТИРОВАТЬ:

Ядгаров М.Я., Берикашвили Л.Б., Каданцева К.К., Кузовлев А.Н., Переходов С.Н., Лихванцев В.В. Многофакторный анализ в клинической медицине. Анестезиология и реаниматология. 2021;5:64-70. https://doi.org/10.17116/anaesthesiology202105164

Multivariate analysis in clinical medicine

© M.YA. YADGAROV1, L.B. BERIKASHVILI1, K.K. KADANTSEVA1, A.N. KUZOVLEV1, S.N. PEREHODOV2, V.V. LIKHVANTSEV1

'Federal Research and Clinical Center of Intensive Care Medicine and Rehabilitology, Moscow, Russia; 2A.I. Evdokimova Moscow State University of Medicine and Dentistry, Moscow, Russia

Multivariate analysis is used to assess the influence of multiple factors on certain outcome, correctly identify independent predictors and interpret scientific results. In this manuscript, the authors emphasize an importance of multivariate analysis and describe the main parameters of this statistical approach. The article is intended for physicians and young researchers.

Keywords: multivariate analysis, odds ratio, relative risk, hazard ratio, regression analysis, nomogram. INFORMATION ABOUT THE AUTHORS:

Yadgarov M.Ya. — https://orcid.org/0000-0003-3792-1682; e-mail: [email protected] Berikashvili L.B. — https://orcid.org/0000-0001-9267-3664; e-mail: [email protected] Kadantseva K.K. — https://orcid.org/0000-0002-6593-8580;e-mail: [email protected] Kuzovlev A.N. — https://orcid.org/0000-0002-5930-0118; e-mail: [email protected] Perehodov S.N. — https://orcid.org/0000-0002-6276-2305; e-mail: [email protected] Lihvantsev VV. — https://orcid.org/0000-0002-5442-6950; e-mail: [email protected] Corresponding author: Yadgarov M.Ya. — e-mail: [email protected]

TO CITE THIS ARTICLE:

Yadgarov MYa, Berikashvili LB, Kadantseva KK, Kuzovlev AN, Perehodov SN, Likhvantsev VV. Multivariate analysis in clinical medicine. Russian Journal of Anaesthesiology and Reanimatology = Anesteziologiya I Reanimatologiya. 2021;5:64-70. (In Russ.). https://doi.org/10.17116/anaesthesiology202105164

РЕЗЮМЕ

ABSTRACT

Введение

Методы одномерного анализа позволяют оценить влияние определенного фактора на риск развития некоторого события у пациентов. Тем не менее, для любого заболевания или патологического состояния характерно наличие множества влияющих на риск переменных и сложной сети причинно-следственных взаимосвязей. Лишь с появлением методов многофакторного анализа исследователям удалось более объективно оценивать не только влияние каждого прогностического фактора на риск, но и учитывать степень взаимодействия между предикторами. Все это имеет огромное значение для клинической практики. Разработка новых инструментов прикладного статистического анализа позволила проводить многофакторный анализ врачам, не обладающим специальными навыками программирования. Однако требуется четкое понимание сути регрессионного анализа и необходима правильная интерпретация рассчитанных откорректированных параметров оценки рисков.

Цель данной статьи — адаптация логики использования и интерпретации методов многофакторного анализа к потребностям начинающего клинициста-исследователя.

Анализ влияния немодифицируемых (возраст, пол и т.д.) и модифицируемых (используемый препарат, метод анестезии, операция и т.д.) факторов на исход лечения (летальность, частота развития осложнений, время пребывания в палате интенсивной терапии и т.д.)

Для количественной оценки степени влияния определенного фактора (предиктора) на изучаемый исход (событие) существует несколько параметров, отличающихся как областью применения, так и особенностями интерпретации. В медицинской статистике широко используется термин «относительный риск», являющийся отношением частоты исходов среди исследуемых, подвергшихся воздействию определенного фактора риска (exposed), к частоте исходов у пациентов контрольной группы (non-exposed). Однако внимательные читатели не могли не заметить, что в зарубежной литературе при оценке результатов одномерного и многофакторного анализа встречаются несколько очень похожих, на первый взгляд, понятий: отношение шансов (OR: odds ratio), относительный риск (RR: relative risk) и отношение рисков (HR: hazard ratio). К сожалению, некоторыми исследователями эти показатели отождествляются как по причине схожести аббревиатур, так и вследствие недостаточных знаний медицинской статистики. Так, W. Holcomb Jr. и соавт. (2001) обнаружили, что примерно 25% всех исследователей неверно интерпретируют отношение шансов как отношение рисков [1], и даже спустя 11 лет ситуация не изменилась: по свидетельству G. Tajeu и соавт. (2012), похожую ошибку все еще допускают 23,2% авторов [2].

Необходимо отдавать себе отчет в том, что отношение рисков, отношение шансов и относительный риск — это разные показатели, и, несмотря на то, что все они являются мерой эффекта факторов риска (воздействия) на вероятность (шансы или относительную частоту) наступления события, они различаются условиями применения, методиками расчета и особенностями в интерпретации (не всегда существенными для клинической практики).

Относительный риск. Относительный риск является удобным параметром, часто используемым в статистическом анализе бинарных исходов для сравнения риска развития события у пациентов, получающих лечение (или под-

вергшихся влиянию определенного фактора), и у пациентов контрольной группы. Главная особенность относительного риска состоит в простоте его интерпретации: если параметр равен 1, это говорит об отсутствии разницы в риске между группами, при наличии значений менее 1 считается, что в основной (экспериментальной) группе событие (исход) развивается реже (пациенты основной группы имеют меньший риск развития определенного исхода), в то время как значения более 1 говорят о большем риске возникновения события в основной группе. Относительный риск хорош именно для выявления различия между группами, когда частота события мала. Он позволяет при малой частоте события выявить существенное влияние фактора риска (или воздействия) на риск развития события, когда абсолютный прирост частоты события статистические методы не идентифицируют как значимый.

Предположим, у пациенток после радикальной операции по поводу рака молочной железы в условиях метода анестезии 1 риск рецидива составляет 25%, тогда как при использовании метода анестезии 2 аналогичный показатель составляет 15%. Для расчета относительного риска требуется провести несложное математическое действие: относительный риск (RR)=0,25/0,15=1,667. Это означает, что пациенты, оперированные в условиях анестезии 1, имеют в 1,667 раза больший риск развития рецидива опухоли, чем пациенты, оперированные в условиях анестезии 2. Этот расчет и есть то, что подразумевается под относительным риском.

Чтобы проиллюстрировать интерпретацию этого параметра, приведем следующий пример. Предположим, что относительный риск развития делирия у оперированных и неоперированных пациентов в отделении реанимации и интенсивной терапии (ОРИТ) оказался равным 2,7; 95% доверительный интервал (95% ДИ: 1,2—3,7), точный тест Фишера: _р=0,013. Это означает, что операция сама по себе в среднем повышает риск развития делирия в ОРИТ в 2,7 раза. Наличие доверительного интервала между 1,2 и 3,7 указывает на то, что у 95% оперированных пациентов диапазон риска развития делирия находится между 1,2—3,7. Точный критерий Фишера свидетельствует о наличии статистически значимого увеличения риска.

Параметр RR имеет и некоторые ограничения [3]. Во-первых, выборка должна быть репрезентативной. Во-вторых, RR является мерой относительного риска, а это значит, что две группы пациентов с вероятностью исхода 0,9 и 1,8% будут иметь тот же RR, что и две группы с вероятностью исхода 30 и 60% (RR=2). Таким образом, рассчитанный RR на уровне восприятия как бы несколько преувеличивает величину эффекта в первом случае и преуменьшает во втором. Однако нужно быть крайне внимательными в интерпретации полученных результатов. Так, если 0,9% прирост перевести на популяцию в несколько миллионов или десятков миллионов человек и посчитать абсолютный прирост в абсолютном числе пациентов, получится достаточно существенное количество. И в данной ситуации именно относительный риск заставит обратить на это внимание. В-третьих, существуют важные ограничения по дизайну исследования для возможности оценки относительного риска. Так, в исследованиях типа случай—контроль (case—control), в ретроспективных исследованиях или исследованиях с историческим контролем объективная оценка параметра RR является неинформативной [3].

Отношение шансов. Показатель OR характеризует величину эффекта, описывающего силу связи или зависимости между двумя величинами. И RR, и OR отражают эффект

Таблица 1. Данные (гипотетические) рандомизированного исследования: сравнение стратегий «On-pump» и «Off-pump» при операции аортокоронарного шунтирования

Table 1. Hypothetic data from a randomized trial: comparison of on-pump and off-pump coronary artery bypass grafting

Методика операции аортокоронарного _Исход__Всег0

шунтирования Умершие Выжившие

Off-pump 36 92 128

On-pump 58 72 130

Всего 94 164 258

фактора воздействия на событие, но в разных терминах: RR в терминах рисков (относительных частот/вероятностей), OR в терминах шансов (отношение числа пациентов, у которых развилось событие, к числу пациентов, у которых его не было, внутри одной группы). RR демонстрирует, во сколько раз больше риск (вероятность) развития события в основной группе по сравнению с контролем, а OR показывает, во сколько раз больше шансы развития события в основной группе по сравнению с контролем.

Следует отметить, что для большинства читателей провести различия между RR и OR достаточно сложно. Однако ряд важных ограничений в использовании RR не позволяет использовать этот показатель повсеместно, в то время как OR может быть рассчитан при любом дизайне исследования. Но в случае малой частоты исхода параметр RR может давать более важную информацию для исследователя.

Так как OR является симметричным относительно обоих событий и не отражает причинно-следственных связей, в случае исследований случай—контроль возможно использовать только этот параметр. По аналогии с RR, OR более 1 указывает на увеличение шансов среди пациентов основной группы в сравнении с больными контрольной группы, тогда как OR менее 1 указывает на уменьшение шансов.

Чтобы наглядно продемонстрировать разницу параметров ОР и OR, предлагаем следующий пример. Сравнивается госпитальная летальность пациентов, аортокоронарное шунтирование которым выполнялось в условиях Off-pump и On-pump. Частота летального исхода в группе Off-pump составила 36/128 (28,1%) по сравнению с 58/130 (44,6%) в группе On-pump (табл. 1, в данном примере эти цифры не являются результатами какого-либо реального исследования).

Показатель RR рассчитан как 0,28/0,45=0,62. Это означает, что риск летального исхода после операции аорто-коронарного шунтирования в условиях Off-pump составляет 62% от риска после операции аортокоронарного шунтирования в условиях On-pump. Иными словами, методика Off-pump снижает относительный риск на 38% (relative risk reduction, рассчитывается как 100%—62%).

Рассчитанный OR составит: (36*72)/(92х58)=0,48, и это означает, что шанс летального исхода при использовании методики Off-pump составляет 48% от шансов летального исхода при применении альтернативной методики. Иными словами, методика Off-pump снижает шанс летального исхода на 52% по сравнению с методикой On-pump. Таким образом, в приведенном примере использование RR как бы «занижает» степень уменьшения риска на 52%—38%=14%, что довольно существенно.

В каких ситуациях предпочтительно использование RR,

а в каких OR?

В случае, когда изучаемый исход является достаточно редким (как правило, частота менее 10%), значение OR

практически не отличается от значения RR, и эти два параметра могут быть взаимозаменяемыми [3]. По мере увеличения частоты исходов значения этих параметров все более расходятся. В ретроспективных исследованиях случай-контроль, где нет данных об общем количестве субъектов, подвергшихся действию определенного фактора, расчет RR может дать ложный результат, а потому рассчитывать данный показатель не рекомендуется. Напротив, в проспективных исследованиях, где известно общее число подверженных риску (количество пациентов, подвергшихся воздействию), можно использовать либо RR, либо OR. Важно отметить тот факт, что множественная логистическая регрессия, зачастую используемая в многофакторном анализе, рассчитывает именно скорректированные OR, а не RR.

Отношение рисков. Относительный риск и отношение шансов оценивают риски/шансы для исследуемых групп за весь период исследования. Параметр отношения рисков (HR) отличен от других тем, что он непосредственно связан не только с вероятностью, но и со временем наступления события. Параметр HR рассматривается, как правило, в тандеме с кривыми выживаемости. Например, в работе В. Вгиезке и соавт. (2019) авторы оценивают риск отдаленных летальных исходов у пациентов с гипо-, нормо- и ги-перкалиемией (рис. 1) [4]. На рис. 1 вертикальная ось соответствует вероятности выживания, а горизонтальная ось

Выживаемость после выписки, годы

Рис. 1. Кривые выживаемости пациентов после выписки из стационара в зависимости от уровня калия в крови при поступлении.

p<0,001 для сравнения показателей у пациентов с гиперкалиемией и пациентов других групп; p>0,1 для сравнения показателей у пациентов с гипо-калиемией и нормокалиемией (B. Brueske и соавт., 2019) [4].

Fig. 1. Survival curves for patients after discharge depending on blood potassium level at admission.

p<0.001 for comparison between patients with hyperkalemia and other groups; p>0.1 for comparison between patients with hypokalemia and normal blood potassium (B. Brueske et al., 2019) [4].

Таблица 2. Сравнительная характеристика параметров оценки влияния факторов на изучаемый исход Table 2. Parameters for assessing the influence of factors on the studied outcome

Параметр

Интерпретация

Ограничения

Временная шкала

RR

OR

HR

Эффект фактора воздействия на событие в терминах рисков Эффект фактора воздействия на событие в терминах шансов

Эффект влияния вмешательства на риск более раннего наступления изучаемого исхода

Исследование является репрезентативным для генеральной совокупности. Нельзя использовать в ретроспективных исследованиях и в исследованиях случай—контроль Исследование является репрезентативным для генеральной совокупности. Обычно может применяться везде. В случае,

когда изучаемый исход встречается достаточно часто (например, высокая летальность), может как бы «преувеличивать» вероятность в сравнении с RR Исследование является репрезентативным для генеральной совокупности. Скорость изменений — время убывания кривых выживаемости в двух группах — должна быть относительно сопоставимой

Не учитывается динамика риска во времени

Не учитывается динамика риска во времени

Привязка ко времени. Отражает динамику риска исследуемого события с течением времени

Примечание. OR — odds ratio (ОШ, отношение шансов); RR — relative risk (ОР, относительный риск); HR — hazard ratio (ОР*, отношение рисков).

отражает время (годы после выписки из стационара). Вероятность изучаемого события можно оценить, взяв ординату относительно той единицы времени, которая интересует читателя, или оценив количество событий за единицу времени.

Параметр отношения рисков (HR), рассчитанный в результате использования регрессионной модели пропорциональных рисков Кокса (регрессии Кокса) при сравнении пациентов с гиперкалиемией с другими пациентами составил 1,20 (95% ДИ: 1,08; 1,34),p<0,001. HR равный 1 указывает на отсутствие различий — для всех кривых выживаемости вероятность события является одинаковой в любой момент времени. В нашем случае результат интерпретируется следующим образом: риск пятилетнего летального исхода в 1,2 раза выше у пациентов, поступивших в ОРИТ с гиперкалиемией.

При оценке параметра HR делается допущение о том, что пропорция рисков сохраняется во времени. Сравнительная характеристика RR, OR и HR представлена в табл. 2.

При наличии данных о времени возникновения изучаемого исхода оценка параметра HR может быть предпочтительна, так как HR дает дополнительную информацию о времени возникновения исхода и о том, как изменяется риск во времени.

Необходимо отметить, что параметры RR и OR в одномерном анализе могут быть оценены как с использованием калькуляторов, так и в логистическом регрессионном анализе, в то время как многофакторный анализ и оценка отношения рисков могут быть проведены только с использованием методов мультифакторного анализа (propensity score matching, регрессионный анализ, а для оценки HR — только регрессионный анализ пропорциональных рисков Кокса).

Регрессионный анализ и метод propensity score matching. Методы многофакторного, или мультифакторного, анализа (от англ. — multivariate analysis) — те же методы одномерного анализа, но расширенные для возможности оценки взаимосвязи одной зависимой переменной отклика и n независимых переменных (влияющих факторов). Эти методы используются для оценки влияния двух и более факторов на изучаемый результат. В то время как одномерная статистика позволяет определить, как каждая из переменных связана с исходом, а оценка частной корреляции (рассмотренная в прошлой статье нашего цикла) лишь устраняет влияние одного или нескольких факторов, многофакторный статистический анализ дает важную информацию не только о влиянии на исход каждой из нескольких переменных, но и о степени взаимодействия всех переменных между собой [5].

Преимущество многофакторного анализа может быть наглядно продемонстрировано в следующем примере: исследователем выдвигается предположение о том, что пациенты с диагнозом COVID-19, у которых развилось острое нарушение мозгового кровообращения (ОНМК) в ОРИТ, имеют больший шанс наступления летального исхода.

Действительно, в одномерном анализе, проведенном в группе 425 пациентов с COVID-19, OR наступления неблагоприятного исхода для пациентов с ОНМК оказался равным 6,2 (95% ДИ: 3,4; 10,8, точный тест Фишера: p<0,001). Иными словами, пациенты с ОНМК в ОРИТ имеют в 6,2 раза больший шанс летального исхода.

В многофакторном анализе должны быть учтены и другие факторы; в нашем случае, как предполагается: пол, возраст, индекс коморбидности (Чарлсона) и проводимая терапия. В результате совместного включения всех параметров в регрессионную модель оказалось, что наличие ОНМК в ОРИТ исключено из набора факторов, влияющих на развитие летального исхода, а реальными независимыми предикторами являются только индекс коморбидности — откорректированное отношение шансов (adjusted odds ratio): 1,5 (95% ДИ: 1,2; 1,9, p=0,002), и назначение блокаторов интерлейкина (ИЛ)-6 — adjusted odds ratio: 0,4 (95% ДИ: 0,2; 0,5, p=0,001). Эти результаты можно интерпретировать следующим образом: при увеличении индекса коморбидности на 1 шанс летального исхода в ОРИТ увеличивается в полтора раза, а использование блокаторов ИЛ-6 оказывает протективное действие — шансы летального исхода снижаются на 60%. Причина, по которой развитие ОНМК в ОРИТ не является независимым предиктором летального исхода, кроется в следующем: пациенты с ОНМК были старше (медиана возраста при госпитализации 65-летних по сравнению с 44-летними, f-Манна—Уитни: p=0,021) и имели больший индекс коморбидности (медиана 3,2 по сравнению с 2,0, U-Манна—Уитни: p=0,004). Кроме того, пациенты с ОНМК чаще имели хроническую болезнь почек (ХБП) в анамнезе (61% по сравнению с 19%, точный тест Фишера: p<0,001), что являлось противопоказанием к назначению блокаторов ИЛ-6, оказывающих протектив-ное действие. Таким образом, только в случае использования многофакторного анализа исследователь, располагая полной информацией о взаимосвязи факторов, может сделать объективный вывод о причинах, влияющих на изучаемый исход, и оценить степень одновременного влияния включаемых в анализ предикторов.

Число сайтов метастази-рования О

ЛДГ

>805 Ед/л Нет

Вероятность г— 5-летней OB_^

Номограмма

0 1 2 3 4 5

Score

,3 ,4 ,5 ,6

0 1 2 3 4 5 6 7 8 Total score

10 11 12 13 14

Рис. 2. Номограмма для прогноза пятилетней обшей выживаемости у пациентов с меланомой (гипотетические данные).

ЛДГ — лактатдегидрогеназа. Пояснение в тексте.

Fig. 2. Nomogram for predicting 5-year overall survival in patients with melanoma (hypothetical data).

В рассмотренном примере на связь между ОНМК и летальным исходом повлияли так называемые вмешивающиеся факторы — конфаундеры (от англ. confounders). Основным преимуществом многофакторного статистического анализа является возможность учесть влияние подобных факторов и провести поправку рассчитанных показателей RR, OR и HR (поправка, корректировка; от англ. adjustment), и рассчитать в регрессионном анализе, соответственно, adjusted RR, adjusted OR и adjusted HR [6].

Помимо регрессионного анализа существует и другой способ устранения конфаундинг-эффекта — метод propensity score matching (PSM). Русского варианта перевода названия этого метода, разработанного еще в 1983 г., нет; А.М. Гржибовский и соавт. в 2016 г. предложили термин «псевдорандомизация» [7]. Метод PSM позволяет рассчитать коэффициент соответствия (propensity score) — вероятность попадания каждого объекта исследования в основную или контрольную группу на основании его характеристик. Главная отличительная особенность метода заключается в том, что он позволяет свести широкий набор характеристик каждого наблюдения к единому вариационному ряду значений коэффициентов соответствия. Метод PSM, не уступая по эффективности регрессионному анализу, не требует при этом большого размера выборки [7, 8]. Основным недостатком метода PSM является тот факт, что процесс отбора конфаундеров не стандартизован и до сих пор является предметом обсуждения в литературе [7, 9]. Таким образом, использование этого метода автоматически несет в себе элемент систематической ошибки (bias), поскольку автор и только автор выбирает, включить или не включить в анализ тот или иной конфаундер.

Следует отметить, что проблема в определении независимых предикторов и конфаундеров актуальна не только для PSM — даже в регрессионном анализе зачастую невозможно выделить независимые предикторы, так как один и тот же фактор может как оказывать независимый эффект на исход, так и быть вмешивающимся фактором, влияющим на другую переменную. Возвращаясь к нашему примеру, применение блокаторов ИЛ-6, исходя из результатов анализа, обладает независимым протективным действием. С другой стороны, генно-инженерная биологическая терапия назначается более молодым пациентам с меньшим числом коморбиднъх состояний в анамнезе и отсутствием противопоказаний. Все выделенные курсивом переменные сами по себе снижают риск летального исхода в ОРИТ.

Следующей проблемой при проведении многофакторного анализа является необходимость учета взаимодействия между переменными. Иными словами, необходимо предварительное проведение одномерного анализа, в том числе корреляционного анализа, межгрупповых сравнений с последующим включением в регрессионную модель нескольких значимых предикторов, так как для внесения параметра в модель необходимо изначально иметь предположение о том, какие переменные могут взаимодействовать [10]. В противном случае, при включении всего массива предикторов в многофакторный анализ начинается системный поиск взаимодействий путем деления групп на подгруппы, и, таким образом, чем больше включено взаимодействующих переменных, тем больше образуется подгрупп данных. Эта ситуация чревата тем, что в одной или нескольких из них взаимодействие будет обнаружено в силу случайного совпадения (ошибка 1-го рода) [5]. Кроме того, реальные анализируемые базы данных, как правило, имеют незаполненные поля (lost for follow up, что неиз-

бежно в реальных условиях), и при внесении значительного числа предикторов в регрессионную модель образуемые подгруппы будут значительно уменьшаться в объеме, что не только может привести к ошибке 1-го рода, но и стать причиной увеличения доверительных интервалов. Однако существует возможность пошагового включения предикторов в регрессионную модель (с использованием статистики Вальда или коэффициента правдоподобия), в ходе которого информативные предикторы отбираются, а зашумлен-ные исключаются автоматически в соответствии с заданным критерием, который не связан с клинической ситуацией. В таком случае возможно внесение всего массива предикторов в регрессионную модель.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Представление результатов многофакторного анализа. Как правило, результаты, полученные в ходе регрессионного анализа, представляются в виде таблиц, содержащих информацию о рассчитанных параметрах (RR, OR и HR), их доверительных интервалах и рассчитанном /»-уровне значимости. По результатам анализа выживаемости и регрессионного анализа пропорциональных рисков Кокса также можно представить кривые выживаемости, а полученные регрессионные уравнения могут быть использованы для разработки, например, онлайн-калькуляторов [11, 12].

В последние годы значительно выросла популярность графического метода представления результатов регрессионного анализа в виде прогностических номограмм [13, 14]. Основным преимуществом номограмм являются простота и наглядность их интерпретации: каждая независимая переменная указана отдельно, с соответствующим количеством баллов, присвоенных каждой величине. Далее полученные совокупные баллы сопоставляются со шкалой результатов (рис. 2).

В случае, представленном на рис. 2, методом многофакторной статистики исследователи проанализировали несколько предикторов пятилетней выживаемости с расчетом ОВ при меланоме (возраст, пол, число сайтов метастазиро-вания и уровень лактатдегидрогеназы (ЛДГ)). В регрессионном анализе Кокса определены два независимых предиктора неблагоприятного исхода: уровень ЛДГ более 805 Ед/л (ИЯ: 2,458 [95% ДИ: 1,091; 5,536], /=0,030) и число сай-

а/а

Обучающая выборка

Валидирующая выборка

1

Тестовая выборка

_JL_

Обучение Тестирование

Обучить несколько регрессионных моделей

Провести валидацию

Регрессионныйанализ О цен ка качества моделей, с включением различных получение оптимальных предикторов и выбором регрессионных разных значений коэффициентов и выбор

лучшей модели

Оценить качество моделей на другой выборке

Проверка модели на независимом массиве данных с оценкой результатов 1ЮС-анализа и/или среднеквадратического отклонения

б/Ь

Набор данных -

Тестирование Обучение Обучение Обучение Обучение

Обучение Тестирование Обучение Обучение Обучение

Обучение Обучение Тестирование Обучение Обучение

Обучение Обучение Обучение Тестирование Обучение

Обучение Обучение Обучение Обучение Тестирование

1 2 3 4 5

-подмножество—11—подмножество—11—подмножество—11— подмножество—11— подмножество -

Рис. 3. Оценка качества регрессионных моделей в многофакторном анализе.

а — обучение, валидация и тестирование моделей на независимом наборе данных; б — схема пятикратной перекрестной проверки модели (cross-validation) на одной выборке.

Fig. 3. Quality assessment of regression models in multivariate analysis.

a — training, validation and testing of models on an independent dataset; b — scheme of 5-fold cross-validation of the model on one sample.

тов метастазирования (HR: 1,818 [95% ДИ: 1,240; 1,666], p=0,002). В результате построена настоящая номограмма. Предлагается вариант расчета вероятности наступления летального исхода у пациента с метастазами в легких, костях и печени (Score 6) и уровнем ЛДГ, равным 504 Ед/л (меньше 807 Ед/л, Score 0). Совокупная оценка для него составила 6 баллов, а значит вероятность летального исхода составляет 50% в течение 5 лет от момента установления диагноза, иначе говоря, пятилетняя ОВ составляет 50%. Особенно часто прогностические номограммы используются в течение последнего года для прогнозирования наступления летального исхода и тяжелого течения инфекции у пациентов с COVID-19 [15—18].

Анализ качества моделей. Для оценки качества моделей на основе логистической регрессии предложено несколько статистических критериев согласия, но наиболее часто используется тест Хосмера—Лемешоу (Hosmer— Le-meshow test) [19]. Главным параметром, оценивающим качество как отдельных предикторов, так и всей регрессионной модели, является площадь под ROC-кривой (AUC, area under curve), рассчитываемая путем интегрирования ROC-кривой (функция чувствительности от переменной «1-специфичность») по переменной «1-специфичность». Чем ближе рассчитанный параметр AUC к единице, тем выше прогностическая значимость предиктора. Если параметр AUC<0,75, то модель считается низкого качества.

Значение AUC=0,5 рассматривается как нижний передел качества, при котором модель аналогична методу случайного выбора.

Важной задачей, стоящей перед исследователем, является не только оценка качества модели на использованной выборке (обучение модели), но и проверка надежности (тестирование) прогностической модели на независимых массивах данных. Для этого должны быть выполнены следующие этапы (рис. 3, а):

1. Обучение модели (training). На этапе обучения исследователи включают в регрессионную модель предикторы и указывают изучаемый исход, все данные берутся из имеющейся выборки (обучающей выборки). Результатом является регрессионная модель с набором характеристик, оценкой коэффициентов регрессионного уравнения и их доверительных интервалов (матрицей ковариации дисперсии). Может быть построено несколько различных регрессионных моделей, отличающихся набором предикторов и/или выбранными точками отсечения для параметров.

2. Валидация модели (validation). На этом этапе необходимо определить, насколько хорошо построенная модель работает на обучающей выборке (например, как выглядит распределение ошибок), а также выбрать наилучшую из моделей (как правило, по результатам ROC-анализа).

3. Третий, последний этап — тестирование модели (testing). Модель должна быть протестирована на другом наборе данных (в лучшем случае, независимом), и здесь исследователи должны понять, насколько хорошо построенная и обученная на первоначальной выборке модель работает для предсказания исхода с новыми данными (удобнее всего сравнить результаты ROC-анализа при обучении/вали-дации и тестировании).

К сожалению, в реальной клинической практике нечасто появляется возможность получить сопоставимые данные независимых исследователей из других центров. Но и из этой ситуации можно найти выход — использовать методы кросс-валидации, получившие широкое распространение в связи с развитием методов машинного обучения [20]. Суть метода к-кратной перекрестной проверки (^-cross-validation) состоит в следующем: поочередно каждое из к подмножеств набора данных исследователей выступает в роли тестовой выборки, а оставшиеся к — 1 выступают в роли обучающей выборки (рис. 3, б). Далее значение к увеличивается на единицу, и всего получается к итераций, значение к выбирается в интервале от 3 до 10 [20].

Разновидностью метода кросс-валидации является метод скользящего экзамена (leave-one-out) [21]. При его реализации на каждой итерации поочередно удаляются из обучающей выборки или одно наблюдение, или набор наблюдений (данных о пациентах), а на оставшейся части строится регрессионная модель, с помощью которой затем выполняется прогноз вероятности развития исхода. После сравнения прогнозируемого исхода с реальным исходом удаленные данные пациента или группы пациентов возвращаются в исходную выборку. Эта процедура впоследствии многократно повторяется, что может занимать достаточно длительное время.

Таким образом, в случае невозможности получения внешних данных для тестирования регрессионной модели можно использовать исключительно собственные данные. Недостатком методов перекрестной проверки является уменьшение размеров обучающей и тестовой выборок, что может негативным образом сказаться на качестве моделей.

Заключение

Наличие множества перекрестных взаимосвязей между изучаемыми факторами (демографическими данными, сопутствующими заболеваниями, несколькими медицинскими препаратами, используемыми одновременно или последовательно и т.д.) существенно затрудняет интерпретацию результатов, полученных в результате применения методов простого сравнения (одномерный анализ). Более того, полученные подобным образом результаты могут ввести в заблуждение даже опытного клинициста-исследователя и подтолкнуть к ложным выводам или заключению. По сути дела, одномерный анализ используется в настоя-

щее время в серьезных исследованиях только для предварительной оценки результатов и создания условий для проведения регрессионного анализа. Без использования методов многофакторной статистики трудно рассчитывать на точность конечного результата.

Ведущие научные журналы к этому заключению пришли достаточно давно и не принимают к публикации статьи, если статистические методы, использованные для обоснования заключений и выводов, вызывают хотя бы малейшие сомнения.

Авторы заявляют об отсутствии конфликта интересов.

The authors declare no conflicts of interest.

ЛИТЕРАТУРА/REFERENCES

1. Holcomb WL Jr, Chaiworapongsa T, Luke DA, Burgdorf KD. An odd measure of risk: use and misuse of the odds ratio. Obstetrics and Gynecology. 2001;98(4):685-688.

https://doi.org/10.1016/S0029-7844(01)01488-0

2. Tajeu GS, Sen B, Allison DB, Menachemi N. Misuse of odds ratios in obesity literature: an empirical analysis of published studies. Obesity.

2012;20(8):1726-1731. https://doi.org/10.1038/oby.2012.71

3. George A, Stead TS, Ganti L. What's the Risk: Differentiating Risk Ratios, Odds Ratios, and Hazard Ratios? Cureus. 2020;12(8):e100 47. https://doi.org/10.7759/cureus.10047

4. Brueske B, Sidhu MS, Schulman-Marcus J, Kashani KB, Barsness GW, Jentzer JC. Hyperkalemia is associated with increased mortality among un-selected cardiac intensive care unit patients. Journal of the American Heart Association. 2019;8(7):e011814. https://doi.org/10.1161/jaha.118.011814

5. Румянцев П.О., Саенко В.А., Румянцева У.В., Чекин С.Ю. Статистические методы анализа в клинической практике. Часть. 2. Анализ выживаемости и многомерная статистика. Проблемы эндокринологии. 2009;55(6):48-56.

Rumyantsev PO, Saenko VA, Rumyantseva UV, Chekin SYu. Statistical methods for the analyses in clinical practice. Part 2. Survival analysis and multivariate statistics. Problemy endokrinologii. 2009;55(6):48-56. (In Russ.). https://doi.org/10.14341/probl200955648-56

6. Holmberg MJ, Andersen LW. Estimating risk ratios and risk differences: alternatives to odds ratios. JAMA. 2020;324(11):1098-1099. https://doi.org/10.1001/jama.2020.12698

7. Гржибовский А.М., Иванов С.В., Горбатова М.А., Дюсупов А.А Псевдорандомизация (propensity score matching) как современный статистический метод устранения систематических различий сравниваемых групп при анализе количественных исходов в обсервационных исследованиях. Экология человека. 2016;5:50-64.

Grzhibovskij AM, Ivanov SV, Gorbatova MA, Dyusupov AA. Pseudo-randomization (propensity score matching) as a modern statistical method for eliminating systematic differences between compared groups in the analysis of quantitative outcomes in observational studies. Ekologiya cheloveka. 2016;5:50-64. (In Russ.).

https://doi.org/10.33396/1728-0869-2016-5-50-64

8. Thoemmes F. Propensity score matching in SPSS. arXiv Preprint arXiv. 2012;1201.6385. Accessed July 25, 2021. https://arxiv.org/abs/1201.6385

9. Garrido MM, Kelley AS, Paris J, Roza K, Meier DE, Morrison RS, Aldridge MD. Methods for constructing and assessing propensity scores. Health Services Research. 2014;49(5):1701-1720. https://doi.org/10.1111/1475-6773.12182

10. Barton B, Peat J. Medical statistics: A guide to SPSS, data analysis and critical appraisal. John Wiley & Sons. 2014. Accessed May 25, 2021. https://www.researchgate.net/publication/263735286_Medical_Statistics_-_A_Guide_to_SPSS_Data_Analysis_and_Critical_Appraisal

11. Gupta H, Gupta PK, Schuller D, Fang X, Miller WJ, Modrykamien A, Morrow LE. Development and validation of a risk calculator for predicting postoperative pneumonia. In Mayo Clinic Proceedings. 2013;88(11):1241-1249. https://doi.org/10.1016/j.mayocp.2013.06.027

12. Cuadrado-Godia E, Jamthikar AD, Gupta D, Khanna NN, Araki T, Man-iruzzaman M, Suri JS. Ranking of stroke and cardiovascular risk factors for an optimal risk calculator design: Logistic regression approach. Computers in Biology and Medicine. 2019;108:182-195. https://doi.org/10.1016/jxompbiomed.2019.03.020

13. Zhang J, Xiao L, Pu S, Liu Y, He J, Wang K. Can we reliably identify the pathological outcomes of neoadjuvant chemotherapy in patients with breast cancer? Development and validation of a logistic regression nomogram based on preoperative factors. Annals oof Surgical Oncology. 2021;28(5):2632-2645. https://doi.org/10.1245/s10434-020-09214-x

14. Genre L, Roché H, Varela L, Kanoun D, Ouali M, Filleron T, Dalenc F. External validation of a published nomogram for prediction of brain metastasis in patients with extra-cerebral metastatic breast cancer and risk regression analysis. European Journal of Cancer. 2017;72:200-209. https://doi.org/10.1016/j.ejca.2016.10.019

15. Nguyen Y, Corre F, Honsel V, Curac S, Zarrouk V, Burtz CP, Galy A. A nomogram to predict the risk of unfavourable outcome in COVID-19: a retrospective cohort of 279 hospitalized patients in Paris area. Annals of medicine. 2020;52(7):367-375.

https://doi.org/10.1080/07853890.2020.1803499

16. Dong YM, Sun J, Li YX, Chen Q, Liu QQ, Sun Z, Ye DW. Development and validation of a nomogram for assessing survival in patients with COVID-19 pneumonia. Clinical Infectious Diseases. 2021;72(4):652-660. https://doi.org/10.1093/cid/ciaa963

17. Zhou Y, He Y, Yang H, Yu H, Wang T, Chen Z, Liang Z. Development and validation a nomogram for predicting the risk of severe COVID-19: A multi-center study in Sichuan, China. PLoS One. 2020;15(5):e0233328. https://doi.org/10.1371/journal.pone.0233328

18. Gong J, Ou J, Qiu X, Jie Y, Chen Y, Yuan L, Hu B. A tool for early prediction of severe coronavirus disease 2019 (COVID-19): a multicenter study using the risk nomogram in Wuhan and Guangdong, China. Clinical Infectious Diseases. 2020;71(15):833-840. https://doi.org/10.1093/cid/ciaa443

19. Paul P, Pennell ML, Lemeshow S. Standardizing the power of the Hos-mer—Lemeshow goodness of fit test in large data sets. Statistics in Medicine. 2013;32(1):67-80.

https://doi.org/10.1002/sim.5525

20. Berrar D. Cross-validation. Encyclopedia oof Bioinformatics and Computational Biology. 2019;542-545.

https://doi.org/10.1016/B978-0-12-809633-8.20349-X

21. Meijer RJ, Goeman JJ. Efficient approximate k-fold and leave-one-out cross-validation for ridge regression. Biometrical Journal. 2013;55(2):141-155. https://doi.org/10.1002/bimj.201200088

Поступила 22.03.2021 Received 22.03.2021 Принята к печати 16.05.2021 Accepted 16.05.2021

i Надоели баннеры? Вы всегда можете отключить рекламу.