ИММУНОЛОГИЯ № 5, 2012
предположение о том, что именно активация эффекторного звена иммунной системы является фактором, предрасполагающим к более агрессивному течению системного воспалительного процесса и определение параметров этих клеток можно использовать как диагностические критерии той или иной стадии активности РА.
При высокой степени активности серопозитивного варианта суставной формы РА в отличие от средней степени аутоиммунной агрессии наблюдается активация цитотоксических лимфоцитов, реализующих киллерный потенциал без помощи антигенраспознающего рецептора. Повышены были как количество НК при высокой степени активности РА, что документируется статистически достоверным увеличением относительного количества CD3"CD(16+56)+-лимфоцитов, так и функциональный потенциал этих клеток. Убедительными доказательствами усиления цитотоксической активности НК являются существенное, статистически достоверное повышение относительного содержания позитивных CD3-CD(16+56)+Гранзим B-лимфоцитов и результаты цитотоксических тестов (см. таблицу).
ЛИТЕРАТУРА
1. Караулов А. В. Клиническая иммунология. - М., 1999. - С. 275-276.
2. Мазуров В. И., Лила А. М. Ревматоидный артрит (клиника, диагностика, лечение). - СПб., 2000. - С. 96.
3. Пинегин Б. В., Ярипин А. А., Симонова А. В. и соавт. Применение проточной цитометрии для оценки функциональной активности иммунной системы человека / Пособие для врачей-лаборантов. - М., 2001. - С. 48-53.
4. Сизякина Л. П., Андреева И. И. Справочник по клинической иммунологии. - Ростов н/Д., 2005.
5. Chapel H. Essentials of clinical immunology - 2008. - P. 312315.
6. Pincus T., Ferraccioli G., Sokka T. et al. Evidence from clinical trials and long-term observational studies that diseasemodifying anti-rheumatic drugs slow radiographic progression in rheumatoid arthritis: updating a 1983 review // Rheumat. (Oxford). -2002. - Vol. 41. - P. 1346-1356.
Поступила 02.03.12
ЭКОЛОГИЧЕСКАЯ ИММУНОЛОГИЯ
© КОЛЛЕКТИВ АВТОРОВ,2012 УДК 616-006.04-037-092:612.017.1
Ю. Г. Пащенкова, М. Ф. Никонова, М. В. Пащенков, В. В. Феоктистов, Г. Х. Викулов, Н. Н. Смирнова, Н. В. Божеская, И. В. йрадовская
оценка прогноза онкологических заболеваний на основании показателей иммунного статуса
ГНЦ Институт иммунологии ФМБА России, Москва (115478, Москва, Каширское ш., д. 24, корп. 2)
В статье рассмотрена возможность прогнозирования развития злокачественных новообразований (ЗНО) на основе текущих показателей иммунного статуса у ликвидаторов последствий аварии на Чернобыльской АЭС (ЧАЭС). Под термином «развитие ЗНО» понимали выявление ЗНО стандартными клинико-инструментальными средствами. Путем ретроспективного анализа иммунных статусов получены прогностические классификаторы, позволяющие предсказать развитие ЗНО в ближайшие 1-5 лет с чувствительностью до 0,8 и специфичностью до 0,72. Полученные классификаторы позволяют сформировать подгруппу ликвидаторов, у которых необходимо более тщательное клинико-лабораторное наблюдение с целью более раннего выявления ЗНО.
Ключевые слова: злокачественные новообразования, прогноз, иммунная система, иммунный статус, ликвидация последствий аварии на Чернобыльской АЭС
Yu. G. Paschenkova, M.F. Nikonova, M.VPaschenkov, V.VFeoktistov, G. H. Vikulov, N.N. Smirnova, N.VBozheskaya, I.V ORADOVSKAYA ASSESSMENT OF THE FORECAST OF ONCOLOGICAL DISEASES ON THE BASIS OF THE INDICES OF IMMUNE STATUS
In this article the possibility of forecasting the development of malignant neoplasms on the basis of current indicators of immune status of the liquidators of the consequences of the accident at the Chernobyl nuclear power plant (ChNPP). Under the term «development of malignant neoplasms» understood the identification of malignant neoplasms standard clinical and instrumental means. By retrospective analysis of the immune status were obtained forward-looking classifiers which allow to predict the development of the malignant neoplasms in the next 1 - 5 years with a sensitivity of up to 0.8 and specificity to 0.72. Received classifiers allow a subgroup of liquidators, who need to be more careful clinical and laboratory monitoring with the purpose of early detection of malignant neoplasms.
Key words: malignant neoplasms, forecast, the immune system, immune status, elimination of the consequences of the accident at the Chernobyl nuclear power plant
1. Введение
-------------- Проблема раннего выявления злокачественных ново-
Пащенкова Юлия Геннадьевна - научн. сотр., тел. образований (ЗНО) у населения в целом и в его отдельных 8(499)617-10-27, e-mail: [email protected] группах, подвергшихся воздействию канцерогенных факто-
- 270 -
ЭКОЛОГИЧЕСКАЯ ИММУНОЛОГИЯ
ров, по-прежнему актуальна. Существующие методы ранней диагностики ЗНО включают регулярное проведение дорогостоящих имиджинговых и эндоскопических исследований, которые не всегда хорошо переносятся обследуемыми.
В течение многих лет мы проводили иммунологический мониторинг участников ликвидации последствий аварии на Чернобыльской АЭС (ЧАЭС). В результате в нашем распоряжении оказались показатели иммунного статуса, на 1-5 лет предшествующие постановке клинического диагноза ЗНО. Тот же набор показателей был исследован у группы сравнения -ликвидаторов, которые на момент исследования не страдали предопухолевыми заболеваниями или доброкачественными новообразованиями и у которых не было выявлено ЗНО в течение минимум 3 лет после исследования иммунного статуса. Данные иммуномониторинга недавно нами опубликованы [1]. У ликвидаторов, исследованных в период перед постановкой диагноза ЗНО, выявлены достоверно более низкое процентное содержание CD3+ и CD4+ T-клеток, более низкий индекс CD4+/ CD8+, более высокое процентное и абсолютное содержание CD8+ T-клеток и CD16+ NK-клеток, более высокий уровень сывороточного IgE, чем в группе сравнения. Однако межгрупповые сопоставления не позволяют оценивать прогноз онкологического заболевания у конкретного человека, обследованного в данный момент времени. В настоящей работе мы попытались создать так называемый прогностический классификатор - математический инструмент, который дает возможность на основании текущих показателей иммунного статуса отнести обследуемого в группу хорошего или плохого прогноза по развитию ЗНО в течение нескольких ближайших лет. (Здесь и далее под термином «развитие ЗНО» понимается постановка диагноза ЗНО стандартными клинико-инструментальными методами.)
Для предсказания значений зависимой переменной у, исходя из значений независимых переменных х1 ... х , наиболее часто используют линейную регрессию, формула которой имеет вид у = a]x] + a2x2 + ... + axn + c, где at ... an и c - константы, определяемые опытным путем. Однако в классическом варианте метода, реализованном во многих статистических программах, переменная у должна быть непрерывной. В настоящей работе для построения классификатора использовали метод взвешенного голосования [6], который представляет собой частный случай линейной регрессии, адаптированный для ситуаций, когда зависимая переменная имеет двоичный характер (например, развитие или неразвитие ЗНО). Ранее этот метод применялся, в частности, для прогнозирования течения рака по данным глобального анализа экспрессии генов в опухоли [6].
В общем случае прогностический классификатор строится на основании так называемого обучающего набора данных (ОНД), который состоит из переменных n, определенных для групп хорошего и плохого прогноза, в данной работе - для лиц, у которых за период наблюдения не развилось или развилось ЗНО. Исход процесса для случаев, входящих в ОНД, уже известен. Если классификатор строится по методу взвешенного голосования, то для каждой переменной х1, входящей в ОНД, вычисляют коэффициенты S. (мера информативности переменной х.) и b. (граница принятия решения):
S
j
] - ]
ал
°]2
(1),
b
]
] +-2 2
(2),
где j и j - средние арифметические переменной х] в 1-й и 2-й группах; а. и а.2 - стандартные отклонения переменной х. в соответствующих классах.
Для определения прогноза каждого отдельно взятого случая z вначале вычисляют голос каждой переменной х. для случая z (V.) по формуле:
] Vjz = S](X]z - b) (3Х
где Xjz - значение переменной х. в случае z.
Результат голосования К по случаю z вычисляют по формуле:
V = sign I Vjz (4),
j=i
где п - количество переменных в классификаторе. Если Vz = -1, то случай относят к классу 2 (плохой прогноз), если V =1 - то к классу 1 (хороший прогноз). Таким образом, голос каждой переменной х. в случае z зависит от величины и направления ее отклонения от границы принятия решения b. и, кроме того, взвешивается значением S. (отсюда название метода); результат голосования определяют знаком суммы всех голосов.
Проверку работы классификатора производят на двух наборах данных: 1) на ОНД (так называемая рекурсивная проверка на том же материале, на котором был построен классификатор); 2) на независимом, или валидационном, наборе данных (ВНД), в который включают случаи, не входящие в ОНД. Если процент совпадений предсказанного прогноза (V) с реальным приемлемо велик как для ОНД, так и для ВНД, то классификатор принимают в качестве рабочей модели.
2. Материалы и методы
2.1. Обследуемые
ОНД составили ликвидаторы, проживающие в СевероЗападном регионе Ленинградской области. Группу плохого прогноза составили 22 человека, у которых в течение 1-5 лет после исследования иммунного статуса было диагностировано ЗНО, в том числе рак легкого (n = 5), рак желудка (n = 3), рак гортани (п = 2), рак предстательной железы (п = 2), рак поджелудочной железы (n = 2), базалиома (n = 2), рак молочной железы (n = 1), рак губы (n = 1), рак околоушной железы (n = 1), рак печени (n = 1), мезотелиома (n = 1), лимфосаркома (n = 1). В группу хорошего прогноза вошли 348 человек, которые на момент исследования не страдали ЗНО, предопухолевыми заболеваниями (хронический бронхит, лейкоплакия гортани, рецидивирующие пневмонии, язвенная болезнь желудка и т. д.) или доброкачественными новообразованиями и у которых не было выявлено ЗНО в течение минимум 3 лет после исследования иммунного статуса. У некоторых ликвидаторов имелось два исследования иммунного статуса и более, удовлетворявших критериям отбора; эти исследования включали в ОНД как независимые (табл. 1).
ВНД составили 31 человек (40 исследований), входивших в подразделения особого риска и ныне проживающих в Северо-Западном регионе Ленинградской области. Это лица, участвовавшие в ядерных испытаниях и ликвидации последствий ядерных катастроф (не на ЧАЭС). 3 человека (6 исследований) составили группу плохого прогноза, 28 человек (34 исследования) - группу хорошего прогноза (см. табл. 1). Группа плохого прогноза была представлена раком толстой
Таблица 1
Характеристика ОНД и ВНД
Показатель n Количество исследований Возраст, годы (M ± &)
Весь ОНД 370 679 54,9 ± 8,8
В том числе:
группа плохого прогноза 22 38 61,2 ± 6,9
группа хорошего прогноза 348 641 54,5 ± 8,8
Весь ВНД 31 40 66,9 ± 6,9
В том числе:
группа плохого прогноза 3 6 70,3 ± 3,5
группа хорошего прогноза 28 34 66,3 ± 7,2
- 271 -
ИММУНОЛОГИЯ № 5, 2012
кишки (1 пациент, 3 исследования), желчного пузыря (1 пациент, 2 исследования) и предстательной железы (1 пациент, 1 исследование).
2.2. Исследование иммунного статуса
Исследование иммунного статуса проводили с 1999 по
2008 г. У всех наблюдаемых определяли абсолютное содержание лейкоцитов в крови, процентное и абсолютное содержание лимфоцитов, процентное и абсолютное содержание CD3+, CD4+ и CD8+ T-клеток, CD19+ B-клеток, CD16+ NK-клеток, процентное содержание HLA-DR+-лимфоцитов и активированных T-клеток (разность между процентом HLA-DR+-лимфоцитов и CD19+ B-клеток), фагоцитарный индекс нейтрофилов с латексом (процент нейтрофилов, поглотивших частицы латекса), а также сывороточный уровень IgM, IgG, IgA и IgE. Поскольку иммунный статус перед постановкой диагноза ЗНО характеризовался дисбалансом содержания субпопуляций лимфоцитов (см. «Введение»), то дополнительно вычисляли следующие индексы: CD4/CD8 (иммунорегуляторный индекс); CD3/CD16 (отношение T-клеток к NK-клеткам); (CD3 + CD19)/CD16 (отношение не-ЫК-клеток к NK-клеткам); CD4/(CD8 + CD16) (отношение CD4+ T-клеток к цитотоксическим лимфоцитам); (CD4 + CD19)/(CD8 + CD16) (отношение нецитотоксических лимфоцитов к цитотоксическим). Всего, таким образом, измерили или вычислили 25 переменных. Все 25 переменных, включенных в анализ, измерены/вычислены не менее чем в 90% исследований, включенных в ОНД и ВНД.
2.3. Нормализация данных, вычисление коэффициентов S. и b, вычисление голосов
Поскольку 25 переменных, включенных в анализ, имели разный порядок значений (от 10-1 до 102), то проводили нормализацию всех значений, входящих как в ОНД, так и в ВНД, по формуле:
х. - х.
_ 1 J5
Xj95 - XJ5
100,
X
Jнорм
(5)
где х. и х - реальное и нормализованное значения пе-
Jw J^M Г ^ W Г
ременной х.; х.; x^ - 5-й и 95-й процентили переменной х. в ОНД. j j j j
Коэффициенты S. и b, для всех 25 переменных вычисляли по формулам (1) и (2) с использованием нормализованных данных ОНД. Голоса всех переменных х. для всех случаев z вычисляли по формуле (3), также используя нормализованные значения х.. Если конкретное значение Xjz отсутствовало, его заменяли средним арифметическим для группы соответствующего прогноза в соответствующем наборе данных (ОНД или ВНД). Таким образом, для ОНД был получен массив голосов 679 • 25 (количество случаев • количество переменных), для ВНД - массив голосов 40 • 25.
2.4. Вычисление результата голосования и определение точности предсказания
Отобрав переменные для включения в классификатор (о принципах отбора - см. «Результаты»), для каждого случая z суммировали голоса отобранных переменных и определяли результат голосования V по формуле (4). При V = -1 предсказанный прогноз данного случая расценивали как плохой (развитие ЗНО), при V = 1 - как хороший (неразвитие ЗНО). Точность предсказания Pr, полученную при использовании данного классификатора, вычисляли как полусумму чувствительности и специфичности:
1 n п2
Pr = — (-- + --)
2 N N2
(6),
где п1 и п2 - количество случаев, правильно предсказанных соответственно в группах хорошего и плохого прогноза; N и N2 - общая численность групп хорошего и плохого прогноза; n1/N1 - чувствительность; n2/N2 - специфичность. Точность каждого классификатора вычисляли отдельно для ОНД (рекурсивная проверка точности) и для ВНД (независимая проверка точности).
2.5. Достоверность предсказания
Использовали метод случайных перемешиваний [4, 5]. Для того чтобы доказать, что достигнутая с помощью данного классификатора точность предсказания не является случайной, 10 000 раз перемешивали принадлежность случаев к группе хорошего или плохого прогноза и после каждого перемешивания вновь определяли точность предсказания. Подсчитывали количество перемешиваний N (Pr > Ргфахт), после которых точность предсказания с помощью данного классификатора была равной или выше реально достигнутой. Значение достоверности p вычисляли по формуле p = N(Pr >Pr^J/10 000; предсказание считали достоверным приp < 0,05. Данную процедуру выполняли как на ОНД, так и на ВНД.
2.6. Преобразование формулы взвешенного голосования в стандартную формулу линейной регрессии
Для практического удобства формулу (4) преобразовывали в традиционную формулу линейной регрессии, учитывающую процедуру нормализации:
V = sign У S/х.
° 1 1норм
1=1
b) = sign(a^2 + ах2 + ... ахп + c),
где n - количество переченных в классификаторе; х...хп -реальные (ненормализованные) значения переменных
100S
а1 = — (7),
х195 - Х5
100S*., n
—о--) + K-S/j) (8).
c = Н(
1=1 х)95 - х.5 1=1
2.7. Вычисления
Нормализацию данных, вычисление коэффициентов Sj и b1, вычисление голосов проводили с помощью программы Microsoft Excel 2003 («Microsoft», США). Мультиколлинеарность тестировали в программе GraphPad Instat («GraphPad Software», США). Большие объемы вычислений, описанные в пп. 2.4. и 2.5., выполняли с помощью программного пакета MATLAB R2009a («Math Works», США). Вычислительные алгоритмы на языке MATLAB могут быть предоставлены авторами в виде текстовых файлов.
3 . Результаты
3.1. Предсказание развития ЗНО по отдельно взятым параметрам иммунного статуса
В табл. 2 приведены средние и стандартные отклонения для нормализованных переменных в группах хорошего и плохого прогноза в ОНД, а также рассчитанные на их основе коэффициенты S. и b.. Модули всех коэффициентов S. были низки (|Sj| < 1), что указывает на существенное перекрытие диапазонов значений двух групп и снижает прогностическую ценность каждой отдельно взятой переменной. Действительно при рекурсивной проверке на ОНД точность предсказания ЗНО по каждой из 25 переменных в отдельности была невысокой (см. табл. 2). Наибольшей прогностической точностью (Pr = 0,6731) отличалось абсолютное содержание CD16+ NK-клеток.
3.2. Предсказание развития ЗНО по сочетаниям переменных
Метод взвешенного голосования предполагает суммацию голосов нескольких переменных (в нашем случае - от 2 до 25). Основной задачей работы было выявить сочетание параметров иммунного статуса, дающее наивысшую точность предсказания развития ЗНО. Общее количество классификаторов C, которое можно создать путем различных сочетаний 25 переменных, равно сумме сочетаний 25 элементов по 1, 2 ... 25:
25
с = Н
k=1
25!
к!(25-к)!
= 33 554 431.
Для того чтобы проверить, позволяет ли суммация голосов в принципе повысить точность предсказания, провели
- 272 -
ЭКОЛОГИЧЕСКАЯ ИММУНОЛОГИЯ
Характеристика переменных в ОНД (переменные отсортированы по Sj) Таблица 2
J Показатель Группа хорошего прогноза Группа плохого прогноза S J b J P ** r
V ад* V
1 CD16+, абс. 37,16 31,07 53,77 39,10 -0,24 45,46 0,6731
2 IgE в сыворотке 19,83 32,09 38,95 55,83 -0,22 29,39 0,5681
3 CD16+, % от лимфоцитов 42,69 32,35 58,45 44,21 -0,21 50,57 0,5645
4 CD8+, % от лимфоцитов 44,84 29,08 58,05 35,45 -0,20 51,44 0,5550
5 CD8+, асб. 40,93 32,91 52,82 32,13 -0,18 46,88 0,6064
6 Активированные T-клетки, % от лимфоцитов 39,38 31,02 45,20 29,66 -0,10 42,29 0,5775
7 Лимфоциты, абс. 41,67 32,80 47,62 26,39 -0,10 44,65 0,6387
8 IgA в сыворотке 39,66 31,50 44,89 28,09 -0,09 42,28 0,6473
9 Лейкоциты, абс. 38,78 29,83 43,44 29,28 -0,08 41,11 0,5900
10 Лимфоциты, % от лейкоцитов 46,82 29,79 50,76 29,20 -0,07 48,79 0,5796
11 IgM в сыворотке 43,10 32,50 46,35 30,24 -0,05 44,73 0,5690
12 HLA-LR+, % от лимфоцитов 42,61 32,43 45,18 28,61 -0,04 43,89 0,5092
13 CD3+, абс. 42,45 32,52 43,35 31,33 -0,01 42,90 0,5598
14 CD4+, абс. 41,55 33,28 38,48 24,01 0,05 40,01 0,5615
15 CD19+, абс. 37,83 33,08 35,01 27,38 0,05 36,42 0,5762
16 Фагоцитарный индекс нейтрофилов, % 59,29 30,78 53,67 35,94 0,08 56,48 0,5871
17 CD19+, % от лимфоцитов 43,93 31,30 36,67 28,07 0,12 40,30 0,5375
18 IgG в сыворотке 43,71 33,44 35,54 30,29 0,13 39,62 0,6098
19 CD3+, % от лимфоцитов 55,99 30,53 43,34 39,05 0,18 49,66 0,5913
20 Индекс CD3/CD16 35,82 38,57 22,20 24,30 0,22 29,01 0,5917
21 Индекс (CD3+CD19)/CD16 36,91 39,48 22,79 24,63 0,22 29,85 0,5933
22 Индекс CD4/CD8 40,89 38,59 25,72 28,65 0,23 33,30 0,5925
23 (CD4+CD19)/(CD16+CD8) 42,08 35,34 24,32 29,61 0,27 33,20 0,6462
24 CD4+, % от лимфоцитов 52,39 31,10 35,82 29,52 0,27 44,10 0,5937
25 Индекс CD4/(CD16+CD8) 42,01 36,21 23,83 27,84 0,28 32,92 0,6400
Примечание. * - нормализованные значения д и а; ** - точность предсказания ЗНО по отдельно взятым переменным (при рекурсивной проверке на ОНД).
статистический эксперимент, в котором рекурсивно тестировали прогностическую точность всех 300 классификаторов, состоящих из двух переменных, по 300 случайно отобранных классификаторов из 3, 4, ... 22 переменных, всех 300 классификаторов по 23 переменных, всех 25 классификаторов по 24 переменных и 1 классификатора из 25 переменных (см. рисунок). Увеличение количества переменных в классификаторе вплоть до 10 приводило к повышению средней точности предсказания. При дальнейшем увеличении числа переменных точность предсказания не возрастала. Таким образом, суммация голосов нескольких переменных увеличивает точность предсказания по сравнению с отдельно взятыми переменными.
Следующий вопрос - принцип отбора переменных для классификатора. Наиболее логично было бы отобрать переменные с максимальными | S. | [6]. Однако в нашем случае все | S. | были низки (см. табл. 2), а классификатор, состоявший из 5 переменных с наиболее высокими | S |, давал низкую прогностическую точность при рекурсивной проверке (данные не показаны). Все это делало принцип отбора переменных неочевидным. Учитывая это, а также сравнительно небольшое общее количество переменных, с помощью программного пакета MATLAB расчитали точность всех возможных классификаторов (n = 33 554 431). Для упрощения даль-
нейшего анализа отбирали только классификаторы, дающие точность Pr > 0,72 при рекурсивной проверке. Таких классификаторов получено 165. Максимальная точность предсказания получена с помощью классификатора из 9 переменных - 0,7327, что было несколько выше, чем максимальная точность предсказания по одной переменной (0,6731).
При проверке на ВНД 163 из этих 165 классификаторов давали низкую точность (Pr < 0,63) и были отвергнуты, в том числе и упомянутый выше классификатор с рекурсивной точностью Pr = 0,7327. Два классификатора, состоящие из 9 и 10 переменных, при проверке на ВНД давали довольно высокую точность (Pr = 0,7843). Из них был выбран классификатор из 9 переменных, который давал более высокую рекурсивную точность (Pr = 0,7256). Этот классификатор был обозначен К1; составляющие его переменные перечислены в табл. 3. Тест на мультиколлинеарность показал, что переменные, включенные в классификатор, не являются взаимно избыточными. При проверке методом перемешивания классификатор был достоверен как в ОНД (р < 0,0001), так и в ВНД (р < 0,05).
Поскольку классификатор К1 был получен путем перебора большого количества сочетаний переменных, то существует вероятность того, что К1 лишь в результате случайного совпаде-
- 273 -
ИММУНОЛОГИЯ № 5, 2012
Рг
N 25 300 25 1
Точность (Pr) прогностических классификаторов, состоящих из переменных к.
N - число протестированных классификаторов для каждого к. Для к = 1 и к = 24 тестировали все 25 возможных классификаторов (для к = 1 - см. также табл. 2); для к = 2 и к = 23 - все 300 возможных классификаторов; для к = 3...22 - по 300 случайно отобранных классификаторов; для к = 25 - единственный возможный классификатор. Показаны M ±<г. * * - p < 0,05; # - p < 0,001 при сравнении с к = 1 (/-тест Стьюдента).
ния обладает высокой точностью и в ОНД, и в ВНД. Результаты анализа всех возможных классификаторов показали, что в ОНД может быть получено 70 классификаторов, обладающих точностью Pr > 0,7256 (независимо от их точности в ВНД), тогда как в ВНД можно получить ~ 1 184 000 классификаторов, обладающих точностью Pr > 0,7843 (независимо от их точности в ОНД). Вероятность случайного получения классификатора с Pr > 0,7256 в ОНД и Pr > 0,7843 в ВНД составляет (70/33 554 431) • (1 184 000/33 554 431) ~ 7,36 • 10-8. При переборе 33 554 431 классификатора может быть случайно получено 7,36 • 10-8 • 33554431 ~ 2 классификаторов с указанными точностями, тогда как в реальности был получен только 1 (К1). Таким образом, то, что классификатор К1 обладает указанными точностями в ОНД и ВНД, может быть результатом случайного совпадения, в связи с чем нельзя с уверенностью утверждать, что классификатор К1 прошел проверку на независимом наборе данных (ВНД).
3.3. Анализ классификатора К1
Как видно из табл. 3, классификатор К1 предсказывал неразвитие ЗНО в 10 из 38 случаев в группе плохого прогноза в ОНД (ложноотрицательный результат). Для того чтобы выявить причины ложноотрицательных предсказаний, проанализировали зависимость правильности предсказания от времени между исследованием и постановкой диагноза ЗНО; возраста пациента на момент исследования; локализации и стадии ЗНО. Анализ проводили только на ОНД, поскольку количество случаев ЗНО в ВНД было слишком мало.
В 28 случаях, в которых развитие ЗНО предсказано правильно, время между исследованием и постановкой диагноза ЗНО было достоверно меньше, чем в 10 случаях ложноотрицательных предсказаний ЗНО (2,8 ± 1,6 года против 4,1 ± 1,2 года; p < 0,05 в /-тесте Стьюдента). В то же время лица, у которых развитие ЗНО было предсказано правильно, были достоверно старше, чем лица с ложноотрицательным предсказанием (62,8 ± 5,8 года против 56,5 ± 7,7 года; p < 0,05 в /-тесте Стьюдента). Поэтому однозначно судить о причине ложноотрицательных предсказаний (относительно молодой возраст или больший интервал между исследованием и постановкой диагноза) не представлялось возможным.
Очевидной связи между правильностью предсказания и локализацией или стадией ЗНО не выявили (данные не показаны).
3.4. Построение классификатора в возрастной группе 61 год и старше
Поскольку лица с правильными предсказаниями ЗНО были достоверно старше, чем лица с ложноотрицательными предсказаниями, и поскольку средний возраст всей группы плохого прогноза был достоверно выше, чем в группе хорошего прогноза (как в ОНД, так и в ВНД; см. табл. 1), нельзя было исключить того, что вместо изменений иммунного статуса, вызванных онкологическим процессом, мы выявляем изменения, вызванные старением. Поэтому мы разделили ОНД на два набора данных по возрасту: ОНД-61 и ОНД-60. ОНД-61 составили лица в возрасте 61 года и старше (203 иммунных статуса, из них 25 с плохим прогнозом и 178 с хорошим). В ОНД-60 включили лиц в возрасте до 60 лет включительно (476 иммунных статусов, из них 13 с плохим прогнозом и 463 с хорошим).
Когда в качестве ОНД использовали ОНД-61, то число классификаторов с рекурсивной точностью Pr > 0,72 было слишком велико, в связи с чем отбирали классификаторы с Pr
> 0,76. Получили 182 таких классификатора. 6 из них давали Pr > 0,7623 при рекурсивной проверке на ОНД-61 и одновременно Pr > 0,8294 при проверке на ВНД. Результаты расчетов, которые аналогичны приведенным выше, показали, что вероятность случайного совпадения этих двух событий составляет ~ 2,38 • 10-9 • 33554431 ~ 0 классификаторов, обладающих точностью Pr > 0,7623 в ОНД-61 и одновременно Pr
> 0,8284 в ВНД. Это достоверно меньше, чем 6 таких классификаторов, полученных в реальности (p = 0,04 в тесте %2). Таким образом, можно утверждать, что эти 6 классификаторов прошли проверку на независимом наборе данных (ВНД). Из них был отобран 1 (К2; см. табл. 3), дающий наиболее высокую точность предсказания в ВНД (Pr = 0,8431). Рекурсивная точность классификатора К2 составила 0,7623. Для сравнения: максимальная рекурсивная точность предсказания ЗНО по одной переменной в этой возрастной группе составила
Классификаторы К1, К2, КЗ и их прогностическая точность
Таблица 3
Группа плохого Группа хорошего
Классификаторы и их компоненты Набор прогноза1 прогноза1 Чувстви- Специ- Pr
данных пра- непра- пра- непра- тельность фичность
вильно вильно вильно вильно
К1: лимфоциты (%), CD3 (%), CD4 (абс.), CD8 (абс.), активированные T-клетки, CD19 (абс.), IgA, IgE, CD4/(CD16+CD8) ОНД ВНД 28 5
К2: лейкоциты, CD3 (%), CD3 (абс.), CD19 (%), IgG, ОНД-61 20
IgA, IgE, CD4/(CD16+CD8) ВНД 5
К3: лейкоциты, CD4 (абс.), CD8 (абс.), CD16 (абс.), ФАН, CD19 (абс.), IgM, IgA ОНД-60 10
10 458 183 0,7368 0,7145 0,7256***
1 25 9 0,8333 0,7353 0,7843*
5 129 49 0,8 0,7207 0,7623***
1 29 5 0,8333 0,8529 0,8431**
3 335 128 0,7692 0,7235 0,7496***
Примечание. 'Показано количество случаев правильного и неправильного предсказания в группах плохого и хорошего прогноза в соответствующих наборах данных. Значения Pr рассчитаны по формуле (6), уровень достоверности p получен методом перемешиваний.
* -p < 0,05; ** -p < 0,01; *** -p < 0,0001.
- 274 -
ЭКОЛОГИЧЕСКАЯ ИММУНОЛОГИЯ
0,6658; этой переменной оказалось абсолютное содержание CD16+-raeTOK. Точность предсказания была достоверна как в ОНД-61 (р < 0,0001), так и ВНД (р < 0,01).
3.5. Построение классификатора в возрастной группе до 60 лет
Применив аналогичные подходы, на материале ОНД-60 получили 309 классификаторов с рекурсивной точностью Pr > 0,74. Наиболее высокую точность из них давал классификатор К3 (Pr = 0,7496 при проверке на ОНД). На ВНД этот классификатор не тестировали, так как основная часть пациентов, входивших в ВНД, была старше 60 лет.
3.6. Анализ классификаторов К2 и К3
Как видно из табл. 3, классификаторы К2 и К3 в своих возрастных группах (ОНД-61, ОНД-60) отличались большей точностью предсказания, чем классификатор К1 во всем ОНД, однако число ложноотрицательных и ложноположительных предсказаний ЗНО было все же довольно велико. И тот, и другой классификатор включал содержание CD4+-, CD8+- и CD16+-лимфоцитов (К3 - в виде абсолютного содержания этих субпопуляций лимфоцитов; К2 - в виде соотношения CD4/(CD16+CD8)), а также уровень лейкоцитов и IgA; остальные компоненты классификаторов разнились. Оба классификатора хорошо работали только в своих возрастных группах. Так, точность классификатора К2 в ОНД-60 составила лишь 0,5508, а точность классификатора К3 в ОНД-61 - 0,6602. Для обоих классификаторов не выявили зависимости правильности предсказания от возраста и времени между исследованием и постановкой диагноза ЗНО. Тест на мультиколлинеарность показал, что переменные, входящие как в К2, так и в К3, не являются взаимно избыточными.
Оценим практическую значимость классификатора К2, взяв за основу данные, полученные для ОНД-61 (см. табл. 3), и данные по онкологической заболеваемости ликвидаторов. Предположим, что исследование иммунного статуса проводится одновременно у 1000 ликвидаторов. Годовая заболеваемость ЗНО среди ликвидаторов старше 61 года, проживающих в Северо-Западном регионе Ленинградской области, с 1989 по 2010 г. составила в среднем ~ 8,8 случая на 1000 человек (наши неопубликованные данные). Предположим, что изменения в иммунной системе, характерные для ЗНО, появляются за 5 лет до установления диагноза ЗНО. Тогда на 1000 ликвидаторов приходится 8,8 • 5 = 44 человека, у которых будущее заболевание в принципе может быть распознано по изменениям иммунного статуса. Из них, согласно данным в табл. 16, развитие ЗНО правильно предсказывается в 35 случаях (44 • чувствительность = 44 • 0,8 ~ 35). При этом ложноположительный прогноз (неправильное предсказание ЗНО в группе хорошего прогноза) делается в 267 случаях: (1000 - 44) • (1 - специфичность) = (1000 - 44) • (1 - 0,7207) ~ 267. В итоге формируется класс из 35 + 267 = 302 человека, в котором предсказывается развитие ЗНО и в котором действительная вероятность развития ЗНО в ближайшие 5 лет составляет 35/302 ~ 0,116 (116 на 1000). Соответственно неразвитие ЗНО предсказывается в 1000 - 302 = 698 случаях. Из них ЗНО разовьется у 44 - 35 = 9 человек. Таким образом, вероятность развития ЗНО в классе, где предсказывается отсутствие ЗНО, составляет 9/698 ~ 0,012 (12 на 1000), что в 10 раз ниже, чем в классе, где предсказывается развитие ЗНО (р < 0,001 в тесте %2).
В ОНД-60 частота ЗНО составляет около 3,2 на 1000 в год. Аналогичные выкладки с использованием классификатора К3 и ОНД-60 дают два класса с 5-летним риском ЗНО 42 и 6 на 1000 человек (р < 0,001). Таким образом, применение прогностических классификаторов позволяет сформировать группы лиц с повышенным риском ЗНО.
4 . Обсуждение
В работе оценена возможность предсказания ЗНО по показателям рутинного исследования иммунного статуса с помощью метода взвешенного голосования. Наиболее убедительно такая возможность продемонстрирована для группы лиц в
возрасте 61 года и старше. Предложенные прогностические классификаторы не позволяют делать безусловное заключение о прогнозе в каждом конкретном случае, однако дают возможность сформировать группу лиц с повышенным риском ЗНО, с тем чтобы проводить в этой группе углубленное клиниколабораторное обследование с целью более раннего выявления ЗНО. Предпочтительнее использовать отдельные классификаторы для возрастных групп 61 год и старше и 60 лет и младше (К2 и К3), которые дают более высокую точность предсказания по сравнению с общим классификатором К1.
Аналогичные классификаторы с использованием различного количества биомаркеров и методов математической обработки ранее публиковались в литературе [6, 7]. Как правило, такие классификаторы используют для предсказания отдельных видов рака, а в качестве биомаркеров используют молекулы, непосредственно экспрессируемые опухолью или связанные с ее метаболизмом. Так, классификатор, включающий сывороточный уровень лептина, пролактина, остеопонтина, инсулиноподобного ростового фактора II, маркера CA-125 и фактора, ингибирующего миграцию, позволяет предсказывать развитие рака яичника с точностью до 98,7% [7]. По сравнению с этой работой точность прогностических классификаторов в нашем исследовании довольно невысокая (см. табл. 3). Это можно объяснить тем, что, во-первых, прогноз ЗНО делался по непрямым показателям - параметрам иммунного статуса; во-вторых, ставилась задача предсказать ЗНО как таковое, а не отдельные виды рака; в-третьих, на показатели иммунного статуса могут влиять факторы, не связанные с онкологическим процессом, например хронические инфекции. Тем не менее мультипараметрические классификаторы К1, К2 и К3 позволяли добиться более высокой точности предсказания ЗНО, чем предсказание по отдельно взятым параметрам иммунного статуса, и сформировать группы риска ликвидаторов, у которых вероятность возникновения ЗНО в ближайшие 5 лет составляет до 116 на 1000. Однако мы не исключаем того, что применение более сложных методов анализа и исследование большего количества переменных, необязательно относящихся к иммунной системе, позволят добиться более высокой точности прогноза. Также необходима валидация классификаторов на более крупных независимых выборках.
Биологический смысл полученных прогностических классификаторов можно интерпретировать двояко. С одной стороны, поскольку ЗНО характеризуется длительным бессимптомным периодом [2, 3] и у значительной части наших пациентов ЗНО было выявлено на относительно поздней стадии, то можно предположить, что изменения иммунного статуса, предсказывающие ЗНО, на деле являются следствием скрытого онкологического процесса. Против этого предположения выступает довольно большое количество ложноположительных предсдказаний (т. е. предсказаний ЗНО у лиц, у которых в реальности ЗНО не развилось по крайней мере за 3 года наблюдения). Окончательный вывод о развитии ЗНО у этих лиц можно сделать только в результате пожизненного наблюдения, тем не менее представляется возможным, что прогностические классификаторы выявляют некую иммунологическую предрасположенность к ЗНО, которая лишь в некоторых случаях (при воздействии определенных дополнительных факторов) может привести к формированию злокачественной опухоли. Выявление этих факторов, вероятно, позволит делать более определенные заключения о риске ЗНО у конкретных лиц.
Приложение
Ниже приводятся формулы прогностических классификаторов К1, К2 и К3, приведенные к стандартному виду линейной регрессии.
Классификатор К1:
V = sign (-0,199 (лимфоциты, %) + 0,529 (CD3, %) + 4,425 (CD4, абс.) - 19,735 (CD8, абс.) - 0,489 (активированные T-клетки) + 16,931 (CD19, абс.) - 2,404 (IgA) - 0,025 (IgE) + 22,656 (CD4/CD16+CD8)) - 22,901).
- 275 -
ИММУНОЛОГИЯ № 5, 2012
Классификатор К2:
V = sign(-1,27 (лейкоциты) + 0,529 (CD3, %) - 0,748 (CD3, абс.) + 1,232 (CD19, %) + 1,215 (IgG) - 2,404 (IgA) -0,025(IgE) +22,656(CD4/CD16+CD8)) - 55,029). Классификатор К3:
Vz = sign (-1,27 (лейкоциты) + 4,425 (CD4, абс.) - 19,735 (CD3, абс.) - 35,098 (CD16, абс.) + 0,206 (фагоцитарная активность нейтрофилов) + 16,931 (CD19, абс.) - 3,094(IgM) - 2,404(IgA) + 27,131).
Примечание. Переменные «лейкоциты», «CD3, абс.», «CD4, абс.», «CD8, абс.», «CD16, абс.», «CD19, абс.» должны быть выражены в виде тысяч клеток на 1 мкл (например, при уровне лейкоцитов 7 • 103/мкл в формулу подставляется число 7), переменные «IgG», «IgA» и «IgM» - в г/л, переменная «IgE» - в МЕ.
ЛИТЕРАТУРА
1. Орадовская И. В., Пащенкова Ю. Г., Феоктистов В. В. и др. Эпидемиологический анализ мониторинга иммунного статуса у ликвидаторов последствий аварии на Чернобыльской АЭС для раннего выявления групп риска и диагностики онкологических заболеваний // Радиац. биол. Радиоэкол. -2011. - Т 51, № 1. - С. 1-16.
2. Ami T., Kuroishi T., Saito Y. et al. // Tumor doubling time and prognosis in lung cancer patients: evaluation from chest films and clinical follow-up study. Japanese Lung Cancer Screening Research Group // Jpn J. Clin. Oncol. - 1994. - Vol. 24, N 4. - P. 199-204.
3. Holland-Frei Cancer Medicine, 6th edition. Под ред. D. W. Kufe, R. E. Pollock, R. R. Weichselbaum, R. C. Bast, T. S. Gansler, J. F. Holland, E. Frei BC Decker, 2003. http://www.ncbi.nlm.nih.gov/ bookshelf/br.fcgi?book=cmed6&part=A30838.
4. Lamb J., Ramaswamy S., FordH. L. et al. A mechanism of cyclin D1 action encoded in the patterns of gene expression in human cancer // Cell. - 2003. - Vol. 114. - P. 323-334.
5. Mootha V. K., Lindgren C. M., Eriksson K. F. et al. PGC-lalpha-responsive genes involved in oxidative phosphorylation are coordinately downregulated in human diabetes // Nature Genet. -2003. - Vol. 34. - P. 267-273.
6. Ramaswamy S., Ross K. N., Lander E. S., Golub T. R. A molecular signature of metastasis in primary solid tumors // Nature Genet. - 2003. - Vol. 33. - P. 49-54.
7. Visintin I., Feng Z., Longton G. et al. Diagnostic markers for early detection of ovarian cancer // Clin. Cancer Res. - 2008. - Vol. 14. - P. 1065-1072.
Поступила 28.05.12
ОБЗОРЫ
© Б. В. ПИНЕГИН, М. И. КАРСОНОВА, 2012 УДК 616.517-092:612.017.1
Б. В. Пинегин, М. И. Карсонова
роль антимикробного пептида ll-37 в развитии аутоиммунного процесса
ФГБУ ГНЦ Институт иммунологии ФМБА России (115478, Москва, Каширское ш., 24, корп. 2), ГБОУ ВПО Первый МГМУ им. И. М. Сеченова Минздравсоцразвития России (119991, Москва, ул. Трубецкая, д. 8, стр. 2)
В обзоре рассмотрено участие антимикробного пептида LL-37 в инициации и ингибиции аутоиммунного воспаления на модели псориаза. Показана роль этого пептида в защите внеклеточных нуклеиновых кислот от нуклеаз, в доставке их в эндосомальный отдел дендритных клеток и индукции синтеза провоспалительных цитокинов. Обсуждаются возможные пути терапевтического применения пептида LL-37.
Ключевые слова: аутоиммунные процессы, псориаз, клетки иммунной системы, дендритные клетки, цитокины, пептид LL-37
Pinegin B.V., Karsonova M.I.
role of antimicrobial peptide ll-37 in the development of autoimmune process
In a review of the participation of antimicrobial peptide LL-37 in the initiation and the inhibition of autoimmune inflammation of the model of psoriasis. Shows the role of the peptide in the protection of extracellular nucleic from nuclease, in the delivery of them in endosomal department of dendritic cells and induction of synthesis of proinflammatory cytokines. Are discussed the ways of possible therapeutic use of peptide LL-37.
Key words: autoimmune processes, psoriasis, immune system cells, dendritic cells, cytokines, peptide LL-37
В развитии аутоиммунных процессов важную роль играют Toll-подобные рецепторы (TLR), распознающие нуклеиновые кислоты (НК). Первично предполагалось, что эти рецепторы распознают преимущественно прокариотические НК. В частности, TLR3, TLR7/TLR8 и TLR9 распознают двухспиральные, односпиральные вирусные РНК и бактериальные и
Пинегин Борис Владимирович - д-р мед. наук, проф., тел. 8(499)617-76-49
вирусные неметилированные CpG-последовательности ДНК соответственно. Взаимодействие прокариотических НК с TLR вызывает активацию клеток врожденного иммунитета, синтез провоспалительных цитокинов и повышение устойчивости организма к инфекционным агентам.
Однако TLR обладают способностью распознавать не только прокариотические, но и эукариотические НК. Последние могут выделяться во внеклеточную среду из стареющих, апоптотиче-ских и некротических клеток и при отсутствии их элиминации вызывать развитие аутоиммунных процессов. Так, у мышей, де-
- 276 -