14
ЗНиСО
Апрель №4 (200)
УДК 616.594.12-02:504.75.06]:004.94
ПРОГНОСТИЧЕСКАЯ МОДЕЛЬ ФОРМИРОВАНИЯ ЗАБОЛЕВАЕМОСТИ ГНЕЗДНОЙ АЛОПЕЦИЕЙ В ЗАВИСИМОСТИ ОТ СОДЕРЖАНИЯ МЕТАЛЛОВ
В ОБЪЕКТАХ ОКРУЖАЮЩЕЙ СРЕДЫ
Н.П. Сетко, Т.В. Николаева, Л.Г. Воронина
ФГБОУ ВО «Оренбургский государственный медицинский университет» Минздрава России,
Оренбург, Россия
Представлены данные, доказывающие влияние факторов окружающей среды на заболеваемость аутоиммунной патологией, на примере гнездной алопеции. Описаны результаты математического моделирования формирования заболеваемости этим дерматозом в зависимости от содержания цинка, меди, никеля, хрома и свинца в объектах окружающей среды. Установлено, что увеличение содержания этих металлов в почве повышает вероятность формирования высоких уровней заболеваемости гнездной алопецией, в то время как содержание этих же металлов в атмосферном воздухе не оказывает существенного влияния на формирование данного вида заболеваемости. Используя показатели содержания цинка, меди, никеля, хрома и свинца в почве, разработанная логит-модель позволяет прогнозировать уровни заболеваемости гнездной алопецией и принимать соответствующие управленческие решения.
Ключевые слова: тяжелые металлы, почва, атмосферный воздух, заболеваемость, логит-модель, гнездная алопеция.
N.P. Setko, T.V. Nikolaeva, L.G. Voronina □ PREDICTIVE MODELS OF ALOPECIA AREATA PREVELENCE FORMING BASED ON THE CONTENT OF METALS IN THE ENVIRONMENT OBJECTS □ Orenburg State Medical University of the Ministry of Healthcare of the Russian Federation, Orenburg, Russia.
The article presents data showing the effect of environmental factors on the prevelence of autoimmune disorders, the example of alopecia areata. The results of mathematical modeling of the formation of this dermatosis prevalence depending on the content of zinc, copper, nickel, chromium and lead in the environment were described. It was found that an increase in the content of these metals in the soil increases the likelihood of the formation of high levels of incidence of alopecia areata. However, the content of the same metals in the air has no effect on the formation of prevelence of this autoimmune skin disease. Using data on the content of zinc, copper, nickel, chromium and lead in the soil developed logit-model allows us to predict the prevalence rates of alopecia areata and make appropriate management decisions. Key words: heavy metals, soil, air, prevalence, logit-model, alopecia areata.
Выделяют несколько факторов, объясняющих общие патогенетические механизмы различных аутоиммунных заболеваний, обозначаемых термином «мозаика аутоиммунитета» и поддерживающих их многофакторное происхождение и клиническое разнообразие [8, 10]. К этим факторам относят генетические факторы, факторы окружающей среды, иммунные дефекты и гормональные нарушения [9]. Среди химических веществ, которые представляют собой самостоятельный класс факторов окружающей среды, оказывающих влияние на формирование аутоиммунной заболеваемости, особое место занимают тяжелые металлы [7]. Это обусловлено их широкой распространенностью в объектах окружающей среды и высоким потенциалом воздействия на организм человека [3, 5, 6]. В современной научной литературе отмечается недостаток исследований, позволяющих сделать выводы о воздействии металлов, поступающих из окружающей среды, на формирование аутоиммунных заболеваний [7]. В качестве примера для определения вклада средовых факторов в формирование аутоиммунных заболеваний кожи может выступить гнездная алопеция (ГА), фенотипические проявления которой, в отличие от остальных дерматозов аутоиммунной природы, непостоянны, что свидетельствует о большем вкладе в ее формирование средовых факторов.
Цель исследования - разработать прогностическую модель формирования заболеваемо-
i
сти ГА в зависимости от содержания металлов в объектах окружающей среды.
Материалы и методы. Для установления возможной взаимосвязи заболеваемости ГА с содержанием металлов в атмосферном воздухе и почве использованы данные региональной системы социально-гигиенического мониторинга в девяти городах Оренбургской области, отличающихся по уровню антропогенного загрязнения, и показатели общей заболеваемости ГА населения этих территорий за 2011-2015 годы. Показатели заболеваемости представлены в виде количества случаев на 10 000 населения и 95%-го доверительного интервала (95%-й ДИ), рассчитанного по методу Уилсона [11]. Из многообразия металлов, загрязняющих объекты окружающей среды, были отобраны те, которые в ранее выполненном модельном эксперименте привели к структурно-функциональной реорганизации кожи и ее производных у экспериментальных животных, - никель, хром, цинк, свинец и медь [4]. Установление взаимосвязи между заболеваемостью ГА и уровнем тяжелых металлов в объектах окружающей среды и математическое моделирование вероятности формирования высокого уровня заболеваемости проводилось на основе логистического регрессионного анализа, выполненного на основе агрегированных признаков содержания металлов, построенных методом главных компонент. Исходные признаки, в частности, уровни металлов в атмосферном воздухе, выражены в долях
•Ш, IM (277)
ЗНиСО
15
от предельно допустимой концентрации (ПДК), F^ и представляли собой отношение абсолютных концентраций к соответствующим предельно допустимым концентрациям в воздухе; содержание металлов в почве выражалось коэффициентом концентрации (мг/кг). Учитывая это, Z^ агрегированные показатели имеют соответствующие единицы измерения. В том случае, если при использовании логит-модели рассчитанная вероятность Р составляет менее 0,5, то в муниципальном образовании прогнозируете мый показатель заболеваемости ГА будет ниже S среднеобластного уровня, если более 0,5 - выше среднего по Оренбургской области показателя заболеваемости ГА. Для количественной характеристики влияния каждого фактора на вероятность формирования высокого уровня _ заболеваемости рассчитывались средние предельные эффекты. Качество модели оценива-° лось с помощью псевдо-коэффициента детерминации, классификационной таблицы и рассчитанных на основе нее показателей чувствительности и специфичности, а также ROC-анализа, состоящего в построении ROC- кривой и расчете площади под ROC-кривой. Количественную интерпретацию ROC-анализа проводили по показателю AUC (area under curve, численное значение клинической значимости диагностического теста). По экспертной шкале для значений AUC показатель в пределах 0,50,6 свидетельствовал о неудовлетворительном качестве диагностического теста, в пределах 0,6-0,7 - о среднем качестве диагностического теста, в пределах 0,7-0,8 - о хорошем качестве диагностического теста, в пределах 0,8-0,9 -очень хорошем, 0,9-1,0 - отличном качестве диагностического теста [2].
Результаты исследования. При оценке взаимосвязи между содержанием Cu, Zn, Pb, Ni, Cr в атмосферном воздухе городов Оренбургской области были установлены тесные корреляционные связи между уровнем меди и цинка (r = 0,73; p = 0,024), меди и никеля (r = 0,87; p = 0,002), меди и хрома (r = 0,78; p = 0,012), цинка и никеля (r = 0,72; p = 0,028), цинка и хрома (r = 0,67; p = 0,048), хрома и никеля (r = 0,96; p < 0,001). Вместе с тем содержание свинца не коррелировало ни с одним из рассматриваемых показателей. Наличие тесной корреляции между Cu, Zn, Ni и Cr позволило реализовать метод главных компонент по содержанию этих металлов в атмосферном воздухе и установить первую главную компоненту, тесно коррелирующую со всеми четырьмя признаками, характеризующими содержание металлов в воздухе, и обеспечивающую уровень информативности, равный 84,5 %. При этом вклад остальных главных компонент составил лишь 9,7 %, 5,2 % и 0,6 %. Это послужило основанием в дальнейшем анализе использовать без существенных потерь информации только первую главную компоненту, построенную на основе содержания в атмосферном воздухе Cu, Zn, Ni и Cr. Агрегированный показатель содержания этих металлов в воздухе, описанный через исходные значения их содержания в этом
объекте окружающей среды, исключая свободный член, не влияющий на дальнейшие расчеты, имел вид:
z1 = 0,153х1 + 0,071x2 + 0,576х3 + 0,321х4, где (1)
х1 - содержание Си в воздухе, доля от ПДК; х2 - содержания в воздухе, доля от ПДК; х3 - содержания N1 в воздухе, доля от ПДК; х4 - содержания Сг в воздухе, доля от ПДК. Значения агрегированного показателя содержания Си, Zn, N1 и Сг вычисленные по формуле (1), а также значение содержания РЬ в воздухе (х5) приведенные в таблице 1, были использованы в расчетах для оценки влияния содержания металлов в атмосферном воздухе на уровень заболеваемости ГА в городах Оренбуржья.
Таблица 1. Показатели содержания металлов в атмосферном воздухе
Города Значения агрегированного показателя содержания Си, Zn, N1, Сг в воздухе, доля от ПДК Содержание Pb в воздухе, доля от ПДК
Кувандык 2,047473 0,26
Медногорск 2,169144 0,17
Новотроицк 0,677036 0,23
Орск 1,288659 0,38
Бугуруслан 0,149862 0,12
Оренбург 1,123241 0,64
Гай 0,766551 0,22
Бузулук 0,229571 0,18
Соль-Илецк 0,207638 0,12
Как показано в таблице 2, средний уровень общей заболеваемости ГА по Оренбургской области составил 3,36 случая на 10 000 населения. Для дальнейшего анализа в рассмотрение был введен признак у, принимающий значение 1 в том случае, если общая заболеваемость ГА населения муниципального образования была выше среднего значения, и значение 0 - если показатель распространенности этого заболевания в городах был ниже, чем в среднем по Оренбургской области. В соответствии с этим для городов Медногорск, Новотроицк, Орск у = 1, для городов Кувандык, Бугуруслан, Оренбург, Гай, Бузулук, Соль-Илецк у = 0.
Таблица 2. Показатели общей заболеваемости ГА в городах Оренбургской области (в случаях на 10 000 населения)
Города Показатели (95%-й ДИ)
г. Бугуруслан 2,91 (1,42 - 4,40)
г. Бузулук 2,76 (1,64 - 3,88)
г. Оренбург 3,15 (2,69 - 3,61)
г. Соль-Илецк 2,90 (0,94 - 5,02)
г. Орск 4,65 (3,78 - 5,52)
г. Новотроицк 4,64 (3,29 - 5,98)
г. Медногорск 3,77 (1,49 - 6,05)
г. Гай 2,40 (0,81 - 3,98)
г. Кувандык 1,10 (0,19 - 2,43)
В среднем по Оренбургской области 3,36 (3,10 - 3,61)
1С
ЗНиСО
Апрель №4 (200)
Анализ данных, представленных в таблице 3, описывающих результаты моделирования вероятности прогностического уровня заболеваемости ГА в зависимости от агрегированных показателей содержания металлов и уровня свинца в атмосферном воздухе, свидетельствует о том, что построенная логит-модель статистически незначима.
Таблица 3. Коэффициенты логит-модели формирования высокого уровня заболеваемости гнездной алопецией в зависимости от агрегированных показателей содержания металлов и уровня свинца в воздухе
Признаки Обозначение Коэффициент Стандартная ошибка p-уровень
Содержание Си, Zn, N1, Сг в воздухе z1 1,327 1,087 0,222
Содержание РЬ в воздухе z2 -1,335 3,697 0,718
Свободный член -1,720 1,389 0,216
Это подтверждают значение статистики Вальда Wald chi2(2), равное 1,49, соответствующее p-значение, составившее 0,4747, и коэффициент детерминации Pseudo R , равный 0,1394. Поэтому влияние содержания Cu, Zn, Pb, Ni, Cr в атмосферном воздухе на вероятность формирования высокого уровня заболеваемости ГА в муниципальных образованиях, не доказано.
Особый интерес представляет собой исследование влияния на формирование заболеваемости ГА металлов, содержащихся в почве, учитывая, что последняя является аккумулирующей средой. При анализе взаимосвязи между показателями содержания металлов в почве установлено наличие тесной корреляционной связи между содержанием Cu, Zn, Pb, а также между содержанием Ni и Cr. Коэффициент корреляции Пирсона (г) между содержанием в почве цинка и меди, меди и свинца, свинца и цинка составил 0,95 (p < 0,001), 0,82 (p = 0,006) и 0,78 (p = 0,012) соответственно. В свою очередь, содержание в почве Ni характеризовалось тесной корреляционной связью с содержанием в почве Cr (г = 0,89; p = 0,001). При этом признаки, характеризующие содержание металлов из этих двух групп в почве, между собой не коррелированы. Это обусловило возможность агрегирования исходных признаков, т. е. показателей содержания металлов в почве, в форме информативных главных компонент. В результате реализации метода главных компонент по содержанию Cu, Zn, Pb в почве было установлено, что первая главная компонента тесно коррелировала со всеми тремя признаками, характеризующими содержание Cu, Zn, Pb в почве, и обеспечивала уровень информативности, равный 90,3 %. При этом вторая и третья главные компоненты имели уровень информативности лишь 8,0 % и 1,7 % соответственно. Это обстоятельство позволило в дальнейшем анализе использовать без существенных потерь ин-
формации только первую главную компоненту, построенную на основе содержания в почве Си, Zn, РЬ. В результате использования первой главной компоненты была получена следующая линейная комбинация содержания Си, Zn, РЬ в почве (без учета свободного члена, не влияющего на дальнейшие результаты), позволившая вычислить значения агрегированного показателя содержания этих металлов в
почве:
= 1,160х; + 0,550х2 + 0,868х3, где (2) X] - содержание Си в почве, мг/кг; х2 - содержания Zn в почве, мг/кг; х3 - содержания РЬ в почве, мг/кг. Аналогичным образом построен агрегированный показатель содержания N1 и Сг в почве. Установлено, что первая главная компонента тесно коррелировала с содержанием в почве как N1, так и Сг и обеспечивала уровень информативности, равный 94,4 %, в то время как вторая главная компонента - лишь 5,6 %. Агрегированный показатель содержания N1 и Сг в почве, записанный через исходные признаки, характеризующие содержание этих металлов в почве, исключая свободный член, не влияющий на дальнейшие результаты, имел вид:
22 = 2,405x4 + 1,213x5, где (3)
х4 - содержание N1 в почве, мг/кг; х5 - содержания Сг в почве, мг/кг. Использование метода главных компонент позволило снизить размерность признакового пространства с пяти признаков, характеризующих содержание в почве металлов, до двух агрегированных показателей содержания Си, Zn, РЬ и N1, Сг (г2), вычисленных по формулам (2) и (3) соответственно. Значения этих показателей, рассчитанные для девяти исследуемых территорий и используемые в дальнейшем регрессионном анализе, приведены в таблице 4.
Таблица 4. Значения агрегированных показателей содержания металлов в почве
Города Агрегированный показатель содержания Cu, Zn, Pb в почве, мг/кг Агрегированный показатель содержания Ni, Cr в почве, мг/кг
Кувандык 3,895 4,222
Медногорск 16,028 4,449
Новотроицк 4,336 19,440
Орск 4,504 28,897
Бугуруслан 1,981 2,531
Оренбург 2,983 7,348
Гай 4,091 7,848
Бузулук 6,120 23,951
Соль-Илецк 1,716 2,699
Анализ данных, представленных в таблице 5, описывающих результаты моделирования вероятности формирования более высокого уровня заболеваемости ГА в зависимости от агрегированных показателей содержания металлов в почве, свидетельствует о ее значимости. Последнее подтверждается рассчитанным значением статистики Вальда Wald chi2(2), равным
i
•Ш, 1М (277)
ЗНиСО
17
ц
7,93, соответствующим ему р-значением, которое составило 0,0189, и коэффициентом детерминации Pseudo R2, равным 0,4971. Приведенные доказательства значимости построенной логит-модели обосновывают использование ее коэффициентов для расчета прогностических уровней заболеваемости ГА.
Таблица 5. Коэффициенты логит-модели формирования высокого уровня общей заболеваемости гнездной алопецией в зависимости от агрегированных показателей содержания металлов в почве
Таблица 6. Показатели средних предельных эффектов логит-модели (4)
Признаки Обо-значение Коэффициент Стандартная ошибка р-уровень
Содержание Си, Zn, РЬ в почве 0,449 0,157 0,005**
Содержание N1, Сг в почве ^2 0,164 0,090 0,041*
Свободный член -5,532 1,813 0,002**
Коэффициент значим на уровне: * р<0,05; **р<0,01
-, где
(4)
Признак Обо-значение Средний предельный эффект Стандартная ошибка р-уровень
Содержание Си, Zn, РЬ в почве 0,043 0,011 0,000***
Содержание N1, Сг в почве 0,016 0,003 0,000***
*** Коэффициент значим на уровне р<0,001
Зависимость вероятности формирования высокого уровня заболеваемости ГА в муниципальном образовании (у) от двух агрегированных показателей содержания металлов в почве описывается моделью вида:
Г ( у = 1 г) = _ехр(5)
. + ехр(я)
Р - оценка вероятности высокого уровня заболеваемости ГА;
s - показатель экспоненты, рассчитываемый по формуле:
s = -5,532 + 0,449^ + 0,164г2
Представленная выше модель позволяет рассчитывать вероятность формирования высокого или низкого уровня заболеваемости ГА. При этом полученные данные свидетельствуют о том, что на уровне р < 0,05 значимое влияние на вероятность формирования того или иного уровня заболеваемости ГА оказывают оба агрегированных показателя содержания металлов в почве, причем увеличение содержания Си, Zn, РЬ и N1, Сг приводят к увеличению вероятности того, что в муниципальном образовании сформируется уровень заболеваемости выше среднеобластного показателя. Рассчитанные средние предельные эффекты, представляющие собой количественную характеристику влияния факторов на вероятность формирования высокого уровня заболеваемости (таблица 6), позволили установить, что в среднем увеличение значения агрегированного показателя содержания Си, Zn, РЬ в почве на 1 единицу приводит к увеличению вероятности формирования высокого уровня общей заболеваемости ГА на 4,3 %. Меньшее влияние на формирование заболеваемости оказывает значение агрегированного показателя содержания N1 и Сг в почве, увеличение значения которого на 1 единицу приводит к увеличению вероятности формирования высокого уровня заболеваемости ГА в среднем на 1,6 %.
Введение данных о содержании металлов в почве девяти городов Оренбургской области в разработанную логит-модель (4) позволило распределить исследуемые города на территории с показателями заболеваемости ГА выше или ниже среднеобластного уровня. Из 3 городов, характеризующихся высоким уровнем общей заболеваемости ГА (Медногорск, Новотроицк, Орск), с помощью модели была подтверждена высокая заболеваемость ГА в 2 городах (66,67 %) (таблица 7). Согласно полученной логит-модели из 6 городов с уровнем заболеваемости ГА ниже среднего областного показателя (Кувандык, Бугуруслан, Оренбург, Гай, Бузулук, Соль-Илецк) к ним были отнесены 5 (83,33 %) муниципальных образований. Один город (33,33 %) с высоким уровнем заболеваемости (Новотроицк) был распознан моделью как город с низким уровнем заболеваемости и один город (16,67 %), характеризующийся низким уровнем заболеваемости (Бузулук), был распознан моделью как город с высоким уровнем заболеваемости. Прогнозы модели относительно высокого уровня заболеваемости оказались ложными в 1 случае из 3 (33,33 %), прогнозы относительно низкого уровня заболеваемости оказались ложным в одном случае из 6 (16,67 %). В целом представленная логит-мо-дель (4) корректно распознала 7 городов, т. е. 77,78 % всех наблюдений.
Таблица 7. Классификационные характеристики
результатов моделирования вероятности формирования высокого уровня заболеваемости гнездной алопецией в зависимости от агрегированных показателей содержания металлов в почве
Уровень заболеваемости ГА Всего городов, абс. число (%) Из них, по результатам моделирования, количество городов, абс. число (%) с уровнем заболеваемости
выше среднего ниже среднего
Выше среднего 3 (100) 2 (66,67) 1 (33,33)
Ниже среднего 6 (100) 1 (16,67) 5 (83,33)
Всего 9 (100) 3 (33,33) 6 (66,67)
Данные таблицы 7 позволили определить качественные характеристики модели: чувствительность и специфичность [1] и на основании последних провести ROC-анализ. Чувствительность модели, рассчитанная как отношение истинно положительных результатов к общему
18
ЗНиСО
Апрель №4 (288)
количеству городов с изучаемыми взаимосвязями заболеваемости ГА и содержанием в почве металлов, составила 66,67 %. Специфичность, являющаяся отношением истинно отрицательных результатов к общему количеству городов с изучаемыми параметрами, равна 83,33 %. Для численного выражения качества логит-модели (4) использован ROC-анализ, графически представленный в виде ROC-кривой (рис. 1). Показатель площади под ROC-кривой AUC (Area Under Curve), которая в данном случае составляет 0,9444, согласно экспертной шкале для значений AUC соответствует отличному качеству модели [2].
Рис. 1. ЛОС-кривая прогнозирования формирования высокого уровня общей заболеваемости гнездной алопецией в зависимости от агрегированных показателей содержания металлов в почве
Выводы. Проведенное исследование доказало, что факторы окружающей среды, в частности тяжелые металлы, вносят вклад в формирование ГА. При этом имеют значение превышение уровней металлов в почве, в то время как, содержание металлов в атмосферном воздухе значимого влияния на формирование заболеваемости ГА не оказывает. Разработанная прогностическая модель формирования заболеваемости ГА позволяет в зависимости от данных о содержании Си, Zn, РЬ и N1, Сг в почве, полученных в ходе социально-гигиенического мониторинга, прогнозировать риск формирования высоких уровней заболеваемости ГА и принимать своевременные управленческие решения.
ЛИТЕРАТУРА
1. Богданов Л.Ю. Оценка эффективности бинарных классификаторов на основе логистической регрессии методом ROC-анализа // Вестник Саратовского государственного технического университета. 2010. № 2. Т. 4. С. 92-97.
2. Власов В.В. Эффективность диагностических исследований. М.: Медицина, 1988. 253 с.
3. Зайцева Н.В. Особенности иммунологических и генетических нарушений человека в условиях дестабилизации среды обитания: Монография / Н.В. Зайцева, О.В. Долгих, Д.Г. Дианова. Пермь: Изд-во Перм. нац. исслед. политехн. ун-та, 2016. 300 с.
4. Сетко Н.П. и др. Оценка риска развития аутоиммунных заболеваний кожи у населения, проживающего в условиях воздействия различного уровня антропогенной нагрузки / Н. П. Сетко, Т. В. Николаева, В. С. Полякова, Л.Г. Воронина // Современные проблемы науки и образования. 2016. № 6. URL: https://www.science-education.ru/ru/article/view?id=25995 (дата обращения: 20.02.2017).
5. Онищенко Г.Г. Гигиеническая индикация последствий для здоровья при внешнесредовой экспозиции химических факторов / Г.Г. Онищенко, Н.В. Зайцева, М.А. Зем-лянова / Под ред. Г.Г. Онищенко. Пермь: Книжный формат, 2011. 532 с.
6. Hemdan N. Y. et al. Alterations of TH1/TH2 reactivity by heavy metals: possible consequences include induction of autoimmune diseases / N.Y. Hemdan, F. Emmrich, S. Faber Tet al.] // Ann. N. Y. Acad. Sci. 2007. № 1109. P. 129137.
7. Miller F. W. et al. Epidemiology of environmental exposures and human autoimmune diseases: findings from a National Institute of Environmental Health Sciences Expert Panel Workshop / F.W. Miller, L. Alfredsson, K.H. Costenbader [et al.] // J. Autoimmun. 2012. Vol. 39. № 4. P. 259-271.
8. Shapira Y. et al. Defining and analyzing geoepidemiology and human autoimmunity / Y. Shapira, N. Agmon-Levin, Y. Shoenfeld // J. Autoimmun. 2010. Vol. №34. P. J168-J177.
9. Shoenfeld Y. et al. The mosaic of autoimmunity: hormonal and environmental factors involved in autoimmune diseases - 2008 / Y. Shoenfeld, G. Zandman-Goddard, L. Sto-janovich [et al.] // Isr. Med. Assoc. J. 2008. Vol. 10. №1. P. 8-12.
10. Youinou P. et al. Geo-epidemiology and autoimmunity / P. Youinou, J.O. Pers, M.E. Gershwin [et al.] // J. Autoimmun. 2010. Vol. 34. № 3. P. J163-J167.
11. Wilson E. B. Probable inference, the law of succession, and statistical inference / E.B. Wilson // Journal of American Statistical Association. 1927. № 22. P. 209-212.
Контактная информация:
Николаева Татьяна Владимировна,
тел.: +7 (903) 366-33-80,
e-mail: [email protected]
Contact information: Nikolaeva Tat'yana, phone: +7 (903) 366-33-80, e-mail: [email protected]
i