УДК: 616.981.455 DOI: 10.12737/7241
К ВОПРОСУ О МАТЕМАТИЧЕСКИХ МЕТОДАХ ПРОГНОЗИРОВАНИЯ ЗАБОЛЕВАЕМОСТИ
ПРИРОДНО-ОЧАГОВЫМИ ИНФЕКЦИЯМИ
В.А. ЕВСТЕГНЕЕВА
Медицинский институт, Тульский государственный университет, Болдина, 128, Тула, Россия, 300012
Аннотация. Проведенный эпидемиологический анализ заболеваемости природно-очаговыми инфекциями показал, что на территории Тульской области регистрируется высокая заболеваемость лептос-пирозом, геморрагической лихорадкой с почечным синдромом, превышающая заболеваемость по Центральному федеральному округу и среднероссийские показатели. Для прогнозирования заболеваемости природно-очаговых инфекций используется анализ временных рядов, регрессионный анализ, метод группового учета аргументов. С помощью метода искусственных нейронных сетей разработана математическая модель прогнозирования заболеваемости геморрагической лихорадкой с почечным синдромом, лептоспирозом, иксодового клещевого боррелиоза. Установлено влияние на заболеваемость численности основных носителей и переносчиков инфекций и климатических факторов. На заболеваемость геморрагической лихорадкой с почечным синдромом оказывают наибольшее влияние численность рыжей полевки и температура воздуха в апреле и июле.
Ключевые слова: туляремия, лептоспироз, геморрагической лихорадкой с почечным синдромом, иксодовый клещевой боррелиоз, временной ряд, регрессионный анализ, метод группового учета аргументов, искусственные нейронные сети.
ABOUT METHOD OF PREDICTION MORBIDITY NATURAL-FOCAL INFECTIONS
V.A. EVSTEGNEEVA
Medical Institute, Tula State University, str. Boldin, 128, Tula, Russia, 300012
Abstract. Epidemiological analysis of morbidity natural-focal infections showed, that at Tula state territory registers high level of morbidity leptospirosis, hemolytic fever with renal syndrome, that exceeds morbidity at Central Federal State and average Russian indexes. For prediction of morbidity used analysis of time series, regression analysis, method group analysis arguments, algebraic model constructive logic. By using method artificial neural networks made mathematical model of prediction morbidity hemolytic fever with renal syndrome (hemolytic fever with renal syndrome), leptospirosis, tick-borne infectious borelliosis. Found that number of main infection carriers and climatic factors effect on morbidity level. By modeling of prediction morbidity prediction morbidity found that main role playing number of bank vole (Myodes glareolus) and average temperatures at April and July.
Key words: leptospirosis, hemolytic fever with renal syndrome, time series, regression analysis, method group analysis arguments, artificial neural networks, tick-borne infectious borelliosis.
Природно-очаговые инфекции являются одной из актуальных проблем в системе эпидемиологического надзора за инфекционными болезнями в РФ, в т.ч. на территории Тульской области. Расположение области на стыке двух ландшафтно-географических зон - лесной и лесостепной, разделенной полосой широколиственных дубрав, Тульских засек, и изрезанность ее территории оврагами и балками, наличие теплокровных носителей инфекций благоприятствует формированию и поддержанию природных очагов туляремии, лептоспироза, геморрагической лихорадки с почечным синдромом, иксодового клещевого боррелиоза и других инфекций.
На современном этапе туляремия не представляет той опасности для населения, которая отмечалась в сороковые - пятидесятые годы прошлого столетия, когда регистрировались сотни, тысячи случаев заболевания среди населения. В настоящее время заболеваемость туляремией в РФ регистрируется в виде спорадической, показатель заболеваемости (ПЗ) на 100 тыс. населения колеблется в пределах от 0,03 до 0,1. На территории Тульской области за 73-летний период эпизоотологического наблюдения (1942-2014 годы) зарегистрировано 537 населенных пунктов, где была выделена 1131 культура туляремийного микроба.
В Российской Федерации ежегодно регистрируется в среднем от 1,5 до 2,5 тысяч заболеваний людей лептоспирозом. Показатель заболеваемости на 100 тыс. населения колеблется от 0,18 до 1,7. Более половины больных приходится на Северо-Кавказский регион (преимущественно Краснодарский край). Высокий уровень заболеваемости отмечается также в Республиках Адыгее и Мордовии, Калининградской, Тульской, Вологодской, Ульяновской, Пермской областях и др.
Библиографическая ссылка:
Евстегнеева В.А. К вопросу о математических методах прогнозирования заболеваемости природно-очаговыми инфекциями // Вестник новых медицинских технологий. Электронное издание. 2014. №1. Публикация 1-10. URL: http://www.medtsu.tula.ru/VNMT/Bulletin/E2014-1/5023.pdf (дата обращения: 01.12.2014).
Территория Тульской области по Центральному федеральному округу является самой неблагополучной по заболеваемости людей лептоспирозом. ПЗ лептоспирозом на 100 тыс. населения в разные годы колеблется от 0,13 (2010 г.), до - 20,0 (2004 г.), что связано с активным проявлением природных очагов лептоспирозной инфекции. Численность обыкновенной полевки - основного носителя лептоспир подвержена колебаниям от 0,1 до 20,9% попадания на 100 орудий лова. Инфицированность ее лептоспи-рами колеблется в разные годы от 0,3 до 26,7% при среднем многолетнем показателе 14,7%.
Российская Федерация занимает второе место в мире, после Китая, по заболеваемости геморрагической лихорадкой с почечным синдромом (ГЛПС). В Российской Федерации ежегодно регистрируется в среднем от 4 до 10 тысяч заболеваний людей ГЛПС. ПЗ ГЛПС на 100 тыс. населения в РФ колеблется от 3,2 до 14,3. Высокая заболеваемость отмечается в Приволжском и в Центральном федеральных округах. В республиках Башкортостан, Удмуртия, Марий Эл, в Нижегородской, Пензенской и Оренбургской областях.
Территория Тульской области является неблагополучной по заболеваемости ГЛПС в Центральном федеральном округе. На территории области существует два типа очага ГЛПС: лесной - с основным хозяином хантавируса серотипа Пуумала рыжей полевкой и лесостепной - с основным хозяином хантавируса серотипа Добрава полевой мышью. Амплитуда колебаний показателя заболеваемости ГЛПС на 100 тыс. населения довольно широка от 1,3 до 11,6. Высокая заболеваемость ГЛПС в нашей области также связана с активным проявлением природных очагов хантавирусной инфекции лесного типа. Численность рыжей полевки - основного носителя этой инфекции колеблется от 5,4 до 31% попадания грызунов на 100 орудий лова. Инфицированность рыжей полевки хантавирусами в разные годы составляет от 2 до 20,2%.
В последние годы на территории нашей области стали активно проявлять себя природные очаги иксодового клещевого боррелиоза. Доля вылова клеща Ix. ricinus до 1998 года составляла от 1-2 клещей на флаго/км, начиная, с 1998 года по настоящее время численность составляет до 35 клещей на флаго/км. На фоне подъема численности иксодовых клещей в Тульской области резко повысилась обращаемость людей в ЛПУ с жалобами на присасывание. Если до 1998 года регистрировались единичные случаи обращения, то в настоящее время обращаемость составляет более 3000 человек в год. Инфицированность клещей боррелиями в разные годы составляет от 10 до 30%. Заболеваемость клещевым боррелиозом в области регистрируются около 10-15 случаев в год. Можно предположить, что истинная заболеваемость инфекциями, передаваемыми клещами, значительно выше регистрируемых значений, так как они еще недостаточно известны инфекционистам. Распознавание болезни затруднено в связи с многообразием клинических проявлений иксодового клещевого боррелиоза.
Поэтому эпизоотологический мониторинг за природными очагами и прогнозирование заболеваемости в системе эпиднадзора за природно-очаговыми инфекциями является актуальной проблемой в РФ и для Тульской области.
Между тем, без оптимизации эпидемиологического надзора невозможны управленческие мероприятия по профилактике и лечению данных инфекций, которые разработаны лишь в общих чертах. Нет сведений об использовании методов системного анализа множества переменных, участвующих в реализации эпидемического процесса природно-очаговых инфекций.
В настоящее время в литературе приводится мало сведений о конкретных результатах прогнозирования заболеваемости природно-очаговыми инфекциями с использованием методов системного анализа. К общепринятым и хорошо исследованным методам многомерного статистического анализа относятся: корреляционный анализ, регрессионный анализ, дискриминантный анализ, анализ временных рядов, алгебраическая модель конструктивной логики.
Использование метода АМКЛ отражено в работах Честновой Т.В. по диагностике листериоза [1, 2]. При прогнозировании заболеваемости лептоспирозом Смольянинова О.Л. использовала метод пошаговой регрессии [3], дискриминантный анализ и метод группового учета аргументов (МГУА)[4]. Небольшое количество работ посвящено прогнозированию с помощью метода искусственных нейронных сетей [5].
Исходя из условий моделирования сложных систем, к которым могут быть отнесены: возможные нелинейные влияния элементов на выходной параметр, синергетика и реципрокность при совместном влиянии отдельных факторов, необходимость учета в отдельных случаях категориальных факторов и нескольких выходных параметров сложной системы. В связи с этим, мы выбрали искусственные нейронные сети, позволяющие реализовать указанные условия при получении математической модели системы. В ходе сравнительного анализа для всех приведенных типов сетей успешности моделирования были определены в качестве базовых многослойные персептроны.
Для прогнозирования заболеваемости ГЛПС, лептоспирозом, ИКБ в качестве выходных параметров модели (у) была представлена заболеваемость в виде показателя на 100 тыс. населения: ГЛПС - за период с 1997 по 2013 годы, лептоспирозом - за период с 1985 по 2013годы, ИКБ - за период с 1999 по 2013 годы. В качестве входных параметров модели (х) были представлены следующие факторы: - численность рыжей полевки (Х1), инфицированность рыжей полевки хантавирусами (Х2), численность обыкновенной полевки (Х3), инфицированность обыкновенной полевки лептоспирами (Х4), инфицированность обыкновенной полевки туляремийной инфекцией (Х5), численность лесного клеща I. ricinus (Х6), инфицированность лесного
Библиографическая ссылка:
Евстегнеева В.А. К вопросу о математических методах прогнозирования заболеваемости природно-очаговыми инфекциями // Вестник новых медицинских технологий. Электронное издание. 2014. №1. Публикация 1-10. URL: http://www.medtsu.tula.ru/VNMT/Bulletin/E2014-1/5023.pdf (дата обращения: 01.12.2014).
клеща I. ricinus боррелиями (Х7), численность лугового клеща Dermacenter reticulatus (Х8), средняя температура воздуха января (Х9), средняя температура февраля (Х10), средняя температура марта (Хп), средняя температура апреля (Х12), средняя температура мая (Х13), средняя температура июня (Х14), средняя температура июля (Х15), средняя температура августа (Х16), средняя температура сентября (Х17), средняя температура октября (Х18), средняя температура ноября (Х19), средняя температура декабря (Х20), среднее количество осадков января (Х21), среднее количество осадков февраля (Х22), среднее количество осадков марта (Х23), среднее количество осадков апреля (Х24), среднее количество осадков мая (Х25), среднее количество осадков июня (Х26), среднее количество осадков июля (Х27), среднее количество осадков августа (Х28), среднее количество осадков сентября (Х29), среднее количество осадков октября (Х30), среднее количество осадков ноября (Х31), среднее количество осадков декабря (Х32), глубина снежного покрова декабря (Х33), глубина снежного покрова января (Х34), глубина снежного покрова февраля (Х35), глубина снежного покрова марта (Х36), а если учитывать предысторию процесса, т.е. влияние факторов предыдущего года на текущую заболеваемость, то количество факторов еще увеличится.
В ходе моделирования заболеваемости ГЛПС получена искусственная нейронная сеть (ИНС) на основе трехслойного многослойного персептрона (МП) с архитектурой МП 14:14 - 9-1:1 (рис. 1).
Рис. 1. Архитектура ИНС системы «Заболеваемость ГЛПС - Метеорологические факторы - Численность
и инфицированность рыжих полевок»
Анализ производительности обучения (отношение предсказанного и наблюдаемого стандартных отклонений) показывает, что контрольная (0,00) и тестовая ошибки (0,00) не различаются. Параметры регрессии, полученной в ходе моделирования, показали, что среднее значение составляет 114,8824, а стандартное отклонение - 49,95, вычисленные соответственно для обучающих данных и для ошибки прогноза. Важным показателем является стандартное отклонение ошибки прогноза. Оно существенно меньше стандартного отклонения обучающих данных равного 0,6871. Отношение стандартного отклонения ошибки прогноза к стандартному отклонению обучающих данных (0,0138) существенно меньше единицы, что говорит о хорошем качестве регрессии. Оно показывает 0,976 доли дисперсии, объяснено полученной моделью. Расположение факторов по чувствительности (рангу) полученной модели показаны в табл. 1.
Таблица 1
Расположение по рангу факторов, влияющих на заболеваемость ГЛПС
Название факторов Ранг
численность рыжей полевки 1
инфицированность рыжей полевки хантавирусами 4
Температура воздуха в апреле 2
Температура воздуха в мае 8
Температура воздуха в июне 7
Температура воздуха в июле 3
Температура воздуха в августе 6
Температура воздуха в сентябре 5
Количество осадков в апреле 9
Количество осадков в мае 13
Количество осадков в июне 11
Количество осадков в июле 10
Количество осадков в августе 12
Количество осадков в сентябре 14
Библиографическая ссылка:
Евстегнеева В.А. К вопросу о математических методах прогнозирования заболеваемости природно-очаговыми инфекциями // Вестник новых медицинских технологий. Электронное издание. 2014. №1. Публикация 1-10. URL: http://www.medtsu.tula.ru/VNMT/Bulletin/E2014-1/5023.pdf (дата обращения: 01.12.2014).
Все переменные модели имеют отношение значительно больше 1 (от 7,9 до 48,78). Оценка регрессионной зависимости показывает высокий показатель коэффициента корреляции равный 0,9999.
Анализ результатов моделирования показывает, что наиболее существенное влияние на заболеваемость ГЛПС оказывают: численность рыжей полевки, температура воздуха в апреле и июле, а также инфицированность рыжей полевки хантавирусами. Влияние на заболеваемость ГЛПС численности рыжей полевки представлено на рис. 2.
Рис. 2. Влияние численности рыжей полевки на заболеваемость ГЛПС
В ходе моделирования заболеваемости лептоспирозом получена ИНС на основе трехслойного МП с архитектурой МП 14:14 - 9-1:1 (рис. 3).
Рис. 3. Архитектура ИНС системы «заболеваемость лептоспирозом - метеорологические факторы - численность и инфицированность обыкновенных полевок»
Анализ производительности обучения (отношение предсказанного и наблюдаемого стандартных отклонений) показывает, что контрольная (0,00) и тестовая ошибки (0,00) не различаются.
Параметры регрессии, полученной в ходе моделирования, показали, что среднее значение составляет 65,82, а стандартное отклонение - 83,65, вычисленные соответственно для обучающих данных и для ошибки прогноза. Важным показателем является стандартное отклонение ошибки прогноза. Оно существенно меньше стандартного отклонения обучающих данных равного 1,59. Отношение стандартного отклонения ошибки прогноза к стандартному отклонению обучающих данных (0,019) существенно меньше единицы, что говорит о хорошем качестве регрессии. Оно показывает 0,99982 доли дисперсии, объяснено полученной моделью.
Расположение факторов по чувствительности (рангу) полученной модели показаны в табл. 2.
Все переменные модели имеют отношение значительно больше 1 (от 5,23 до 41,23). Оценка регрессионной зависимости показывает высокий показатель коэффициента корреляции равный 0,9999.
Анализ результатов моделирования показывает, что наиболее существенное влияние на заболеваемость лептоспирозом оказывают: инфицированность обыкновенной полевки, количество осадков в июле, августе, апреле месяцах. Влияние на заболеваемость лептоспирозом инфицированности обыкновенной полевки представлено на рис. 4.
Библиографическая ссылка:
Евстегнеева В.А. К вопросу о математических методах прогнозирования заболеваемости природно-очаговыми инфекциями // Вестник новых медицинских технологий. Электронное издание. 2014. №1. Публикация 1-10. URL: http://www.medtsu.tula.ru/VNMT/Bulletin/E2014-1/5023.pdf (дата обращения: 01.12.2014).
Таблица 2
Расположение по рангу факторов, влияющих на заболеваемость лептоспирозом
Название факторов Ранг
численность обыкновенной полевки 13
инфицированность обыкновенной полевки лептоспирами 1
Температура воздуха в апреле 10
Температура воздуха в мае 7
Температура воздуха в июне 5
Температура воздуха в июле 11
Температура воздуха в августе 14
Температура воздуха в сентябре 9
Количество осадков в апреле 4
Количество осадков в мае 12
Количество осадков в июне 8
Количество осадков в июле 2
Количество осадков в августе 3
Количество осадков в сентябре 6
30
25
20
15
10
£ 5 '.
1 О -5 -10 -15 -20 -25
-5 О 5 10 15 20 25 30 35 40 45 50 инфобп.
Рис. 4. Влияние инфицированности обыкновенной полевки на заболеваемость лептоспирозом
В ходе моделирования заболеваемости ИКБ получена ИНС на основе трехслойного МП с архитектурой МП 14:14 - 9-1:1 (рис. 5).
Рис. 5. Архитектура ИНС системы «заболеваемость ИКБ - метеорологические факторы - численность
иксодовых клещей Ixodes ricinus»
Анализ производительности обучения (отношение предсказанного и наблюдаемого стандартных отклонений) показывает, что контрольная (0,00) и тестовая ошибки (0,00) не различаются.
Параметры регрессии, полученной в ходе моделирования, показали, что среднее значение составляет 0,574, а стандартное отклонение - 0,463 вычисленные соответственно для обучающих данных и для Библиографическая ссылка:
Евстегнеева В.А. К вопросу о математических методах прогнозирования заболеваемости природно-очаговыми инфекциями // Вестник новых медицинских технологий. Электронное издание. 2014. №1. Публикация 1-10. URL: http://www.medtsu.tula.ru/VNMT/Bulletin/E2014-1/5023.pdf (дата обращения: 01.12.2014).
ошибки прогноза. Важным показателем является стандартное отклонение ошибки прогноза. Оно существенно меньше стандартного отклонения обучающих данных равного 0,0045. Отношение стандартного отклонения ошибки прогноза к стандартному отклонению обучающих данных (0,0098) существенно меньше единицы, что говорит о хорошем качестве регрессии. Оно показывает 0,999 доли дисперсии, объяснено полученной моделью.
Расположение факторов по чувствительности (рангу) полученной модели показаны в табл. 3.
Таблица 3
Расположение по рангу факторов, влияющих на заболеваемость ИКБ
Название факторов Ранг
Весенняя численность клещей Ixodes ricinus 12
Численность обыкновенной полевки 2
Температура воздуха в апреле 7
Температура воздуха в мае 11
Температура воздуха в июне 9
Температура воздуха в июле 5
Температура воздуха в августе 10
Температура воздуха в сентябре 13
Количество осадков в апреле 6
Количество осадков в мае 1
Количество осадков в июне 3
Количество осадков в июле 4
Количество осадков в августе 14
Количество осадков в сентябре 8
Все переменные модели имеют отношение значительно больше 1 (от 10,53 до 85,30). Оценка регрессионной зависимости показывает высокий показатель коэффициента корреляции равный 0,9999.
Анализ результатов моделирования показывает, что наиболее существенное влияние на заболеваемость ИКБ оказывают: численность обыкновенной полевки и количество осадков в мае, июне. Влияние на заболеваемость ИКБ количества осадков в мае представлено на рис. 6.
5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 SO S5 90 Осмай
Рис. 6. Влияние количества осадков в мае на заболеваемость ИКБ
Таким образом, метод ИНС, а именно, многослойный персептрон позволяет учитывать не только количественные, но и категориальные факторы, комплексное нелинейное влияние факторов. В качестве выходных параметров модели можно использовать не один, а два фактора. Этот метод позволяет прогнозировать количественные показатели заболеваемости.
Библиографическая ссылка:
Евстегнеева В.А. К вопросу о математических методах прогнозирования заболеваемости природно-очаговыми инфекциями // Вестник новых медицинских технологий. Электронное издание. 2014. №1. Публикация 1-10. URL: http://www.medtsu.tula.ru/VNMT/BuUetin/E2014-1/5023.pdf (дата обращения: 01.12.2014).
Литература
1. Честнова Т.В., Хромушин В.А. Контекстно-развивающаяся база данных для логической интеллектуальной системы, используемой в здравоохранении // Эпидемиология и инфекционные болезни. 2001. № 4. С. 38-40.
2. Честнова Т.В. Логико-математическая модель дифференциальной диагностики листериоза // Эпидемиология и инфекционные болезни. 2001. № 5. С. 49-50.
3. Смольянинова О.Л., Честнова Т.В. Влияние инфицированности и численности мелких млекопитающих по ландшафтно-географическим зонам Тульской области на заболеваемость лептоспирозом серогруппы гриппотифоза // Вестник новых медицинских технологий. 2005. №1. С.122-124.
4. Честнова Т.В., Смольянинова О.Л., Логвинов С.И. К вопросу о выборе метода прогнозирования заболеваемости лептоспирозом // Вестник новых медицинских технологий. 2011. № 4. С. 18-21.
5. Честнова Т.В., Смольянинова О.Л., Смольянинова В.А. К вопросу прогнозирования численности иксодовых клещей I. ricinus в природных биотопах с помощью искусственных нейронных сетей // Вестник новых медицинских технологий. 2012. № 1. С. 231-232.
References
1. Chestnova TV, Khromushin VA. Kontekstno-razvivayushchayasya baza dannykh dlya logicheskoy in-tellektual'noy sistemy, ispol'zuemoy v zdravookhranenii. Epidemiologiya i infektsionnye bolezni. 2001;4:38-40. Russian.
2. Chestnova TV. Logiko-matematicheskaya model' differentsial'noy diagnostiki listerioza. Epidemiologiya i infektsionnye bolezni. 2001;5:49-50. Russian.
3. Smol'yaninova OL, Chestnova TV. Vliyanie infitsirovannosti i chislennosti melkikh mlekopitayush-chikh po landshaftno-geograficheskim zonam Tul'skoy oblasti na zabolevaemost' leptospirozom serogruppy grippotifoza. Vestnik novykh meditsinskikh tekhnologiy. 2005;1:122-4. Russian.
4. Chestnova TV, Smol'yaninova OL, Logvinov SI. K voprosu o vybore metoda prognozirovaniya zabo-levaemosti leptospirozom. Vestnik novykh meditsinskikh tekhnologiy. 2011;4:18-21. Russian.
5. Chestnova TV, Smol'yaninova OLSmol'yaninova VA. K voprosu prognozirovaniya chislennosti ikso-dovykh kleshchey I. ricinus v prirodnykh biotopakh s pomoshch'yu iskusstvennykh neyronnykh setey. Vestnik novykh meditsinskikh tekhnologiy. 2012;1:231-2. Russian.
Библиографическая ссылка:
Евстегнеева В.А. К вопросу о математических методах прогнозирования заболеваемости природно-очаговыми инфекциями // Вестник новых медицинских технологий. Электронное издание. 2014. №1. Публикация 1-10. URL: http://www.medtsu.tula.ru/VNMT/Bulletin/E2014-1/5023.pdf (дата обращения: 01.12.2014).