МЕТОДЫ И СРЕДСТВА ОБЕСПЕЧЕНИЯ БЕЗОПАСНОСТИ SAFETY METHODS
Оригинальная статья / Original article УДК 331.45, 369.04, 369.2
ИСПОЛЬЗОВАНИЕ МЕТОДОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ ДЛЯ ПРОГНОЗИРОВАНИЯ ДЕМОГРАФИЧЕСКИХ ПОКАЗАТЕЛЕЙ В КРУПНОМ ПРОМЫШЛЕННОМ ГОРОДЕ
© Е.Н. Потылицына1, Е.В. Сугак2
Сибирский государственный университет науки и технологий имени академика М.Ф. Решетнева, Российская Федерация, 660037, г. Красноярск, пр. им. газеты «Красноярский рабочий», 31. РЕЗЮМЕ. ЦЕЛЬ. Анализ данных медицинской статистики различных стран за последние десятилетия показывает, что в связи с ростом воздействия вредных факторов промышленного производства и загрязнений окружающей среды прямо или опосредованно возрастает частота многих хронических патологических процессов практически всех органов и систем человека. В связи с этим оценка воздействия на здоровье населения вредных факторов окружающей среды является очень актуальным научным направлением. МЕТОДЫ. Темпы эволюции информационных технологий значительно опережают эволюцию методологических основ экологии, охраны и управления состоянием окружающей среды - существующие методики и нормативы базируются на устаревших традиционных понятиях и представлениях, технологии подготовки и принятия решений отстают от достижений в математическом моделировании, информационных и вычислительных технологиях. РЕЗУЛЬТАТЫ. Рассмотрена возможность использования искусственных нейронных сетей для оценки и прогнозирования состояния смертности жителей крупного промышленного города Красноярска. Данный метод позволяет разрабатывать высокоэффективные информационные компьютерные системы прогнозирования и анализа заболеваемости и смертности при изменении каких-либо факторов, оказывающих влияние на здоровье населения. Анализ полученных результатов показывает высокую точность прогнозных оценок и эффективность предлагаемой методики. Кроме того, данный метод доступен исследователям без специализированного образования в области информационных технологий. ВЫВОДЫ. Предлагаемую методику можно использовать для принятия оперативных решений при желании бизнесменов разместить в населенном пункте предприятие, угрожающее здоровью жителей. Без долгосрочных и дорогостоящих лабораторных исследований с высокой долей вероятности она позволит определить, насколько увеличится смертность или заболеваемость при этом жителей конкретного города или региона. Ключевые слова: демографические показатели, здоровье населения, прогнозные оценки, крупный промышленный город.
Формат цитирования: Потылицына Е.Н., Сугак Е.В. Использование методов интеллектуального анализа данных для прогнозирования демографических показателей в крупном промышленном городе // XXI век. Техносферная безопасность. 2017. Т. 2. № 4. С. 124-131.
METHODS OF INTELLECTUAL DATA ANALYSIS FOR FORECASTING DEMOGRAPHIC INDICATORS IN A LARGE INDUSTRIAL CITY E.N. Potylitsyna, E.V. Sugak
Siberian state university of science and technologies n.a. the academician M.F. Reshetnev, 31, avenue n.a. the Krasnoyarsky Rabochy newspaper, Krasnoyarsk, 660037, Russian Federation. ABSTRACT. INTRODUCTION. Analysis of medical statistics data for various countries for the last decades shows that effects of harmful industrial environment pollution factors directly or indirectly increase the number of chronic pathological processes in all human organs and systems. In this regard, assessment of these effects on human health is crucial. METHODS. Developing information technologies considerably advance evolution of methodological fundamentals of ecology, environment protection and management - existing methods and standards are based on outdated traditional concepts. Decision-making technologies lag behind achievements in mathematical simulation, information and computing
Потылицына Елена Николаевна, старший преподаватель кафедры безопасности жизнедеятельности, e-mail: [email protected]
Elena N. Potylitsyna, Senior teacher of the Health and Safety Department, e-mail: [email protected]
2Сугак Евгений Викторович, доктор технических наук, профессор кафедры безопасности жизнедеятельности,
e-mail: info@sibsau
Evgeny V. Sugak, Doctor of Engineering, Professor of the Health and Safety Department, e-mail: info@sibsau
124
Том 2, № 4 2017 Vol. 2, no. 4 2017
XXI ВЕК. ТЕХНОСФЕРНАЯ БЕЗОПАСНОСТЬ XXI CENTURY. TECHNOSPHERE SAFETY
ISNN 2500-1582
ШМ
МЕТОДЫ И СРЕДСТВА ОБЕСПЕЧЕНИЯ БЕЗОПАСНОСТИ SAFETY METHODS
technologies. RESULTS. We analyzed the possibility of using artificial neural networks to evaluate and predict mortality rates for the population of a large industrial city such as Krasnoyarsk. This method enables development of a highperformance computer information system of morbidity and mortality prediction and analysis when factors affecting human health change. Results analysis speaks for the high accuracy of forward-looking estimates and efficiency of the developed method. In addition, this method can be used by researchers lacking special knowledge in information technologies. CONCLUSIONS. The method can be used for making operational decisions when planning a harmful facility. It helps determine an increase in mortality and morbidity rates without long-term and expensive laboratory researches with high probability.
Keywords: demographic indicators, human health, projections, large industrial city
For citation: Potylitsyna E.N., Sugak E.V. Methods of intellectual data analysis for forecasting demographic indicators in a large industrial city. XXI century. Technosphere Safety. 2017, vol. 2, no. 4, pp. 124-131. (In Russian).
Введение
Анализ данных медицинской статистики различных стран за последние десятилетия показывает, что в связи с ростом воздействия вредных факторов промышленного производства и загрязнений окружающей среды прямо или опосредованно возрастает частота многих хронических патологических процессов - заболеваний органов дыхания, печени, почек, отравлений, аллергических проявлений, генетических дефектов и врожденных пороков, злокачественных опухолей и болезней крови, веге-тососудистых нарушений, неврозов, атеро-склеротических поражений сердца и сосудов, т.е. практически всех органов и систем человека [1].
Проанализировав Государственные доклады «О состоянии и охране окружающей среды в Красноярском крае» в период с 2012 по 2015 гг. [2], выяснили, что основной причиной смертности населения г. Красноярска являются болезни системы кровообращения - более 40% от всех случаев смерти. На втором месте - смертность от новообразований - 16-18,5% от всех случаев смерти за исследуемый период. На третьем месте - смертность от внешних причин (несчастные случаи, отравления, травмы, убийства, самоубийства).
В связи с этим оценка воздействия на здоровье населения вредных факторов
окружающей среды является очень актуальным научным направлением.
В последние годы накоплен богатый материал о влиянии неблагоприятных экологических факторов на здоровье населения, получены новые научные результаты о связи факторов окружающей среды и здоровья населения. Однако накопление информации не приводит к новым знаниям. Темпы эволюции информационных технологий значительно опережают эволюцию методологических основ экологии, охраны и управления состоянием окружающей среды - существующие методики и нормативы базируются на устаревших традиционных понятиях и представлениях, технологии подготовки и принятия решений отстают от достижений в математическом моделировании, информационных и вычислительных технологиях.
Таким образом, целью работы является разработка комплексной количественной статистически достоверной информационной модели социально-экологического состояния и развития города Красноярска с оценкой и прогнозированием техногенных социально-экологических рисков населения с использованием современных информационных технологий и технологий интеллектуального анализа данных.
Том 2, № 4 2017 Vol. 2, no. 4 2017
XXI ВЕК. ТЕХНОСФЕРНАЯ БЕЗОПАСНОСТЬ XXI CENTURY. TECHNOSPHERE SAFETY
ISNN 2500-1582
В
МЕТОДЫ И СРЕДСТВА ОБЕСПЕЧЕНИЯ БЕЗОПАСНОСТИ SAFETY METHODS
Объекты и методы исследования
Природно-климатические особенности г. Красноярска. Красноярск расположен в глубине материка Азия, на обоих берегах реки Енисей в среднем его течении на стыке трех геоморфологических районов: а) долины Енисея; б) прилегающих к реке плато; в) предгорий Восточного Саяна. Преобладает долина Енисея.
Растительность в городе и его окрестностях различается: левобережье Енисея - типичная лесостепь, а правобережье - ярко выраженная горная тайга. Основными водными объектами на территории Красноярска являются р. Енисей и его небольшие притоки (Базаиха, Кача и Березовка).
Город находится в зоне умеренного климата с хорошо выраженной континен-тальностью. Годовая амплитуда колебаний температуры воздуха (по средним месячным значениям) составляет 38°С. Наиболее часто в районы Красноярска поступают массы континентального полярного воздуха, реже - арктического. В течение всего года преобладают циклоны, приходящие с юго-запада. Чаще циклоны этого направления повторяются в теплый период года. В холодный - преобладают антициклоны западного и северо-западного направлений.
Для Красноярска характерна однородность режима ветра в течение всего года, что объясняется условиями орографии [3].
Основные тенденции заболеваемости населения г. Красноярска. Чистый атмосферный воздух является непреложным условием для здоровой жизни. Вместе с тем, многие важнейшие виды деятельности человека, связанные с социально-экономическим развитием, приводят к загрязнению воздушного бассейна среды обитания населения. Загрязненный атмосферный воздух свободно преодолевает границы предприятий, городов и стран, проникая в офисы, жилища и больницы.
Экспозиция человека в условиях загрязненной воздушной среды может приводить к самым разнообразным влияниям на здоровье: в зависимости от конкретного типа загрязняющих веществ; величины, продолжительности и повторяемости экспозиции; токсического воздействия, вызывающего особую тревогу.
Химическое загрязнение атмосферного воздуха населенных мест, постоянно действуя на организм человека, может быть одной из причин развития заболеваний различных классов. На протяжении 2000-2010 гг. уровень смертности населения города Красноярска по основным классам причин, обусловленным воздействием факторов окружающей среды, имеет тенденцию к снижению по классу болезней системы кровообращения, психических расстройств, болезней нервной системы (табл. 1). Рост уровня смертности по основным классам причин характерен для болезней органов дыхания, пищеварения, новообразований, болезней мочеполовой системы (рис.).
Отмечается снижение показателей общей и младенческой смертности, это связано с улучшением медицинского обслуживания и внедрением ведомственных программ развития системы здравоохранения. Также наблюдается увеличение рождаемости за исследуемый период, что специалистами объясняется введением материнского капитала и выделением денежных средств после рождения 3-го и последующих детей.
Но, несмотря на эти показатели -рост рождаемости, снижение смертности, демографическая ситуация в Красноярске оценивается как неблагополучная. Смертность населения сохраняется на уровне выше средних, а на отдельных территориях - высоких и очень высоких величин; заболеваемость, как среди детей, так и среди взрослых, несмотря на ее снижение по от-
126
Том 2, № 4 2017 Vol. 2, no. 4 2017
XXI ВЕК. ТЕХНОСФЕРНАЯ БЕЗОПАСНОСТЬ XXI CENTURY. TECHNOSPHERE SAFETY
шм
ISNN 2500-1582
У
Ii
\Я/
МЕТОДЫ И СРЕДСТВА ОБЕСПЕЧЕНИЯ БЕЗОПАСНОСТИ SAFETY METHODS
дельным классам болезней, остается на высоких уровнях по классу болезней органов дыхания, пищеварения, мочеполовой системы.
Крупные города становятся все более малопригодными для здоровой жизни людей. Адаптационные механизмы человека не успевают за быстрыми изменениями окружающей среды. На заболеваемость проживающего на определенной террито-
кьР
рии населения могут влиять десятки тысяч факторов. Загрязнение окружающей среды может оказывать самое разное воздействие на организм и зависит от его вида, концентрации, длительности и периодичности. В свою очередь, реакция организма определяется индивидуальными особенностями, возрастом, полом, состоянием здоровья человека.
Таблица 1
Смертность по основным классам причин смерти в г. Красноярске Mortality by main classes of mortality causes in Krasnoyarsk
Table 1
Класс причины смерти / Class of mortality cause Год / Year
2010 2008 2005 2002 2000
Случаев на 100 тысяч чел. / Deaths for 100 thousand persons
Болезни системы кровообращения / Blood circulatory system diseases 517,6 548,12 621,23 640,49 627,81
Психических расстройств / Mental disorders 1,02 1,92 5,77 10,08 10,73
Болезней нервной системы / Diseases of the nervous system 6,07 6,61 5,88 7,45 5,7
Болезни органов дыхания / Diseases of the respiratory organs 62,1 50,25 59,85 62,38 59,93
Болезни органов пищеварения / Diseases of the digestive system 67,8 64,76 77,62 57,66 61,19
Новообразования / New growths 202,6 211,8 205,29 186,6 208,81
Болезней мочеполовой системы / Diseases of the urinogenital system 13,48 10,13 11,12 9,75 11,87
Смертность общая, случаев на 1000 чел. / General mortality, deaths for 1000 people 11,0 11,4 13,3 14,0 14,1
Смертность младенческая (до 1 года), случаев на 1000 родившихся живыми / Infantile mortality (till 1 year), Deaths for 1000 children 5,7 6,2 9,6 14,0 18,3
Рождаемость, случаев на 1000 чел. / Birth rate, for1000 people 13,5 12,7 10,9 10,7 8,6
Ш/
Том 2, № 4 2017 Vol. 2, no. 4 2017
XXI ВЕК. ТЕХНОСФЕРНАЯ БЕЗОПАСНОСТЬ XXI CENTURY. TECHNOSPHERE SAFETY
ISNN 2500-1582
H
Ii
\Я/
МЕТОДЫ И СРЕДСТВА ОБЕСПЕЧЕНИЯ БЕЗОПАСНОСТИ SAFETY METHODS
кьР
у
Динамика смертности по основным классам причин смертности в г. Красноярске Dynamics of mortality by main classes of mortality causes in Krasnoyarsk. On the right, from top to down: Respiratory organs; digestive organs; growths; Diseases of the urinogenital system
Результаты
Разработка ИНС. Здоровье выступает обобщенным показателем качества среды обитания и ее влияния на жизнедеятельность людей, интегральным индикатором медико-экологического благополучия территории. Многократно зарегистрированные и изученные явления повышенной смертности и заболеваемости в районах с высоким загрязнением атмосферы и окружающей среды в целом свидетельствуют об очевидности и массовости такого воздействия на здоровье населения. В последние десятилетия наблюдается увеличение распространенности болезней, которое обусловлено техногенным загрязнением окружающей среды. К таким экозависи-мым заболеваниям относят новообразования, заболевания эндокринной, мочеполовой систем, системы крови и кроветворных тканей, органов пищеварения, дыхания.
В исследовании был использован метод искусственных нейронных сетей (ИНС), относящийся к методам интеллекту-
ального анализа. Эти методы находят применение в тех ситуациях, когда обычные методы анализа трудно или невозможно применить из-за отсутствия сведений о характере или закономерностях исследуемых процессов, взаимозависимостях явлений, фактов, о поведении объектов и систем из различных предметных областей, в том числе социальной и экономической.
Искусственная нейронная сеть представляет собой математический аппарат, позволяющий строить алгоритмы обработки информации, обладающий уникальной способностью обучаться на примерах и «узнавать» в потоке «зашумлен-ной» и часто противоречивой информации приметы ранее встреченных образов и ситуаций. ИНС позволяют находить скрытые зависимости между входными и выходными данными, которые остаются вне внимания классических методов.
Программное обеспечение, используемое в исследовательской работе для
128
Том 2, № 4 2017 Vol. 2, no. 4 2017
XXI ВЕК. ТЕХНОСФЕРНАЯ БЕЗОПАСНОСТЬ XXI CENTURY. TECHNOSPHERE SAFETY
шм
ISNN 2500-1582
У
МЕТОДЫ И СРЕДСТВА ОБЕСПЕЧЕНИЯ БЕЗОПАСНОСТИ SAFETY METHODS
a
кьР
построения нейросетевой модели, -NeuroPro 0,25.
NeuroPro 0,25 является свободно распространяемой альфа-версией
нейросетевого программного продукта для работы с искусственными нейронными сетями и извлечения знаний из таблиц данных с помощью нейронных сетей в среде Windows. Разработчик - В.Г. Царегородцев, Институт вычислительного моделирования СО РАН, г. Красноярск.
К возможностям программы относятся:
- работа (чтение, запись, редактирование) с файлами данных, представленными в форматах dbf (СУБД dBase, FoxPro, Clipper) и db (СУБД Paradox);
- создание слоистых нейронных сетей для решения задач прогнозирования (число слоев нейронов - до 10, число нейронов в слое - до 100);
- обученная нейронная сеть может одновременно решать несколько задач прогнозирования, для каждого из выходных сигналов могут быть установлены свои требования к точности прогнозирования;
- обучение нейронной сети производится по принципу двойственного функционирования с применением одного из следующих методов оптимизации;
- и др.
Применение данного программного продукта возможно в традиционных областях, а именно: в медицине, экологии, климатологии, метеорологии, при построении моделей технических объектов и их идентификации, в экономике (прогнозирование курсов валют, акций и т.д.); вообще для решения любой задачи классификации или прогноза, которая решается при наличии выборки данных и для решения которой ранее использовались традиционные математические методы (регрессионный анализ, непараметрическая статистика), однако не была достигнута требуемая точность прогноза.
Данный нейропакет несомненно
удобен для изучения и использования по следующим причинам:
- является русскоязычным;
- прост в изучении;
- имеет такие достоинства, как возможность упрощения сети и выявление наиболее (или наименее) значимых входов.
К недостаткам можно отнести скромные интерфейсные и сервисные удобства.
Для обучения ИНС были созданы базы данных (БД), содержащие статистические данные. В качестве индикаторов состояния окружающей среды использовались концентрации загрязняющих веществ в воздухе г. Красноярска по данным Центра по мониторингу загрязнения окружающей среды ГУ «Красноярский ЦГСМ-Р». Обработаны ежегодники «Состояние загрязнения атмосферного воздуха городов на территории Красноярского края, республик Хакасия и Тыва» с 1999 по 2012 гг.
В качестве индикатора здоровья населения использовались данные сани-тарно-демографической статистики Территориального органа федеральной службы государственной статистики по Красноярскому краю (Красноярскстат), а именно: данные о смертности от заболеваний сердечно-сосудистой системы за период с 1999 по 2012 гг.
Обсуждение полученных результатов. Обучение нейронной сети проводили на статистических данных в период с 1999 по 2011 гг. В качестве «входных» данных подавали среднегодовые данные о концентрации загрязняющих веществ, находящихся в воздухе г. Красноярска. «Выходом» при обучении использовались данные о смертности от заболеваний сердечно-сосудистой системы жителей г. Красноярска с 1999 по 2011 гг.
В результате обучения была получена нейросетевая модель, состоящая из 3-х слоев, в какждом расположено по 10 нейронов. Число входов сети - 21, выходов - 1. Средняя относительная ошибка про-
Ж)
ISNN 2500-1582
н
Том 2, № 4 2017 XXI ВЕК. ТЕХНОСФЕРНАЯ БЕЗОПАСНОСТЬ Vol. 2, no. 4 2017 XXI CENTURY. TECHNOSPHERE SAFETY
Ii
\Я/
МЕТОДЫ И СРЕДСТВА ОБЕСПЕЧЕНИЯ БЕЗОПАСНОСТИ SAFETY METHODS
гноза, взятая по модулю для «выхода», -0,98%, т.е. сеть обеспечивает хорошую сходимость расчетных и фактических значений (табл. 2).
Далее провели тестирование полученной ИНС на данных, не участвующих в обучении сети. Были внесены значения концентрации загрязняющих веществ за
кьР
у
2012 год для получения прогноза количества умерших от заболеваний сердечно-сосудистой системы в 2012 году. Полученное значение равнялось 515,63 чел. на 100 000, тогда как реальное значение составляет 491,03 на 100 000 человек. Средняя относительная ошибка прогноза, взятая по модулю, равнялась 5%.
Таблица 2
Полученные значения и расчет относительной ошибки между полученными и реальными значениями
Table 2
Calculated values and calculation of a relative error between the calculated and real values
Смертность от заболеваний сердечнососудистой системы (на 100 тыс. человек) / Mortality due to diseases of the cardiovascular system (for 100 thousand people) Смертность от заболеваний сердечно-сосудистой системы (на 100 тыс. человек), прогноз ИНС / Mortality due to diseases of the cardiovascular system (for 100 thousand people), forecast of INS Разница между полученным и реальным значением / Difference between calculated and real values Относительная ошибка (%) / Relative error (%)
505,30 512,32 -7,02 1,39
517,60 521,63 -4,03 0,78
533,56 526,71 6,85 1,28
548,12 546,40 1,72 0,31
544,54 537,53 7,01 1,29
561,46 570,24 -8,78 1,56
621,23 614,81 6,42 1,03
593,33 590,86 2,47 0,42
630,14 638,12 -7,98 1,27
640,49 648,44 -7,95 1,24
654,67 646,56 8,11 1,24
627,81 626,63 1,18 0,19
665,20 660,45 4,75 0,71
Средняя относительная ошибка по модулю 0,98% / Average relative mistake by the module of 0.98%
Том 2, № 4 2017 Vol. 2, no. 4 2017
XXI ВЕК. ТЕХНОСФЕРНАЯ БЕЗОПАСНОСТЬ XXI CENTURY. TECHNOSPHERE SAFETY
Ii
\Я/
МЕТОДЫ И СРЕДСТВА ОБЕСПЕЧЕНИЯ БЕЗОПАСНОСТИ SAFETY METHODS
Выводы
Приведенные результаты свидетельствуют, что применение нейросетевых технологий для решения прикладных экологических задач, связанных с обработкой информации и построением моделей, является перспективным направлением прогнозирования социально-экологических параметров.
Предлагаемую методику можно использовать для принятия оперативных решений при желании бизнесменов разместить в населенном пункте предприятие,
угрожающее здоровью жителей. Без долгосрочных и дорогостоящих лабораторных исследований с высокой долей вероятности она позволит определить, насколько увеличится при этом смертность или заболеваемость жителей конкретного города или региона.
Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 18-013-00200.
Библиографический список
1. Гичев Ю.П. Здоровье человека как индикатор ноярском крае в 2015 году. Красноярск: КрасРост-экологического риска индустриальных регионов // Стат, 2016. 36 с.
Вестник Российской АМН. 1995. № 8. С. 52-54. 3. Швер Ц.А., Герасимова А.С. Климат Красноярска.
2. О состоянии и охране окружающей среды в Крас- Ленинград: Гидрометеоиздат, 1982. 231 с.
References
1. Gichev Yu.P. Human health as an indicator of the environmental risk of industrial regions. Vestnik Rossi-iskoi AMN [Bulletin of the Russian Academy of Medical Science]. 1995, no. 8, pp. 52-54. (In Russian).
2. O sostoyanii i okhrane okruzhayushchei sredy v Krasnoyarskom krae v 2015 godu [On the state and
Критерий авторства
Потылицына Е.Н., Сугак Е.В. обладают равными авторскими правами и несут равную ответственность за плагиат.
environmental protection in Krasnoyarsk Krai in 2015]. Krasnoyarsk: KrasRostStat Publ., 2016. 36 p. (In Russian).
3. Shver Ts.A., Gerasimova A.S. Klimat Krasnoyarska [Climate of Krasnoyarsk]. Leningrad: Gidrometeoizdat Publ., 1982, 231 p. (In Russian).
Authorship criteria
Elena N. Potylitsyna, Evgeny V. Sugak have equal authors' rights and responsibility for plagiarism.
Конфликт интересов
Авторы заявляют об отсутствии интересов.
конфликта
Поступила 17.10.2017
Conflict of interests
The authors declare no conflict of interests.
Received on 17 October 2017
Том 2, № 4 2017 Vol. 2, no. 4 2017
XXI ВЕК. ТЕХНОСФЕРНАЯ БЕЗОПАСНОСТЬ XXI CENTURY. TECHNOSPHERE SAFETY
ISNN 2500-1582
131