3ACKrv\Jt?i)MHW« НДуИР^-О(5/7ДЗО0ДИіЄА(?Н(ЯЙ
Вссірник
Здоровье и образование в XXI веке
2013, том 15 [11]
ANALYSIS OF THE RESULTS AND PROSPECTS OF USING MINING METHODS DYNAMICS OF COSMOPHYSI-CAL INDICATORS TO IDENTIFY THE SITUATIONS THAT PROVOKE OCCURRENCE OF EPISODES OF STROKE
Karp V.P, Sayapina Y.A
Moscow State Technical University of Radio Engineering, Electronics and auto-tomatiki (MSTU
MIREA), Cybernetics. Russia, 117454, Moscow, Vernadsky Prospekt, 78,
The paper shows the key points of the research of the problem of spaceweather and helio- and geomagnetic activity (GMA) factors influencing human cardiovascular system. The data about the strokes in the particular climate region (Vladikavkaz, Russia) in 2010 was used as illustration. 23 factors were investigated: 7 heliomagnetic activity factors, 9 geomagnetic activity factors and 7 meteo pathogenicity indexes. Two classes were defined: A-class for dates in 2010 when no strokes were registered (‘quiet dates’) and B-class - for dates in 2010 with strokes (any type - lethal/non-lethal) were registered (‘dangerous dates’). principle of computer simulation (learning by example), semantics methods for 3-days dynamics description and decision support system (DSS) ‘Consilium’ were used for classification rules building.
Keywords: computer modeling, dynamics, alternative processes, factors stroke.
АНАЛИЗ РЕЗУЛЬТАТОВ И ПЕРСПЕКТИВ ИСПОЛЬЗОВАНИЯ МЕТОДОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДИНАМИКИ КОСМОФИЗИЧЕСКИХ ПОКАЗАТЕЛЕЙ С ЦЕЛЬЮ ВЫЯВЛЕНИЯ СИТУАЦИЙ, ПРОВОЦИРУЮЩИХ ВОЗНИКНОВЕНИЕ ЭПИЗОДОВ ИНСУЛЬТА
Карп В.П., Саяпина Ю.А.
Московский государственный технический университет радиотехники, электроники и автоматики (МГТУ МИРЭА), Кибернетика. Россия, 117454, г. Москва, проспект Вернадского, 78,
—-----------------—
1
Издание зарегистрировано в Федеральной службе по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор). Свидетельство о регистрации СМИ ПИ ЭЛ № ФС77-50518 Журнал представлен в НАУЧНОЙ ЭЛЕКТРОННОЙ БИБЛИОТЕКЕ (НЭБ) - головном исполнителе проекта по созданию Российского индекса научного цитирования (РИНЦ).
3ACKrv\Jt?i)MHW« НДуИ^О-О(5рДЗО0ДИлеА(?Н4ЛЙ
Вссщник
Здоровье и образование в XXI веке
2013, том 15 [11]
Исследованы различные сочетания значений космофизических показателей (КФП) за 2010 г. в аспекте их влияния на возникновение случаев инсульта в конкретном географическом регионе. Рассматривались 23 КФ-показателя: показатели Солнечной активности (7), Земли (9) и индексы патогенности (7). Были сформированы два класса сравнений: А-класс - даты 2010 г. без инсультов («спокойные» дни) и В-класс - даты 2010 г., в которые были зарегистрированы случаи инсульта различной степени тяжести («тревожные» дни). Построение альтернативных диагностических правил (ДП), характерных для каждого из сравниваемых классов, производилось с использованием принципов компьютерного моделирования (обучение на примерах), семантического подхода к описанию динамики показателей по трем предшествующим датам, и интеллектуальной системы поддержки принятия решений (СППР) «Consilium».
Ключевые слова: компьютерное моделирование, динамика, альтернативные процессы, космофизические факторы, инсульт.
В настоящее время факт влияния космофизических и, как следствие, геомагнитных и метеорологических факторов на функциональное состояние не только больных, но и здоровых лиц, уже не вызывает сомнения, поскольку подтвержден большими объемами экспериментальных данных [1, 2, 3, 4]. Однако для фундаментальной и практической медицины чрезвычайно важной остается необходимость установить, какие именно космофизические показатели могут оказывать решающее влияние на состояние здоровья населения, в каком сочетании своих значений, у какого контингента пациентов они могут провоцировать развитие острых сосудистых заболеваний [5].
Целью проведенного исследования явилось: изучение характера динамики космофизических показателей (КФП) для выявления прогностически тревожных сочетаний их значений, провоцирующих возникновение ин-
сультов; построение альтернативных диагностических правил (ДП), отличающих характер динамики КФП «тревожных» дней от характера динамики «спокойных», и формирование критериев оценки степени их влияния на прогноз инсультов.
Исследование проведено по данным за 2010 год в конкретном климатическом регионе (г. Владикавказ) на примере возникновения (обострения) острого нарушения мозгового кровообращения (ОНМК) - инсульта различной степени тяжести. В каждую конкретную дату было зафиксировано значение каждого измеренного КФП, важные (перспективные с точки зрения врачей) клинические показатели госпитализированных больных с ОНМК, и характером его исхода. Таким образом, объектом исследования явилась каждая дата года наблюдения, сопровождаемая значениями измеренных КФ показателей и символом наличия или
— еъз+ыз--------------—
2
Издание зарегистрировано в Федеральной службе по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор). Свидетельство о регистрации СМИ ПИ ЭЛ N° ФС77-50518 Журнал представлен в НАУЧНОЙ ЭЛЕКТРОННОЙ БИБЛИОТЕКЕ (НЭБ) - головном исполнителе проекта по созданию Российского индекса научного цитирования (РИНЦ).
Электр^нисгй ндучио -о(5рдзо0д(мел(?нин'
Бесщник
Здоровье и образование в XXI веке
2013, том 15 [11]
отсутствия зарегистрированного факта инсульта и характера его исхода. Собранный материал составил базу исходных данных (БИД) для дальнейшего исследования.
Предварительный «разведочный» анализ исходных данных, включающий комплекс классических статистических методов анализа многомерных неоднородных данных, различные способы визуализации графических изображений и семантический подход к описанию динамики поведения объекта, позволил внести перспективные (относительно поставленных задач), преобразования исходной структуры данных.
Так, за основу модели анализа динамики показателя был принят принцип семантического описания и расчета изменений его значений в течение трех дней, предшествующих конкретной дате.
Были сконструированы диагностически перспективные производные характеристики (ПХ): максимальное изменение значений показателя («максимальная разница»); «относительная максимальная разница» -«максимальная разница», отнесенная к значению показателя в текущую дату; «характер динамики» - словесно описывающий характер «спада-подъема» значений КФП [6].
Было замечено, что в некоторые даты количество больных с инсультом превышало 6-7 человек. С другой стороны, «обратили внимание на себя» некоторые даты, в которых не были отмечены случаи инсультов, но сами они находились между близко расположенными (соседними) днями с повторенными случаями
инсультов. Такие даты были выделены нами в отдельную подгруппу «условно спокойные дни», требующих более внимательного исследования их характеристик. В виду присутствия в одну и ту же дату нескольких случаев ОНМК с различными исходами, было предусмотрено рассматривать каждый факт инсульта со своим исходом как самостоятельный объект. В связи с этим, в исследовании были предусмотрены различные комбинации формирования выборок для акцентированного анализа.
Таким образом, были сформированы три группы объектов:
□ класс «0» - даты с отсутствием эпизода (инсульта) - 192 объекта;
□ класс «1» - даты с не летальным исходом инсульта - 262 объекта;
□ класс «2» - даты с летальным исходом инсульта - 70 объектов.
Преобразованные исходные данные составили проблемно ориентированную базу данных (ПОБД) исследований.
Была выдвинута гипотеза о том, что воздействие на формирование «тревожных» ситуаций оказывают не отдельные значения КФП, а специфические комбинации по классам исхода.
Для того, чтобы рассмотреть все возможные (перспективные) комбинации показателей было решено использовать методы интеллектуального анализа данных, в частности, методы «машинного обучения на примерах», реализованные в системе поддержки принятия решений (СППР) «Consilium» [7]. Эта про-
3
Издание зарегистрировано в Федеральной службе по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор). Свидетельство о регистрации СМИ ПИ ЭЛ № ФС77-50518 Журнал представлен в НАУЧНОЙ ЭЛЕКТРОННОЙ БИБЛИОТЕКЕ (НЭБ) - головном исполнителе проекта по созданию Российского индекса научного цитирования (РИНЦ).
Элекпар^нк^й ндучио - о5рдзобдкиел(?Н4лй
Вссщник
Здоровье и образование в XXI веке
2013, том 15 [11]
грамма позволяет получить набор диагностических правил (ДП) для каждого класса объектов по разным наборам показателей: по исходным КФ-показателям; только по показателям Солнца (7); только по показателям Земли (9); только по Индексам патогенности (7 показателей); по совокупности показателей: Солнца, Земли, Индексов; по производным характеристикам (60) описания динамики всех перечисленных исходных показателей, без учета исходных (абсолютных) значений и других.
Для первоначального этапа исследований (выявление различий между «спокойными» и «тревожными» днями) объекты классов «1» и «2» были объединены в общий класс «1у2» (332 объекта), который семантически означает факт наличия инсульта (без уточнения типа). В таком варианте задача сводится к построению таких альтернативных ДП (сочетаний значений различных КФП), которые способны достоверно обеспечить различение дат с отсутствием инсульта от дат, в которые инсульты были зафиксированы. Построение ДП проводилось по каждой из рассматриваемых групп показателей (Солнце, Земля, Индексы патогенности) в отдельности и в различных их комбинациях.
Исследование состояло в выполнении следующих основных этапов:
^ визуализация динамики исходных показателей и распределения зарегистрированных случаев инсультов по датам;
^ преобразование исходного простран-
ства признаков КФП в пространство производных характеристик (ПХ) динамики КФП;
выделение информативных интервалов значений исходных КФП и их ПХ;
^ формирование материала «обучения» и «контроля» на случайно сформированной выборке в каждом классе сравнений («0» -«1у2»);
^ построение альтернативных диагностических правил материала исследования.
По вариантам материала обучения и контроля («0» - «1у2»):
о365 объектов : МО: (182 - 173); МК: (192- 173);
о524 объекта : МО: (182-332); МК: (192 -332);
оМО: 524 объекта; МК: 365 дней.
По результатам сопоставительного анализа различных вариантов решения задачи диагностики было выражено суждение о том, что по исходным показателям из групп Солнце, Земля и индексы патогенности наибольший вклад вносят показатели Земли (55,9% узнавания, из них 96,9% узнаются верно, 3,1% -ошибки), при этом, «отказ от диагноза» составил 44,1%).
В таблицах 1 и 2 представлены результаты «узнавания», полученные (в табл.1) - по комплексу Исходных значений (СуЗуИнд) 23 показателей объектов, а (в табл.2) - по Производным характеристикам (ПХ) тех же показателей того же комплекса (СуЗуИнд), с одним и тем же материалом «обучения», (МО: 182 -332) и «контроля» (МК: 192- 332 об).
— еъз+ыз--------------—
I
Издание зарегистрировано в Федеральной службе по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор). Свидетельство о регистрации СМИ ПИ ЭЛ № ФС77-50518 Журнал представлен в НАУЧНОЙ ЭЛЕКТРОННОЙ БИБЛИОТЕКЕ (НЭБ) - головном исполнителе проекта по созданию Российского индекса научного цитирования (РИНЦ).
Электронной НДуЧИО-ОЙрДЗО0ДКиЄЛ(?Н4ЛЙ
Вссщник
Здоровье и образование в XXI веке
Диагностический потенциал по Исходным КФ-показателям (С+З+И)
2013, том 15 [11]
Таблица 1 (23 КФП)
Обобщенный результат внутреннего тестирования (МО) Узнавание (524 об.)
Объем выборки Варианты прогноза А-В (,0’-’1У2) Отн. доли % в долях в % кол-во ДП
524 (МО: 182332; МК: 192332) + 453 446 155-291 446/453 98,5 (446+7)/524 86,5 62-82
- 7 5-2 7/453 1,5
= 71 71 32-39 71/524 13,5 71/524 13,5
Из табл.1 следует: по материалу контроля (МК: 192-332) «отказ от диагноза» составляют - 13,5% (71/524); «узнаются» (+/-) - 453 объекта; среди «узнанных» - 98,5% (446/453) - «правильно узнаны», и 1,5% (7/453) - «ошибки».
Таблица 2
Диагностический потенциал по ПХ КФ-показателям (С+З+И) __________________________________________________________________(60 ПХ)
Обобщенный результат внутреннего тестирования (МО) Узнавание (524 об.)
Объем выборки Варианты прогноза А-В (,0’-’1У2) в долях % в долях в % кол-во ДП
524 (МО: 182332; МК: 192332) + 577 518 188-330 518/522 99,2 522/524 99,6 229-257
- 4 4-0 4/522 0,8
= 2 2 0-2 2/524 0,4 2/524 0,4
Из табл.2 следует: «отказ от диагноза» составляют - 0,4% (2/524);
«узнаются» (+/-) - 522 объекта; среди «узнанных» - 99,2% (518/522) - «правильно узнаны», и 0,8% (4/522) - «ошибки».
Из анализа таблиц следует, что потен- циал прогнозирования по Исходным показате-
— еъз+ыз--------------—
5
Издание зарегистрировано в Федеральной службе по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор). Свидетельство о регистрации СМИ ПИ ЭЛ № ФС77-50518 Журнал представлен в НАУЧНОЙ ЭЛЕКТРОННОЙ БИБЛИОТЕКЕ (НЭБ) - головном исполнителе проекта по созданию Российского индекса научного цитирования (РИНЦ).
Электронной НДуЧНО-ОЙрДЗО0ДКиЄЛ(?Н4ЛЙ
Бесірник
Здоровье и образование в XXI веке
2013, том 1S [11]
лям (табл. 1) ниже, чем по Производным характеристикам. То есть, более перспективным является использование тиражирования объектов-дат (табл.2).
Выводы
1. Сформированы гипотезы, получившие подтверждение в решении задач диагностики «тревожных» и «спокойных» дней по KФ-по-казателям;
S Выявлены устойчивые различия комплексов значений KФ-показателей между «спокойными» и «тревожными» днями;
S Оценена степень участия групп KФ-пока-зателей, «провоцирующих» возникновение инсультов;
S Разработаны методы и алгоритмы для семантического описания характера динамики показателей (по трем предшествующим дням); S Использован расчетный (количественный) подход для конструирования прогностически перспективных «производных характеристик» ^П;
S Принцип машинного обучения на примерах, реализованный в СППР «Consilium», обеспечил аргументацию (интерпретацию) построенных диагностических правил, различающих «спокойные» и «тревожные» дни, относительно инсультов;
S Определена перспективность использования разработанного метода в решении задачи диагностики ЖФП-СЗ» в реальных условиях на контрольных данных.
2. Что дальше? - Необходимо выполнить: S Провести оценку «устойчивости» (эффек-
тивности) диагностических правил (ДП) задачи «КФП-Инсульт» на расширенном контроле (2-3 года наблюдений в том же географическом регионе):
о провести обучение на обобщенном множестве объектов наблюдения; о провести анализ полученных результатов;
Реализовать методику «КФП-ДП» на другом географически-климатическом регионе на классе сосудистых заболеваний.
Реализовать методику «КФП-ДП» на другой группе сосудистых заболеваний - «КФП-Инфаркт» (2-3 года наблюдений в том же географическом регионе).
ЛИТЕРАТУРА:
1. Зенченко Т.А. Метод последовательных приближений в задаче исследования механизма индивидуальных гелео-метеотропных реакций // Влияние космической погоды на человека: в космосе и на Земле: международная конференция: Тез. докл. - М.: 2012. - с. 49.
2. Бреус Т.К. Формирование ритмической структуры биологических объектов в процессе эволюции // Влияние космической погоды на человека: в космосе и на Земле: междунар, конференция: Тез. докл. - М.: 2012. - с. 45.
3. Чибисов С.М., Рагульская М.В. Современные аспекты астро-хронобиологии // Хронобиология и хрономедицина: Руководство / под ред. С.И. Раппорта, В.А. Фролова, Л.Г. Хетагу-ровой. / М.: ООО "Медицинское информационное агентство", 2012. - с. 159-190.
4. Карп В.П. Формирование новых знаний в
бИздание зарегистрировано в Федеральной службе по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор). Свидетельство о регистрации СМИ ПИ ЭЛ N° ФС77-50518 Журнал представлен в НАУЧНОЙ ЭЛЕКТРОННОЙ БИБЛИОТЕКЕ (НЭБ) - головном исполнителе проекта по созданию Российского индекса научного цитирования (РИНЦ).
Электронной нлучно-ойрдзобдтел(?н4лй
Вссщник
Здоровье и образование в XXI веке
2013, том 15 [11]
хронобиологии и хрономедицине с использованием современных методов интеллектуального анализа динамических данных // Хронобиология и хрономедицина: Руководство / под ред. С.И. Раппорта, В.А. Фролова, Л.Г. Хетагу-ровой. / М.: ООО "Медицинское информационное агентство", 2012. - с. 252 - 284.
5. Карп В.П., Хетагурова Л.Г., Ботоева Н. К., Саяпина Ю. А. Изучение влияния космофизических факторов на возникновение ситуаций, провоцирующих сосудистые заболевания // Материалы V Региональной научно-практической конференции. Новые технологии в рекреации здоровья населения. - Владикавказ, 2012. -с. 191-196.
6. Семантический подход в исследовании динамики космофизических показателей / Саяпина Ю.А., Карп В.П. Хетагурова Л. Г. // Математика. Компьютер. Образование: международная конференция: Тез. -М.: 2012. - с. 65.
7. Карп В.П. интеллектуальный анализ данных в проблеме построения решающих правил классификации (на примере задач медицинской диагностики) // Новости искусственного интеллекта. - 2006. - N 2. - с. 57-75.
— еъз+ыз--------------—
7
Издание зарегистрировано в Федеральной службе по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор). Свидетельство о регистрации СМИ ПИ ЭЛ № ФС77-50518 Журнал представлен в НАУЧНОЙ ЭЛЕКТРОННОЙ БИБЛИОТЕКЕ (НЭБ) - головном исполнителе проекта по созданию Российского индекса научного цитирования (РИНЦ).