УДК 681.518
А.И. ПОВОРОЗНЮК, канд. техн. наук, доц. НТУ "ХПИ" (г. Харьков),
Н.А. ЧИКИНА, канд. техн. наук, доц. НТУ "ХПИ" (г. Харьков),
И.В. АНТОНОВА, аспирантка НТУ "ХПИ" (г. Харьков)
НЕЧЕТКАЯ ЭКСПЕРТНАЯ СИСТЕМА ПРОГНОЗА
РИСКА РАЗВИТИЯ ПРОФЕССИОНАЛЬНО
ОБУСЛОВЛЕННЫХ ЗАБОЛЕВАНИЙ
Предложен метод идентификации состояния здоровья на основе выявленных внешних и внутренних факторов риска в условиях вредного производства. Разработана модель нечеткой экспертной системы по прогнозу уровня риска развития профессионально обусловленных аллергодерматозов и определены функциональные характеристики ее модулей. Проведено компьютерное моделирование в среде Ма1;ЬаЬ. Ил.: 2. Библиогр.: 9 назв.
Ключевые слова: идентификация состояния, нечеткая экспертная система, прогноз риска развития, компьютерное моделирование.
Постановка проблемы. За последние 20 - 30 лет существенно изменилась социальная и производственная среда, что обусловило увеличение числа рисков возникновения профессионально обусловленных заболеваний (ПОЗ). На предприятиях химико-фармацевтической промышленности к профессиональным рискам относится воздействие активных химических веществ, вызывающих различные заболевания аллергического генеза. Поэтому актуальной является разработка системы прогноза риска развития ПОЗ у рабочих и служащих предприятия с вредными условиями производства.
В ходе исследований, проводимых в рамках научно-исследовательских работ Харьковского НИИ Дерматологии и Венерологии совместно с НТУ "ХПИ" на предприятиях химико-фармацевтической промышленности авторами кроме профессиональных рисков были выявлены групповые и внутренние факторы риска развития ПОЗ [1 - 3]. Наличие таких факторов риска дает возможность построить экспертную систему прогноза риска развития ПОЗ.
Анализ литературы. Появление и совершенствование автоматизированных систем для массовых обследований населения нельзя рассматривать в отрыве от процессов, связанных с проникновением компьютера во врачебное мышление. Если в начале развития медицинской кибернетики речь шла о создании экспертных систем для дифференциальной диагностики заболеваний с похожей симптоматикой, то в последние годы ставится задача создания автоматизированных информационных систем -советчиков врача [4].
Общепринятая классификация ЭС отсутствует, однако наиболее часто ЭС различают по назначению, предметной области, методам представления знаний, динамичности и сложности [5].
Человек способен принимать практически полезные решения в условиях неполной и неопределенной (нечеткой) информации. Поэтому построение моделей, использующих рассуждения человека и применение их в компьютерных системах представляет собой одну из важнейших научно -технических проблем. При количественном описании и построении моделей биологических объектов и систем решения конкретных прикладных задач целесообразно, а в ряде случаев - и необходимо, использовать указанную способность человеческого интеллекта с тем, чтобы адекватно учесть специфику биообъектов. Мощным инструментом совместного решения этих проблем является математический аппарат нечеткой логики, основы которого были предложены Л. Заде еще в 1965 г. [6]. Это подтолкнуло исследователей к созданию нечетких ЭС.
Логико-лингвистические методы описания нечетких систем основаны на том, что поведение исследуемой системы описывается в естественном (или близком к естественному) языке в терминах лингвистических переменных [7]. Входные и выходные параметры системы являются лингвистическими переменными, а качественное описание процесса задается совокупностью простейших правил вида:
Ь}-: если А, то В у, (у = 1,к0),
где А и В - нечеткие подмножества, заданные на декартовом произведении
универсальных множеств входных и выходных лингвистических переменных соответственно. Кроме того, в основе нечетких ЭС лежит принцип вычисления суперпозиции многих влияний на окончательный результат (композиционное правило Заде), что позволяет учесть совместное влияния целого ряда факторов в решении задачи прогноза риска развития ПОЗ.
Целью статьи является описание структуры и принципов работы нечеткой ЭС прогноза уровня риска развития профессионально обусловленных аллергодерматозов у рабочих предприятий химикофармацевтической промышленности.
Основная часть. Рассматриваемая нечеткая ЭС проектируется на основе выявленных в ходе предыдущих исследований факторов риска [1 - 3]. В качестве экспертов при создании нечеткой базы знаний были привлечены руководители и ответственные исполнители НИР ХНИИДиВ и НТУ "ХПИ".
Пусть для описания множества О, состоящего из т объектов, используется п признаков (выявленных факторов риска): {Х15 Х2,...,Хп}. Каждому объекту из множества О соответствует некоторое значение целевого признака Х0. Признаки Xг (г = 0, п) измерены в порядковой или номинальной шкале. Целевой признак Х0 имеет к0 градаций, т. е. принимает к0 различных значений.
Для всех градаций признаков Хі (і = 1, п) построены функции
принадлежности ц' (Хі) входного признака Хг нечеткому терму Х' .
На основе результатов предыдущих исследований был синтезирован набор к0 правил вида:
Ь : ЕСЛИ (Х1 = Х/1) И (Х2 = Х'1) И ... И (Хп = ХП1) (с весом Ш7І )
ИЛИ (Х1 = Х'2) И (Х2 = х22) и ... И (хп = XI2) (с весом Ю;-2 )
ИЛИ (Х1 = Х'д' ) И (Х2 = Х^ ) И ... И (Хп = Х]пд ) (с весом ю ),
ТО Хо = Х0, ____
где Ь ' - решающее правило с номером ' (' = 1, к0); Х' - градация входной переменной Хі в правиле с номером 'р (' = 1, к0, р = 1, д); д' - количество правил, в которых выход Х о оценивается термом Х . На основе базы нечетких правил Ь; ('= 1, к0) была получена модель Мамдани нечеткого
логического вывода для прогноза риска развития ПОЗ.
Согласно [8] лингвистическая переменная описывается набором {Х,Т(Х), и, О,М}, в котором Х - название этой переменной; Т(Х) - терм-множество Х, т.е. совокупность ее лингвистических значений; и -универсальное множество; О - синтаксическое правило, порождающее термы множества Т(Х) ; М - семантические правила, задающие функции принадлежности нечетких термов, порожденных синтаксическими правилами
О.
В процессе структурной идентификации модели для каждой переменной Хі (і = 0, п) задавалось ее имя, терм-множества (градации) Ті, универсальное множество и і .
Приведем в качестве примера некоторые терм-множества входных переменных (факторов риска) и их множества значений:
Х] = "Уровень адаптации": Т ={"низкий", "средний", "высокий"},
и є [0; 1];
Х2 = "Стаж работы на предприятии": Т2 ={"небольшой", "средний", "большой"}, и2 є [0; 40];
Х3 = "Возраст": Т3 ={"молодой", "средний", "старший"}, из є [20; 60];
Х4 = "Наличие контакта с лекарственными препаратами по месту работы": Т ={"нет", "отчасти", "есть"}, и4 є[0;1];
X5= " Обобщенный внутренний фактор риска": Г5 ={"слабый",
"повышенный", "высокий"}, U є [0; 1].
Для выходной переменной: X = "Уровень риска развития ПОЗ":
T ={"есть", "повышенный", "высокий"}, U0 є[0;1].
Метод, по которому авторы определяли индивидуальный уровень обобщенного влияния внутренних факторов риска развития ПОЗ, был назван обобщённым фактором риска и описан в [9].
На основе этих данных строились соответствующие функции
принадлежности цjp (Xt). График функции принадлежности фактора риска X2 = " Стаж работы на предприятии" представлен на рис. 1.
plot points:
181
Membershp function plots
небольшой средний большой
О 5 10 15 20 25 30 35 40
nput variable ‘Стаж работы*
Рис. 1. Функции принадлежности факторов риска Х2 = "Стаж работы на предприятии".
Правило нечеткого вывода, соответствующее, например, повышенному риску развития ПОЗ имеет вид:
ЕСЛИ (Х1 = "низкий") (с весом 0,6) ИЛИ (Х2 = "средний") (с весом 1) ИЛИ (Х3 = "средний") (с весом 0,7) ИЛИ (Х4 = "есть") (с весом 0,8)
ИЛИ (Х5 = " высокий") (с весом 0,6), ТО Х0 = "высокий".
Согласно механизму Мамдани (Mamdani) нечеткий вывод в ЭС осуществляется следующим образом:
1. На этапе фаззификации определяются степени истинности, т.е.
значения функций принадлежности ц№ (XІ) (у = 1, £0, р = 1, # ■, / = 1, п) для
левой части правила Ь(состоящей из ]р подправил).
2. Для текущих входных значений Х0 = (X*,X*,...,X*) минимаксным методом определяется степень истинности целевого признака, т.е.:
ц0 (X *) = v_(юj (X*)), j = 1,, где v(a) - операция 5-нормы
p=1,qj i=1,n
(t-нормы).
3. На этапе дефаззификации четкое значение целевого признака X0,
-* * * *
соответствующее входному вектору Х0 = (Xl5 X2,...,Xn), определяется методом центра тяжести.
Проверка адекватности модели нечеткой ЭС проводилась средствами пакета Fuzzy Logic среды MatLab на случайно сформированной выборке из имеющейся базы, содержащей информацию о 430 обследованных рабочих профильных предприятий. В выборку вошли представители каждой из групп риска в одинаковых пропорциях (всего 150 обследованных). Результаты проверки представлены на рис. 2.
Из рисунка видно, что проведенная апробация позволяет выделить три нечетких состояния обследованных в зависимости от наличия (отсутствия) тех или иных факторов риска, а именно S1 ("есть риск развития ПОЗ"), S2 ("повышенный риск развития ПОЗ") и S3 ("высокий риск развития ПОЗ"). Для повышения качества распознавания ЭС предполагается в дальнейшем провести ее оптимизацию.
Значение уровня риска
Рис. 2. Распределение объектов тестовой выборки по признаку "Риск развития ПОЗ"
Выводы. Разработана модель нечеткой ЭС по прогнозу уровня риска развития профессионально обусловленных аллергодерматозов и определены функциональные характеристики ее модулей. Проведенное моделирование в среде Ма1ЬаЬ показало, что нечеткость в исходных данных не является препятствием для идентификации состояния обследуемых. Оптимизацию разработанной модели ЭС предполагается осуществить путем ее параметрической идентификации по обучающей выборке. Результаты работы данной ЭС могут быть использованы на предприятии химикофармацевтической промышленности при проведении профилактических
медицинских осмотров в качестве рекомендаций по мерам профилактики профзаболевания.
Список литературы: 1. Чикина Н.А. Изучение влияния внутренних факторов риска на развитие аллергодерматозов у рабочих химико-фармацевтических предприятий / Н.А. Чикина, И.В. Антонова // Tр. Международной науч.-техн. конф. "MicroCAD - 2007". - Xaрьков: HTУ '^ПИ". - 2007. - Ч. 8. - С. 195-200. 2. Чикина Н.А. Идентификация состояния здоровья на основе анализа типов реакции адаптации у рабочих предприятий химико-фармацевтической промышленности / Н.А. Чикина, И.В. Антонова // Вестник HTУ '^ПИ". - Xaрьков, HTУ '^ПИ". -2008. - № 24. - С. 178-184. 3 Чикина Н.А. Математические модели адаптации к вредным условиям труда на основе метода корреляционной адаптометрии / Н.А. Чикина, И.В. Антонова // Вестник ШУ '^ПИ". - Xaрьков, HTУ ^ПИ". - 2008. - № 49. - С. 184-189. 4. Баевский Р.М. Оценка адаптационных возможностей организма и риска развития заболеваний / Р.М. Баевский, А.П. Берсенева. - М.: Медицина, 1997. - 60 с. 5. Джарратано Д. Экспертные системы: принципы разработки и программирование / Д. Джарратано, Г. Райли - М.: Издательский дом "Вильямс", 2006. - 1152 с. б. ZadehL.A. Fuzzy sets / L.A. Zadeh // Information and Control, 1965. - № 8 (3). -P. 338-353. 7. Штовба С.Д. Проектирование нечетких систем средствами MATLAB
/ С.Д. Штовба. - М.: Горячая линия^елеком, 2007. - 288 с. 8. Заде Л.А. Понятие лингвистической переменной и его применение к принятию приближенных решений / Л.А. Заде. - М.: Мир, 1976. -165 с. 9. Поворознюк А.И. Прогноз развития профессионально обусловленных заболеваний с помощью дискриминантного анализа / А.И. Поворознюк, НА. Чикина, Ю.Л. Геворкян, И.В. Антонова // Системи обробки інформації. Збірник наукових праць XУПС. - Xaрків, 2010. -Випуск 1 (82). - С. 200-203.
Статья представлена д.т.н., проф. НТУ ’ХПИ" Пиротти Е.Л.
УДК 681.518
Нечітка експертна система прогнозу ризику розвитку професійно обумовлених захворювань / Поворознюк А.І., Чікіна Н.О., Антонова І.В. // Вісник HTУ '^Ш". Tемaтичний випуск: Інформатика і моделювання. - Xaрків: HTУ ^Ш". - 2010. - № 31. - С. 127 - 132.
Запропоновано метод ідентифікації стану здоров'я на основі виявлених зовнішніх і внутрішніх чинників ризику в умовах шкідливого виробництва. Розроблено модель нечіткої експертної системи прогнозу рівня ризику розвитку професійно обумовлених алергодерматозів і визначені функціональні характеристики її модулів. Проведено комп'ютерне моделювання в середовищі MatLab. Іл.: 2. Бібліогр.: 9 назв.
Ключові слова: ідентифікація стану, нечітка експертна система, прогноз ризику розвитку, комп'ютерне моделювання.
UDC 681.518
Fuzzy expert system risk prognosis of development the professionally conditioned diseases I Povoroznuk A.I., Ohkina N.A., Antonova I.V. // Herald of the National Technical University "KhPI". Subject issue: Information Science and Modelling. - Kharkov: NTU "KhPI". - 2010. - №. 31. - P. 127 -132.
The method of identification of the health state is offered on the basis of the indicated external and internal risk factors in the conditions of harmful production. The model of fuzzy expert system of risk prognosis of development of the professionally conditioned allergodermathoses is worked out and functional descriptions of its modules are determined. A computer modeling is conducted in the MatLab environment. Figs.: 2. Refs.: 9 titles.
Keywords: identification of the health state, fuzzy expert system, risk prognosis of development, computer modeling.
Поступила в редакцию 20.04.2010