-□ □-
Наведено результати застосування методiв моделювання для создания класифiкаторiв дифе-ренщальног дiагностики патологiчних статв системи кровообиу для випадку, коли об'екти характеризуються множинами точок у бага-товимiрному просторi. Дiагностична проблема виршуеться шляхом переводу задачi класифта-ци у простiр ознак-параметрiв оптимальног структури об'ектiв класифтацп. Застосовано методи бтарног лог^тичног регреси, дис-кримтантного аналiзу та метод групового вра-хування аргументiв
Ключовi слова: моделювання, класифшатори, лог^тична регреЫя, дискримтантний аналiз,
метод групового врахування аргументiв
□-□
Приведены результаты применения методов моделирования для создания классификаторов дифференциальной диагностики патологических состояний системы кровообращения для случая, когда объекты характеризуются множеством точек в многомерном пространстве. Диагностическая проблема решается путем перевода задачи классификации в пространство признаков-параметров оптимальной структуры объектов классификации. Использованы методы бинарной логистической регрессии, дис-криминантного анализа и метод группового учета аргументов
Ключевые слова: моделирование, классификаторы, логистическая регрессия, дискрими-нантный анализ, метод группового учета аргументов
-□ □-
УДК 519.711:616.12
|DOI: 10.15587/1729-4061.2014.31079|
МОДЕЛЮВАННЯ КЛАСИФ1КАТОР1В ДИФЕРЕНЦ1АЛЬНО1 Д1АГНОСТИКИ ПАТОЛО1ЧНИХ СТАН1В СИСТЕМИ КРОВООБ1ГУ
€. А. Настенко
Доктор бюлопчних наук, старший науковий ствробЬник, завщуючий вщдтенням Вщдт шформацтних технологш та математичного моделювання фiзiологiчних процеав ДУ «Науково-дослщний шститут серцево-судинноТ xipyprii iм. М. М. Амосова» НАМН УкраТни вул. Миколи Амосова, 6, м. КиТв, УкраТна, 03110 E-mail: [email protected] В. А. Павлов Кандидат техычних наук, доцент* E-mail: [email protected] О. К. Носовець Астрант, старший викладач* E-mail: [email protected] *Кафедра бюмедичноТ мбернетики Нацюнальний теxнiчний yнiвеpситет УкраТни «КиТвский полiтеxнiчний шститут» пр. Перемоги, 37, м. КиТв, УкраТна, 03056
1. Вступ
Провщне мшце серед причин смертносп населення УкраТни займають захворювання системи кровообiгу, питома вага яких в структурi загальноТ летальностi складае 66 %, а в працездатному ввд - 29,3 % (Державна служба статистики УкраТни, 2011 рж) [1].
Для полшшення даноТ статистики важливим е створення простого нешвазивного методу дiагности-ки, що дозволить на раннiх етапах виявляти та корегу-вати патологiчнi стани системи кровооб^у.
Одним з варiантiв дiагностики станiв системи кро-вообжу, що дозволяе пiдвищити точнiсть виявлення сташв вiдмiнних вiд нормального, е варiант з застосу-ванням багаторазових вимiрювань показникiв дiасто-лiчного, систолiчного артерiального тиску (АТД, АТС) та частоти серцевих скорочень (ЧСС). Це дозволяе тд-вищити точнiсть класифжацп за рахунок тдвищен-ня юлькосп показникiв, що характеризують кожного пащента. Однак, класифiкацiя пацiентiв у в такому випадку не е однозначною.
Це е поширений випадок варiанту задач класи-фiкацiТ, коли об'ект (пащент) характеризуеться не
поодинокими вимiрами в багатовимiрному npocTopi ознак, а Тх пiдмножинами, причому для кожного з них допускаеться частковий перетин тдмножин областей простору ознак де вимiрювалися об'екти рiзних клаив (дiагнозiв) (рис. 1)
Рис. 1. Приклад перетину показнимв об'eктiв, що належать до piзниx класiв
© е.
Така умова не дозволяе при класифжацп об'екта використовувати окремi точки, а вимагае застосу-вання спецiальних пiдходiв, де можливо оперувати множинами вимiрювань, або характеристиками, отри-маними на основi цих множин, або параметрами рiз-них доцiльних розкладань наявних характеристик в модельний ряд [2-4].
2. Аналiз лкературних даних та постановка проблеми
Результати дослвджень показниюв артерiального тиску та частоти серцевих скорочень показали, що вони е високошформативними та вiдображають функцiю сер-ця, функцiю ендотелiю та стан катлярних судин [5-7]. Ця шформащя дала можливiсть розробити новi тдходи до виявлення патологiчних станiв системи кровообку [8-10], що базуються на одноразових та багаторазових вимiрюваннях показниюв отриманих у сташ спокою. При цьому методи, що не виключають з аналiзу данi монiторингу тиску та пульсу тд дiею психо^зичного навантаження, майже не розвинутi, в зв'язку з ввдсут-нiстю норм для таких даних та складтстю 1х вiднесення до певного стану.
Особливктю цiеi задачi е неможливкть гаранто-вано1, в загальному випадку, класифжацп об'ектiв по окремих точках Zi у початковому просторi ознак z1,...,zM . Такий висновок слвдуе з можливих перетинiв областей простору , коли об'екти (пащенти) di i ^ належать рiзним класам.
Вирiшення проблеми пропонуеться за рахунок переводу задачi класифжацп у просторi ознак - пара-метрiв деякоi найкращоi структури, що описуе вiдомi нам об'екти класифжацп. Така структура одержуеться комбiнаторним алгоритмом МГВА, що базуеться на основних ршеннях наведених в робот [11]. Вщмш-нiстю запропонованоi реалiзацii [12] вщ роботи [11] е застосування дощльного для даноi задачi зовшшнього критерiю: критерiю регулярностi похибок моделей в«х об'ектiв класифiкацii.
3. Цшь та задачi дослщження
Цiль дано! роботи полягае у вирiшеннi задачi моде-лювання класифiкаторiв диференцiйноi дiагностики патологiчних CTaHiB системи кровообiгу багатовимiр-ному просторi, що базуеться на даних отриманих тсля згортки в точки в просторi параметрiв R .
Для досягнення поставлено! мети виршувалися наступш задачi:
- визначити структуру модел^ що реалiзуе згортку сукупност об'ектiв;
- розрахувати класифжатори патологiчних станiв за рiзними методами математичного моделювання;
- визначити тдхщ до математичного моделювання, що мае найбшьш точнi результати класифжацп.
4. Клiнiчнi матерiали та методи моделювання класифiкаторiв диференщально! дiагностики
В якост дослiдницького матерiалу були викори-станi данi багаторазових вимiрювань показниюв АТД,
АТС та ЧСС, отримаш в результат монiторингу у 62 обстежених. Вж обстежуваних знаходився в межах вщ 33 до 64 роюв (середнiй вiк 44,6 роюв). Всього було отримано 12 357 вимiрювань за допомогою апарату A&D Medical UA-878 (Японiя). 2437 вимiрiв не брали участь процесi моделювання, осюльки були вiдiбранi для оцшки якостi отриманих моделей.
Первиннi ознаки пащентв - ЧСС, АТС, АТД. В якосп вихiдноi змiнноi (2) - визначено дiастолiчний тиск.
В просторi параметрiв клiнiчних ознак х;, i = 1,...m було задано 5 клаав (станiв системи кровообжу): Д1-систолiчна iзольована гiпертензiя (1Гс), Д2 - артерiаль-на гiпертензiя (АГ), Д3 - нормальна регулящя (НР), Д4 - серцева недостатшсть невисоких ступенiв (АНн), Д5 - серцева артерiальна недостатнiсть високих сту-пенiв (АНв). Всi пацiенти, що брали участь у обстежен-нях було вщнесено до одного з цих клаав.
5. Результати створення методу дiагностики
патологiчних станiв в багатовимiрному просторi
5. 1 Реалiзацiя переходу до альтернативного простору ознак
Для виршення задачi класифiкацii в багатовимiр-ному просторi припускаемо, що опис об'екту d за-даеться тдмножиною точок Zd ={Zi }а, знятих з де-яко' невщомо'! нам характеристики об'екту fd(z) = 0. Тодi вказаних характеристик передбачаеться стльки, скiльки об'ектiв:
fd(z) = 0, d = 1,...,п, (1)
Дал^ без втрати загальностi, розглядаемо той ви-падок, коли серед початкових змшних z1,_,zM можливо вид^ити характерну вихiдну змiнну у.
Визначимо новий простр ознак х, як простр узагальнених змiнних Х1, х2,..., хМ1 початкового простору z, що найкраще представляють характеристики = 0, d = 1,...,п по початковiй множинi точок Zd = {Zi }а уже як лшшну згортку по х;. Тодi з точнiстю до переозначення, характеристики (1) можливо шука-ти у виглядi (2):
м м
у=г0г1ф1(^=г0rixi, (2)
1=1 1=1
де М - розмiрнiсть нового простору узагальнених змшних х для представлення об'ектв d.
Тодi рiшення задачi класифiкацii можливо перевести з простору узагальнених змшних, у простр
м
параметрiв Я = {г,}. характеристик у = г0 + ^г;х;,
,ь0,-м 1=1
що дозволить розглядати об'екти d уже не як множини Zd ={Zi}а , та не як характеристики = 0, d=1,..,n, а як точки в просторi параметрiв Я. Одиночш точки rd вже однозначно визначають об'екти d зважаю-чи на вiдсутнiсть повнiстю ствпадаючих пiдмножин
zd ={Zl }d.
Таким чином виршення проблеми пропонуеться за рахунок переводу задачi класифiкацii у просторi ознак - параметрiв дея^ найкращоi структури, що описуе вiдомi нам об'екти класифiкацii. Така струк-
тура одержуеться комбшаторним алгоритмом МГВА, що базуеться на основних рiшеннях наведених в робот [4]. Вщмшшстю запропоновано! реалiзацii [5] вiд роботи [4] е застосування дощльного для дано! задачi зовнiшнього критерiю: критерт регулярностi похибок моделей всiх об'ектв класифiкацii.
Надалi передбачаеться класифiкувати об'екти d як точки га у просторi параметрiв R .
Застосування вказаного алгоритму, дало можли-вкть перевести задачу класифiкацii у простр пара-метрiв, для чого було обрано оптимальну структуру, одержану за комбшаторним алгоритмом МГВА [5], що описувала вихвдну змшну (АТД) за вхщними змшни-ми (АСТ та ЧСС).
DIA = г0 +г ^HR^. (3)
На знайденiй структурi було розраховано коефщь енти моделей для вах пацiентiв та здшснено перетво-рення бази даних пащентв вiдповiдно до знайдених значень параметрiв оптимально! структури (3). Для цього були використаш методи нелiнiйного регресш-ного аналiзу. В подальшому перетворена база даних використана для побудови класифiкаторiв диференщ-ально! дiагностики.
Для побудови дiагностичних класифiкаторiв вико-ристовуються наступнi методи:
- логiстичний регресшний аналiз;
- дискримiнантний аналiз;
- метод групового урахування аргументв (МГУА) [6].
В якост остаточних будуть обраш класифжато-ри, що показали максимальну яюсть роздiлення на тестовш вибiрцi пацiентiв - показники чутливост та специфiчностi для пацiентiв, що не брали участь в на-лаштуванш вiдповiдного класифiкатора
5. 2. Розрахунок класифiкаторiв за допомогою дискриминантного аналiзу
1. Формула класифiкатора, що диференщюе стан «1Гс» (табл. 1):
У(х)=-4,672 +0,074 т0+0,003*г1. (4)
Таблиця 1
Характеристики отриманого класифiкатора 1Гс
Виб1рка % розтзнавання чутливють специф1чшсть
Вся виб1рка 89,1 % 0,99 0,88
Навчання 90,1 % 1 0,89
Екзамен 84,2 % 0,95 0,83
2. Формула класифжатора, що диференцiюе стан «АГ» (табл. 2):
У(х)=-3,452+0,050.г0+0,001.г1. (5)
Таблиця 2
Характеристики отриманого класифкатора АГ
3. Формула класифжатора, що диференщюе стан «НР» (табл. 3):
У(х)=-3,647+0,053т0+0,001т1. (6)
Таблиця 3
Характеристики отриманого класифiкатора НР
Виб1рка % розтзнавання чутливють специф1чтсть
Вся виб1рка 79 % 0,86 0,76
Навчання 79,1 % 0,86 0,76
Екзамен 78,5 % 0,84 0,76
4. Формула класифжатора, що диференцiюе стан «СНн» (табл. 4):
У(х)=-0,247+0,014т0+0,002т1. (7)
Таблиця 4
Характеристики отриманого класифiкатора СНн
Виб1рка % розтзнавання чутливють специф1чтсть
Вся виб1рка 70,9 % 0,9 0,66
Навчання 71,1 % 0,905 0,663
Екзамен 69,8 % 0,89 0,65
5. Формула класифжатора, що диференцiюе стан «СНв» (табл. 5):
У(х)=-5,895+0,095.г0+0,004.г1. (8)
Таблиця 5
Характеристики отриманого класифкатора СНв
Виб1рка % розтзнавання чутливють специф1чнють
Вся виб1рка 91,4 % 0,99 0,859
Навчання 92,1 % 1 0,869
Екзамен 87,9 % 0,98 0,813
Результати моделювання класифiкаторiв за допомогою дискримшантного аналiзу показали великий розкид точност - вщ 68 % правильно класифiкованих при дiагностицi стану «АГ», до 91,4 % - при дiагностицi стану СНв. Розраховаш показники чутливостi та спец-ифiчностi, що е найбшьш значимими при оцiнцi якостi моделювання також не показали високих значень.
5. 3 Розрахунок класифiкаторiв за допомогою ло-пстично! регресп
1. Формула класифжатора, що диференцiюе стан «1Гс» (табл. 6):
У(х)=36,445-0,406.г0-0,014.г1. (9)
Таблиця 6
Характеристики отриманого класифкатора 1Гс
Виб1рка % розтзнавання чутливють специф1чнють
Вся виб1рка 98 % 0,904 0,99
Навчання 98,2 % 0,909 0,99
Екзамен 97 % 0,88 0,98
2. Формула класифiкатора, що диференщюе стан «АГ» (табл. 7):
Виб1рка % розтзнавання чутливють специф1чтсть
Вся виб1рка 68 % 0,71 0,68
Навчання 68,4 % 0,72 0,68
Екзамен 66,2 % 0,68 0,66
Y(х)=4,853-0,032тo-0,001т1. (10)
Таблиця 7
Характеристики отриманого класифiкатора АГ
Виб1рка % розтзнавання чутливють специф1чшсть
Вся виб1рка 90 % 0 0,99
Навчання 90,1 % 0 1
Екзамен 89,3 % 0,1 0,98
3. Формула класифжатора, що диференцiюе стан «НР» (табл. 8):
Y(х)=-4,530-0,045т0-0,001т1. (11)
Таблиця 8
Характеристики отриманого класифiкатора НР
Виб1рка % розтзнавання чутливють специф1чшсть
Вся виб1рка 69,5 % 0,16 0,938
Навчання 70,1 % 0,16 0,942
Екзамен 66,7 % 0,1 0,92
4. Формула класифiкатора, що диференцiюе стан «СНн» (табл. 9):
Y(х)=1,579-0,008.г0-0,001.г1. (12)
Таблиця 9
Характеристики отриманого класифкатора СНн
Виб1рка % розтзнавання чутливють специф1чнють
Вся внб1рка 77,5 % 0,03 0,95
Навчання 78,4 % 0,045 0,967
Екзамен 73 % 0 0,91
5. Формула класифжатора, що диференщюе стан «СНв» (табл. 10):
Y(х)=-28,505+0,521т0+0,021тl. (13)
Таблиця 10
Характеристики отриманого класифiкатора СНв
Виб1рка % розтзнавання чутливють специф1чнють
Вся виб1рка 95,5 % 0,921 0,976
Навчання 96,3 % 0,928 0,985
Екзамен 91,7 % 0,891 0,934
Моделювання за допомогою методу вiдтворення бiнарноТ лопстичноТ кривоТ показало бiльш точнi показники. Найб^ьша точнiсть класифiкацiТ була досягнута для стану «1Гс» - 98 % правильно кла-сифiкований значень. Найменьшу точнiсть показав класифiкатор стану «НР» - 69,5 %. Однак, аналiз показниюв чутливостi показав, що на трьох моделях з п'яти, незважаючи на висок показники правильно класифжований значень, не перевищував зна-чення 0,16.
5. 4. Розрахунок класифiкаторiв за допомогою МГУА
1. Формула класифжатора, що диференцiюе стан «1Гс» (табл. 11):
Y(х)=2,156-0,022.г0-0,001.a1-0,01.г13. (14)
Таблиця 11
Характеристики отриманого класифкатора 1Гс
Виб1рка % розтзнавання чутливють специф1чтсть
Вся виб1рка 94 % 1 0,93
Навчання 93,7 % 1 0,93
Екзамен 95,4 % 0,99 0,95
2. Формула класифiкатора, що диференщюе стан «АГ» (табл. 12):
Y(х)=1,47-0,013т0-0,004тl. (15)
Таблиця 12
Характеристики отриманого класифiкатора АГ
Виб1рка % розтзнавання чутливють специф1чтсть
Вся виб1рка 87,1 % 0,88 0,87
Навчання 86,4 % 0,88 0,86
Екзамен 90,8 % 0,89 0,91
3. Формула класифжатора, що диференцiюе стан «НР» (табл. 13):
Y(х)=1,028-0,017т0-0,001т1+0,189т03+0,001т13. (16)
Таблиця 13
Характеристики отриманого класифiкатора НР
Виб1рка % розтзнавання чутливють специф1чтсть
Вся виб1рка 82,8 % 0,8 0,83
Навчання 82,7 % 0,8 0,839
Екзамен 83,4 % 0,82 0,84
4. Формула класифжатора, що диференцiюе стан «СНн» (табл. 14):
Y(х)=0,436-0,001.г1. (17)
Таблиця 14
Характеристики отриманого класифкатора СНн
Виб1рка % розтзнавання чутливють специф1чтсть
Вся виб1рка 86 % 0,85 0,86
Навчання 86,2 % 0,863 0,862
Екзамен 84,8 % 0,84 0,85
5. Формула класифжатора, що диференщюе стан «СНв» (табл. 15):
Y(х)=-0,612+0,027т0-+0,001т1-0,139т13. (18)
Таблиця 15
Характеристики отриманого класифiкатора СНв
Виб1рка % розтзнавання чутливють специф1чтсть
Вся виб1рка 96,9 % 0,99 0,95
Навчання 97,4 % 1 0,957
Екзамен 94,7 % 0,96 0,938
Аналiз отриманих класифiкаторiв показав, що най-бiльшу точнiсть показали класифжатори отриманi
за допомогою МГУА. Модел^ отримаш за допомогою цього методу мали висок показники чутливост, специфiчностi та найбшьший процент правильно кла-сифжованих значень.
6. Висновки
Вирiшена задача дiагностики патологiчних станiв системи кровооб^у пацiентiв, що характеризуються множинами вимiрiв за допомогою моделювання кла-сифiкаторiв, що використовують данi згортки до простору параметрiв характеристик об'ектв класифiкацii. Реалiзацiя модифiкованого комбiнаторного МГУА, за
рахунок визначення структури, що найлшшим чином описуе ва об'екти включен аналiз, дозволила перейти з багатовимiрного простору багаторазових вимiрювань до просту ознак характеристик об'ектв. Перехщ до такого простору дозволив уникнути проблему перетину областей значень ознак об'ектв, що належать до рiзних класiв. Розрахунок класифiкаторiв за допомогою трьох методiв моделювання (лопстичного ре-гресiйного аналiзу, дискримiнантного аналiзу, МГУА) показав, що найкращi результати демонструють мо-делi отриманi за допомогою МГУА. Середне значення правильно класифжованих значень - 89,6 %, процент правильно класифжованих значень всередиш сво'х класiв - 92,3 %.
Лиература
1. Медико-демограф1чна ситуащя та оргашзащя медично! допомоги населенню у 2011 рощ [Текст] / за ред. О.В. Атщенко. -Мшютерство охорони здоров'я Украши, Ки!в, 2012. - 103 с.
2. Забара, С. С. Метод видшення швар1антних ознак сигнашв [Текст] / С. С. Забара, Н. Б. ФЫмонова, К. Х. Зеленский // Доповщ Нацюнально! академп наук Украши. - 2009. - № 2. - С. 49-55.
3. Редько, И. Н. Оценка области глобальной устойчивости уравнения маятникового типа методами теории классификации объектов [Текст] : 4-я конф. / И. Н. Редько // Нелинейные колебания в механических системах ННГУ, 1996. - С. 45-46.
4. Редько, И. Н. Применение методов теории классификации объектов для оценок областей существования установившихся движений [Текст] / И. Н. Редько, В. Д. Шалфеев // Вестник ННГУ, сер. Радиофизика (Нелинейная динамика - синхронизация и хаос). - 1998. - С. 68-72.
5. Cowley, A. W. Long-tern control of arterial blood pressure [Text] / A. W. Cowley, Jn Physiol // CirculaT Researches. - 1992. -Vol. 72, Issue 1. - P. 231-300.
6. Eule!, U. S. Observations on the pulmonary arterial blood pressure [Text] / U. S. Eule!, G. Liljestrand // Acta Physiologica Scandinavica. - 1996. - Vol. 12, Issue 4. - P. 301-320. doi: 10.1111/j.1748-1716.1946.tb00389.x
7. Arthur C. Arterial pressure regulation [Text] / C. Arthur M. D. Guyton, G. Thomas // The American Journal of Medicine. -1992. - Vol. 52, Issue 5. - P. 584-594.
8. O'RouAe, M. Arterial stiffness, systolic blood pressure, and logical treatment of arterial hypertension [Text] / M. O'RouAe // Hypertension. - 1990. - Vol. 15, Issue 4. - P. 339-347. doi: 10.1161/01.hyp.15.4.339
9. McKenna, M. The ratio of ankle and am arterial pressure as an independent pгedictoг of mortality [Text] / M. McKenna, S. Wolfson, L. Kuller // Atherosclerosis. -1991. - Vol. 87, Issues 2. - P. 119-128. doi: 10.1016/0021-9150(91)90014-t
10. McVeigh, G. E. Age-Related Ab^^al^ies in Arterial Compliance Identified by Pressure Pulse Conta^ Analysis [Text] / G. E. McVeigh, C. W. Bratteli, D. J. Mo^an // Hypertension. - 1999. - Vol. 33, Issue 6. - P. 139-142. doi: 10.1161/01.hyp.33.6.1392
11. Степашко, В. С. Комбинаторный алгоритм МГУА с оптимальной схемой перебора моделей [Текст] / В. С. Степашко // Автоматика. - 1981. - № 3.- С. 31-36.
12. Nastenko, Ie. A. Combinatorial agorithm constrncting a parametric feature space Ьг the classification of multidimensional models [Text] / Ie. A. Nastenko, G. V. Knishov, O. K. Nosovets, V. A. Pavlov, N. V. Kondrashova // Cybernetics and Systems Analysis. - 2014. - Vol. 50, Issue 4. - P. 627-633. doi: 10.1007/s10559-014-9651-3