Розглядаеться проблема проектування тформацш-ног технологИ визначення структури групи трудових мiгрантiв. В ходi дослидження виконано вербальну та математичну постановку задачi та розглянуто адап-тований метод нечтких с-середтх для и розв'язання. Вiдмiчено особливостi проектування та запропоновано структурно-функцитальну схему iнформацiйно-аналi-тичног системи для визначення структури групи трудових мiгрантiв. Виконано експериментальну верифшацю результатiв дослидження
Ключовi слова: визначення структури групи трудових мiгрантiв, метод нечтких с-середтх, тформацшна тех-нологiя
□-□
Рассматривается проблема проектирования информационной технологии определения структуры группы трудовых мигрантов. В ходе исследования выполнена вербальная и математическая постановка задачи и рассмотрен адаптированный метод нечетких с-сред-них для ее решения. Отмечены особенности проектирования и предложена структурно-функциональная схема информационно-аналитической системы для определения структуры группы трудовых мигрантов. Выполнена экспериментальная верификация результатов исследования Ключевые слова: определение структуры группы трудовых мигрантов, метод нечетких с-средних, информационная технология
УДК 004.9+519.816
|DOI: 10.15587/1729-4061.2015.47204|
ОСОБЛИВОСТ1 ПРОЕКТУВАННЯ 1НФОРМАЦ1ЙНОТ ТЕХНОЛОГИ ВИЗНАЧЕННЯ СТРУКТУРИ ГРУПИ ТРУДОВИХ М1ГРАНТ1В
О. Ю. Мулеса
Кандидат техычних наук, доцент Кафедра мбернетики i прикладной' математики ДВНЗ "Ужгородський нацюнальний ушверситет" пл. Народна, 3, м. Ужгород, УкраТна, 88000
E-mail: [email protected]
1. Вступ
Впровадження сучасних шформацшних техноло-гш у процес аналiзу складних сощальних явищ дозволяв забезпечити отримання науково-обгрунтованих та свовчасних результапв. Необхщшсть розв'язання слабко структурованих та неструктурованих задач при виршент складних науково-техшчних проблем спричиняв потребу в розробщ релевантних моделей, методiв та програмних засобiв. Задачу як виникають перед спещалштами рiзних галузей в сферi проф^ак-тики та боротьби з В1Л/Сшдом, як правило, важко шддаються формалiзащi, а 1х розв'язання вщомими методами супроводжувться значними складностями, спричиненими характером вхщних даних та зв'язками мiж ними. Такою задачею в задача визначення структури групи трудових м^ранив [1]. Ак-туальшсть дослщження вказаноi соцiальноi групи шдтверджувться тим, що мiгрантiв та представниюв мобiльних популяцiй визнано уразливою щодо шфь кування В1Л групою населення в багатьох крашах свiту [2]. В той же час, одшвю з найб^ьш уразливих категорiй м^ранив в саме трудовi мiгранти [3]. При дослщжент групи трудових м^ранив важливим в врахування ряду соцiально-демографiчних пара-метрiв ii представникiв, а також, власне напряму трудовоi м^рацп [1]. Розробка спецiальноi шформа-цiйноi технологii для розв'язання задачi визначення структури даноi соцiальноi групи дозволить шдви-
щити ефективнiсть процесiв визначення основних napaMeTpiB групи.
2. Аналiз лiтературних даних та постановка проблеми
Визначення особливостей ряду сощальних груп в сферi проф^актики та боротьби з В1Л/Сшдом проводиться, як правило, на основi результатiв спе-щальних поведiнково-епiдемiологiчних дослiджень методом анонiмного анкетування о«б-представниюв цiльовоi групи [1, 4]. Задачу якi при цьому виникають, математично можуть бути вщнесеш до задач класифжацп з учителем та без, задач щентифжацп невщомих залежностей та iнших [5, 6]. Методи кластерного аналiзу можна под^ити на статистичнi [7], в осшж яких лежить припущення, що кластери можна описати за допомогою iмовiрнiсних розподiлiв; де-ревовиднi [8], за допомогою яких будуються дерева кластерiв; нейромережнi [9], в основi яких лежить ви-користання карт Кохонена; генетичнi алгоритми [10], що використовують принципи природного вiдбору. В свою чергу, методи структурноi та параметричноi iдентифiкацii невiдомих залежностей представлен в роботах [11, 12]. В робой [13] запропоновано адап-тащю методу нечiтких с-середнiх для розв'язання задачi визначення структури соцiальноi групи, яка базувться на представленi вхщних даних задачi у ви-глядi лiнгвiстичних змiнних.
g
Розробка ефективно' шформацшно' технологii розв'язання задачi визначення структури групи трудо-вих м^раш^в потребуе побудови адекватних моделей для задач, що виникають, тдбору вiдповiдних методiв iх розв'язання та розробки релевантних шструмен-тальних засобiв.
3. Цiль та задачi дослщження
Метою дослiдження е пiдвищення ефективност процесiв прийняття рiшень при розв'язуванш задач, що виникають у ходi дослiдження групи трудових мь гранпв у сферi профiлактики та боротьби з В1Л/Сш-дом, шляхом розробки релевантноi iнформацiйноi тех-нологii.
Для проектування ефективноi iнформацiйноi технологи визначення структури групи трудових м^ран-тiв необхiдно розв'язати такi задача
- побудувати математичнi моделi задач, що виникають;
- дослщити можлившть розв'язання задач ввдпо-вщними методами;
- визначити особливостi структури та функщону-вання iнформацiйноi технологи визначення структури групи трудових м^ранпв;
- виконати експериментальну верифжащю отри-маних результатiв.
4. Математична постановка задачi визначення структури групи трудових мирантш
Вербальна постановка задачi визначення структури групи трудових м^ранпв може бути виконана таким чином [13]: у заданш сощальнш груш здшснити групування ii членiв за заданими сощально-демо-графiчними параметрами; визначити юльюсний та представницький склад кожноi складовоi заданоi групи. Представники групи характеризуются за такими параметрами, що утворюють '¿х соцiально-демографiч-ний портрет [1, 4]: територiя проживання та мкцевкть (сiльська, мiська); вщ рiвень освiти; сiмейний стан; мкце роботи або працевлаштування (краiна або регюн мiграцii) та iнше.
В такш постановцi задачу визначення структури групи трудових м^ранпв можна представити як задачу нечико' кластеризацп, математичну модель яко' побудуемо таким чином:
Нехай дано множину об'екпв
Х^. (X, ) =1.
8=1
Х={Х, =(Х,1,Х,2,...,Х1
= 1^} ,
якi характеризуются за множиною ознак К = {К1,К2,...,КМ},
тобто х, - значення ]-о' ознаки для ьго об'екта. Необ-хiдно розбити дану множину X на G нечггких клас-терiв за заданим критерiем, тобто для кожного об'екта X, е X, , = 1, N визначати ступеш належностi до кожного з кластерiв (ц1 (X,),ц2 (X,),...,(X,)), де (X,) - сту-пiнь належностi об'екта X, до кластеру тд номером 8, 8 = 1,С, при чому
5. Адаптащя методу нечкких с-середнiх для розв'язання задачi визначення структури групи трудових миранив
Вщповщно до алгоритму, наведеному в робоп [13], на початку роботи процедури кластеризацп необхвдно розв'язати такi задача
1. Задача впорядкування ознак. Вербальна постановка задачi е такою: необхщно для кожно' ознаки з множини К встановити стутнь и впливу на можли-вiсть входження об'екта до того чи шшого кластеру.
Математично задача полягае у щентифжацп функ-цiональноi залежностi О, за допомогою яко' б здшсню-валося вiдображення
та визначалася б стутнь впливу ознаки на формуван-ня кластерiв.
Один iз способiв обчислення значень функцп О базуеться на результатах експертних опитувань та зво-диться до послвдовних розв'язань задач числово' ощн-ки об'екта. Серед методiв визначення числово' оцiнки об'екта можна виокремити статистичний метод, утиль тарний та егалиарний методи, евристичнi методи тощо [14]. Позначимо а = о(к), ] = 1,М.
2. Задача побудови лтгвгстичнихзмтних. Для кож-но' ознаки з множини К будуемо лшгвштичну змш-ну. Побудову можна виконувати на основi висновюв експертiв. Позначимо через ^^Т^^Р^ параметри, що вщповщають лiнгвiстичнiй змiннiй ] = 1,М; Rj - потужшсть множини Т]; цгТ (xj) - функцiя належ-ностi для г-го терму множини Тр г = 1,Rj.
Шсля розв'язання вказаних задач переходимо до запуску иерацшно' процедури адаптованого методу нечиких с-середнiх. Алгоритм методу е таким:
Крок 1. Задаемо параметр зупинки алгоритму ее(0;1) та стутнь нечикосп т, 1 <т <°». При т = 1 отримуемо чiтке розбиття, тобто розбиття, у якому кожен об'ект вщноситься пльки до одного кластеру. 1з збiльшенням параметру т збiльшуеться стутнь розмитост видiлених кластерiв.
Для кожного об'екта iз множини
X
Х,1,Х,2,...,Х,
дов^ьним чином задаемо ступiнь належностi кожному з кластерiв та формуемо матрицю и0 =(и^), и,в е[0;1], де и,в - початкова стутнь належносп 1-го об'екта 8-му кластеру
(, = = 1С), та £и,8 = 1, V, е{l,...,N}.
в=1
Визначимо функцiю вiдстанi мiж двома об'ектами X, Д, еX таким чином:
11 12
(1)
d(Xll,Xl2 ) = ^^ ]Г=1
М
де x, i,x, : - вiдповiднi компоненти BeKTopiB X ,X .
MJ '2J M '2
Крок 2. Визначаемо значення функцiй належносп для компонент векторiв, що е поточними центрами кластерiв за формулою:
И Jc«) := ^
N m
IK) ■^rTJ(xJ)
I К )m
де C(g) = (c(g),c2g),...,cMM)) - поточний центр g-го кластеру (g = 1,G). '
Крок 3. Знаходимо вiдстанi вiд об'ектiв до центрiв кластерiв за формулою (1). Позначимо dig = d(Xi,C(g)), i = 1,N, g = 1,G.
Крок 4. Обчислюемо коефiцiенти матрицi U за формулами:
якщо 3gi e{l,2,...,G}: d^ = 0,
то U'gi = 1, U'g = 0, Vg = gi, g = 1,G;
якщо Vg = 1,G dig >0, 1
Крок 5. Перевiряeмо умови зупинки алгоритму. Тобто, якщо ||U — U*|J <£, де U* - матриця, отримана на попередньому крощ, то алгоритм закшчено, шакше переходимо до кроку 2.
В результат виконання процедури отримаемо розбиття об'екпв на нечiткi кластери.
6. Особливост проектування шформацшно-аналiтичноï системи
Запропоноваш в дослiдженнi моделi i методи, в сукупносп з розробленою на ïx основi шформацш-но-аналггичною системою (1АС), утворять вiдповiдну шформацшну теxнологiю визначення структури групи трудових мпранпв.
Розробка iнформацiйно-аналiтичноï системи для розв'язання задачi визначення структури соцiальноï групи, вiдповiдно до наведеного алгоритму, передбачае реалiзацiю таких завдань:
— вибiр експертiв для проведення експертиз та визначення ïx компетентности
— формування та ранжування множини параме-трiв, що утворюють соцiально-демографiчний портрет особи;
— побудова лшгвктичних змiнниx для заданих па-раметрiв;
— визначення ступенiв належностi оаб до кластерiв.
1АС, яка буде супроводжувати виршення зазначе-
них завдань, дозволить спещалштам рiзниx галузей в сферi профiлактики та боротьби з В1Л/Сшдом, при-ймати ефективнi ршення в процесi дослiдження ними групи трудових мпранпв.
Враховуючи те, що щльова група дослiджуеться шляхом аналiзу анонiмниx анкет ïï представникiв, мож-
на припустити, що вхвдш даш будуть носити неповний та суб'ективний характер, тому для ïï штерпретацп, а та-кож, вiдповiдно до наведеного адаптованого методу нечетких с-середшх, доцiльно використовувати висновки експерпв [14] та елементи теорiï нечиких множин [15].
В процесi реалiзацiï вказаних завдань виникае не-обхщшсть розв'язання ряду супутнix задач:
— формування перелжу ознак, якi мають вплив на входження об'екта до певного кластеру; формування множини можливих значень кожноï ознаки;
— задача експертного визначення ранпв ознак сощ-ально-демографiчного портрету;
— побудова лiнгвiстичниx змшних для кожноï з вiдiбраниx ознак;
— задача нечи^ кластеризацiï, яка полягае у по-будовi процедури ©, виконання якого дозволило б визначати ступеш належностi об'екта до кожного з кластерiв, тобто
X' Д(Ц1 (X' ),ц 2 (X' ),..., ^ (X' )),
де |ig (X')— ступiнь належносп об'екта X' кластеру
__G
тд номером g, g = 1,G, при чому (X') = 1. Робота
g=1
зазначеноï процедури мае опиратися на ефективне використання вхщних даних та результапв експерт-них опитувань, iз застосуванням адаптованого методу нечиких с-середнix.
Послщовна побудова моделей та реалiзацiя вщпо-вiдниx методiв для розв'язання зазначених задач стане основою аналгтичного блоку 1АС.
Розробку iнформацiйно-аналiтичноï системи необ-xiдно виконувати згiдно рiвнiв системноï моделi:
цш1=>задач1(модел1)=>методи (алгоритми)=>засоби.
Основою 1АС е сукупнiсть математичних моделей i методiв, серед яких можна видшити такi:
— моделi i методи визначення компетентносп екс-пертiв;
— моделi i методи визначення числовоï оцiнки об'екта на основi експертних опитувань;
— непрямi методи побудови функцш належностi нечiткиx множин на основi суджень експертiв;
— моделi i методи нечiткоï кластеризацп. Формально структурно-функщональна схема 1АС
показана на рис. 1.
Блок визначення ранпв ознак
даш
Блок побудовн лгнтстичних змшннх
Аншптичний блок
Блок внводу результат
Рис. 1. Структурно-функцюнальна схема IAC
то u'g =
2
Таким чином, на попередньому етат здшснювться тдготовка вхiдних даних шляхом обробки результа-тiв експертних опитувань та побудови лшгвктичних змiнних. Пiсля цього, дат надходять в аналiтичний блок, в якому реалiзований адаптований метод нечетких с-середнiх для визначення структури групи трудо-вих м1грант1в.
7. Експериментальна верифiкацiя технологи визначення структури групи трудових мирантш
Для тдвищення точностi результатiв роботи спро-ектованоi iнформацiйноi технологii необхiдно виконати налаштування основних параметрiв системи. Для цього пропонувться розв'язати задачу нечгтюл кластеризацii групи осiб-трудових мiгрантiв (для яких заздалегщь вь домi напрямки трудовоi мiграцii), з метою розд1лити '¿х на кластери вiдповiдно до можливих напрямiв трудово' мiграцii та порiвняти результати з фактичними даними.
На початковому еташ ОПР та експертами було ввдбрано ознаки соцiально-демографiчного портрету, сформовано множину '¿х можливих значень та визна-чено '¿х коефiцiвнти впливу на розбиття. Результати наведет в табл. 1.
Таблиця 1
Ознаки соцiально-демографiчного портрету особи трудового мiгранта
Номер Ознака Коефiцieшт впливу Можл^ значення
1 Стать 10 Чоловiча, Жiшоча
2 Вж 8 18-24, 25-34, 35-44, 45+
3 Мюце про- 3 Сшьська мiсцевiсть, Мiська
живання мюцевють
4 Освiтшiй рiвешь 5 Неповна середня освiта, Середня осв™, Середня спещальна освiта, Неповна вища освiта, Вища Освiта
5 Омейний стан 2 Одружений, Розлучеший/Вдiвець, У шлюбi не перебував
Серед напрямкiв можливо' мiграцii розглядалися такi: Укра'на, кра'ни Захiдноi бвропи, кра'ни СНД.
Для кожно' ознаки соцiально-демографiчного портрету були сформован вiдповiднi лiнгвiстичнi змшш. Приклад нечiтких множин для лшгвштично' змiнноi «В1к» наведений у табл. 2.
Таблиця 2
Неч^к множини лшгвютичноТ змшноТ «Вiк»
Терм 18-24 25-34 35-44 45+
Молода особа 1 0,8 0,4 0
Особа зршого вiку 0,2 0,7 1 0,8
Особа старшого вшу 0 0 0,2 1
Аналогiчним чином побудовано лшгвктичш змш-нi для шших ознак.
Для виконання кластеризацп з елементiв множини X = {Х!,1 = 1,100} було сформовано базу даних з 100 за-пиав. Фрагмент бази наведений у табл. 3.
Таблиця 3
Елементи початковоТ множини (фрагмент)
№ Стать Вiк Мюце прожи-вання Осв^нш рiвешь Омейний стан
1 чоловж 35-44 село повна середня Одруж./ Цив.шлюб
2 чоловж 35-44 село середня спец. Одруж./ Цив.шлюб
3 чоловж 25-34 село н. сер у шлюбi шiколи не перебував
4 чоловж 25-34 село повна середня Одруж./ Цив.шлюб
5 чоловж 45+ мюто повна середня Розлуч./ Вдова
6 чоловж 25-34 село середня спец. Одруж./ Цив.шлюб
7 чоловж 35-44 мюто повна середня Розлуч./ Вдова
8 жшка 45+ село н. сер Одруж./ Цив.шлюб
9 жшка 25-34 мюто повна середня Одруж./ Цив.шлюб
10 чоловiк 45+ село н. сер Розлуч./ Вдова
11 чоловiк 35-44 мюто н. вища Одруж./ Цив.шлюб
12 чоловiк 45+ село середня спец. Одруж./ Цив.шлюб
13 чоловiк 25-34 село н. сер Одруж./ Цив.шлюб
14 чоловж 25-34 село середня спец. Одруж./ Цив.шлюб
15 жiшка 45+ село н.сер Одруж./ Цив.шлюб
; ; ; ; ; ;
Розбиття проводилося на три кластери.
В результат роботи алгоритму, для кожного еле-мента з множини X було обчислено вектор и = (и1,и2,и3), де и е[0;1] - стутнь належностi об'вкта до вiдповiд-ного кластеру.
Аналiз результатiв показав, що до першого кластеру з ступенем належност1, бiльшим нiж 0,5 переважно були вщнесеш особи з напрямком м1грацп «Кра'ни За-хiдноi бвропи», до другого - «Кра'ни СНД», до третьо-го - «Укра'на». Вщносна похибка результатiв розбиття на кластери становила близько 5 %.
Наведеш в дослщженш моделi, методи та шстру-ментальнi засоби утворюють шформацшну техноло-гiю визначення структури групи трудових м1грант1в, яка може використовуватися спещалктами сфери профiлактики та боротьби з В1Л/Сшдом з метою до-слiдження особливостей цiльовоi групи, а також визначення '¿х поведшкових ризикiв.
Особливостями технологи в те, що моделi та методи в чутливими до налаштувань, а '¿х ефективнiсть залежить вiд особи, що приймав рiшення та висновюв експертiв, об'вму та характеру вхщних даних. Проте, виконана експериментальна верифжащя пiдтверджув можливiсть здiйснення вiдповiдних налаштувань та отримання достовiрних результатiв.
8. Висновки
В ходi дослщження було:
1. Виконано вербальну та математичну постановки задачi визначення структури групи трудових Mi-гранив; показано, що дана задача може бути представлена як задача нечiткоï кластеризацп, основним припущенням якоï е те, що об'ект може одночасно належати до рiзних кластерiв з рiзними ступенями належностi.
2. Для розв'язання поставленоï задачi нечiткоï кластеризацп запропоновано застосовувати адаптова-ний метод нечетких с-середнiх, в основi якого лежить представлення вхщних даних через лшгвктичш змш-нi. Застосування такого тдходу дозволяе знаходити вiдстанi мiж об'ектами, вектор ознак яких мае як чис-ловi, так i нечисловi компоненти.
3. Визначено особливост проектування 1АС для розв'язання сформульованих задач: вщзначено завдання, якi мають бути реалiзованi в 1АС; побудова-
но систему задач, якi розв'язуються 1АС; наведено систему математичних моделей i методiв, якi становлять основу аналгтичного блоку 1АС; наведено структур-но-функцiональну схему системи. Проектування 1АС вiдповiдно до описаноï схеми дозволить ефективно розв'язувати поставлен задачi та супроводжувати дея-кi процеси прийняття ршень в сферi профшактики та боротьби з ВIЛ/Снiдом.
4. Виконано експериментальну верифжащю технологи визначення структури групи трудових м^ранпв для заданоï початковоï множини оаб. Експеримент проводився на прикладi задачi кластеризацiï групи осiб вiдповiдно до напрямку '¿х трудовоï мiграцiï. Результати експерименту показали, що тсля ввдповвд-них налаштувань та розв'язання супутшх задач, було отриманi достовiрнi розв'язки задачi.
Таким чином, запропонована в дослщженш техно-логiя визначення структури групи трудових м^ранпв може ефективно використовуватися для розв'язуван-ня зазначених задач.
Лиература
1. Миронюк, I. С. Поведшков1 ризики шфжування В1Л oci6, пов'язаних з трудовою мшращею [Текст] / I. С. Миронюк // Про-фшактична медицина. - 2012. - № 2 (18). - С. 7-10.
2. Крупным планом: СПИД и мобильные группы населения [Текст] / ЮНЕЙДС // Доклад о глобальной эпидемии ВИЧ/ СПИДа. - 2002. - С. 117-123.
3. Бобрик, А. В. Организация комплексной профилактики ВИЧ-инфекции, ИППП и вирусных гепатитов среди трудовых мигрантов [Текст] / А. В. Бобрик, К. М. Ерошина, Е. А. Михель. - М., 2009. - 32 с.
4. Миронюк, I. С. Особливост ризиковано'1 поведшки ВШ-шфшованих трудових мшран™ Закарпатсько'1 обласл залежно вщ репону мюрацп [Текст] / I. С. Миронюк // Науковий вюник Ужгородського ушверситету. Серiя "Медицина". - 2012. -Вип. 1 (43). - С. 146-151.
5. Мулеса, О. Ю. Послщовний аналiз варiантiв в неч^ких задачах кластеризацп' та щентифшацп [Текст] / О. Ю. Мулеса // Вiсник Кшвського нацюнального унiверситету iменi Тараса Шевченка. Серiя фiзико-математичнi науки. - 2013. - Вип. 2. -С. 205-209.
6. Мулеса, О. Ю. Технолопя кiлькiсного оцшювання представникiв груп високого ризику шфжування вiрусом iмунодефi-циту людини в умовах невизначеност [Текст] / О. Ю. Мулеса // Вiсник Нацюнального техшчного унiверситету «ХШ». Серiя: «Новi рiшення в сучасних технолопях». - 2013. - № 56 (1029). - С. 172-179.
7. Батуркин, С. А. Статистические алгоритмы кластеризации данных в адаптивных обучающих системах [Текст] / С. А. Батур-кин, Е. Ю. Батуркина, В. А. Зименко, И. В. Сигинов // Вестник РГРТУ. - Рязань, 2012. - Вып. 31, № 1. - C. 82-85.
8. Котов, А. Кластеризация данных [Электронный ресурс] / А. Котов, Н. Красильников. - Режим доступа: \www/URL: yury.name/internet/02ia-seminar-note.pdf
9. Горбаченко, В. И. Сети и карты Кохонена [Электронный ресурс] / В. И. Горбаченко. - Режим доступа: \www/URL: http://gorbachenko.self-organization.ru/index.html
10. Снитюк, В. Эволюционная кластеризация сложных объектов и процессов [Текст] / В. Снитюк // XI-th International Conference «Knowledge-Dialogue-Solution». - Varna, 2005. - Т. 1. - С. 232-237.
11. Гроп, Д. Методы идентификации систем [Текст] / Д. Гроп. - М.: Мир, 1979. - 302 с.
12. Наконечний, С. I. Економетрiя [Текст]: тдручник / С. I. Наконечний, Т. О. Терещенко, Т. П. Романюк. - К.: КНЕУ, 2004. - 520 с.
13. Мулеса, О. Ю. Адаптащя методу неч^ких с-середшх до задачi визначення структури сощальних груп [Текст] / О. Ю. Мулеса // Технолопчний аудит та резерви виробництва. - 2015. - № 2/2 (22). - С. 73-76. doi:10.15587/2312-8372.2015.41014
14. Волошин, О. Ф. Теорiя прийняття ршень [Текст]: навч. поабн. / О. Ф. Волошин, С. О. Мащенко. - К.: Видавничо-полiграфiчний центр «Кшвський ушверситет», 2010. - 366 с.
15. Орловский, С. А. Проблемы принятия решений при нечеткой исходной информации [Текст] / С. А. Орловский - М.: Наука. Главная редакция физико-математической литературы, 1981. - 208 с.