5. ОСВ1ТЯНСЬК1 ПРОБЛЕМИ ВИЩО1 ШКОЛИ
нлты
ы КРАЖИ
wi/ган
Науковий в!сн и к НЛТУУкраТни Scientific Bulletin of UNFU
http://nv.nltu.edu.ua https://doi.org/10.15421/40270638 Article received 03.09.2017 р. Article accepted 28.09.2017 р.
УДК 004.89
ISSN 1994-7836 (print) ISSN 2519-2477 (online)
1 EE3 Correspondence author N. E. Kunanets [email protected]
Н. Е. Кунанець1, В. С. Ленько1, В. В. Паачник1, Ю. М. Щербина2
1 Нацюнальнийутверситет "Львiвська полтехтка", м. Львiв, Украша 2 Львiвський нацюнальний утверситет iM. 1вана Франка, м. Львiв, Украша
ПЕРСОНАЛЬН1 БАЗИ ДАНИХ ТА ЗНАНЬ В1РТУАЛЬНИХ ДОСЛ1ДНИЦЬКИХ СП1ЛЬНОТ
Дослщжено процеси набуття та управлшня персональними даними i знаннями, а також комунжацп в межах BipTyanbHHX до^даицьких спшьнот. Розглянуто поняття вiртуaльного наукового колективу та особливостi захисту шформацп у налаго-дженнi процесiв комунжацп в ньому. Висвiтлено проблеми в оргашзацп ефективноï комунiкaцiï мiж учасниками вiртуaль-них дослiдницьких спшьнот, що породженi вiдсутнiстю цiлiсного технологiчного ршення, яке забезпечило б надшшсть, приваттсть, швидкодiю та структуровaнiсть потокiв шформацп, даних i знань. Запропоновано принципово новий пiдхiд до проектування платформ комунжацп, що Грунтуеться на вдеях децеитрaлiзaцп та крипто-безпеки. Проaнaлiзовaно методоло-гiчнi вiдмiнностi мiж поняттями "шформащя", "дат" та "знания". Висвiтлено сучасний пiдхiд до здiйснення мiркувaння в онтолопчнш моделi подання знань, що Грунтуеться на використанш апарату теорп типiв та асистента доведення теорем Coq. Структуровано подано вдаошення мiж логжою та теорiею типiв, а також наведено споаб подання основних елеменгiв онтологiï формальною мовою системи Coq. Розглянуто приклад здiйснеиия мiркувaння з використанням мови тактик Ltaс над фрагментом онтологiï, що описуе певнi вiдиошеиия з предметиоï област функцiонувaиия вiртуaльиих до^даицьких спiльнот. Вказано шляхи та iнструменги здiйснеиня подальшого дослiджеиия.
Krnuoei слова: е-наука; комунжащя; блокчейн; онтолопя; теорiя титв; лопчне мiркувaиня.
Вступ. Стрiмкий розвиток шформацшних техноло-гiй та обчислювальних ресурав помiтно впливае практично на ва сфери повсякденного суспiльного життя, в якому чiльне мiсце належить працi дослвдника. Ретель-не планування етапiв наукового дослвдження передба-чае вивчення та аналiз значних за об'емом та структурною складшстю даних, що надходять з рiзноманiтних джерел. У процесi 1'х опрацювання в дослiдника фор-муеться знанневий потенщал, який за своею суттю е особиспсним ввдображенням iнформацiï про конкрет-ний об'ект, методи, засоби та способи його дослщження та навколишнш свiт загалом.
Плин часу породжуе проблему, яку зазвичай назива-ють проблемою зберiгання знань: якщо набутi знання активно не використовуються та не актуалiзуються, то вони тддаються забуттю або ж частково втрачають свою первинну цiннiсть. Осшльки набуття знань належить до категорп енергозатратних та часомiстких видiв дiяльностi, науковець-дослщник зацiкавлений у подо-ланнi означених вище проблем. Персональш бази знань
дослвдника, як1 зафжсоваш у комп'ютернiй формi, знач-ною мiрою дають змогу уникнути втрати знань, а також технiчно полегшують процеси 1'х актуалiзацiï.
Мета дослщження полягае в комплексному аналiзi поточного стану та перспектив технологiчноï оптишза-цiï функцiонування вiртуальних наукових колективiв. Дослвдження проблем ефективноï та захищеноï комуш-кацiï, набуття та управлiння знанневим потенцiалом, розгляд основних понять та технологш, висвiтлення су-часних тенденцш покликанi створити мiцне аналггичне пiдгрунтя для проектування надiйноï та ефективно1' платформи комунiкацiï вiртуальних дослвдницьких спiльнот. Конкретизацiя зазначено1' мети передбачае застосування методiв аналiзу та синтезу до предметних областей, що ввдображають специфiку функцiонування вiртуальних наукових колективiв, технологiчнi шстру-менти його забезпечення, ефективнi моделi подання знань та мiркування, понятiйний апарат.
Стан дослщження проблеми. Сучасна комушкащя вiртуальних дослвдницьких спiльнот характеризуеться
1нформащя про aBTopiB:
Кунанець Наталiя Едуардiвна, д-р наук i3 соцiальних комунтацш, професор кафедри шформацмних систем та мереж. Email: [email protected]
Ленько Василь Степанович, астрант кафедри шформацмних систем та мереж. Email: [email protected] Паачник Володимир Володимирович, д-р техн. наук, професор кафедри iнформацiйних систем та мереж. Email: [email protected].
Щербина Юрм Миколайович, канд. фiз.-мат. наук, професор кафедри дискретного аналiзу та iнтелектуальних систем. Email: [email protected].
Цитування за ДСТУ: Кунанець Н. Е., Ленько В. С., Паачник В. В., Щербина Ю. М. Персональн бази даних та знань вiртуальних
дослiдницьких спiльнот. Науковий вкник НЛТУ УкраУни. 2017. Вип. 27(6). С. 185-191. Citation APA: Kunanets, N. E., Lenko, V. S., Pasichnyk, V. V., & Shcherbyna, Yu. M. (2017). Personal Data and Knowledge Bases of Virtual Research Communities. Scientific Bulletin of UNFU, 27(6), 185-191. https://doi.org/10.15421/40270638
використанням po3pi3HeHm ÎHCTpyMeHTÎB, що здебшь-шого opieHTOBaHÎ на широкий загал та не враховують особливi потреби конкретних груп. Формування мето-дологiчноï та технолопчно1' основи для проектування систем комушкацп вiртyaльних наукових колективiв е актуальною задачею. Деяк1 напрацювання в цьому нап-рямку сприяють ïï вирiшенню. Зокрема, в роботi (Vere-tennikova et al., 2015) подано означення вiртyaльного наукового колективу, його роль, структуру та особли-востi фyнкцiонyвaння. Технолопчш компоненти, що здaтнi забезпечити ефективне та надшне середовище для комушкацп, описано в роботах (Romano & Schmid, 2017; Protocol Labs, 2016; Li et al., 2017). Понятшний апарат передбачае оперування концептами "даш", "ш-формащя", "знання" та ïхнiми вiдношеннями (Wang, 2015; Liew, 2007). Онтолопчний iнжинiринг (Feilmayr, & Wöß, 2016; Noy, & McGuinness, 2001) та здшснення мiркyвaння з використанням теорп типiв (Dapoigny, & Barlatier, 2008; Hafsi, Dapoigny & Bolon, 2015) у межах асистента доведення теорем Coq (Cog, 2017) пропону-ють сучасний тдхвд до управлшня базами знань.
Комунiкацiя у BÏpTy^bH^ наукових колективах. Cyчaснi нayковi дослщження, з огляду на свою склад-нiсть, виходять за меж1 класичних iнститyцiй та потре-бують експертизи дослщнишв-науковшв, як1 працюють у рiзних фiзичних локaцiях. Iнновaцiйнy шформацшно-технолопчну платформу для оргaнiзaцiï таких досль джень у Великобритaнiï та в £врош трактують як e-Sci-ence, а в США як Cyberinfrastructure i перебувае вона на стадп швидкого формування та методологiчного ста-новлення.
Ефективно функцюнуюча платформа вибудовуеться на бaзi телекомyнiкaцiйноï iнфрaстрyктyри, комп'ютер-них та шформацшних технологiй, сховищ та просторiв даних. Одним зi сутшсних складников yспiшноï реaлiзa-цiï проекпв на бaзi iнфрaстрyктyри е-науки (e-Science) та досягнення поставлених у проектах цшей е управлш-ня шформащею та ефективна комyнiкaцiя мiж членами вiртyaльноï проектно1' команди, що, зазвичай, передбачае формування вiртyaльного наукового колективу (Ve-retennikova et al., 2015). Вiртyaльний науковий колек-тив - це ситуативно сформована група з представнишв рiзних наукових шституцш, як1 шляхом системного ви-користання сучасних iнформaцiйних та комyнiкaцiйних технологш вiртyaльно об'еднуються для проведення спшьних наукових дослвджень та реaлiзaцiï комплек-сних наукових проектiв. Iнгегрaцiя вщбуваеться по вер-тикaлi з метою об'еднання ключових компетентностей окремих учаснишв вiртyaльного територiaльно розподь леного колективу та оргашзацп роботи для виршення задач як едино1' оргaнiзaцiйно-цiлiсноï науково-дослщ-ницько1' одиницi.
Так1 нayковi колективи можуть об'еднувати геогра-фiчно або шституцшно розподiлених дослiдникiв, представнишв рiзних галузей знань, як1 проводять системне дослвдження тiеï чи шшо1" проблеми. Ефективнiсть таких дослщжень iстотно пiдвищyеться в рaзi налаго-дження процесiв комфортно!' спiвпрaцi та яшсних кому-нiкaцiй мiж членами наукового колективу, що скла-даеться з представнишв рiзних регiонiв та установ.
Невiдклaдним завданням, яке потрiбно вирiшyвaти для yспiшноï реaлiзaцiï проекту, е забезпечення ефек-тивного використання iнформaцiйно-технологiчноï платформи i комyнiкaцiйних зв'язшв мiж учасниками
вiртуального наукового колективу, який, зазвичай, фор-муеться i3 вузькопрофiльних високо-фахових дослвдни-к1в. Такий пiдхiд забезпечуе налагодження ефективно! комушкацп та ствпращ у реальному масштабi часу i3 збереженням з генеровано! шформацп у формi даних та знань, виконання функцiй управлiння спшьною дiяль-нiстю учасник1в в рамках великомасштабних, розподь лених мультидисциплiнарних проекпв.
Взаeмодiя у вiртуальному науковому колективi повинна пiдкрiплюватися архiтектурними програмно-ал-горитмiчними та iнформацiйно-технологiчними ршен-нями, як1 сприяли б отриманню нових наукових резуль-татiв. Учасники наукових проекпв, як1 реалiзуються на платформi е-науки, стикаються з низкою проблем, як пов'язанi з вiдсутнiстю яшсних i верифiкованих методiв управлiння вiртуальними проектними групами та зруч-них у використанш iнструментальних програмно-алго-ритшчних комплексiв.
Сучасне iнформацiйне суспiльство генеруе потребу активного поступального розвитку окремо! шнова-цшно! галузi, якою е електронна наука як системно з ш-тегрований комплекс сучасних комп'ютерних шформацшних та комушкацшних технологш, яш забезпечують реалiзацiю основних функцш i завдань науки. Такий тдхвд реалiзуе вiдкритий доступ до консолвдованих ш-формацiйних ресурсiв, сформованих на використання технологш хмарних обчислень (Cloud computing) (Dhamdhere, 2014) та великих за обсягом даних (Big Data) (Kaisler et al., 2013), що шстятъ результати наукових дослвджень, як1 проводяться вiртуальними проектними групами та науковими колективами.
Сшвпраця мiж науковцями, зазвичай, полягае в об-говореннi iдей, координацп спшьних дш, обмiнi напра-цюваннями, джерелами знань та отриманими результатами. Осшльки iнформацiя передаеться здебiльшого в електронному виглядi через мережу 1нтернет, то постае необхвдшсть в забезпеченнi приватносп, швидшсно! пе-редачi, безпеки, фшсаци гсгори обмiну повiдомленнями в процесi комушкацп.
Як свiдчать результати аналiзу, комунiкацiя у вiрту-альних наукових колективах здшснюеться переважно за допомогою програмних продуктiв, що реалiзованi за принципом ктент-серверно! архiтектури (Gmail, Skype, Viber, веб-платформи). Реалiзацiя комунiкацiйних про-цесiв покладаеться, зазвичай, на серверну компоненту. Недолiком цього пiдходу е те, що користувачi системи повшстю покладаються на коректнiсть функцiонування ввддаленого вузла. У разi його недоступности несанквд-онованого доступу, технологiчно! застаршосп, цензору-вання вiртуальний науковий колектив ризикуе втратити конфiденцiйнiсть поввдомлень, не досягти ефективно! комушкацп. Нова форма оргашзацп дослщницько! роботи потребуе розроблення та запровадження шнова-цшних пiдходiв i до комунiкацiйних процеав. Для удосконалення та пiдвищення ефективносп шформа-цiйно-технологiчного супроводу шутово-досл^но! роботи вiртуальних наукових колективiв дослвдники ка-федри iнформацiйних систем та мереж Нацюнального унiверситету "Львiвська полггехшка" запропонували ш-новацiйнi пiдходи.
Для забезпечення режиму захищеносп та збережен-ня статусу конфiденцiйностi отриманих результапв наукових дослiджень та комушкативних процесiв у вiрту-альних групах та наукових колективах плануеться вико-
ристання технологш блок-чейн (Blockchain) (Romano & Schmid, 2017). Такий технологiчний B^ip дае змогу ефективно pеалiзовувати процедури, пов'язанi i3 захис-том прав штелектуально1 власностi автоpiв на результата, отримат в рамках виконання проекту, або конкретного наукового експерименту.
Вiдбуваеться бурхливий розвиток pозподiлених систем та технологш, що покликанi вилучити центpалiзо-вану серверну ланку з процешв обмiну, збереження та доступу до шформацл. Становлення мереж piвнопpав-них вузлiв peer-to-peer (P2P), вдосконалення крипто-геш функцiй, поява технологи Blockchain та розподше-но1 файлово1 системи IPFS (Protocol Labs, 2016) тдго-тували необхiдне пiдrpунтя для проектування систем децентpалiзованоi комунiкацii. Проведений авторами пошук пpодуктiв для ефективноi комуткацл класу P2P зафiксував тiльки проект системи обмiну повдамлення-ми Echo (Bitshares Munich IVS, 2016). Зпдно з описом, система шифруе повщомлення (Marshall, 2016) та зберь гае iх в стpуктуpi Graphene Blockchain. Для того, щоб отримати та прочитати повдамлення користувача, де-центpалiзований клiент повiдомлень повинен мати доступ до ланцюжка блокiв. Обмш файловими та потоко-вими ресурсами здшснюеться шляхом запису IPFS геш-коду в Blockchain полi "memo".
Технолопю Blockchain було описано у 2008 p. (Na-kamoto, 2008), а ii перша практична pеалiзацiя з'явилася на piк пiзнiше в основi криптовалюти Bitcoin. Blockchain е розподшеною базою даних, яка шдтримуе постiйно зростаючий пеpелiк запиив (блокiв) та е кpиптогpафiч-но захищеною вiд пiдpобки. Кожен блок мютить групу нових "пеpевipених" транзакцш, хеш попереднього блоку, власний хеш та службову iнфоpмацiю. У 2014 р. з'явилося поняття Blockchain 2.0 (Swan, 2015), яке поз-начае новi напрямки застосування pозподiленоi бази даних. Одним з таких застосувань е "розумш контракта" (Omohundro, 2014), що надають можливють програмо-ваного обмiну цiннiсною шформащею без впливових посеpедникiв. Коpпоpацii, своею чергою, активно впро-ваджують "приватш" ланцюжки блокiв (Li et al., 2017), що дають змогу надавати доступ визначеним вузлам.
Одним з недолшв Blockchain е постiйне зростання обсягу pозподiленоi бази даних. Кожен учасник ланцюжка володiе повноцшною або частковою копiею даних, яка регулярно синхрошзуеться. Якщо спробувати збер^ати в Blockchain великi дат чи мультимедшний контент, то в швидкш пеpспективi обсяг ланцюжка мо-же спричинити для коpистувачiв проблему, яка поляга-тиме у вщсутност достатнiх pесуpсiв для збеpiгання бази даних. О^м цього, ютотно зросте тpивалiсть син-хpонiзацii стану бази мiж користувачами. Рiшення цiеi проблеми полягае у збеpеженнi в Blockchain гешу об'екта замiсть його контенту (рис. 1).
Розподшена файлова система IPFS початково проек-тувалася як система контролю веpсii об'емних наукових файлiв, проте згодом переросла у контентно-адресова-ний, гiпеpмедiйний P2P протокол. IPFS мають таю особливостг
• Кожному файлу та уам його блокам присвоюють унь кальш кpипто-гешi;
• IPFS видаляе дублкати в меpежi та збергае юторго вер-сiй кожного файлу;
• Вузли меpежi збертають тiльки важливий для них контент та певний iндекс;
• Пошук файлу здшснюеться за ункальним гешом або через сервю IPNS;
• Обмш контентом здшснюеться в меpежi ршноправних вузл1в P2P.
IPFS:
-гешкоди фашив -закодований контент
Actor Користувач: -приватний ключ -публ1чний ключ (адреса) -котя Blockchain -юпентська програма Повщомлення: -службова шформащя (час,...) -контент, закодований приватним ключем -адреса вщправника (публ1чний ключ) -гешкод закодованого контенту
Перев1рка коректносп повщомлення (адреси, час,...)
Actor
Отримувач:
-приватний ключ -публ1чний ключ (адреса)
-котя Blockchain -ктентська програма
Blockchain
h-íHWVi
Блок повщомлень:
-гешкод блоку -гешкод батьювського блоку
-список повщомлень -службова шформащя
Рис. 1. Схема процесу обмшу повiдомленнями з використан-ням технологш Blockchain та IPFS
Даш, шформащя, знання. Персональш бази даних та знань дослщниюв, науковщв, фах1вц1в виконують специфгчну роль пор1вняно 1з традицшними базами даних та знань, як слугують для збер1гання та опрацю-вання емшричних даних, масивгв докуменлв та вщо-мостей у !х висхщному подант. Вони, зокрема, дають змогу накопичувати та опрацьовувати дат, як е важли-вими для фах1вця-досл1дника. Так бази даних виконують роль персоналгзованого шформацшного ресурсу, що створюеться та впорядковуеться в1дпов1дно до шди-вгдуальних потреб дослщника. Технолопчно персональна база даних може реалгзовуватися у вигляд1 хмарного сховища, на основ1 реляцшно! чи постреля-цшно! модел1 даних, або ж поеднувати ряд вгдомих су-часних п1дход1в. Виб1р т1е1 чи 1ншо1 архгтектури зазви-чай здшснюеться з урахуванням функцюнальних та безпекових вимог ii власника.
В процес проектування персональних баз даних та знань потр1бно обов'язково враховувати методолопчт в1дм1нност1, як юнують м1ж поняттями "1нформац1я", "дат" та "знання". У роботах (Wang, 2015; Liew, 2007) подано означення, функцп, в1дм1нност1 i зв'язки, як ю-нують мiж цими поняттями. З формально гносеолопч-них позицiй, дат трактуються як абстрактне подання кшьюсних властивостей об'ектiв реального свiту або абстрактних об'ектiв, вiдповiдно до конкретних кшьюс-них шкал (Wang, 2015). Дат по в^ношенню до кшьюс-но! властивостi X за шкалою мiри а , D(X,х), отриму-ються шляхом застосування перетворення Га : X ^ ^ , яке породжуе дшсне число 1"хЩ в одиницях [а], де IX е цiлою частиною, а RX е залишком (Wang, 2015): _ . ^ ™ X тхтхг п
и
а
а<=Ж , Iх eZ , 0 < RZ <а , {IX = modx(X), RX = modx(X)} .
Бшьш iнтуïгивие означення трактуе дaиi як збереже-иi символи чи покази сигналу, що представляють певиi факти чи поди (Shen, 2014). Варто зазначити, що о^м шльшсних, тут враховуються ще й i яшсш влaсгивосгi об'екгiв. Обидва означення передбачають, що дaиi е "сирою" шформащею, яка отримана в резульгaгi абстракцп зовиiшиiх сутностей та 1х ввдношень в певиi величини: fD : O ^ Q, де O - об'ект, Q - величина, D - даш Основна роль даних полягае в запиа дiй чи си-гуaцiй з метою фшсування iсгиииоï картини чи реаль-иоï подiï.
Iиформaцiя - це поввдомлення, що мае ввдповщний змiсг, висновок або вхiдиi даш для прийняття рiшеиня чи здшснення Aiï (Liew, 2007). Iиформaцiя е штерпрета-цiею даних та передбачае наявшсть семантики: fi : D ^ S , де D - даш, S - семантика, I - шформащя. У n -символьнш сисгемi iиформaцiя I визначаеться за формулою ентропп:
H =-Z Pi lo§2^_Pi) ,
i
де pi - ймовiриiсть появи значення i в поввдомлент. Окрiм цього, в робот (Wang, 2015) подано модель та поняття "сучасно1" iиформaцiï", яка дае змогу розшири-ти певш твердження, що присутиi в теорп iиформaцiï К. Шеннона. Основна роль концепту "шформащя" полягае у забезпеченш ведомостями процесiв прийняття ршень щодо розв'язання актуальних задач чи реaлiзaцiï потенцiйних можливостей.
Теорiя шформацп за К. Шенноном грунтуеться на оцшщ кiлькостi iнформaцiï у випадкових величинах, яку iнтуïтивно можна описати як "визначення середньо1' кiлькостi бтв, що е необхiдною для кодування випад-ково1' величини" (Shen, 2014). Проте iснуе багато дже-рел шформацп, яш не е випадковими величинами, зок-рема книги, структура ДНК тощо. 1дея А. М. Колмогорова, який е автором алгоритшчно1' теорiï iнформaцiï, полягала в переходi вiд визначення кiлькостi шформацп у випадкових величинах до визначення шлькосп шформацп в iндивiдуaльних об'ектах (Shen, 2014). Нехай F : p ^ F(p) - це функщя (мова програмування, штер-претатор), яка обчислюе результат роботи програми p . Тодi складшсть (к1льк1сть iнформaцiï) слова x при ш-терпретaторi F - це мшмальна довжина l програми p , яка необхщна, щоб це слово створити:
KP (x) = min{l( p)| F( p) = x}.
Варто зазначити, що функщя x ^ KP(x) в загально-му випадку е нерозв'язною, тобто не iснуе ефективного алгоритму, який для Vx обчислюе KP (x).
Знання - це внутршне особистiсне вiдобрaження об'ективно1' дщсносп, що формуеться суб'ектом у про-цесi ïï пiзнaння. Знання е набутою та осмисленою ш-формащею, що породжена iнтелектуaльною розумовою дiяльнiстю та втiленa у певному концепп-понятп: fK : I ^ C , де I - шформашя, C - формальне поняття, K - знання. Формальна модель знань "об'ект-атрибут-властивють" задаеться кортежем (O, A,R, де O - мно-
жина об'ектiв з ушкальними iменaми, A - множина ат-рибутiв, як1 ввдносяться до того чи шшого об'екта, R -множина ввдношень мiж об'ектами та атрибутами (Wang, 2015). Формулюючи узагальнене подання трьох означених вище понять "даш", "шформащя", "знання"
можна зафшсувати таю трактування: "даш" - це матерь алiзована на певному носieвi iнформацiя, а "знання" -це суб'ектизована "шформащя", яка е особистiсним Bi-дображенням, що формуеться у суб'екта внаслвдок тз-нання ним зовнiшнього свiту (рис. 2).
' Фшсування, збереження
Рис. 2. Стввдаошення понять "знання", "шформащя" та "даш" (Ые^ 2007)
Робота дослiдникiв у складi вiртуальних наукових колективiв передбачае одночасове оперування як дани-ми, так i iнформацiею та знаннями, що отриманi учас-никами колективу чи надходять з рiзноманiтних р!зно-типових iнформацiйних джерел. Даш можуть подавати результати натурних експерименпв, покази давачiв, статистики певного дослщження тощо. Iнформацiя зде-бiльшого подаеться у формi наукових статей, матерiалiв доповвдей i дискусiй, монографiй, поабнишв i т. iн. Знання подаються через призму внутрiшнiх особиспс-них вщображень об'ективно! дiйсностi учасниками в!р-туального дослiдницького колективу. Реалiзацiя шфор-мацшно-технолопчно! пiдтримки пошуково! дiяльностi дослвдника та оперування знаннями потребуе !х явного подання.
Подання персональних знань дослвдника. У теорп подання знань та мiркування е илька клаав моделей, найпопуляршшими серед яких е лопчш моделi, семан-тичнi мереж1, фрейми та продукцшш правила. Кожен iз наведених вище класiв моделей характеризуеться експресившстю, тобто здатнiстю представити довшьне за природою знання, розвиненим формально-матема-тичним апаратом для здiйснення мiркування, що полягае у виведенш нових несуперечливих знань на основi висхiдних знань, а також зручшстю у використаннi кш-цевим користувачем. Широке рiзноманнiття пропонова-них моделей пояснюеться наявнiстю груп явних пере-ваг, як1 надае та чи iнша модель за певними критерiями. Водночас, проектування великих та гшервеликих баз знань потребуе вибору гнучко! та верифшовано! моделi подання знань, яка б рiзнопланово та ефективно задо-вольнила потреби користувача. На думку широкого фа-хового загалу, однiею з найприйнятнiших для цього е саме онтолопчна модель.
Онтолопя - це формальна, явна специфшащя спшь-но! концептуалiзацil, яка характеризуеться високою се-мантичною виразнiстю (БеПтауг, & WбB, 2016). Уза-гальнено онтолопя подаеться кортежем О = (С, R, , де: С - сшнченна множина понять-"концеппв" предметно! областi; R: С ^ С - ск1нченна множина вщношень мiж поняттями; F - сшнченна множина функцш штерпре-тацп (обмеження, аксiоми) (Ьу1ууп, 2013). Особливою онтологiй е те, що вони поеднали переваги цшого спектра моделей подання знань в узагальненш структур^ що уможливлюе И використання як цiлiсного, утфшо-ваного формального апарату. Поняття та ввдношення подаються у виглядi семантично! мереж!, структура поняття ввдповвдае фреймовiй модел^ обмеження запису-
ються як продукцшш правила, а формальна лопка ви-користовуеться для аксюматизацп предметно! областi.
Однieю з потужних додатних особливостей онтоло-гiй е уможливлення поширення загального розумiння структури iнформацi!, багаторазового повторного вико-ристання знань про предметну область, явного подання гiпотез предметно! областi, роздшення предметних i операцiйних знань. Спектр застосування тiе! чи iншо! онтологп визначаеться ступенем загальностi предметно! области, яку вона описуе. I як наслвдок, базова онто-лопя мiстить таксономiю понять загального призначен-ня. На противагу, орiентованi на конкретш завдання он-тологi! описують зазвичай тiльки тi поняття, яи вщгра-ють важливу роль при виконанш певного завдання. Предметно орiентованi онтологi! мають ширше прак-тичне застосування та грунтуються на експертних знан-нях у певнiй предметнш областi.
Методи та засоби проектування онтологiй розлого подано в роботах (Feilmayr, & Wófi, 2016; Noy, & McGuinness, 2001). Процес !х формування, зазвичай, зводиться до виконання таких крок1в:
1. Визначення предметно! област та обсягу онтологп;
2. Аналiз наявних онтологiй на предмет 1х повторного ви-
користання;
3. Створення перелiку важливих "концеплв" (понять) в
онтологп;
4. Означення кламв та 1хньо! iерархп;
5. Означення властивостей кламв та слотав;
6. Означення аспеклв (facets) слотав;
7. Створення екземплярiв класiв.
Кроки 3-4 полягають у здiйсненнi концептуалiзацi! предметно! областi з метою створення таксономп важливих понять. Кроки 5-6 деталiзують властивостi понять, щоб забезпечити можливiсть здiйснення лопчного мiркування.
Важливою властивiстю баз знань та онтологш зок-рема е несуперечшсть збережених фактiв. Незабезпече-шсть цiе! властивостi призводить до можливосп лопч-ного виведення абсурдних тверджень, як1 е джерелом потенцiйних помилок. Несуперечнiсть онтологiчних знань забезпечуеться шляхом створення !хнього подан-ня в межах певно! формально! системи та дедуктивним обчисленням iстинностi певного твердження. При вибо-рi ввдповщно! формально! системи необхiдно врахову-вати !! ключовi характеристики, а саме: експресившсть мови, алгоритмiчна розв'язнiсть та обчислювальна складнiсть розв'язання основних лопчних проблем. Значною популярнiстю серед розробниив онтологiй ко-ристуеться технологiя OWL 2 DL, що заснована на базi формально! системи описово! лопки. Оск1льки вона е пiдмножиною лопки предикапв, то !! виразнiсть е об-меженою. Актуальним напрямком сучасних дослвджень е спроби застосування лопк вищих порядков та теорi! титв до мiркування в онтологiях (Dapoigny, & Barlatier, 2008; Hafsi, Dapoigny & Bolon, 2015).
Основою формальних лопк вищих порядив е орга-шзащя лопчних понять - висловлювань, iндивiдiв, про-позицiйних функцiй - в iерархiю типiв таким чином, що сутносп можуть оперувати тшьки тими поняттями, як1 розташованi нижче в iерархi!. Таким чином лопки вищих порядив дають змогу у природний та зручний спо-сiб явно описувати зв'язок мiж унiверсалами та iндивi-дами без необхвдносп введення додаткових спецiалiзо-ваних конструкцiй (Hafsi, Dapoigny & Bolon, 2015). Хо-
ча логiка предикапв володie хорошими мета-властивос-тями компактносп та Ловенгейма-Сколема, !! обмежена експресившсть е перешкодою для втiлення багаторiвне-вого мiркування.
Вiдкриття iзоморфiзму КаррьГоварда-Ламбека дало змогу встановити зв'язки мiж формальними системами теорi! доведень, теорп типiв та теорi! категорiй. Таким чином лопчш висловлювання можуть бути записаними за допомогою елементiв теорп титв (табл. 1). Бшьше того встановлено, що процес лопчного доведення може бути реалiзований в межах просто титзовано! системи X -числення. Це спричинило появу нових концепцш "висловлювання як типи", "доведення як програми" та "спрощення доведень, як ощнювання програми". Прог-рамним втшенням цих концепцiй е асистенти доведення теорем Coq (Cog, 2017), Lean (Lean, 2017), Nuprl (Cornell University, 2017) та rnmi, як в нашвавтоматизо-ваному режимi дають змогу обчислити несуперечшсть певних висловлювань задекларованим положенням.
Табл. 1. Деяю cпiввiднoшення мiж лoгiкoю виьтовлювань _та теoрieю типiв (Homotopy type theory, 2013)_
Логжа виотовлювань Tеоpiя титв Onnc
виотовлювання A тип A
доведення a i A шдиввд a типу A
1, T 0, 1 нульовий, одиничний тип
A v B A + B тип кодо6утку
A л B A x B тип добутку
A ^ B A ^ B функцшний тип
-A A ^ 0 функцшний тип
У фyпдaмептaльпиx pоботax ввдомих вчепих (Dapoigny, & Barlatier, 2008; Hafsi, Dapoigny & Bolon, 2015) поcлiдовно викладено метод подання онтологш з вико-pиcтaнням теоpiï типiв y межах статеми "acиcтепт доведення теоpем" Coq. У зaзпaчепiй cиcтемi pеaлiзовaнa фоpмaльпa мова з вжокою екcпpеcивпicтю, зacобaми пaпiвaвтомaтичпого доведення теоpем, меxaнiзмом rac-лiдyвaпня та гapaптовaним зaкiнчепням обчиcлепь. Oпиc оптологiй y теоpiï типiв пеpедбaчae пaявпicть конcтpyкцiй для подання вiдпошепь, понять, екземпля-piв, aтpибyтiв, iepapxiчпиx та меpеологiчниx зв'язк1в (табл. 2).
Табл. 2. Прдання елементiв oнтoлoгiï у шстеш Coq
Елемент онтологп KoHcrpyKma Coq
Поняття Class C: Type.
Е^емт^ Instance X: C.
Aтpибyт Class C: Type:= { attr: Prop; }.
Biдношепня Parameter Relation: C ^ C ^ Prop.
Iepapxiчне нacлiдyвaпня Coercion D1: SubClass_G C.
Mеpеологiчне вiдпошепня "чacтипa-цiле" Definition Part_of(x y: C):= Relation x y. Axiom A1 : Reflexive Part_of. Axiom A2: Asymmetric Part_of. Axiom A3 : Transitive Part of.
^a^rapn 3, V exists X: C, forall X: C
Приклад 1. Розгляпемо частиц пpедметпоï оптоло-гiï O = (C, R, F), що вiдобpaжae оcобливоcтi комyпiкaцiï
до^едник^в y межах вipтyaльного пayкового колективy. Нехай
C = {Biртуальна _ Наушва _Мережа, Пoвiдoмлeння,Учacнuк} ; R = {Bлacнuк _noвiдoмлeння i Пoвiдoмлeння ^ Уча^ш ^ Pr op, Icwye _ mнтакт i Учатт ^ Учатт ^ Pr op} ;
F = {noeidoMneHrn _ Належить _ До _ Колективу, Редукщя _ 1снуе _ Зв' язок, .
Учасник _ Належить _ До _ Колективу} Тодi подання онтологп в Coq та MipKyBaHHH запи-шеться наступним чином:
1. Оголошення поняття вщношення та класу для насл1ду-вання:
Definition Kind:= Type.
Parameter Relation: Kind ^ Kind ^ Prop.
2. Оголошення таксономп понять онтологп: Class VirtualScientificNetwork: Type. Parameter D2: VirtualScientificNetwork ^ Kind. Coercion D2: VirtualScientificNetwork Kind. Class VSNMessage: Type.
Parameter D3: VSNMessage ^ Kind. Coercion D3: VSNMessage Kind. Class VSNMember: Type. Parameter D4: VSNMember ^ Kind. Coercion D4: VSNMember Kind.
3. Означення вщношень онтологп та 1х властивостей: Definition Owned_by(x: VSNMessage)(y: VSNMember):= Relation x y. Definition In_touch(x y: VSNMember):= Relation x y.
Axiom s_of_in_touch: Symmetric In_touch. Axiom t_of_in_touch: Transitive In_touch. Definition Part_of(x y: Kind):= Relation x y. Axiom r_of_part_of: Reflexive Part_of. Axiom a_of_part_of: Asymmetric Part_of. Axiom t_of_part_of: Transitive Part_of.
4. Означення аксюм онтологп: Axiom Msg_Part_Owned_by:
forall
(message: VSNMessage) (member: VSNMember)(network: VirtualScientificNetwork),
Owned_by(message)(member) /\ Part_of(message)(network) ^
Part_of(member)(network).
Axiom Mem_Part_Owned_by:
forall (message: VSNMessage)(member: VSNMember)(network: VirtualScientificNetwork),
Owned_by(message)(member) /\ Part_of(member)(network) ^
Part_of(message)(network). Axiom intro_of_in_touch:
forall (m1 m2: VSNMember)(message: VSNMessage), Owned_by(message)(m1) /\ Owned_by(message)(m2) ^ In_to-uch(m1)(m2). Axiom elim_of_in_touch:
forall (m1 m2: VSNMember), In_touch(m1)(m2) ^
exists message: VSNMessage, Owned_by(message)(m1) /\ Owned_by(message)(m2).
5. Доведення леми з використанням мови тактик: Lemma Dist_Part_In_touch:
forall (m1 m2: VSNMember)(network: VirtualScientificNetwork), In_touch(m1)(m2) /\ Part_of(m1)(network) ^ Part_of(m2)(network). Proof.
intros m1 m2 net H1. destruct H1 as [H1 H2]. apply elim_of_in_touch in H1. elim H1; intros msg H3; clear H1. destruct H3 as [H3 H4].
assert (H5: Owned_by(msg)(m1) /\ Part_of(m1)(net)). split; assumption.
apply Mem_Part_Owned_by in H5.
assert (H6: Owned_by(msg)(m2) /\ Part_of(msg)(net)).
split; assumption.
apply Msg_Part_Owned_by in H6; assumption. Qed.
Висновки. Отже, системно проаналiзовано процеси управлiння персональною iнформацieю дослiдника, що здiйснюe свою дiяльнiсть у межах вiртуального науко-вого колективу. Розглянуто технологiчнi можливостi побудови принципово нових, децентралiзованих систем комушкацп вiртуального наукового колективу, з ввд-мiнними характеристиками приватносп, безпеки, на-дiйностi та швидкодп. Висвiтлено особливостi функць онування розподiлених баз даних Blockchain та IPFS, що е нарiжними каменями P2P комунiкацiйних систем. Проаналiзовано роль та особливосп понять "даш", "ш-формащя" та "знання", а також технологiчнi особливос-тi 1'хнього адмшстрування.
Значну увагу зосереджено на проектуванш персо-нальних баз знань та здшсненш логiчного мiркування. Наведено принципово новий тдхщ до мiркування в он-тологiчнiй моделi подання знань, що грунтуеться на ви-користанш апарату теорп типiв у межах системи асис-тента доведення теорем Coq. У виглящ таблиць висвггле-но основнi спiввiдношення мiж лопкою висловлювань та теорiею типiв, а також структурними елементами онто-логш та 1'х поданням у формальнш мовi системи Coq. Розглянуто приклад титзованого подання та мiркування над фрагментом онтологп, що описуе предметну область функцiонування вiртуальноl науково! стльноти.
Подальше дослвдження охоплюе ретельний аналiз структури та властивостей компонент проекту системи комушкацп вiртуальних наукових колективiв, зокрема, подання онтологш та мiркування з використанням теорп типiв, функцюнування P2P мереж (Homotopy type theory, 2013), застосування технологи Blockchain у поеднанш з алгоритмами мульти-пiдпису та iерархiчно-го детермiнованого створення ключiв (Wuille, 2017), ви-користання технологи IPFS для приеднання великих даних до ланцюжка блоков, дослвдження алгоритмiв консенсусу, розроблення зручного iнтерфейсу користувача тощо. Аналiз зазначених компонент здшснюватиметься як на теоретичному, так i емтричному рiвнях.
Перелш використаних джерел
Bitshares Munich IVS (2016). ECHO - Free Encrypted Private Chat.
Retrieved from: https://my-echo.com/#messenger Coq (2017). French Institute for Research in Computer Science and Automation. The Coq Proof Assistant. Retrieved from: https://coq.inria.fr Cornell University. (2017). Nuprl Proof Development System.
Retrieved from: http://www.nuprl.org Dapoigny, R., & Barlatier, P. (2008). Towards a Conceptual Structure based on Type theory. Retrieved from: http://ceur-ws.org/Vol-354/p63.pdf
Dhamdhere, S. N. (2014). Cloud computing and visualization technologies in libraries. Hershey, PA: Information Science Reference. Feilmayr, C., & WoB, W. (2016). An analysis of ontologies and their success factors for application to business. Data & Knowledge Engineering, 101, 1-23. https://doi.org/10.1016/j.datak.2015.11.003 Hafsi, M., Dapoigny, R., & Bolon, P. (2015). Toward a Type-Theoretical Approach for an Ontologically-Based Detection of Underground Networks. Knowledge Science, Engineering and Management Lecture Notes in Computer Science, 90-101. https://doi.org/10.1007/978-3-319-25159-2 8 Homotopy type theory: univalent foundations of mathematics. (2013).
Princeton, NJ: Univalent Foundations Program. Kaisler, S., Armour, F., Espinosa, J. A., & Money, W. (2013). Big Data: Issues and Challenges Moving Forward. 2013 46th Hawaii International Conference on System Sciences. https://doi.org/10.1109/hicss.2013.645
Lean (2017). Microsoft Research. The Lean Theorem Prover. Omohundro, S. (2014). Cryptocurrencies, smart contracts, and artifici-
Retrieved from: https://leanprover.github.io al intelligence. AI Matters, 1(2), 19-21.
Li, W., Sforzin, A., Fedorov, S., & Karame, G. O. (2017). Towards https://doi.org/10.1145/2685328.2685334
Scalable and Private Industrial Blockchains. Proceedings of the Protocol Labs (2016). IPFS is the Distributed Web. Retrieved from:
ACM Workshop on Blockchain, Cryptocurrencies and Contracts - https://ipfs.io
BCC17. https://doi.org/10.1145/3055518.3055531 Romano, D., & Schmid, G. (2017). Beyond Bitcoin: A Critical Look
Liew, A. (2007). Understanding Data, Information, Knowledge and at Blockchain-Based Systems. Cryptography, 1(2), 15.
Their Inter-Relationships. Journal of Knowledge Management https://doi.org/10.3390/cryptography1020015
Practice, 8(2), 1-10. Shen, A. (2014). Algoritmicheskaia teoriia informatcii i sluchainost
Lytvyn, V. (2013). Pidkhid do pobudovy intelektualnykh system individualnyh obektov. Retrieved from: https://www.youtu-
pidtrymky pryiniattia rishen na osnovi ontolohii. Problemy prohra- be.com/watch? v=X0Lo5IWLjko
muvannia, 4, 43-52. Swan, M. (2015). Blockchain: blueprint for a new economy. Sebasto-
Marshall, A. (2016). Powered by Blockchain, New Decentralized pol, CA: OReilly Media, Inc.
Messenger to Save Data, Battery and Time. Retrieved from: Veretennikova, N., Pasichnyk, V., Kunanets, N., & Gats, B. (2015).
https://cointelegraph.com/news/powered-by-blockchain-new-de- E-Science: New paradigms, system integration and scientific rese-
centralized-messenger-to-save-data-battery-and-time arch organization. 2015 Xth International Scientific and Technical
Nakamoto, S. (2008). Bitcoin: A Peer-to-Peer Electronic Cash Conference "Computer Sciences and Information Technologies"
System. Retrieved from: https://bitcoin.org/bitcoin.pdf (CSIT). https://doi.org/10.1109/stc-csit.2015.7325436
Noy, N., & McGuinness, D. (2001). Ontology Development 101: A Wang, Y. (2015). Formal Cognitive Models of Data, Information,
Guide to Creating Your First Ontology. Retrieved from: http://pro- Knowledge, and Intelligence. WSEAS Transactions on Computers,
tege.stanford.edu/publications/ontology_development/ontology101- 14, 770-781.
noy-mcguinness.html Wuille, P. (2017). Hierarchical Deterministic Wallets. Retrieved from:
https://github.com/bitcoin/bips/blob/master/bip-0032.mediawiki.
Н. Э. Кунанец1, В. С. Ленько1, В. В. Пасичник1, Ю. Н. Щербина2
1 Национальный университет "Львовская политехника", г. Львов, Украина 2 Львовский национальный университет им. Ивана Франко, г. Львов, Украина
ПЕРСОНАЛЬНЫЕ БАЗЫ ДАННЫХ И ЗНАНИЙ ВИРТУАЛЬНЫХ
ИССЛЕДОВАТЕЛЬСКИХ СООБЩЕСТВ
Исследованы процессы приобретения и управления персональными данными и знаниями, а также коммуникации среди членов виртуальных исследовательских сообществ. Рассмотрено понятие виртуального научного коллектива и особенности защиты информации при организации процессов коммуникации в нем. Освещены проблемы коммуникации между участниками виртуальных исследовательских сообществ, возникшие из-за отсутствия целостного технологического решения, которое бы обеспечило конфиденциальность, быстродействие и структурированность потоков информации, данных и знаний. Предложен принципиально новый подход к проектированию платформ коммуникации, основанной на идеях децентрализации и крипто-безопасности. Проанализированы методологические различия между понятиями "данные", "информация" и "знание". Освещён современный подход к логическому мышлению в онтологической модели представления знаний, на основе использования аппарата теории типов и ассистента доказательства теорем Coq. Структурированы отношения между логикой и теорией типов, а также рассмотрен способ представления основных элементов онтологии с помощью формального языка системы Coq. Представлен пример рассуждения на языке тактик Ltaс над фрагментом онтологии, который описывает определенные отношения предметной области функционирования виртуальных исследовательских сообществ. Указаны пути и инструменты проведения дальнейших исследований.
Ключевые слова: е-наука; коммуникация; блокчейн; онтология; теория типов; логическое рассуждение.
N. E. Kunanets1, V. S. Lenko1, V. V. Pasichnyk1, Yu. M. Shcherbyna2
lLviv Polytechnic National University, Lviv, Ukraine 2Ivan Franko National University of Lviv, Lviv, Ukraine
PERSONAL DATA AND KNOWLEDGE BASES OF VIRTUAL RESEARCH COMMUNITIES
The paper researches the processes of acquisition and management of personal data and knowledge, as well as the communication within the virtual research communities. It presents the concept of a virtual research group and the specifics of information protection during the establishment of communication processes within it. The paper highlights the existing issues in organization of an effective communication between the participants of virtual research communities, which are caused by the lack of a unified technological solution that ensures reliability, privacy, speed and common structure of an information, data and knowledge. A fundamentally new approach to the architecture of communication platforms based on the ideas of decentralization and crypto-security is proposed. It emphasizes the utility of a Blockchain solution, which combined with the distributed encrypted file system IPFS, InterPlanetary File System, provides the security of a next generation. The methodological differences between the concepts "data", "information" and "knowledge" are emphasized. The study provides a description of a modern approach to the reasoning in ontologies that is based on the use of a type-theoretical approach and Coq proof assistant. It highlights the relationship between the logic and type theory and defines the way of representing the core structural elements of ontology with the formal language of Coq system. An application of the Ltac tactics language for the reasoning over an ontology fragment, which describes some relations in the domain of the virtual research communities functioning, is considered. It shows the feasibility and advantages of the hierarchical type system of concepts, and provides a strong evidence of the higher-order reasoning in ontology. Finally, the paths and tools for further research are indicated.
Keywords: e-Science; communication; blockchain; ontology; type theory; logical reasoning.